A Study on Context-aware Latent Variable Models for Neural Machine Translation

神经机器翻译上下文感知潜变量模型的研究

基本信息

  • 批准号:
    21K12031
  • 负责人:
  • 金额:
    $ 2.66万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2021
  • 资助国家:
    日本
  • 起止时间:
    2021-04-01 至 2024-03-31
  • 项目状态:
    已结题

项目摘要

令和4年度は、潜在変数を用いたコンテキストアウェアな機械翻訳の学習を目的として、1) 潜在ディリクレ配分法 (LDA) を用いたトランスフォーマーの研究、2) EMアルゴリズムを用いたバイリンガルサブワード分割の研究、3) 潜在拡散モデルを用いたマルチモーダル機械翻訳の研究、4) 階層型BARTによる生成型要約の研究を行った。1)について、潜在変数トピックモデルの有効性を確認するために、LDAにより与えられるタグを対訳文の先頭に付与して機械翻訳を行う手法を提案した。日英対訳コーパスASPECを用いた実験の結果、提案手法により翻訳精度BLEUが38.8%から39.0%まで向上することを確認できた。2)について、現在ほとんどの機械翻訳システムではトークン分割のためにサブワード分割が用いられているが、従来のサブワード分割は単言語を対象としていた。本研究では、ユニグラム言語モデルを基にして、2言語間のサブワードアライメントを潜在変数とするバイリンガルサブワード分割を提案した。サブワードの対応関係を学習するためにEMアルゴリズムを用いた。ASPECを用いた実験の結果、日英翻訳のBLEU値が26.7%から27.3%まで向上することが確認できた。3)について、潜在拡散モデルを用いることで、マルチモーダル機械翻訳に不要な画像情報を除去する画像変換を行う手法を提案した。Multi30kを用いた実験の結果、BLEU値が41.06%から41.20%まで向上することが確認できた。4)について、階層型モデルの有効性を確認するため、コンテキストアウェアな階層型BARTによる生成型要約の研究を行った。文レベルの情報と単語レベルの情報を階層的に融合するモデルを考案し、自動要約に適用した。実験の結果、要約精度ROUGEが40.88%から40.98%まで向上することが確認できた。
2020年,以使用潜在变量学习上下文感知机器翻译为目标,我们将进行1)使用潜在狄利克雷分配(LDA)的变压器研究,2)使用EM算法的双语子词分割研究,3)研究。使用潜在扩散模型进行多模态机器翻译的研究,以及 4)使用分层 BART 进行生成摘要的研究。关于1),为了确认潜变量主题模型的有效性,我们提出了一种通过在双语句子开头添加LDA给出的标签来进行机器翻译的方法。使用日英双语语料库ASPEC进行的实验结果证实,该方法将翻译准确率BLEU从38.8%提高到39.0%。关于2),目前大多数机器翻译系统都使用子词分割来进行标记分割,但传统的子词分割是针对单一语言的。在本研究中,我们提出了基于一元语言模型的双语子词分割,使用两种语言之间的子词对齐作为潜在变量。 EM算法用于学习子词的对应关系。使用 ASPEC 进行的实验结果证实,日语-英语翻译的 BLEU 值从 26.7% 提高到 27.3%。关于3),我们提出了一种图像变换方法,通过使用潜在扩散模型去除多模态机器翻译中不必要的图像信息。使用Multi30k进行的实验结果证实,BLEU值从41.06%提高到41.20%。关于4),为了确认分层模型的有效性,我们使用上下文感知分层BART进行生成摘要研究。我们设计了一种将句子级信息和词级信息分层组合的模型,并将其应用于自动摘要。实验结果证实,ROUGE的总结准确率从40.88%提高到40.98%。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Hie-BART: Abstractive Summarization by Hierarchical BART
Hie-BART:分层 BART 的抽象概括
  • DOI:
    10.5715/jnlp.29.835
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    秋山 和輝; 田村 晃裕; 二宮 崇; 梶原 智之
  • 通讯作者:
    梶原 智之
バイリンガルサブワード分割のためのEMアルゴリズム
双语子词分割的 EM 算法
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    松井 大樹; 二宮 崇; 田村 晃裕
  • 通讯作者:
    田村 晃裕
潜在拡散モデルによる変換画像を用いるマルチモーダルニューラル機械翻訳
使用潜在扩散模型转换图像的多模态神经机器翻译
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    湯浅 亮也; 田村 晃裕; 梶原 智之; 二宮 崇; 加藤 恒夫
  • 通讯作者:
    加藤 恒夫
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

二宮 崇其他文献

軌道回路の状態基準保全に向けた検討(その2)‐機械学習による設備状態のトレンド分析-
轨道电路状态维护的考虑(第 2 部分) - 使用机器学习对设备状态进行趋势分析 -
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    志田 洋;武市 徹;大串 裕郁;二宮 崇;高橋 寛
  • 通讯作者:
    高橋 寛
3年先を見据えたAI~機械学習と深層学習~
AI 展望未来 3 年 ~ 机器学习和深度学习 ~
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    二宮 崇
  • 通讯作者:
    二宮 崇
EGFR変異陽性NSCLCに対するafatinib・bevacizumab併用療法の第I相試験:OLCSG1404
阿法替尼和贝伐珠单抗联合治疗 EGFR 突变阳性 NSCLC 的 I 期研究:OLCSG1404
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    青江 啓介;近森 研一;前田 忠士;亀井 治人;二宮 崇;野上 尚之;別所 昭宏;久山 彰一;藤本 伸一;杉本 啓介;瀧川 奈義夫;木浦 勝行
  • 通讯作者:
    木浦 勝行
シンボルグラウンディングに関する研究調査と愛媛大学での取り組み
符号基础的研究和爱媛大学的努力
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    二宮 崇
  • 通讯作者:
    二宮 崇
Chemosynthetic fossil molluscan faunas from the Neogene Taishu Group, distributed in Tsushima Islands, Nagasaki Prefecture, the southwest Japan
分布于日本西南部长崎县对马群岛的新近纪大周群的化学合成软体动物化石
  • DOI:
  • 发表时间:
    2011-03-10
  • 期刊:
  • 影响因子:
    0
  • 作者:
    T. Ninomiya;二宮 崇;タカシ ニノミヤ
  • 通讯作者:
    タカシ ニノミヤ

二宮 崇的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('二宮 崇', 18)}}的其他基金

主辞駆動句構造文法に基づく並列処理を用いた頑健な自然言語処理の研究
基于头驱动短语结构语法的并行处理鲁棒自然语言处理研究
  • 批准号:
    98J04884
  • 财政年份:
    1998
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows

相似国自然基金

基于Deep-learning的三江源区冰川监测动态识别技术研究
  • 批准号:
    51769027
  • 批准年份:
    2017
  • 资助金额:
    38.0 万元
  • 项目类别:
    地区科学基金项目
基于异构医学影像数据的深度挖掘技术及中枢神经系统重大疾病的精准预测
  • 批准号:
    61672236
  • 批准年份:
    2016
  • 资助金额:
    64.0 万元
  • 项目类别:
    面上项目
具有时序处理能力的Spiking-Deep Learning(脉冲深度学习)方法研究
  • 批准号:
    61573081
  • 批准年份:
    2015
  • 资助金额:
    64.0 万元
  • 项目类别:
    面上项目

相似海外基金

Deep Learningを活用した超音波ガイドによる安全な静脈穿刺法の開発
利用深度学习的超声引导开发安全静脉穿刺方法
  • 批准号:
    24K13362
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
CAREER: Geometric Deep Learning to Facilitate Algorithmic and Scientific Advances in Therapeutics
职业:几何深度学习促进治疗学的算法和科学进步
  • 批准号:
    2339524
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Continuing Grant
CAREER: Accelerating Scientific Discovery via Deep Learning with Strong Physics Inductive Biases
职业:通过具有强物理归纳偏差的深度学习加速科学发现
  • 批准号:
    2338909
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Continuing Grant
SHF: Small: Hardware-Software Co-design for Privacy Protection on Deep Learning-based Recommendation Systems
SHF:小型:基于深度学习的推荐系统的隐私保护软硬件协同设计
  • 批准号:
    2334628
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Standard Grant
Collaborative Research: OAC Core: CropDL - Scheduling and Checkpoint/Restart Support for Deep Learning Applications on HPC Clusters
合作研究:OAC 核心:CropDL - HPC 集群上深度学习应用的调度和检查点/重启支持
  • 批准号:
    2403088
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了