A Study on Context-aware Latent Variable Models for Neural Machine Translation

神经机器翻译上下文感知潜变量模型的研究

基本信息

  • 批准号:
    21K12031
  • 负责人:
  • 金额:
    $ 2.66万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2021
  • 资助国家:
    日本
  • 起止时间:
    2021-04-01 至 2024-03-31
  • 项目状态:
    已结题

项目摘要

令和4年度は、潜在変数を用いたコンテキストアウェアな機械翻訳の学習を目的として、1) 潜在ディリクレ配分法 (LDA) を用いたトランスフォーマーの研究、2) EMアルゴリズムを用いたバイリンガルサブワード分割の研究、3) 潜在拡散モデルを用いたマルチモーダル機械翻訳の研究、4) 階層型BARTによる生成型要約の研究を行った。1)について、潜在変数トピックモデルの有効性を確認するために、LDAにより与えられるタグを対訳文の先頭に付与して機械翻訳を行う手法を提案した。日英対訳コーパスASPECを用いた実験の結果、提案手法により翻訳精度BLEUが38.8%から39.0%まで向上することを確認できた。2)について、現在ほとんどの機械翻訳システムではトークン分割のためにサブワード分割が用いられているが、従来のサブワード分割は単言語を対象としていた。本研究では、ユニグラム言語モデルを基にして、2言語間のサブワードアライメントを潜在変数とするバイリンガルサブワード分割を提案した。サブワードの対応関係を学習するためにEMアルゴリズムを用いた。ASPECを用いた実験の結果、日英翻訳のBLEU値が26.7%から27.3%まで向上することが確認できた。3)について、潜在拡散モデルを用いることで、マルチモーダル機械翻訳に不要な画像情報を除去する画像変換を行う手法を提案した。Multi30kを用いた実験の結果、BLEU値が41.06%から41.20%まで向上することが確認できた。4)について、階層型モデルの有効性を確認するため、コンテキストアウェアな階層型BARTによる生成型要約の研究を行った。文レベルの情報と単語レベルの情報を階層的に融合するモデルを考案し、自動要約に適用した。実験の結果、要約精度ROUGEが40.88%から40.98%まで向上することが確認できた。
2020年,以使用潜在变量学习上下文感知机器翻译为目标,我们将进行1)使用潜在狄利克雷分配(LDA)的变压器研究,2)使用EM算法的双语子词分割研究,3)研究。使用潜在扩散模型进行多模态机器翻译的研究,以及 4)使用分层 BART 进行生成摘要的研究。关于1),为了确认潜变量主题模型的有效性,我们提出了一种通过在双语句子开头添加LDA给出的标签来进行机器翻译的方法。使用日英双语语料库ASPEC进行的实验结果证实,该方法将翻译准确率BLEU从38.8%提高到39.0%。关于2),目前大多数机器翻译系统都使用子词分割来进行标记分割,但传统的子词分割是针对单一语言的。在本研究中,我们提出了基于一元语言模型的双语子词分割,使用两种语言之间的子词对齐作为潜在变量。 EM算法用于学习子词的对应关系。使用 ASPEC 进行的实验结果证实,日语-英语翻译的 BLEU 值从 26.7% 提高到 27.3%。关于3),我们提出了一种图像变换方法,通过使用潜在扩散模型去除多模态机器翻译中不必要的图像信息。使用Multi30k进行的实验结果证实,BLEU值从41.06%提高到41.20%。关于4),为了确认分层模型的有效性,我们使用上下文感知分层BART进行生成摘要研究。我们设计了一种将句子级信息和词级信息分层组合的模型,并将其应用于自动摘要。实验结果证实,ROUGE的总结准确率从40.88%提高到40.98%。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
バイリンガルサブワード分割のためのEMアルゴリズム
双语子词分割的 EM 算法
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    松井 大樹;二宮 崇;田村 晃裕
  • 通讯作者:
    田村 晃裕
潜在拡散モデルによる変換画像を用いるマルチモーダルニューラル機械翻訳
使用潜在扩散模型转换图像的多模态神经机器翻译
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    湯浅 亮也;田村 晃裕;梶原 智之;二宮 崇;加藤 恒夫
  • 通讯作者:
    加藤 恒夫
Hie-BART: Abstractive Summarization by Hierarchical BART
Hie-BART:分层 BART 的抽象概括
  • DOI:
    10.5715/jnlp.29.835
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    秋山 和輝;田村 晃裕;二宮 崇;梶原 智之
  • 通讯作者:
    梶原 智之
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

二宮 崇其他文献

3年先を見据えたAI~機械学習と深層学習~
AI 展望未来 3 年 ~ 机器学习和深度学习 ~
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    野口 敬輔;小川 達也;安保 良佑;高原 圭太;河野 靖;木下 浩二;二宮 崇;田村 晃裕;高橋 寛;王 森レイ;樋上 善信;藤田 欣裕;二宮 宏;二宮 崇
  • 通讯作者:
    二宮 崇
画像生成による疑似教師データを用いたマルチモーダルニューラル機械翻訳
使用图像生成生成的伪监督数据进行多模态神经机器翻译
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    岩本 裕司;田村 晃裕;二宮 崇
  • 通讯作者:
    二宮 崇
ニューラル機械翻訳のためのアテンション確率のスムージングとゲーティング学習
神经机器翻译的注意力概率平滑和门控学习
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    張 瀟廬;二宮 崇;田村 晃裕
  • 通讯作者:
    田村 晃裕
EGFR変異陽性NSCLCに対するafatinib・bevacizumab併用療法の第I相試験:OLCSG1404
阿法替尼和贝伐珠单抗联合治疗 EGFR 突变阳性 NSCLC 的 I 期研究:OLCSG1404
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    青江 啓介;近森 研一;前田 忠士;亀井 治人;二宮 崇;野上 尚之;別所 昭宏;久山 彰一;藤本 伸一;杉本 啓介;瀧川 奈義夫;木浦 勝行
  • 通讯作者:
    木浦 勝行
CKYに基づく畳み込みアテンション構造を用いたニューラル機械翻訳
基于CKY的使用卷积注意力结构的神经机器翻译
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    渡邊 大貴;田村 晃裕;二宮 崇;Teguh Bharata Adji
  • 通讯作者:
    Teguh Bharata Adji

二宮 崇的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('二宮 崇', 18)}}的其他基金

潜在拡散モデルを用いたニューラル機械翻訳の研究
基于潜在扩散模型的神经机器翻译研究
  • 批准号:
    24K15071
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
主辞駆動句構造文法に基づく並列処理を用いた頑健な自然言語処理の研究
基于头驱动短语结构语法的并行处理鲁棒自然语言处理研究
  • 批准号:
    98J04884
  • 财政年份:
    1998
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows

相似国自然基金

基于Deep-learning的三江源区冰川监测动态识别技术研究
  • 批准号:
    51769027
  • 批准年份:
    2017
  • 资助金额:
    38.0 万元
  • 项目类别:
    地区科学基金项目
基于异构医学影像数据的深度挖掘技术及中枢神经系统重大疾病的精准预测
  • 批准号:
    61672236
  • 批准年份:
    2016
  • 资助金额:
    64.0 万元
  • 项目类别:
    面上项目
具有时序处理能力的Spiking-Deep Learning(脉冲深度学习)方法研究
  • 批准号:
    61573081
  • 批准年份:
    2015
  • 资助金额:
    64.0 万元
  • 项目类别:
    面上项目

相似海外基金

Developing and Visualising a Retrieval-Augmented Deep Learning Model for Population Health Management
开发和可视化用于人口健康管理的检索增强深度学习模型
  • 批准号:
    2905946
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Studentship
DMS-EPSRC: Asymptotic Analysis of Online Training Algorithms in Machine Learning: Recurrent, Graphical, and Deep Neural Networks
DMS-EPSRC:机器学习中在线训练算法的渐近分析:循环、图形和深度神经网络
  • 批准号:
    EP/Y029089/1
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Research Grant
Navigating Chemical Space with Natural Language Processing and Deep Learning
利用自然语言处理和深度学习驾驭化学空间
  • 批准号:
    EP/Y004167/1
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Research Grant
CAREER: Adaptive Deep Learning Systems Towards Edge Intelligence
职业:迈向边缘智能的自适应深度学习系统
  • 批准号:
    2338512
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Continuing Grant
MFB: Better Homologous Folding using Computational Linguistics and Deep Learning
MFB:使用计算语言学和深度学习更好的同源折叠
  • 批准号:
    2330737
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了