品質推定に基づく半教師あり機械翻訳

基于质量估计的半监督机器翻译

基本信息

  • 批准号:
    20K19861
  • 负责人:
  • 金额:
    $ 2.58万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
  • 财政年份:
    2020
  • 资助国家:
    日本
  • 起止时间:
    2020-04-01 至 2024-03-31
  • 项目状态:
    已结题

项目摘要

本研究では、自然言語処理モデルによる出力文を正解文なしで自動評価する品質推定に取り組み、これを活用して半教師ありの設定で機械翻訳をはじめとするテキスト生成モデルを訓練する。今年度は、品質推定の研究に取り組むとともに、品質推定などの評価の技術を機械翻訳の訓練に活用するための強化学習の研究にも取り組んだ。(i) Encoderモデルに基づく機械翻訳の品質推定:複数言語のデータを用いて単語穴埋めの事前学習を行ったマスク言語モデルをベースに、言語横断の文間意味的類似度推定モデルを構築した。提案手法では、マスク言語モデルから得られる文ベクトルを、言語情報を表す言語ベクトルと意味情報を表す意味ベクトルに分離した。特に、言語情報と意味情報の分離を促すために、敵対的学習を行い、意味ベクトルから入力言語を判別できないように工夫した。この意味ベクトルを用いて、入力文と出力文の間の意味的類似度推定を行うことで、正解文や人手評価値を使用しない教師なし設定での品質推定を実現した。実験の結果、Encoderモデルに基づく機械翻訳の教師なし品質推定において、最高性能を達成した。(ii) Encoder-Decoderモデルに基づく機械翻訳の品質推定:複数言語のデータを用いて単語穴埋めの事前学習を行った系列変換モデルをベースに、言語横断の文間意味的類似度推定モデルを構築した。提案手法では、入力文から出力文を生成する際の文生成確率に基づき、正解文や人手評価値を使用しない教師なし設定での品質推定を実現した。実験の結果、特に多資源言語対において、Encoderモデルに基づく品質推定の性能を上回ることを確認した。(iii) 機械翻訳のための強化学習:様々な評価指標を報酬として機械翻訳の強化学習を行った。実験の結果、マスク言語モデルに基づく評価指標を報酬とすることで、機械翻訳の品質を改善できることを確認した。
在这项研究中,我们将致力于质量估计,在不使用正确句子的情况下自动评估自然语言处理模型的输出句子,并将利用它来训练文本生成模型,例如半监督环境中的机器翻译。今年,除了研究质量估计之外,我们还进行了强化学习的研究,以在机器翻译训练中利用质量估计等评估技术。 (i) 基于编码器模型的机器翻译质量估计:我们基于掩码语言模型构建了跨语言句子间语义相似度估计模型,该模型经过预训练,可以使用多种语言的数据来填补空白。在所提出的方法中,从掩码语言模型获得的句子向量被分成表示语言信息的语言向量和表示语义信息的语义向量。特别是,为了促进语言信息和语义信息的分离,我们进行了对抗性学习,并设计了一种防止从语义向量确定输入语言的方法。通过使用这个语义向量来估计输入和输出句子之间的语义相似度,我们在不使用正确句子或人类评估值的无监督设置中实现了质量估计。实验结果表明,我们在基于 Encoder 模型的机器翻译无监督质量估计方面取得了最高性能。 (ii) 基于编码器-解码器模型的机器翻译质量估计:基于序列转换模型构建跨语言句子间语义相似度估计模型,该模型已使用多种语言的数据进行填词预训练。做过。该方法基于从输入句子生成输出句子时的句子生成概率,在无监督的环境中实现质量估计,无需使用正确的句子或人类评估值。实验结果表明,我们的方法优于基于编码器模型的质量估计,特别是对于具有许多资源的语言对。 (iii)机器翻译的强化学习:使用各种评价指标作为奖励来进行机器翻译的强化学习。实验结果表明,使用基于掩码语言模型的评价指标作为奖励可以提高机器翻译的质量。

项目成果

期刊论文数量(8)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Unsupervised Quality Estimation via Multilingual Denoising Autoencoder
通过多语言去噪自动编码器进行无监督质量估计
  • DOI:
    10.5715/jnlp.29.669
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    西原哲郎; 岩本裕司; 吉仲真人; 梶原智之; 荒瀬由紀; 二宮崇
  • 通讯作者:
    二宮崇
Optimization of Reference-less Evaluation Metric of Grammatical Error Correction for Manual Evaluations
手动评估语法纠错无参考评估指标的优化
  • DOI:
    10.5715/jnlp.28.404
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    吉村綾馬; 金子正弘; 梶原智之; 小町守
  • 通讯作者:
    小町守
Comparing BERT-based Reward Functions for Deep Reinforcement Learning in Machine Translation
比较机器翻译中深度强化学习的基于 BERT 的奖励函数
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yuki Nakatani; Tomoyuki Kajiwara; Takashi Ninomiya
  • 通讯作者:
    Takashi Ninomiya
Language-agnostic Representation from Multilingual Sentence Encoders for Cross-lingual Similarity Estimation
用于跨语言相似性估计的多语言句子编码器的与语言无关的表示
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Nattapong Tiyajamorn; Tomoyuki Kajiwara; Yuki Arase; Makoto Onizuka
  • 通讯作者:
    Makoto Onizuka
Text Simplification with Reinforcement Learning using Supervised Rewards on Grammaticality, Meaning Preservation, and Simplicity
使用语法性、意义保存和简单性方面的监督奖励通过强化学习来简化文本
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Akifumi Nakamachi; Tomoyuki Kajiwara; Yuki Arase
  • 通讯作者:
    Yuki Arase
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

梶原 智之其他文献

梶原 智之的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似海外基金

既存住宅の維持管理の状態を考慮した資産価値評価手法の開発
开发考虑现有住房维护状况的资产价值评估方法
  • 批准号:
    22K01480
  • 财政年份:
    2022
  • 资助金额:
    $ 2.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Innovative human "emotion / preference / satisfaction" estimation system realized by wearable devices
可穿戴设备实现的创新人类“情感/偏好/满意度”评估系统
  • 批准号:
    21K11902
  • 财政年份:
    2021
  • 资助金额:
    $ 2.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
溶接モニタリングと深層学習の融合による溶接品質その場推定と判断根拠の可視化
焊接监控与深度学习相结合的现场焊接质量评估及判断依据可视化
  • 批准号:
    21K03806
  • 财政年份:
    2021
  • 资助金额:
    $ 2.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
溶接モニタリングと深層学習の融合による溶接品質その場推定と判断根拠の可視化
焊接监控与深度学习相结合的现场焊接质量评估及判断依据可视化
  • 批准号:
    21K03806
  • 财政年份:
    2021
  • 资助金额:
    $ 2.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
深層学習を用いた形質推定アルゴリズムの開発と有用品種のデザイン
利用深度学习开发性状估计算法和有用品种的设计
  • 批准号:
    20J20016
  • 财政年份:
    2020
  • 资助金额:
    $ 2.58万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了