基于深度学习的机器译文质量估计方法研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61462044
  • 项目类别:
    地区科学基金项目
  • 资助金额:
    46.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0211.信息检索与社会计算
  • 结题年份:
    2018
  • 批准年份:
    2014
  • 项目状态:
    已结题
  • 起止时间:
    2015-01-01 至2018-12-31

项目摘要

As a new method for automatic evaluation of machine translation, quality estimation of machine translation not only can replace the traditional methods on automatically evaluating the translation quality to some extent, but also can provide a new weight optimization mode for statistical translation system. However, there exist some shortcomings in nowadays research on quality estimation of machine translation, such as it depend heavily on linguistic analysis and algorithm complexity is high in feature extraction, as well as its performance is not satisfactory, and all of which restricts severely its application in self-training of statistical translation system etc. Thus, this project will investigate and delve deeply in the following areas: (1) study a new model to quality estimation of machine translation, establish a layer by layer structured representation of machine translation based on recursive neural network and a translation quality estimated model based on soft-max regression to improve the effect of quality estimation. (2) not only investigate the approach of quality estimation for English translation, but also investigate the approach for Chinese translation by annotating a certain amount of translation quality of Chinese translation and combining the characteristics of Chinese word segmentation in Chinese translation.(3)investigate the self-training issue of statistical translation system without development set, achieve the optimization algorithm of feature weights by integrating the decoding knowledge of machine translation system and reducing the iteration times in feature weights optimization. Finally, we will establish a new framework for quality estimation of machine translation, which will promote the development of research on machine translation.
作为一种新的译文自动评价方法,机器译文质量估计不仅能一定程度上替代传统方法自动评价译文质量,而且能提供一种全新的统计翻译系统特征权重优化方式。针对目前机器译文质量估计中特征提取严重依赖语言学分析、算法复杂度高、译文质量估计效果不够理想且这些严重制约着其在统计翻译系统自训练中的应用等不足,本项目将在以下方面进行深入的研究和探索:(1)研究新的机器译文质量估计模型,通过建立基于递归神经网络的机器译文逐层结构化表示和基于soft-max回归的译文质量估计模型,提高估计的效果。(2)不仅研究英语译文的质量估计方法,而且通过标注一定规模的汉语译文质量语料并结合汉语译文分词特点,对汉语译文的质量估计方法展开研究。(3)探索无需开发集的统计翻译系统自训练方法,结合解码时的知识和减少特征权重优化的迭代次数,将新的译文质量估计方法应用于翻译系统自训练中。最终建立机器译文质量估计的新框架,推动机器翻译的发展。

结项摘要

机器译文质量估计是指不使用人工参考译文的情况下自动估计机器翻译的质量。作为一种新的译文自动评价方法,它在机器翻译后编辑和辅助机器翻译等方面发挥着重要作用。针对目前机器译文质量估计中特征提取严重依赖语言学分析、算法复杂度高、译文质量估计效果不够理想等不足,本项目进行了如下的研究:.(1) 提出了将当前译文质量估计中“预测器”和“估计器”两个子网络联合成单个端到端的神经网络并一起训练的方法。相比于预测器-估计器模型,联合神经网络模型针对译文质量估计进行细粒度的参数训练,训练后的神经网络更适合译文质量估计任务。我们使用提出的方法参加WMT18 句子级别译文质量估计评测,在6个评测子方向上,取得了3个方向上的第1名;2个方向上的并列第1名;1个方向上的第3名。.(2) 提出利用深度学习中上下文单词预测模型和矩阵分解模型训练词向量作为特征,并将其与递归神经网络语言模型特征相结合来提高译文质量自动估计与人工评价的相关性。在WMT15和WMT16 译文质量估计子任务数据集上的实验结果表明,利用上下文单词预测模型训练词向量特征的方法统计一致的优于传统的QuEst方法和连续空间语言模型词向量特征提取方法。.(3) 在机器翻译自动评价方面,提出了抽取与测试领域相关的复述来提高机器译文自动评价的方法。首先将通用单语训练语料进行聚类,并利用改进的M-L方法过滤得到特定领域训练语料,然后在训练语料中利用Markov网络模型抽取特定领域复述表,最后将此复述表应用在机器译文自动评价中以提高同义词和近义词的匹配精度。我们使用提出的方法参加WMT16 机器翻译自动评价评测,该方法在其他欧洲语言到英语的翻译任务系统级别评价中取得了第1名,在混合翻译结果系统级别评价中取得了第1名。.在项目研究过程中,共发表学术论文14篇;成功申请软件著作权2项;培养硕士研究生6名。

项目成果

期刊论文数量(9)
专著数量(0)
科研奖励数量(0)
会议论文数量(5)
专利数量(0)
Optimizing Automatic Evaluation of Machine Translation with the ListMLE Approach
使用 ListMLE 方法优化机器翻译的自动评估
  • DOI:
    10.1145/3226045
  • 发表时间:
    2018-11
  • 期刊:
    ACM Transactions on Asian and Low-Resource Language Information Processing
  • 影响因子:
    2
  • 作者:
    李茂西;王明文
  • 通讯作者:
    王明文
机器翻译自动评价中领域知识复述抽取研究
  • DOI:
    --
  • 发表时间:
    2017
  • 期刊:
    北京大学学报(自然科学版)
  • 影响因子:
    --
  • 作者:
    张丽林;李茂西;肖文艳;万剑怡;王明文
  • 通讯作者:
    王明文
基于翻译质量估计的神经网络译文自动后编辑
  • DOI:
    10.13209/j.0479-8023.2017.153
  • 发表时间:
    2018
  • 期刊:
    北京大学学报(自然科学版)
  • 影响因子:
    --
  • 作者:
    谭亦鸣;王明文;李茂西
  • 通讯作者:
    李茂西
基于word2vec的大中华区词对齐库的构建
  • DOI:
    --
  • 发表时间:
    2015
  • 期刊:
    中文信息学报
  • 影响因子:
    --
  • 作者:
    王明文;徐雄飞;徐凡;李茂西
  • 通讯作者:
    李茂西
Modeling Monolingual Character Alignment for Automatic Evaluation of Chinese Translation
中文翻译自动评估的单语字符对齐建模
  • DOI:
    10.1145/2815619
  • 发表时间:
    2016-01
  • 期刊:
    ACM TRANSACTIONS ON ASIAN AND LOW-RESOURCE LANGUAGE INFORMATION PROCESSING
  • 影响因子:
    2
  • 作者:
    Maoxi Li;Mingwen Wang;Hanxi Li;Fan Xu
  • 通讯作者:
    Fan Xu

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

基于子词的句子级别神经机器翻译的译文质量估计方法
  • DOI:
    --
  • 发表时间:
    2020
  • 期刊:
    厦门大学学报(自然科学版)
  • 影响因子:
    --
  • 作者:
    李培芸;翟煜锦;项青宇;李茂西;裘白莲;罗文兵;王明文
  • 通讯作者:
    王明文
“细粒度英汉机器翻译错误分析语料库”的构建与思考
  • DOI:
    --
  • 发表时间:
    2022
  • 期刊:
    中文信息学报
  • 影响因子:
    --
  • 作者:
    裘白莲;王明文;李茂西;陈聪;徐凡
  • 通讯作者:
    徐凡
基于主位-述位结构理论的英文作文连贯性建模研究
  • DOI:
    --
  • 发表时间:
    2016
  • 期刊:
    中文信息学报
  • 影响因子:
    --
  • 作者:
    徐凡;王明文;谢旭升;李茂西;万剑怡
  • 通讯作者:
    万剑怡
基于ListMLE排序学习方法的机器译文自动评价研究
  • DOI:
    --
  • 发表时间:
    2013
  • 期刊:
    中文信息学报
  • 影响因子:
    --
  • 作者:
    李茂西;江爱文;王明文
  • 通讯作者:
    王明文
基于词项—句子—文档三层图模型的多文档自动摘要
  • DOI:
    --
  • 发表时间:
    2014
  • 期刊:
    中文信息学报
  • 影响因子:
    --
  • 作者:
    熊娇;王明文;李茂西;万剑怡
  • 通讯作者:
    万剑怡

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

李茂西的其他基金

融合词级特征和深度交叉网络的机器译文自动评价
  • 批准号:
    62366020
  • 批准年份:
    2023
  • 资助金额:
    33 万元
  • 项目类别:
    地区科学基金项目
自动后处理和语法错误校正驱动的译文质量提高方法
  • 批准号:
    61662031
  • 批准年份:
    2016
  • 资助金额:
    40.0 万元
  • 项目类别:
    地区科学基金项目
基于语言理解的机器翻译译文自动评价方法研究
  • 批准号:
    61203313
  • 批准年份:
    2012
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码