基于强化学习的神经机器翻译研究
项目介绍
AI项目解读
基本信息
- 批准号:61876174
- 项目类别:面上项目
- 资助金额:16.0万
- 负责人:
- 依托单位:
- 学科分类:F0606.自然语言处理
- 结题年份:2019
- 批准年份:2018
- 项目状态:已结题
- 起止时间:2019-01-01 至2019-12-31
- 项目参与者:刘群; 张金超; 马青松; 张文; 李京谕; 薛海洋;
- 关键词:
项目摘要
Recently reinforcement learning has shown its superiority on machine translation and drawn more attention. It works by adjusting the behavior of the agent according to the defined rewards so that the agent can take the action which leads to a high reward. In this project, we apply reinforcement learning to resolve the problem caused by the discrepancy of target context between training and test. We take as the teacher the model which uses as context the previous words from ground truth translation, and take as the student the model which uses as context the previous word generated by the model, then use the probabilities from the teacher as rewards to guide the training of the student under the framework of reinforcement learning.
最近强化学习在机器翻译中表现出优异的性能,受到越来越多的关注。它通过定义的奖励函数来调整当前智能体的行为,使得智能体倾向于采用奖励高的行动。本项目采用强化学习的方法来解决神经机器翻译中由于训练和测试使用的上文不一致引起模型偏差的问题。我们将以参考译文中的词为上文得到模型作为老师模型,将以模型生成的词作为上文得到的模型作为学生模型,用老师模型生成奖励来指导学生模型进行优化。
结项摘要
神经机器翻译中的曝光偏差问题受到了人们越来越多的关注。曝光偏差是指神经机器翻译模型的词级别优化方法中存在的训练与测试不一致的现象。目前,通常的解决方案是使用序列级训练方法来缓解模型的曝光偏差问题,对模型的序列级训练则一般是基于强化学习算法来实现。在本项目中,一方面,我们提出了谕示词方法,通过在训练时向模型输入一定的谕示词来减小训练与测试的差异,在基于强化学习的序列级训练方法外探索了缓解曝光偏差问题的另一种思路。实验表明,谕示词方法能有效地缓解翻译模型的曝光偏差、提升模型的翻译质量;另一方面,我们进一步地探索了强化学习算法在神经机器翻译上的应用,验证了序列级训练在非自回归模型上的有效性。实验表明,对非自回归模型进行基于强化学习的序列级训练能有效地提升模型的翻译质量、减少译文中的过翻译、漏翻译错误。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(1)
会议论文数量(9)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
创伤失血性休克限制性液体复苏的研究进展
- DOI:--
- 发表时间:2012
- 期刊:中国急救医学 》.2012:32(6):542-545(通讯作者)2012
- 影响因子:--
- 作者:冯洋;尹文
- 通讯作者:尹文
基于油田企业服务总线的一体化无缝集成技术
- DOI:--
- 发表时间:2015
- 期刊:化工自动化及仪表
- 影响因子:--
- 作者:霍凤财;孙宝翔;任伟建;冯洋
- 通讯作者:冯洋
1-己基-3-甲基咪唑四氟硼酸盐离子液体对蓖麻油润滑性能的影响
- DOI:--
- 发表时间:2015
- 期刊:摩擦学学报
- 影响因子:--
- 作者:钱善华;李庆忠;冯洋;刘利国
- 通讯作者:刘利国
阻断NF-B信号途径防治急性肺损伤的研究进展
- DOI:--
- 发表时间:--
- 期刊:中国急救医学
- 影响因子:--
- 作者:冯洋;尹文
- 通讯作者:尹文
手术联合口服中药膏方治疗胫骨骨折不愈合的疗效观察
- DOI:--
- 发表时间:2018
- 期刊:中国骨与关节损伤杂志
- 影响因子:--
- 作者:章晓云;梁庆华;陈跃平;周桂玲;林楚;朱继翀;冯洋;卓映宏;容向宾
- 通讯作者:容向宾
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}

内容获取失败,请点击重试

查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图

请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
冯洋的其他基金
非自回归神经机器翻译关键技术研究
- 批准号:62376260
- 批准年份:2023
- 资助金额:52.00 万元
- 项目类别:面上项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}