引入功能语篇分析的汉英语篇统计机器翻译方法研究
项目介绍
AI项目解读
基本信息
- 批准号:61573294
- 项目类别:面上项目
- 资助金额:66.0万
- 负责人:
- 依托单位:
- 学科分类:F0606.自然语言处理
- 结题年份:2019
- 批准年份:2015
- 项目状态:已结题
- 起止时间:2016-01-01 至2019-12-31
- 项目参与者:史晓东; 周昌乐; 郑泽芝; 苏劲松; 郑旭玲; 曾华琳; 黄研洲; 邬昌兴; 胡金铭;
- 关键词:
项目摘要
In the project, researches on how to incorporate functional discourse analysis and rhetorical structure knowledge in statistical machine translation (SMT) models will be conducted. Besides the problem of setting up a discourse-based SMT model driven by functional structures and rhetorical structures, two other key problems will be investigated in this project. One is how to implement the automatic functional analysis of Chinese discourse, and the other is how to model the features for Chinese rhetorical relation classification. For the first problem, a method based on the synergetic theory will be studied. For the second one, we will introduce an approach based on complex network analysis. The project comprises four primary phases. Firstly, we will study an automatic method for functional analysis of Chinese discourses, in which structures of different functional will be labeled synchronously by using a method base on Synergetic Neural Network (SNN). Secondly, we will conduct a research on modeling the features for Chinese rhetorical relation classification, in which a method based on complex network analysis will be introduced. Thirdly, we will carry out research on automatic partition of Chinese sentence groups, in which both thematic progression knowledge and rhetorical knowledge will be used. Finally, based on the above phases, we will try to set up a discourse-based statistical machine translation model driven by functional structures and rhetorical structures, which will consist of three sub models: a model for Chinese-English discourse structures transformation, a discourse-aware sentence translation model, and a model for English discourse combination. Obviously, the work of this project is significant for machine translation research, research on functional discourse analysis and rhetoric-related research.
扩展到语篇层是统计机器翻译进一步发展的一种可能途径。这方面的研究目前刚刚起步,特别是,语篇结构分析还不够深入。针对这一问题,本项目拟以系统功能语言学和修辞学理论为指导,建立以汉语小句功能结构和语篇修辞结构为驱动的汉英语篇统计机器翻译模型。项目主要研究内容包括有:汉语小句功能分析方法研究、汉语语篇修辞关系分析方法研究、汉语句群划分方法研究、汉英语篇结构转译模型研究、基于句群全局信息的汉英小句翻译模型研究、英语译文语篇拼接模型研究等。为实现汉语小句功能自动标注,本项目将研究利用概念、交际和语篇三大纯理功能相互关联与协同互动的特点,借助协同神经网络模型实现这三个功能的一体化标注;为了对汉语修辞格层进行关系特征建模,本项目将借助复杂网络的数据分析方法,这为修辞学的计算研究提供了新思路。很明显,这项研究无论对统计机器翻译研究、功能语篇分析研究或是对汉语修辞学研究,都是有着重要理论意义与实际意义的。
结项摘要
本项目旨在以系统功能语言学和修辞学理论为指导实现机器翻译模型的篇章层改造,项目组围绕相互关联的4个方面开展了深入研究:(1)在功能语篇建模与语篇分析相关研究方面,项目组结合系统功能语法和汉语篇章研究成果,制订了汉语语篇主述标注规范并建设了相关语料,进而实现了汉语语篇主述自动标注方法;同时,针对语篇关系识别问题,项目组提出了结合协同训练方法、结合双语限制合成数据和多任务训练方式、结合语篇增强嵌入表示等多种有效的语篇隐式关系识别方法,这些工作为融合语篇的机器翻译建模奠定了坚实的基础。(2)在融合语篇语义的神经机器翻译研究方面,项目组建立了性能优秀的基线神经翻译系统,提出了格到序列、结合词性增强注意力、结合时态注意力等多个创新的神经翻译改进模型,最终建立了结合主述信息的篇章神经翻译模型,实现机器翻译模型的篇章级改造。(3)在语义分析与语义表示相关研究方面,项目组提出了从传统语义资源构建概率框架库的方法,建立了基于自注意力机制的深度语义角色标注方法,尝试了结合脑电技术的词汇语义相似度标准集建立与验证方式,提出了融合双语语义约束的词汇嵌入表示方法,这些工作对汉语语篇分析起到了良好的辅助和补充。(4)在稀缺资源机器翻译研究与多模态机器翻译研究方面,项目组实现了性能优异的藏汉双向神经翻译系统,提出了基于增量自学习的多语言机器翻译方法,建立了汉英语音翻译模型和相应的同声传译系统,并探索了中国手语神经翻译方法,这些工作通过拓展应用进一步验证了篇章增强机器翻译模型的有效性。整体而言,项目组通过4年的项目执行,达成了预期的研究目标,取得了较丰富的成果:累计在本领域重要学术期刊和会议上发表标注论文19篇,其中SCI检索7篇,EI检索13篇,AAAI、ACL、EMNLP等本领域顶级会议论文各1篇;获得西藏自治区科学技术奖一等奖1次;举办全国性学术会议1次;受邀做全国性学术论坛特邀报告1次;培养毕业了2位博士研究生、5位硕士研究生。
项目成果
期刊论文数量(10)
专著数量(0)
科研奖励数量(1)
会议论文数量(9)
专利数量(0)
Leveraging bilingually-constrained synthetic data via multi-task neural networks for implicit discourse relation recognition
通过多任务神经网络利用双语约束合成数据进行隐式话语关系识别
- DOI:10.1016/j.neucom.2017.02.084
- 发表时间:2017-06
- 期刊:Neurocomputing
- 影响因子:6
- 作者:Wu Changxing;Shi Xiaodong;Chen Yidong;Huang Yanzhou;Su Jinsong
- 通讯作者:Su Jinsong
Lattice-to-sequence attentional Neural Machine Translation models
格到序列注意力神经机器翻译模型
- DOI:10.1016/j.neucom.2018.01.010
- 发表时间:2018-04-05
- 期刊:NEUROCOMPUTING
- 影响因子:6
- 作者:Tan, Zhixing;Su, Jinsong;Shi, Xiaodong
- 通讯作者:Shi, Xiaodong
POS Tag-enhanced Coarse-to-fine Attention for Neural Machine Translation
用于神经机器翻译的 POS 标签增强的从粗到细的注意力
- DOI:10.1145/3321124
- 发表时间:2019
- 期刊:ACM Transactions on Asian and Low-Resource Language Information Processing
- 影响因子:2
- 作者:Yin Yongjing;Su Jinsong;Wen Huating;Zeng Jiali;Liu Yang;Chen Yidong
- 通讯作者:Chen Yidong
基于特征自动选择方法的汉语隐喻计算
- DOI:--
- 发表时间:2016
- 期刊:厦门大学学报(自然科学版)
- 影响因子:--
- 作者:曾华琳;周昌乐;陈毅东;史晓东
- 通讯作者:史晓东
Exploring Implicit Semantic Constraints for Bilingual Word Embeddings
探索双语词嵌入的隐式语义约束
- DOI:10.1007/s11063-017-9762-8
- 发表时间:2017-11
- 期刊:Neural Processing Letters
- 影响因子:3.1
- 作者:Su Jinsong;Song Zhenqiao;Lu Yaojie;Xu Mu;Wu Changxing;Chen Yidong
- 通讯作者:Chen Yidong
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
语料库语言学视角下的台湾汉字简化研究
- DOI:--
- 发表时间:2014
- 期刊:北京大学学报(自然科学版)
- 影响因子:--
- 作者:史晓东;陈毅东;任文瑶;阎思瑶
- 通讯作者:阎思瑶
引入集成学习的最大熵短语调序模型
- DOI:--
- 发表时间:2014
- 期刊:中文信息学报
- 影响因子:--
- 作者:苏劲松;史晓东;陈毅东;黄研洲
- 通讯作者:黄研洲
引入复述技术的统计机器翻译研究综述
- DOI:--
- 发表时间:2013
- 期刊:智能系统学报
- 影响因子:--
- 作者:胡金铭;史晓东;苏劲松;陈毅东
- 通讯作者:陈毅东
引入基于主题复述知识的统计机器翻译模型
- DOI:--
- 发表时间:2014
- 期刊:浙江大学学报(工学版)
- 影响因子:--
- 作者:董槐林;陈毅东;史晓东;吴清强
- 通讯作者:吴清强
基于层次聚类的中文词义归纳(英文)
- DOI:--
- 发表时间:2010
- 期刊:心智与计算
- 影响因子:--
- 作者:蔡科;史晓东;陈毅东;黄哲煌
- 通讯作者:黄哲煌
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
陈毅东的其他基金
融合手语语言学知识的中国手语神经翻译方法研究
- 批准号:62076211
- 批准年份:2020
- 资助金额:58 万元
- 项目类别:面上项目
引入多源知识空间及协同语义分析的统计机器翻译方法研究
- 批准号:61005052
- 批准年份:2010
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}