面向资源稀缺型语言的机器翻译理论方法及关键技术研究
项目介绍
AI项目解读
基本信息
- 批准号:61732005
- 项目类别:重点项目
- 资助金额:295.0万
- 负责人:
- 依托单位:
- 学科分类:F0211.信息检索与社会计算
- 结题年份:2022
- 批准年份:2017
- 项目状态:已结题
- 起止时间:2018-01-01 至2022-12-31
- 项目参与者:黄河燕; 朱靖波; 线岩团; 史树敏; 张春良; 高盛祥; 张俐; 鉴萍; 毛存礼;
- 关键词:
项目摘要
Machine Translation is one of the priority research areas in National Medium and Long-term Scientific and Technological Development Plan In the last decade, Machine Translation has witnessed great progress in several translation tasks of resource-rich languages, but translation between resource-poor languages is still difficult due to its inherent dependence to parallel resource. This proposal plan to research on the Machine Translation between resource-poor languages, and the focuses are: 1) Oriented to resource-poor languages, research on the representation theory and learning approaches of Machine Translation knowledge, and integrating different resource characteristics, propose the approaches to distribution representation learning of monolingual knowledge and cross-language translation knowledge; 2) Research on the Machine Translation models for resource-poor languages, propose the Neural Machine Translation framework based on multi-encoder and multi-decoder, integrate multi-level monolingual and bilingual translation knowledge, and achieve multilingual collaborative translation by using different resources; 3) Working on corpus acquiring of resource-poor languages and development of the Machine Translation platform and system oriented to Southeast Asian languages (Vietnamese, Lao, Burmese, Cambodian, Thai, etc.). This proposal has important implications for advancing the research of natural language processing and artificial intelligence, serves for the Belt and Road Initiatives, and simultaneously has important practical value in cooperation and communication between China and Southeast Asian countries.
机器翻译符合国家中长期科技发展规划。虽然近十年机器翻译在资源丰富语言间取得了长足进步,但由于对语言对齐资源的高度依赖,资源稀缺语言的机器翻译依然举步维艰。鉴于此,项目将针对资源稀缺语言机器翻译开展深入研究:1)研究面向资源稀缺语言的翻译知识表示理论及表示学习方法,结合不同语料特点,提出单语知识分布表示学习及跨语言翻译知识学习方法;2)研究面向资源稀缺型语言的翻译方法,提出基于多编码-多解码机制的神经机器翻译框架,融合多层次单语知识及跨语言翻译知识,有效利用不同资源实现多语言协同翻译;3)研究面向资源稀缺型语言的语料资源获取及翻译平台构建,研发面向东南亚语言的机器翻译原型系统。项目对推动自然语言处理及人工智能学科发展具有重要的科学意义,符合国家“一带一路”战略,对推动与东南亚国家的合作交流具有重要的应用价值。
结项摘要
近几年神经机器翻译取得了令人瞩目的突破,但资源稀缺语言翻译还面临双语资源稀缺、翻译模型学习不充分等难题,翻译性能还不理想。项目以东南亚语言为主要研究对象,围绕翻译语料库构建及语言解析、知识表示与学习、机器翻译模型构建等开展研究,取得了积极进展:1.在翻译语料库构建方面,提出了基于多源数据及语言知识挖掘的双语词典及平行句对自动构建技术,构建了当前最大规模的东南亚语言翻译语料库;2.在语言解析方面,提出了融合多粒度特征和跨语言知识的东南亚语言分句、分词、实体识别及句法解析方法,研发了东南亚语言解析平台;3.在语言知识表示与学习方面,提出了面向资源稀缺语言的跨语言预训练、多层知识表示融合等方法,有效提升了翻译模型对语言知识的表示和学习能力;4.在机器翻译模型架构方面,提出了基于深度Transformer的翻译建模、基于网络结构搜索的模型自动优化、深层网络训练和基于参数共享和知识蒸馏的模型压缩等系列方法,从模型结构设计、模型训练和模型部署等方面提出了适合资源稀缺语言的模型架构和解决方案,显著提升了资源稀缺语言机器翻译性能;5.在先验知识融合方面,提出了融合分类词典、多粒度词法、句法等知识的翻译方法,解决了连续向量表示的神经机器翻译模型与概率化离散表示的翻译知识融合困难的问题;6.在多语言协同和多模态信息融合方面,提出了基于语义空间映射的多语言翻译、噪声鲁棒的跨模态交互学习等系列方法,通过对富资源语言对及语音图像等信息的充分利用,有效缓解了翻译模型对平行数据的过渡依赖问题。7.研发了云岭翻译和小牛翻译,支持300多个语种的机器翻译,在WMT翻译评测中,共取得了10次第一,7次第二和8次第三名的优异成绩。相关成果在国家安全、公众服务、疫情防控、国际交流合作等方面得到了广泛应用,日均翻译量超5亿字符,经济社会效益显著。项目发表论文93篇,其中CCF A/B类论文29篇,SCI/EI收录70篇,授权发明专利23项,受理发明专利35项,登记软件著作权13项,出版专著1部,承办国际国内学术会议7次,参加国际国内学术会议400余人次。获得国家及省级人才称号17人次,培养博士21人、硕士114人、获得省级优秀硕士论文7篇。项目还获得云南省科技进步特等奖1项和自然科学三等奖1项。
项目成果
期刊论文数量(47)
专著数量(1)
科研奖励数量(2)
会议论文数量(46)
专利数量(58)
Relation-aware attention for video captioning via graph learning
通过图学习对视频字幕进行关系感知关注
- DOI:--
- 发表时间:2021
- 期刊:Pattern Recognition
- 影响因子:8
- 作者:Yunbin Tu;Chang Zhou;Junjun Guo;Huafeng Li;Shengxiang Gao;Zhengtao Yu
- 通讯作者:Zhengtao Yu
从粗粒度到细粒度的神经机器翻译系统推断加速方法
- DOI:10.6043/j.issn.0438-0479.201909012
- 发表时间:2020
- 期刊:厦门大学学报. 自然科学版
- 影响因子:--
- 作者:张裕浩;许诺;李垠桥;肖桐;朱靖波
- 通讯作者:朱靖波
融合EMD最小化双语词典的汉-越无监督神经机器翻译
- DOI:--
- 发表时间:2021
- 期刊:中文信息学报
- 影响因子:--
- 作者:薛明亚;余正涛;文永华;于志强
- 通讯作者:于志强
融入语言差异化特征的汉越神经机器翻译译文质量估计
- DOI:10.20009/j.cnki.21-1106/tp.2020-1084
- 发表时间:2022
- 期刊:小型微型计算机系统
- 影响因子:--
- 作者:邹翔;朱俊国;高盛祥;余正涛;杨福岸
- 通讯作者:杨福岸
Enhancing low-resource neural machine translation with syntax-graph guided self-attention
通过语法图引导的自注意力增强低资源神经机器翻译
- DOI:10.1016/j.knosys.2022.108615
- 发表时间:2022
- 期刊:Knowledge-Based Systems
- 影响因子:8.8
- 作者:Longchao Gong;Yan Li;Junjun Guo;Zhengtao Yu;Shengxiang Gao
- 通讯作者:Shengxiang Gao
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
用深度可信网抽取中文特定领域的实体属性关系
- DOI:--
- 发表时间:2016
- 期刊:Int. J. Computing Science and Mathematics
- 影响因子:--
- 作者:郭剑毅;周兰江;余正涛;陈玮
- 通讯作者:陈玮
基于源语言句法增强解码的神经机器翻译方法
- DOI:--
- 发表时间:2021
- 期刊:计算机应用
- 影响因子:--
- 作者:龚龙超;郭军军;余正涛
- 通讯作者:余正涛
越南语短语树到依存树的转换研究
- DOI:--
- 发表时间:2016
- 期刊:计算机科学与探索
- 影响因子:--
- 作者:李英;郭剑毅;余正涛;毛存礼;线岩团
- 通讯作者:线岩团
基于标签传播算法的新词情感极性识别
- DOI:--
- 发表时间:2015
- 期刊:计算机科学与探索
- 影响因子:--
- 作者:余正涛;严馨;高盛祥;线岩团
- 通讯作者:线岩团
基于随机游走策略的专家关系网络构建
- DOI:--
- 发表时间:2016
- 期刊:山东大学学报(理学版)
- 影响因子:--
- 作者:余正涛;秦雨;程韵如;庙介璞
- 通讯作者:庙介璞
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
余正涛的其他基金
面向小语种的多语言事件分析及态势感知方法研究
- 批准号:
- 批准年份:2021
- 资助金额:267 万元
- 项目类别:联合基金项目
基于枢轴语言的汉越句法统计翻译方法研究
- 批准号:61672271
- 批准年份:2016
- 资助金额:61.0 万元
- 项目类别:面上项目
汉越双语事件语料库构建及舆情观点挖掘方法研究
- 批准号:61472168
- 批准年份:2014
- 资助金额:84.0 万元
- 项目类别:面上项目
纳西-汉语双语语料库构建与翻译方法研究
- 批准号:61163022
- 批准年份:2011
- 资助金额:49.0 万元
- 项目类别:地区科学基金项目
专家检索资源获取与学习排序方法研究
- 批准号:61175068
- 批准年份:2011
- 资助金额:57.0 万元
- 项目类别:面上项目
受限域汉语问答系统普适性理论与方法研究
- 批准号:60863011
- 批准年份:2008
- 资助金额:29.0 万元
- 项目类别:地区科学基金项目
受限域汉语问答系统研究
- 批准号:60663004
- 批准年份:2006
- 资助金额:7.0 万元
- 项目类别:地区科学基金项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}