纳西-汉语双语语料库构建与翻译方法研究
项目介绍
AI项目解读
基本信息
- 批准号:61163022
- 项目类别:地区科学基金项目
- 资助金额:49.0万
- 负责人:
- 依托单位:
- 学科分类:F0211.信息检索与社会计算
- 结题年份:2015
- 批准年份:2011
- 项目状态:已结题
- 起止时间:2012-01-01 至2015-12-31
- 项目参与者:车文刚; 高兰; 线岩团; 张志坤; 张磊; 赵兴; 郭春晓; 蒋年树; 张辉辉;
- 关键词:
项目摘要
纳西文字是目前世界上"唯一活着的象形文字",但在现代文明的渗透下,正在变异和消亡。纳西-汉语双语语料资源构建及纳西语言分析方法是纳西语言信息处理的基础课题。本课题针对纳西语言特点,首先将研究面向纳西-汉语对齐文本的双语词语抽取方法,构建纳西-汉语双语电子词典,其次将研究纳西树库标记及依存关系识别方法,构建纳西依存树库,实现纳西依存句法分析系统,然后将研究纳西-汉语语料选取、标注规范、双语自动词语对齐方法,构建纳西-汉语双语词语级对齐语料库,最后将研究面向依存句法分析的树到串的纳西-汉语统计翻译方法,实现纳西-汉语双语句子互译原型系统,解决纳西-汉语双语知识资源建设、依存句法分析及机器翻译过程中的难点问题。项目研究成果将为机器理解纳西语言提供语言及语料资源,同时提出的纳西-汉语双语机器翻译方法将推动纳西语与汉语的互译互通,为保护、普及及传承纳西语言奠定基础。
结项摘要
纳西语是世界上唯一活着的象形文字,纳西文字信息化及翻译研究对纳西文化的传承和保护有着重要的作用。项目围绕纳西语言信息化过程中的纳西字库制作,纳西-汉语双语词典、纳西依存树库、纳西-汉语双语语料库构建,纳西依存句法分析、纳西-汉语双语词对齐方法及纳西-汉语双语机器翻译等关键问题展开研究和探讨,取得了以下进展:1.收集了4186个纳西象形文字,采用Unicode编码,制作了纳西字库,构建了6891个词的纳西-汉语-英语三语电子词典,研发了中文、英文和纳西拼音三种方式的纳西文字输入法;2.在纳西依存树库构建及依存句法分析方面,提出了基于汉语-纳西语语言对齐关系及协同训练的纳西语依存树库构建方法,制定了纳西依存树库标注规范,构建了3万句的纳西依存树库,研发了规则与统计相结合的纳西依存句法分析器;3.在纳西-汉语双语语料库构建及词对齐方法方面,针对纳西-汉语的语言特点,提出了融合特征约束及实体约束的纳西-汉语双语词语对齐方法,有效提高了纳西-汉语双语词对齐准确率,制定了双语词对齐标注规范,研发了双语词对齐的标注和管理工具,构建了23000句汉语-纳西语词对齐语料库;4.在纳西-汉语双语机器翻译方面,针对纳西-汉语的语法差异,提出了改进的依存树到串、树到树及子树对齐的汉语-纳西语机器翻译方法,针对纳西语言的词义及语义的特点,在统计句法翻译模型的基础上,探讨了融合谓词-论元、词义归纳及语义角色的翻译方法,设计实现了纳西-汉语双语翻译系统,表现了好的效果,为实现纳西-汉语双语学习系统奠定了基础。5.项目发表论文18篇,其中SCI收录3篇,EI收录10篇,受理发明专利1项,授权软件著作权5项,项目负责人通过培养入选中组部首批“万人计划”和国家“百千万人才”,培养博士研究生3名,培养硕士研究生16名,获得省级优秀硕士论文1篇。
项目成果
期刊论文数量(18)
专著数量(0)
科研奖励数量(0)
会议论文数量(5)
专利数量(0)
基于词义归纳模型的汉-纳统计机器翻译
- DOI:--
- 发表时间:2016
- 期刊:中文信息学报
- 影响因子:--
- 作者:余正涛;高盛祥;程立;毛存礼
- 通讯作者:毛存礼
The Extracting Method of Chinese-Naxi Translation Template Based on Improved Dependency Tree-To-String
基于改进依存树到字符串的汉纳西翻译模板提取方法
- DOI:10.1007/978-3-642-45185-0_37
- 发表时间:2014
- 期刊:Lecture Notes in Computer Science
- 影响因子:--
- 作者:Li Lei;Yu Zhengtao;Mao Cunli;Guo Jianyi
- 通讯作者:Guo Jianyi
Naxi-English Bilingual Word Alignment Based on Language Characteristics and Log-Linear Model
基于语言特征和对数线性模型的纳西英双语词对齐
- DOI:--
- 发表时间:2012
- 期刊:China Communications
- 影响因子:4.1
- 作者:Xian Yantuan;Tian Wei;Guo Jianyi;Zhang Tao
- 通讯作者:Zhang Tao
基于知网的纳西智能输入法研究
- DOI:--
- 发表时间:--
- 期刊:数据采集与处理
- 影响因子:--
- 作者:孔迎春;余正涛;郭剑毅
- 通讯作者:郭剑毅
The Method for Building Naxi Language Dependency Treebank based on Chinese-Naxi Language Align Relationship
基于汉纳西语对齐关系的纳西语依存树库构建方法
- DOI:--
- 发表时间:2014
- 期刊:International Journal of Database Theory and Application
- 影响因子:--
- 作者:An Mingjia;Yu Zhengtao;Mao Cunli;Xian Yantuan
- 通讯作者:Xian Yantuan
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
结合词向量和Bootstrapping的领域实体上下位关系获取与组织
- DOI:10.11896/j.issn.1002-137x.2018.01.010
- 发表时间:2018
- 期刊:计算机科学
- 影响因子:--
- 作者:马晓军;郭剑毅;线岩团;毛存礼;严馨;余正涛
- 通讯作者:余正涛
基于源语言句法增强解码的神经机器翻译方法
- DOI:--
- 发表时间:2021
- 期刊:计算机应用
- 影响因子:--
- 作者:龚龙超;郭军军;余正涛
- 通讯作者:余正涛
用深度可信网抽取中文特定领域的实体属性关系
- DOI:--
- 发表时间:2016
- 期刊:Int. J. Computing Science and Mathematics
- 影响因子:--
- 作者:郭剑毅;周兰江;余正涛;陈玮
- 通讯作者:陈玮
结合FCA与Jena的领域本体半自动构建方法研究
- DOI:--
- 发表时间:2013
- 期刊:计算机工程与科学
- 影响因子:--
- 作者:郭剑毅;余正涛;线岩团;王炎冰
- 通讯作者:王炎冰
本体概念实例、属性和属性值的提取及关系预测
- DOI:--
- 发表时间:--
- 期刊:南京大学学报 (自然科学版)
- 影响因子:--
- 作者:余正涛;郭剑毅;李真
- 通讯作者:李真
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
余正涛的其他基金
面向小语种的多语言事件分析及态势感知方法研究
- 批准号:
- 批准年份:2021
- 资助金额:267 万元
- 项目类别:联合基金项目
面向资源稀缺型语言的机器翻译理论方法及关键技术研究
- 批准号:61732005
- 批准年份:2017
- 资助金额:295.0 万元
- 项目类别:重点项目
基于枢轴语言的汉越句法统计翻译方法研究
- 批准号:61672271
- 批准年份:2016
- 资助金额:61.0 万元
- 项目类别:面上项目
汉越双语事件语料库构建及舆情观点挖掘方法研究
- 批准号:61472168
- 批准年份:2014
- 资助金额:84.0 万元
- 项目类别:面上项目
专家检索资源获取与学习排序方法研究
- 批准号:61175068
- 批准年份:2011
- 资助金额:57.0 万元
- 项目类别:面上项目
受限域汉语问答系统普适性理论与方法研究
- 批准号:60863011
- 批准年份:2008
- 资助金额:29.0 万元
- 项目类别:地区科学基金项目
受限域汉语问答系统研究
- 批准号:60663004
- 批准年份:2006
- 资助金额:7.0 万元
- 项目类别:地区科学基金项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}