纳西-汉语双语语料库构建与翻译方法研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61163022
  • 项目类别:
    地区科学基金项目
  • 资助金额:
    49.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0211.信息检索与社会计算
  • 结题年份:
    2015
  • 批准年份:
    2011
  • 项目状态:
    已结题
  • 起止时间:
    2012-01-01 至2015-12-31

项目摘要

纳西文字是目前世界上"唯一活着的象形文字",但在现代文明的渗透下,正在变异和消亡。纳西-汉语双语语料资源构建及纳西语言分析方法是纳西语言信息处理的基础课题。本课题针对纳西语言特点,首先将研究面向纳西-汉语对齐文本的双语词语抽取方法,构建纳西-汉语双语电子词典,其次将研究纳西树库标记及依存关系识别方法,构建纳西依存树库,实现纳西依存句法分析系统,然后将研究纳西-汉语语料选取、标注规范、双语自动词语对齐方法,构建纳西-汉语双语词语级对齐语料库,最后将研究面向依存句法分析的树到串的纳西-汉语统计翻译方法,实现纳西-汉语双语句子互译原型系统,解决纳西-汉语双语知识资源建设、依存句法分析及机器翻译过程中的难点问题。项目研究成果将为机器理解纳西语言提供语言及语料资源,同时提出的纳西-汉语双语机器翻译方法将推动纳西语与汉语的互译互通,为保护、普及及传承纳西语言奠定基础。

结项摘要

纳西语是世界上唯一活着的象形文字,纳西文字信息化及翻译研究对纳西文化的传承和保护有着重要的作用。项目围绕纳西语言信息化过程中的纳西字库制作,纳西-汉语双语词典、纳西依存树库、纳西-汉语双语语料库构建,纳西依存句法分析、纳西-汉语双语词对齐方法及纳西-汉语双语机器翻译等关键问题展开研究和探讨,取得了以下进展:1.收集了4186个纳西象形文字,采用Unicode编码,制作了纳西字库,构建了6891个词的纳西-汉语-英语三语电子词典,研发了中文、英文和纳西拼音三种方式的纳西文字输入法;2.在纳西依存树库构建及依存句法分析方面,提出了基于汉语-纳西语语言对齐关系及协同训练的纳西语依存树库构建方法,制定了纳西依存树库标注规范,构建了3万句的纳西依存树库,研发了规则与统计相结合的纳西依存句法分析器;3.在纳西-汉语双语语料库构建及词对齐方法方面,针对纳西-汉语的语言特点,提出了融合特征约束及实体约束的纳西-汉语双语词语对齐方法,有效提高了纳西-汉语双语词对齐准确率,制定了双语词对齐标注规范,研发了双语词对齐的标注和管理工具,构建了23000句汉语-纳西语词对齐语料库;4.在纳西-汉语双语机器翻译方面,针对纳西-汉语的语法差异,提出了改进的依存树到串、树到树及子树对齐的汉语-纳西语机器翻译方法,针对纳西语言的词义及语义的特点,在统计句法翻译模型的基础上,探讨了融合谓词-论元、词义归纳及语义角色的翻译方法,设计实现了纳西-汉语双语翻译系统,表现了好的效果,为实现纳西-汉语双语学习系统奠定了基础。5.项目发表论文18篇,其中SCI收录3篇,EI收录10篇,受理发明专利1项,授权软件著作权5项,项目负责人通过培养入选中组部首批“万人计划”和国家“百千万人才”,培养博士研究生3名,培养硕士研究生16名,获得省级优秀硕士论文1篇。

项目成果

期刊论文数量(18)
专著数量(0)
科研奖励数量(0)
会议论文数量(5)
专利数量(0)
基于词义归纳模型的汉-纳统计机器翻译
  • DOI:
    --
  • 发表时间:
    2016
  • 期刊:
    中文信息学报
  • 影响因子:
    --
  • 作者:
    余正涛;高盛祥;程立;毛存礼
  • 通讯作者:
    毛存礼
The Extracting Method of Chinese-Naxi Translation Template Based on Improved Dependency Tree-To-String
基于改进依存树到字符串的汉纳西翻译模板提取方法
  • DOI:
    10.1007/978-3-642-45185-0_37
  • 发表时间:
    2014
  • 期刊:
    Lecture Notes in Computer Science
  • 影响因子:
    --
  • 作者:
    Li Lei;Yu Zhengtao;Mao Cunli;Guo Jianyi
  • 通讯作者:
    Guo Jianyi
Naxi-English Bilingual Word Alignment Based on Language Characteristics and Log-Linear Model
基于语言特征和对数线性模型的纳西英双语词对齐
  • DOI:
    --
  • 发表时间:
    2012
  • 期刊:
    China Communications
  • 影响因子:
    4.1
  • 作者:
    Xian Yantuan;Tian Wei;Guo Jianyi;Zhang Tao
  • 通讯作者:
    Zhang Tao
基于知网的纳西智能输入法研究
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    数据采集与处理
  • 影响因子:
    --
  • 作者:
    孔迎春;余正涛;郭剑毅
  • 通讯作者:
    郭剑毅
The Method for Building Naxi Language Dependency Treebank based on Chinese-Naxi Language Align Relationship
基于汉纳西语对齐关系的纳西语依存树库构建方法
  • DOI:
    --
  • 发表时间:
    2014
  • 期刊:
    International Journal of Database Theory and Application
  • 影响因子:
    --
  • 作者:
    An Mingjia;Yu Zhengtao;Mao Cunli;Xian Yantuan
  • 通讯作者:
    Xian Yantuan

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

结合词向量和Bootstrapping的领域实体上下位关系获取与组织
  • DOI:
    10.11896/j.issn.1002-137x.2018.01.010
  • 发表时间:
    2018
  • 期刊:
    计算机科学
  • 影响因子:
    --
  • 作者:
    马晓军;郭剑毅;线岩团;毛存礼;严馨;余正涛
  • 通讯作者:
    余正涛
基于源语言句法增强解码的神经机器翻译方法
  • DOI:
    --
  • 发表时间:
    2021
  • 期刊:
    计算机应用
  • 影响因子:
    --
  • 作者:
    龚龙超;郭军军;余正涛
  • 通讯作者:
    余正涛
用深度可信网抽取中文特定领域的实体属性关系
  • DOI:
    --
  • 发表时间:
    2016
  • 期刊:
    Int. J. Computing Science and Mathematics
  • 影响因子:
    --
  • 作者:
    郭剑毅;周兰江;余正涛;陈玮
  • 通讯作者:
    陈玮
结合FCA与Jena的领域本体半自动构建方法研究
  • DOI:
    --
  • 发表时间:
    2013
  • 期刊:
    计算机工程与科学
  • 影响因子:
    --
  • 作者:
    郭剑毅;余正涛;线岩团;王炎冰
  • 通讯作者:
    王炎冰
本体概念实例、属性和属性值的提取及关系预测
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    南京大学学报 (自然科学版)
  • 影响因子:
    --
  • 作者:
    余正涛;郭剑毅;李真
  • 通讯作者:
    李真

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

余正涛的其他基金

面向小语种的多语言事件分析及态势感知方法研究
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    267 万元
  • 项目类别:
    联合基金项目
面向资源稀缺型语言的机器翻译理论方法及关键技术研究
  • 批准号:
    61732005
  • 批准年份:
    2017
  • 资助金额:
    295.0 万元
  • 项目类别:
    重点项目
基于枢轴语言的汉越句法统计翻译方法研究
  • 批准号:
    61672271
  • 批准年份:
    2016
  • 资助金额:
    61.0 万元
  • 项目类别:
    面上项目
汉越双语事件语料库构建及舆情观点挖掘方法研究
  • 批准号:
    61472168
  • 批准年份:
    2014
  • 资助金额:
    84.0 万元
  • 项目类别:
    面上项目
专家检索资源获取与学习排序方法研究
  • 批准号:
    61175068
  • 批准年份:
    2011
  • 资助金额:
    57.0 万元
  • 项目类别:
    面上项目
受限域汉语问答系统普适性理论与方法研究
  • 批准号:
    60863011
  • 批准年份:
    2008
  • 资助金额:
    29.0 万元
  • 项目类别:
    地区科学基金项目
受限域汉语问答系统研究
  • 批准号:
    60663004
  • 批准年份:
    2006
  • 资助金额:
    7.0 万元
  • 项目类别:
    地区科学基金项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码