基于格依存树到串模型的日汉机器翻译研究
项目介绍
AI项目解读
基本信息
- 批准号:61370130
- 项目类别:面上项目
- 资助金额:73.0万
- 负责人:
- 依托单位:
- 学科分类:F0211.信息检索与社会计算
- 结题年份:2017
- 批准年份:2013
- 项目状态:已结题
- 起止时间:2014-01-01 至2017-12-31
- 项目参与者:张玉洁; 姜文斌; 谢军; 涂兆鹏; 刘凯; 茹旷; 赵紫玉; 吴培昊; 刘江鸣;
- 关键词:
项目摘要
The research on methods of Japanese Chinese machine translation plays an important significance on Chinese economy,national defense and the construction of national security.This application proposes a Japanese Chinese machine translation method integrating dependency grammar and case grammar into a new proposed Case-Dependency Grammar, which innovation is mainly reflected in: proposing a description form on case dependency syntax and a machine translation meathod of Case Dependency tree to string model based.The main contents include: 1)Japanese Case Dependency structure's description and its formal definition; 2)Japanese Case Dependency syntactic analysis's algorithm design and implementation, rules and parameter learning; 3)method based on Case Dependency structure tree to string translation,including translating mathematics models,training and decoding. We will thoroughly explore the formal description based on the case dependency structure tree to string model,large-scale real text oriented translation rules extraction and probability estimation, and efficient decoding algorithom.In this study,the research strategy mainly by statistics ,supplemented by the rule will be adopted.By implementing high-quality Japanese to Chinese translation system ,we can provide a reference to experience and methods of theoretical basis for statistical machine translation based on syntax between adhesion language and Chinese.
日汉机器翻译方法研究对我国国防、国家安全和经济建设具有重要意义。 .本项目提出了融合依存树到串模型和格语法的日汉机器翻译方法,创新性主要体现在:充分利用日语格语法特点,提出一种新的格依存句法结构描述形式和一种基于格依存树到串模型的机器翻译方法;主要研究内容包括:1)日语格依存结构描述及其形式化定义;2)日语格依存句法分析算法设计实现、规则或参数学习等;3)基于格依存结构的树到串翻译方法,包括翻译数学模型,训练和解码。 我们将深入探索基于格依存结构的树到串模型的形式化描述、面向大规模真实文本的翻译规则抽取和概率估计以及高效解码算法等问题。本研究拟采用统计为主规则为辅的研究策略,通过实现高质量的日汉翻译系统,为黏着语系与孤立语系间的基于句法的统计机器翻译实现提供借鉴经验和方法理论依据。
结项摘要
研究背景:.日汉机器翻译方法研究对我国的国防、国家安全和经济建设具有重要意义。..主要研究内容:.本项目提出了融合依存树到串模型和格语法的日汉机器翻译方法,创新性主要体现在:充分利用日语格语法特点,提出一种新的格依存句法结构描述形式和一种基于格依存树到串模型的机器翻译方法;主要研究内容包括:1)日语格依存结构描述及其形式化定义;2)日语格依存句法分析算法设计实现、规则或参数学习等;3)基于格依存结构的树到串翻译方法,包括翻译数学模型,训练和解码。..重要结果:.围绕本项目的主要研究内容展开研发工作,取得了丰硕的研究成果。共发表期刊论文和会议论文共计30余篇,其中包括Coling、EMNLP、ACL等顶级会议论文3篇、以及SCI论文4篇、EI论文5篇,核心期刊17篇。申报国家级发明专利9项,授权发明专利6项。培养硕士生20余人,博士生4人。..关键数据及其科学意义:.本项目注重机器翻译理论研究的同时,在培养研究生过程中,注重系统研发,并积累了大量的研究数据,累计构建了机器翻译平行语料库5千多万句对,其中,英汉平行语料库4千多万句对、日英汉平行语料库500万句对、日汉新闻领域500万句对、日汉词典150万词、日语动词词典4万词、日语格框架库52万词、日语名词格框架库16万词、日汉命名实体翻译对100万词。同时,还搭建了以日英汉三种不同语言为中心的机器翻译研发平台,包括基于规则/实例/统计机器翻译、以及神经网络机器翻译等系统。.本研究采用统计为主规则为辅的研究策略,实现了高质量的日汉翻译系统,为黏着语系与孤立语系间的基于句法的统计机器翻译实现提供借鉴经验和方法理论依据,并具有较大的实用价值。
项目成果
期刊论文数量(24)
专著数量(0)
科研奖励数量(0)
会议论文数量(7)
专利数量(9)
A lazy associative classifier for time series
时间序列的惰性关联分类器
- DOI:10.3233/ida-150754
- 发表时间:2015
- 期刊:Intelligent Data Analysis
- 影响因子:1.7
- 作者:Jidong Yuan;Zhihai Wang;Meng Han;Yange Sun
- 通讯作者:Yange Sun
基于枢轴语言的平行语料构建方法
- DOI:--
- 发表时间:2017
- 期刊:情报工程
- 影响因子:--
- 作者:单华;张玉洁;周雯;徐金安;陈钰枫
- 通讯作者:陈钰枫
Research on Contrastive Viewpoint Summarization for Opinionated Texts
观点文本对比观点概括研究
- DOI:10.1142/s0219265913600037
- 发表时间:2013-09
- 期刊:Journal of Interconnection Networks
- 影响因子:0.7
- 作者:XU LIANG;YOULI QU;GUIXIANG MA
- 通讯作者:GUIXIANG MA
融合词法句法分析联合模型的树到串EBMT方法
- DOI:10.13209/j.0479-8023.2017.035
- 发表时间:2016
- 期刊:北京大学学报(自然科学版)
- 影响因子:--
- 作者:王丹丹;徐金安;陈钰枫;张玉洁;杨晓晖
- 通讯作者:杨晓晖
日语时间表达式识别与日汉翻译研究
- DOI:--
- 发表时间:2014
- 期刊:北京大学学报(自然科学版)
- 影响因子:--
- 作者:赵紫玉;徐金安;张玉洁;刘江鸣
- 通讯作者:刘江鸣
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
基于随机行走N步的汉语复述短获取方法
- DOI:--
- 发表时间:2017
- 期刊:中国科学:信息科学
- 影响因子:--
- 作者:马军;张玉洁;徐金安;陈钰枫
- 通讯作者:陈钰枫
复述平行语料构建及其应用方法研究
- DOI:--
- 发表时间:2021
- 期刊:北京大学学报(自然科学版)
- 影响因子:--
- 作者:王雅松;刘明童;张玉洁;徐金安;陈钰枫
- 通讯作者:陈钰枫
融合小句对齐知识的汉英神经 机器翻译
- DOI:--
- 发表时间:2022
- 期刊:北京大学学报(自然科学版)
- 影响因子:--
- 作者:苗国义;刘明童;陈钰枫;徐金安;张玉洁;冯文贺
- 通讯作者:冯文贺
无监督的句法可控复述模型用于对抗样本生成
- DOI:--
- 发表时间:2021
- 期刊:北京大学学报自然科学版
- 影响因子:--
- 作者:杨二光;刘明童;张玉洁;孟遥;胡长建;徐金安;陈钰枫
- 通讯作者:陈钰枫
中文实体关系抽取研究综述
- DOI:--
- 发表时间:2018
- 期刊:计算机与现代化
- 影响因子:--
- 作者:武文雅;陈钰枫;徐金安;张玉洁
- 通讯作者:张玉洁
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
徐金安的其他基金
融合知识的多语种对话神经器翻译关键技术研究
- 批准号:62376019
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
融合谓词框架和语义知识的神经机器翻译研究
- 批准号:61976015
- 批准年份:2019
- 资助金额:62 万元
- 项目类别:面上项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}