汉英篇章衔接对齐资源构建与分析研究
项目介绍
AI项目解读
基本信息
- 批准号:61502149
- 项目类别:青年科学基金项目
- 资助金额:21.0万
- 负责人:
- 依托单位:
- 学科分类:F0211.信息检索与社会计算
- 结题年份:2018
- 批准年份:2015
- 项目状态:已结题
- 起止时间:2016-01-01 至2018-12-31
- 项目参与者:贡正仙; 赵颖; 李学勇; 冯洪玉; 苗国义; 金松林; 郑颖; 王中卿; 朱珠;
- 关键词:
项目摘要
Discourse cohesion analysis plays a critical role in discourse understanding, in which there exist differences in cohesion between English and Chinese, including anaphor, ellipsis and connective. However, there are few studies in discourse cohesion alignment between Chinese and English, due to the lack of publicly available parallel resource annotated with discourse cohesion on both language sides. Consequently, few studies have been seen in applying discourse cohesion in natural language process tasks, such as machine translation...To this end, this project aims to create a Chinese-English parallel resource with discourse cohesion annotation on both sides and their alignment. This is done in three-level levels. First, we explore proper strategies in annotating discourse cohesion, including anaphor, ellipsis, and connectives. Second, we propose targeted approach to automatically recognize anaphor, ellipses, and connectives in both Chinese and English, and consequently learn the alignment of cohesion between the two languages. Third and finally, we propose several approaches to effectively apply bilingual discourse cohesion in statistical machine translation (SMT) and SMT evaluation...To sum up, The project has important significance for promoting discourse semantic analysis between English and Chinese.
篇章衔接性分析是理解篇章的基础,英语和汉语在指代、省略和连接等主要衔接方式上存在差异。现有汉英平行语料主要进行了句子对齐,缺乏衔接信息的对齐,导致国内外对于汉英篇章衔接对齐分析研究很少,从而影响了融合衔接信息的机器翻译等相关应用。本项目旨在创建汉英篇章衔接对齐资源,研究衔接自动对齐分析技术,并将此应用于融合衔接信息的机器翻译。首先,研究汉英篇章衔接对齐标注策略,建立包含指代、省略和连接对齐信息的汉英篇章衔接对齐资源;其次,基于所建资源,结合汉英衔接特点,采取不同的分析策略和处理方法,实现汉英衔接对齐分析平台;最后,将衔接信息融入机器翻译系统中,从提高机器翻译性能和改善评测两方面考察衔接信息的作用。本项目开展的研究工作对于推进汉英篇章语义分析研究具有重要的意义。
结项摘要
篇章衔接性分析是理解篇章的基础,英语和汉语在指代、省略和连接等主要衔接方式上存在差异。英语和汉语在指代、省略和连接等主要衔接方式上存在差异,现有汉英平行语料主要进行了句子对齐,缺乏衔接信息的对齐,导致国内外对于汉英篇章衔接对齐分析研究很少, 从而影响了融合衔接信息的机器翻译等相关应用。本项目的研究成果包括:. 1)提出汉英篇章衔接对齐语料库标注策略,给出了语料标注方案,开发了标注工具,完成了包含子句、指代、省略和连接对齐信息的200个平行文档的汉英篇章衔接对齐语料库标注,标注质量良好。. 2)基于所建资源,结合汉英衔接方式的特点,采取不同的分析策略和处理方法,进行了子句、连接词和指代的分析研究,结果表明本语料库是可计算的。. 3)将衔接信息融入机器翻译系统,初步实验表明衔接信息可提高机器翻译性能。. 本项目工作对于推进汉英篇章语义分析研究具有重要的意义。
项目成果
期刊论文数量(7)
专著数量(0)
科研奖励数量(0)
会议论文数量(3)
专利数量(0)
基于医学领域的汉英子句对齐语料库检索系统的设计与实现
- DOI:--
- 发表时间:2016
- 期刊:河南科技学院学报(自然科学版)
- 影响因子:--
- 作者:王全蕊;李艳翠
- 通讯作者:李艳翠
非平衡数据集中的特征选择方法和三支分类算法研究
- DOI:--
- 发表时间:2018
- 期刊:河南科技学院学报(自然科学版)
- 影响因子:--
- 作者:刘杰;苏慧哲;李艳翠
- 通讯作者:李艳翠
基于序列到序列的中文短文本省略补全
- DOI:--
- 发表时间:2018
- 期刊:中文信息学报
- 影响因子:--
- 作者:郑杰;孔芳;周国栋
- 通讯作者:周国栋
《文心雕龙》的篇章连接词研究
- DOI:--
- 发表时间:2018
- 期刊:中文信息学报
- 影响因子:--
- 作者:冯文贺;郭海芳;刘涛
- 通讯作者:刘涛
汉英篇章结构平行语料库的对齐标注评估
- DOI:--
- 发表时间:2017
- 期刊:中文信息学报
- 影响因子:--
- 作者:冯文贺;李艳翠;任函;周国栋
- 通讯作者:周国栋
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
汉语隐式篇章关系识别
- DOI:--
- 发表时间:2013
- 期刊:北京大学学报(自然科学版)
- 影响因子:--
- 作者:孙静;李艳翠;周国栋;冯文贺
- 通讯作者:冯文贺
指代消解中距离特征的研究
- DOI:--
- 发表时间:--
- 期刊:中文信息学报
- 影响因子:--
- 作者:李艳翠;周国栋;朱巧明;杨勇
- 通讯作者:杨勇
添加冒号和分号分类标签特征的汉语逗号分类
- DOI:--
- 发表时间:2014
- 期刊:中文信息学报
- 影响因子:--
- 作者:李艳翠;谷晶晶;周国栋
- 通讯作者:周国栋
基于树核函数的代词指代消解
- DOI:--
- 发表时间:--
- 期刊:计算机工程
- 影响因子:--
- 作者:周国栋;李艳翠;谭魏璇;王海东
- 通讯作者:王海东
基于支持向量机的英语名词短语指代消解
- DOI:--
- 发表时间:--
- 期刊:计算机工程
- 影响因子:--
- 作者:杨勇;周国栋;朱巧明;李艳翠
- 通讯作者:李艳翠
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}

内容获取失败,请点击重试

查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图

请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}