汉英篇章衔接对齐资源构建与分析研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61502149
  • 项目类别:
    青年科学基金项目
  • 资助金额:
    21.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0211.信息检索与社会计算
  • 结题年份:
    2018
  • 批准年份:
    2015
  • 项目状态:
    已结题
  • 起止时间:
    2016-01-01 至2018-12-31

项目摘要

Discourse cohesion analysis plays a critical role in discourse understanding, in which there exist differences in cohesion between English and Chinese, including anaphor, ellipsis and connective. However, there are few studies in discourse cohesion alignment between Chinese and English, due to the lack of publicly available parallel resource annotated with discourse cohesion on both language sides. Consequently, few studies have been seen in applying discourse cohesion in natural language process tasks, such as machine translation...To this end, this project aims to create a Chinese-English parallel resource with discourse cohesion annotation on both sides and their alignment. This is done in three-level levels. First, we explore proper strategies in annotating discourse cohesion, including anaphor, ellipsis, and connectives. Second, we propose targeted approach to automatically recognize anaphor, ellipses, and connectives in both Chinese and English, and consequently learn the alignment of cohesion between the two languages. Third and finally, we propose several approaches to effectively apply bilingual discourse cohesion in statistical machine translation (SMT) and SMT evaluation...To sum up, The project has important significance for promoting discourse semantic analysis between English and Chinese.
篇章衔接性分析是理解篇章的基础,英语和汉语在指代、省略和连接等主要衔接方式上存在差异。现有汉英平行语料主要进行了句子对齐,缺乏衔接信息的对齐,导致国内外对于汉英篇章衔接对齐分析研究很少,从而影响了融合衔接信息的机器翻译等相关应用。本项目旨在创建汉英篇章衔接对齐资源,研究衔接自动对齐分析技术,并将此应用于融合衔接信息的机器翻译。首先,研究汉英篇章衔接对齐标注策略,建立包含指代、省略和连接对齐信息的汉英篇章衔接对齐资源;其次,基于所建资源,结合汉英衔接特点,采取不同的分析策略和处理方法,实现汉英衔接对齐分析平台;最后,将衔接信息融入机器翻译系统中,从提高机器翻译性能和改善评测两方面考察衔接信息的作用。本项目开展的研究工作对于推进汉英篇章语义分析研究具有重要的意义。

结项摘要

篇章衔接性分析是理解篇章的基础,英语和汉语在指代、省略和连接等主要衔接方式上存在差异。英语和汉语在指代、省略和连接等主要衔接方式上存在差异,现有汉英平行语料主要进行了句子对齐,缺乏衔接信息的对齐,导致国内外对于汉英篇章衔接对齐分析研究很少, 从而影响了融合衔接信息的机器翻译等相关应用。本项目的研究成果包括:. 1)提出汉英篇章衔接对齐语料库标注策略,给出了语料标注方案,开发了标注工具,完成了包含子句、指代、省略和连接对齐信息的200个平行文档的汉英篇章衔接对齐语料库标注,标注质量良好。. 2)基于所建资源,结合汉英衔接方式的特点,采取不同的分析策略和处理方法,进行了子句、连接词和指代的分析研究,结果表明本语料库是可计算的。. 3)将衔接信息融入机器翻译系统,初步实验表明衔接信息可提高机器翻译性能。. 本项目工作对于推进汉英篇章语义分析研究具有重要的意义。

项目成果

期刊论文数量(7)
专著数量(0)
科研奖励数量(0)
会议论文数量(3)
专利数量(0)
基于医学领域的汉英子句对齐语料库检索系统的设计与实现
  • DOI:
    --
  • 发表时间:
    2016
  • 期刊:
    河南科技学院学报(自然科学版)
  • 影响因子:
    --
  • 作者:
    王全蕊;李艳翠
  • 通讯作者:
    李艳翠
非平衡数据集中的特征选择方法和三支分类算法研究
  • DOI:
    --
  • 发表时间:
    2018
  • 期刊:
    河南科技学院学报(自然科学版)
  • 影响因子:
    --
  • 作者:
    刘杰;苏慧哲;李艳翠
  • 通讯作者:
    李艳翠
基于序列到序列的中文短文本省略补全
  • DOI:
    --
  • 发表时间:
    2018
  • 期刊:
    中文信息学报
  • 影响因子:
    --
  • 作者:
    郑杰;孔芳;周国栋
  • 通讯作者:
    周国栋
《文心雕龙》的篇章连接词研究
  • DOI:
    --
  • 发表时间:
    2018
  • 期刊:
    中文信息学报
  • 影响因子:
    --
  • 作者:
    冯文贺;郭海芳;刘涛
  • 通讯作者:
    刘涛
汉英篇章结构平行语料库的对齐标注评估
  • DOI:
    --
  • 发表时间:
    2017
  • 期刊:
    中文信息学报
  • 影响因子:
    --
  • 作者:
    冯文贺;李艳翠;任函;周国栋
  • 通讯作者:
    周国栋

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

汉语隐式篇章关系识别
  • DOI:
    --
  • 发表时间:
    2013
  • 期刊:
    北京大学学报(自然科学版)
  • 影响因子:
    --
  • 作者:
    孙静;李艳翠;周国栋;冯文贺
  • 通讯作者:
    冯文贺
指代消解中距离特征的研究
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    中文信息学报
  • 影响因子:
    --
  • 作者:
    李艳翠;周国栋;朱巧明;杨勇
  • 通讯作者:
    杨勇
添加冒号和分号分类标签特征的汉语逗号分类
  • DOI:
    --
  • 发表时间:
    2014
  • 期刊:
    中文信息学报
  • 影响因子:
    --
  • 作者:
    李艳翠;谷晶晶;周国栋
  • 通讯作者:
    周国栋
基于树核函数的代词指代消解
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    计算机工程
  • 影响因子:
    --
  • 作者:
    周国栋;李艳翠;谭魏璇;王海东
  • 通讯作者:
    王海东
基于支持向量机的英语名词短语指代消解
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    计算机工程
  • 影响因子:
    --
  • 作者:
    杨勇;周国栋;朱巧明;李艳翠
  • 通讯作者:
    李艳翠

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码