自然语言处理中的覆盖域界定和聚焦点识别研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61272260
  • 项目类别:
    面上项目
  • 资助金额:
    80.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0211.信息检索与社会计算
  • 结题年份:
    2016
  • 批准年份:
    2012
  • 项目状态:
    已结题
  • 起止时间:
    2013-01-01 至2016-12-31

项目摘要

Scope determination deals with analyzing what part of a given sentence is under user's interest while focus identification further analyzes the specific object in which the user is mostly interested. As a fundamental issue in deep semantic parsing at sentence level, these two closely related and complementary tasks have many potential applications in natural language processing. The study of scope determination, however, currently focuses on chunking-based approaches and fails to effectively explore structured syntactic information while the research of focus identification just emerges. Within the guidance of linguistic theory, this project targets at the key issues of scope determination and focus identification from various aspects, such as computational modeling, exploring of structured syntactic information and managing of imbalanced data. The main content of this project includes: 1) a computational modeling framework for scope determination via shallow semantic parsing, 2) tree kernel-based scope determination, 3) focus identification using competition learning and centering theory, and 4) various solutions to imbalanced data from both data level and algorithm level. Last but not least, the project also aims to eliminate the performance gap between Chinese and English by constructing high-quality corpora for both scope determination and focus identification in Chinese.
覆盖域界定和聚焦点识别研究分别从作用面和作用点两个层面确定用户感兴趣的文本片断和关注对象,相互补充,相辅相成,在自然语言处理研究中具有广泛的应用价值,是实现句子级深层语义理解的重要基础之一。目前,覆盖域界定研究在建模和有效利用结构化句法信息的方面存在缺陷,聚焦点识别研究刚起步。本课题将在语言学理论指导下,从建模、结构化句法信息利用和数据不平衡问题研究等多个角度,深入研究自然语言处理中的覆盖域界定和聚焦点识别问题。主要研究内容包括:1)基于浅层语义分析的覆盖域界定模型;2)基于树核函数的覆盖域界定研究;3)基于竞争机制和中心理论的聚焦点识别研究;4)面向数据层面和算法层面的数据不平衡解决方案。同时,针对中文语料库缺乏问题,本课题将构建一定规模的高质量中文覆盖域界定和聚焦点识别语料库,深入开展中文覆盖域界定和聚焦点识别研究,缩短与英文相关研究的差距。

结项摘要

本课题在研究自然语言中否定语义和不确定语义表示结构的基础上,提出了新颖的覆盖域和聚焦点识别方法和计算模型,实现了一个高性能的覆盖域界定和聚焦点识别系统,性能达到国际领先水平,为将来的进一步研究打下了扎实的基础。.三年来,课题总体进展顺利,所有研究计划已按要求完成,达到预期目标。特别是:.1)在覆盖域界定方面,揭示了平面化句法特征与结构化句法特征在覆盖域界定模型中的不同作用,采用完全子树和关键路径两类句法结构,提出了一个基于卷积树核的融合模型,并借助触发词词性驱动的多分类器融合策略,优化覆盖域界定系统性能。在BioScope语料库上,覆盖域界定性能提高约5%。此外,提出了基于卷积神经网络的覆盖域界定模型,性能再提高了约2%。.2)在聚焦点识别方面,提出了基于“词-主题”的双层结构图模型的聚焦点识别方法,利用上下文中的线索及特征来识别聚焦点,此外,作为无监督模型,该方法避免了人工标注的开销。在SEM’2012评测语料上的实验表明,聚焦点识别的性能比该评测最优系统提高了约6%。.3)在面向汉语的覆盖域界定和聚焦点识别研究方面,构建了一个较大规模的完备的汉语语料库CNeSp,并借助汉语词素特征和跨语言触发词扩展技术,优化了汉语触发词识别方法,在CNeSp语料库上性能提高约3%。此外,借助元决策树模型,有效融合了序列化特征和结构化特征,实现了面向汉语的覆盖域界定系统,在CNeSp语料库上的性能平均达到60%。.研究成果方面,本课题发表SCI索引源期刊论文1篇、EI索引源期刊论文4篇、国际顶级会议ACL/IJCAI/EMNLP/COLING论文8篇;获得软件著作权2项、专利3件。

项目成果

期刊论文数量(13)
专著数量(0)
科研奖励数量(0)
会议论文数量(13)
专利数量(0)
Research on Chinese negation and speculation: corpus annotation and identification
汉语否定与推测研究:语料库标注与识别
  • DOI:
    10.1007/s11704-015-5101-2
  • 发表时间:
    2016
  • 期刊:
    Frontiers of Computer Science
  • 影响因子:
    4.2
  • 作者:
    Zou; Bowei;Zhou; Guodong;Zhu; Qiaoming
  • 通讯作者:
    Qiaoming
平行推理机制:一种新型的隐式篇章关系检测方法
  • DOI:
    --
  • 发表时间:
    2014
  • 期刊:
    软件学报
  • 影响因子:
    --
  • 作者:
    严为绒;姚建民;朱巧明;周国栋
  • 通讯作者:
    周国栋
基于跨场景推理的事件关系检测方法
  • DOI:
    10.1007/978-3-030-70210-6_4
  • 发表时间:
    2014
  • 期刊:
    中文信息学报
  • 影响因子:
    --
  • 作者:
    陈亚东;王潇斌;姚建民;朱巧明
  • 通讯作者:
    朱巧明
否定与不确定信息抽取研究综述
  • DOI:
    10.1002/cphc.201900949
  • 发表时间:
    2015
  • 期刊:
    中文信息学报
  • 影响因子:
    --
  • 作者:
    邹博伟;周国栋;朱巧明
  • 通讯作者:
    朱巧明
面向自然语言文本的否定性与不确定性信息抽取研究
  • DOI:
    --
  • 发表时间:
    2016
  • 期刊:
    软件学报
  • 影响因子:
    --
  • 作者:
    钱忠;陈站成;朱巧明;周国栋
  • 通讯作者:
    周国栋

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

基于搜索引擎的双语混合网页识别新方法
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    中文信息学报
  • 影响因子:
    --
  • 作者:
    洪宇;姚建民;冯艳卉;颜振祥;朱巧明
  • 通讯作者:
    朱巧明
基于多模型的新闻标题分类
  • DOI:
    --
  • 发表时间:
    2018
  • 期刊:
    中文信息学报
  • 影响因子:
    --
  • 作者:
    董孝政;宋睿;洪宇;朱芬红;朱巧明
  • 通讯作者:
    朱巧明
融合多维度信息的中文事件时序关系识别方法
  • DOI:
    10.13451/j.sxu.ns.2020147
  • 发表时间:
    2021
  • 期刊:
    山西大学学报(自然科学版)
  • 影响因子:
    --
  • 作者:
    李婧;李培峰;朱巧明
  • 通讯作者:
    朱巧明
平行推理机制:一种新型的隐式篇章关系检测方法
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    软件学报
  • 影响因子:
    --
  • 作者:
    洪宇;车婷婷;严为绒;姚建民;朱巧明;周国栋
  • 通讯作者:
    周国栋
基于密令位置信息特征的问题生成
  • DOI:
    --
  • 发表时间:
    2019
  • 期刊:
    中文信息学报
  • 影响因子:
    --
  • 作者:
    董孝政;洪宇;朱芬红;姚建民;朱巧明
  • 通讯作者:
    朱巧明

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

朱巧明的其他基金

面向话题的对话篇章结构分析研究
  • 批准号:
    62376181
  • 批准年份:
    2023
  • 资助金额:
    51 万元
  • 项目类别:
    面上项目
微观和宏观主次关系驱动的篇章结构分析研究
  • 批准号:
    61773276
  • 批准年份:
    2017
  • 资助金额:
    65.0 万元
  • 项目类别:
    面上项目
中文句法分析与语义角色标注的联合学习机制研究
  • 批准号:
    60970056
  • 批准年份:
    2009
  • 资助金额:
    32.0 万元
  • 项目类别:
    面上项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码