自然语言处理中的覆盖域界定和聚焦点识别研究
项目介绍
AI项目解读
基本信息
- 批准号:61272260
- 项目类别:面上项目
- 资助金额:80.0万
- 负责人:
- 依托单位:
- 学科分类:F0211.信息检索与社会计算
- 结题年份:2016
- 批准年份:2012
- 项目状态:已结题
- 起止时间:2013-01-01 至2016-12-31
- 项目参与者:李军辉; 徐凡; 邹博伟; 陆军; 康杨杨; 夏德利;
- 关键词:
项目摘要
Scope determination deals with analyzing what part of a given sentence is under user's interest while focus identification further analyzes the specific object in which the user is mostly interested. As a fundamental issue in deep semantic parsing at sentence level, these two closely related and complementary tasks have many potential applications in natural language processing. The study of scope determination, however, currently focuses on chunking-based approaches and fails to effectively explore structured syntactic information while the research of focus identification just emerges. Within the guidance of linguistic theory, this project targets at the key issues of scope determination and focus identification from various aspects, such as computational modeling, exploring of structured syntactic information and managing of imbalanced data. The main content of this project includes: 1) a computational modeling framework for scope determination via shallow semantic parsing, 2) tree kernel-based scope determination, 3) focus identification using competition learning and centering theory, and 4) various solutions to imbalanced data from both data level and algorithm level. Last but not least, the project also aims to eliminate the performance gap between Chinese and English by constructing high-quality corpora for both scope determination and focus identification in Chinese.
覆盖域界定和聚焦点识别研究分别从作用面和作用点两个层面确定用户感兴趣的文本片断和关注对象,相互补充,相辅相成,在自然语言处理研究中具有广泛的应用价值,是实现句子级深层语义理解的重要基础之一。目前,覆盖域界定研究在建模和有效利用结构化句法信息的方面存在缺陷,聚焦点识别研究刚起步。本课题将在语言学理论指导下,从建模、结构化句法信息利用和数据不平衡问题研究等多个角度,深入研究自然语言处理中的覆盖域界定和聚焦点识别问题。主要研究内容包括:1)基于浅层语义分析的覆盖域界定模型;2)基于树核函数的覆盖域界定研究;3)基于竞争机制和中心理论的聚焦点识别研究;4)面向数据层面和算法层面的数据不平衡解决方案。同时,针对中文语料库缺乏问题,本课题将构建一定规模的高质量中文覆盖域界定和聚焦点识别语料库,深入开展中文覆盖域界定和聚焦点识别研究,缩短与英文相关研究的差距。
结项摘要
本课题在研究自然语言中否定语义和不确定语义表示结构的基础上,提出了新颖的覆盖域和聚焦点识别方法和计算模型,实现了一个高性能的覆盖域界定和聚焦点识别系统,性能达到国际领先水平,为将来的进一步研究打下了扎实的基础。.三年来,课题总体进展顺利,所有研究计划已按要求完成,达到预期目标。特别是:.1)在覆盖域界定方面,揭示了平面化句法特征与结构化句法特征在覆盖域界定模型中的不同作用,采用完全子树和关键路径两类句法结构,提出了一个基于卷积树核的融合模型,并借助触发词词性驱动的多分类器融合策略,优化覆盖域界定系统性能。在BioScope语料库上,覆盖域界定性能提高约5%。此外,提出了基于卷积神经网络的覆盖域界定模型,性能再提高了约2%。.2)在聚焦点识别方面,提出了基于“词-主题”的双层结构图模型的聚焦点识别方法,利用上下文中的线索及特征来识别聚焦点,此外,作为无监督模型,该方法避免了人工标注的开销。在SEM’2012评测语料上的实验表明,聚焦点识别的性能比该评测最优系统提高了约6%。.3)在面向汉语的覆盖域界定和聚焦点识别研究方面,构建了一个较大规模的完备的汉语语料库CNeSp,并借助汉语词素特征和跨语言触发词扩展技术,优化了汉语触发词识别方法,在CNeSp语料库上性能提高约3%。此外,借助元决策树模型,有效融合了序列化特征和结构化特征,实现了面向汉语的覆盖域界定系统,在CNeSp语料库上的性能平均达到60%。.研究成果方面,本课题发表SCI索引源期刊论文1篇、EI索引源期刊论文4篇、国际顶级会议ACL/IJCAI/EMNLP/COLING论文8篇;获得软件著作权2项、专利3件。
项目成果
期刊论文数量(13)
专著数量(0)
科研奖励数量(0)
会议论文数量(13)
专利数量(0)
Research on Chinese negation and speculation: corpus annotation and identification
汉语否定与推测研究:语料库标注与识别
- DOI:10.1007/s11704-015-5101-2
- 发表时间:2016
- 期刊:Frontiers of Computer Science
- 影响因子:4.2
- 作者:Zou; Bowei;Zhou; Guodong;Zhu; Qiaoming
- 通讯作者:Qiaoming
平行推理机制:一种新型的隐式篇章关系检测方法
- DOI:--
- 发表时间:2014
- 期刊:软件学报
- 影响因子:--
- 作者:严为绒;姚建民;朱巧明;周国栋
- 通讯作者:周国栋
基于跨场景推理的事件关系检测方法
- DOI:10.1007/978-3-030-70210-6_4
- 发表时间:2014
- 期刊:中文信息学报
- 影响因子:--
- 作者:陈亚东;王潇斌;姚建民;朱巧明
- 通讯作者:朱巧明
否定与不确定信息抽取研究综述
- DOI:10.1002/cphc.201900949
- 发表时间:2015
- 期刊:中文信息学报
- 影响因子:--
- 作者:邹博伟;周国栋;朱巧明
- 通讯作者:朱巧明
面向自然语言文本的否定性与不确定性信息抽取研究
- DOI:--
- 发表时间:2016
- 期刊:软件学报
- 影响因子:--
- 作者:钱忠;陈站成;朱巧明;周国栋
- 通讯作者:周国栋
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
基于搜索引擎的双语混合网页识别新方法
- DOI:--
- 发表时间:--
- 期刊:中文信息学报
- 影响因子:--
- 作者:洪宇;姚建民;冯艳卉;颜振祥;朱巧明
- 通讯作者:朱巧明
基于多模型的新闻标题分类
- DOI:--
- 发表时间:2018
- 期刊:中文信息学报
- 影响因子:--
- 作者:董孝政;宋睿;洪宇;朱芬红;朱巧明
- 通讯作者:朱巧明
融合多维度信息的中文事件时序关系识别方法
- DOI:10.13451/j.sxu.ns.2020147
- 发表时间:2021
- 期刊:山西大学学报(自然科学版)
- 影响因子:--
- 作者:李婧;李培峰;朱巧明
- 通讯作者:朱巧明
平行推理机制:一种新型的隐式篇章关系检测方法
- DOI:--
- 发表时间:--
- 期刊:软件学报
- 影响因子:--
- 作者:洪宇;车婷婷;严为绒;姚建民;朱巧明;周国栋
- 通讯作者:周国栋
基于密令位置信息特征的问题生成
- DOI:--
- 发表时间:2019
- 期刊:中文信息学报
- 影响因子:--
- 作者:董孝政;洪宇;朱芬红;姚建民;朱巧明
- 通讯作者:朱巧明
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
朱巧明的其他基金
面向话题的对话篇章结构分析研究
- 批准号:62376181
- 批准年份:2023
- 资助金额:51 万元
- 项目类别:面上项目
微观和宏观主次关系驱动的篇章结构分析研究
- 批准号:61773276
- 批准年份:2017
- 资助金额:65.0 万元
- 项目类别:面上项目
中文句法分析与语义角色标注的联合学习机制研究
- 批准号:60970056
- 批准年份:2009
- 资助金额:32.0 万元
- 项目类别:面上项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}