汉语篇章结构分析的资源建设与计算模型研究
项目介绍
AI项目解读
基本信息
- 批准号:61273320
- 项目类别:面上项目
- 资助金额:81.0万
- 负责人:
- 依托单位:
- 学科分类:F03.自动化
- 结题年份:2016
- 批准年份:2012
- 项目状态:已结题
- 起止时间:2013-01-01 至2016-12-31
- 项目参与者:冯文贺; 李艳翠; 赵知纬; 彭成; 曹媛;
- 关键词:
项目摘要
Discourse structure analysis deals with discourse coherence and is fundamental to discourse-level semantic analysis. Currently, most of research in NLP focuses on morphological and syntactic levels and there is much less research on the inherent regulations in discourse. This results in the lack of theoretical and computational methodologes towards effective discourse analysis and serevely restricts its wide applications...This project addresses Chinese discourse structure analysis from following aspects:..1)Studying the general regulations and special characteristics in the structure organization of Chinese discourses and building a theretical framework suitable to the representation and analysis of Chinese discourse structures. Specially, a connective-driven depepdency tree structure is proposed to represent Chinese discourse structures and a Chinese discourse relationship framework will be constructed on connectives...2)Proposing a annotation scheme for Chinese discourse structures and semi-automatically building a certain-scale high-quality annotated Chinese discourse structure corpus by integrating bootstrapping and co-training...3)Proposing a bottom-up approach to parse the hierarchical structure in a Chinese discourse and the structure relationship between its compomnents. Specially, both supervised and un-supervised approaches are employed to recognize the implicit discoure relations.
篇章结构分析针对篇章的连贯性,是篇章级语义分析的基础。目前自然语言处理研究的重点聚焦在词法和句法层面,对篇章内在规律的研究相对较少,缺乏对篇章进行有效分析的理论和计算方法,从而严重制约了基于篇章的相关应用。本项目将从理论体系完善、语料库构建和计算模型研究等方面系统开展汉语篇章结构分析的研究:1)从研究汉语篇章结构组织的规律和特点入手,建立一套适用于汉语篇章结构表示与分析的理论体系。拟采用一种连接依存树的形式表示汉语的篇章结构,并基于连接词构建汉语的篇章关系体系。2)提出一套汉语篇章结构标注规范,并结合自举学习和主动学习方法半自动构建一定规模的高质量汉语篇章结构标注资源。3)以子句为基本单位,自底向上,借鉴依存句法分析算法,分析篇章中的层次结构及各组成成分之间的结构关系。有指导性和无指导性方法双管齐下,重点解决隐式(连接词缺省)篇章结构关系的识别。
结项摘要
篇章级结构分析针对篇章的连贯性,是篇章级语义分析的基础。目前自然语言处理研究的重点聚焦在词法和句法层面,对篇章内在规律的研究相对较少,缺乏对篇章进行有效分析的理论和计算方法,从而严重制约了基于篇章的相关应用。本项目从理论体系探索、语料库构建和计算模型研究等方面系统开展了汉语篇章结构分析的研究,主要研究成果包括:1)提出了基于连接依存树(Connective-driven dependency tree)的汉语篇章结构表示机制,该机制融合了PDTB和RST分别重视连接词和篇章层次结构的优点;2)建立了汉语篇章结构标注规范,建成了一个包含500个文档9000多个篇章关系的汉语篇章结构语料库(CDTB1.0);3)基于上述标注语料库,系统研究了汉语小句、篇章层次、篇章关系及连接词等识别算法,实现了一个端到端的汉语篇章结构分析器。本项目的研究丰富和深化了汉语篇章结构形式分析的理论研究,奠定了汉语篇章结构计算分析的资源基础与算法基础,并为篇章翻译、文本摘要等相关研究奠定了扎实的理论、资源及技术基础。
项目成果
期刊论文数量(11)
专著数量(0)
科研奖励数量(0)
会议论文数量(10)
专利数量(0)
汉语显式篇章关系分析
- DOI:--
- 发表时间:2014
- 期刊:中文信息学报
- 影响因子:--
- 作者:丁彬;孔芳;李生;周国栋
- 通讯作者:周国栋
复合名词短语 N1 AN2 形容词语义指向的判定与分析
- DOI:--
- 发表时间:2013
- 期刊:汉语学习
- 影响因子:--
- 作者:冯文贺
- 通讯作者:冯文贺
空省识别在中文句法分析的应用
- DOI:--
- 发表时间:2013
- 期刊:JOURNAL OF COMPUTER SCIENCE AND TECHNOLOGY
- 影响因子:0.7
- 作者:Guodong Zhou;Peifeng Li
- 通讯作者:Peifeng Li
基于依存句法树结构的中文名词性谓词语义角色标注
- DOI:--
- 发表时间:2013
- 期刊:JOURNAL OF COMPUTER SCIENCE AND TECHNOLOGY
- 影响因子:0.7
- 作者:Hongling Wang;Guodong Zhou
- 通讯作者:Guodong Zhou
汉语隐式篇章关系识别
- DOI:--
- 发表时间:2013
- 期刊:北京大学学报(自然科学版)
- 影响因子:--
- 作者:孙静;李艳翠;周国栋;冯文贺
- 通讯作者:冯文贺
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
面向自然语言文本的否定性与不确定性信息抽取
- DOI:--
- 发表时间:2015
- 期刊:软件学报
- 影响因子:--
- 作者:邹博伟;钱忠;陈占成;朱巧明;周国栋
- 通讯作者:周国栋
汉语表述识别与指代消解
- DOI:--
- 发表时间:2016
- 期刊:计算机工程
- 影响因子:--
- 作者:黄学华;孔芳;周国栋
- 通讯作者:周国栋
融合上下文依赖和句子语义的事件线索检测研究
- DOI:--
- 发表时间:2018
- 期刊:计算机科学与探索
- 影响因子:--
- 作者:王凯;洪宇;邱盈盈;姚建民;周国栋
- 通讯作者:周国栋
衔接性驱动的篇章一致性建模研究
- DOI:--
- 发表时间:2014
- 期刊:中文信息学报
- 影响因子:--
- 作者:徐凡;朱巧明;周国栋;王明文
- 通讯作者:王明文
基于简介和评论的标签推荐方法研究
- DOI:--
- 发表时间:2015
- 期刊:中文信息学报
- 影响因子:--
- 作者:褚晓敏;王中卿;朱巧明;周国栋
- 通讯作者:周国栋
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
周国栋的其他基金
面向信息安全领域的事件分析及态势感知研究
- 批准号:62376178
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
基于事件关联性的层次话题建模研究
- 批准号:62076175
- 批准年份:2020
- 资助金额:59 万元
- 项目类别:面上项目
汉语篇章话题结构:形式化表示体系、语料库构建及其关键技术研究
- 批准号:61673290
- 批准年份:2016
- 资助金额:65.0 万元
- 项目类别:面上项目
跨语言社会舆情分析基础理论与关键技术研究
- 批准号:61331011
- 批准年份:2013
- 资助金额:285.0 万元
- 项目类别:重点项目
基于配价结构和话题结构的汉语句法分析和语义计算模型研究
- 批准号:90920004
- 批准年份:2009
- 资助金额:50.0 万元
- 项目类别:重大研究计划
基于树核函数的弱指导实体间语义关系抽取研究
- 批准号:60873150
- 批准年份:2008
- 资助金额:30.0 万元
- 项目类别:面上项目
基于机器学习的高性能自适应信息抽取关键技术研究
- 批准号:60673041
- 批准年份:2006
- 资助金额:27.0 万元
- 项目类别:面上项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}