汉语句法分析中的自动歧义识别和分类问题研究
项目介绍
AI项目解读
基本信息
- 批准号:61300158
- 项目类别:青年科学基金项目
- 资助金额:23.0万
- 负责人:
- 依托单位:
- 学科分类:F0211.信息检索与社会计算
- 结题年份:2016
- 批准年份:2013
- 项目状态:已结题
- 起止时间:2014-01-01 至2016-12-31
- 项目参与者:陈家骏; 赵迎功; 周浩; 陈华栋; 朱长峰; 孙辉丰;
- 关键词:
项目摘要
Efficient information processing applications often require effective methods to automatically analyze and understand the text. Syntactic analysis, or parsing, is an important step of the text analysis pipeline. However, the parsing result of real world applications is usually not good enough. An important factor of parsing errors is the structural ambiguity. Structural ambiguity refers to the presence of multiple syntactic structures for the same or similar sentence fragments. Most of the previous studies focus on the theoretical issues, the analysis of given ambiguous instances or the application of a certain linguistic resource. In this project we plan to study methods for automatically identifying and classifying structural ambiguities. We firstly identify structural ambiguities using uncertainty measures. Then we classify these ambiguities into different categories according to the context or linguistic resources requires to solve them. These identification and classification results may leads to specific resolution techniques for a certain ambiguity type and better resolution result.
高效的信息处理应用需要有效的文本的自动分析和理解方法,句法分析是文本分析体系中的重要环节。句法分析效果在实际应用中仍然难以让人满意,这主要是由于对句法结构歧义的处理错误导致的。句法结构歧义是指存在相同或相似的句子片段对应多个不同的句法结构的情况。以往的研究大多关注于部分歧义实例的消解、某个具体的歧义问题或特定的语义资源的使用,缺乏通用的歧义处理手段。本项目拟研究在自动句法分析中的歧义识别方法以及面向消解过程的歧义分类方法。首先采用不确定性分析的技术对句法分析中影响分析效果的关键性歧义自动识别;然后结合语言学的歧义理论,根据消解这些歧义所需要的不同上下文和语义知识来源对歧义进行分类,为自动的歧义消解提供依据。
结项摘要
句法分析建立在词法分析的基础上,为高层的语法语义分析提供基础,是自然语言处理中的一项基本任务。句法分析中的歧义问题是指对给定的语言片段存在多个可能的句法标注的情况。在分析过程中,歧义往往是由于模型本身的建模的上下文信息不足等原因造成的。如果这些歧义不能被有效地识别和消解,句法分析性能将会受到影响。.围绕自动句法分析中的歧义识别问题,本项目从给定句法分析模型下的歧义识别问题和给定任务场景下的歧义消解问题两个方面展开了研究。第一方面,研究了基于统计和神经网络的句法分析表示和建模以及句法分析中的歧义表示、建模和搜索的方法和技术。探索了在复杂的结构化预测问题中进行建模和搜索的方法和手段,为进一步进行歧义的判别和消解奠定了基础。第二方面,研究了句法分析中歧义判别和消解方法以及一些特殊歧义来源和特定任务中的歧义消解。探索了在复杂的自然语言处理任务需求和场景下的歧义分析、消解的方法和技术,为更好的研究更加通用的歧义分析消解方法打下了基础。项目进行过程中研制了多个句法分析系统具有较好的分析精度,以及较高的分析效率,可以为文本分析理解等应用服务。.
项目成果
期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(8)
专利数量(0)
中英命名实体识别及对齐中的中文分词优化
- DOI:--
- 发表时间:2015
- 期刊:电子学报
- 影响因子:--
- 作者:尹存燕;黄书剑;戴新宇;陈家骏
- 通讯作者:陈家骏
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
一种基于图划分的无监督汉语指代消解算法
- DOI:--
- 发表时间:--
- 期刊:中文信息学报
- 影响因子:--
- 作者:周俊生;陈家骏;黄书剑;曲维光
- 通讯作者:曲维光
一种适用于机器翻译的汉语分词方法
- DOI:--
- 发表时间:2012
- 期刊:中文信息学报
- 影响因子:--
- 作者:奚宁;李博渊;黄书剑;陈家骏
- 通讯作者:陈家骏
词对齐搜索中的假设剪枝
- DOI:--
- 发表时间:--
- 期刊:Chinese Journal of Electronics
- 影响因子:1.2
- 作者:黄书剑;戴新宇
- 通讯作者:戴新宇
一种基于句法的用于汉英翻译的预调序方法
- DOI:--
- 发表时间:2011
- 期刊:中国计算语言学研究前沿进展(2009-2011)
- 影响因子:--
- 作者:吴秋锋;黄书剑;戴新宇;陈家骏
- 通讯作者:陈家骏
一种错误敏感的词对齐评价方法
- DOI:--
- 发表时间:--
- 期刊:中文信息学报
- 影响因子:--
- 作者:赵迎功;戴新宇;陈家骏;奚宁;黄书剑
- 通讯作者:黄书剑
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
黄书剑的其他基金
面向多任务的机器翻译知识学习和共享研究
- 批准号:62376116
- 批准年份:2023
- 资助金额:51 万元
- 项目类别:面上项目
基于结构信息的神经网络机器翻译研究
- 批准号:61772261
- 批准年份:2017
- 资助金额:59.0 万元
- 项目类别:面上项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}