规则与统计相结合的现代汉语虚词用法自动识别研究
项目介绍
AI项目解读
基本信息
- 批准号:60970083
- 项目类别:面上项目
- 资助金额:30.0万
- 负责人:
- 依托单位:
- 学科分类:F0211.信息检索与社会计算
- 结题年份:2012
- 批准年份:2009
- 项目状态:已结题
- 起止时间:2010-01-01 至2012-12-31
- 项目参与者:俞士汶; 朱学锋; 张坤丽; 柴玉梅; 穆玲玲; 赵丹; 史苇杭; 刘锐; 张军珲;
- 关键词:
项目摘要
与其它语言相比,汉语虚词在现代汉语中承担着尤其重要的语法表现和语义辨析任务。一般地,在句子中用错一个实词会造成一个词汇理解的错误,而用错一个虚词往往会造成整个句子甚至篇章的理解错误。因此,对现代汉语虚词用法的自动识别研究,将有助于现代汉语精确的机器理解,促进中文信息处理的相关研究。.现代汉语虚词的研究历史悠久,成果丰富。但是目前已有的虚词研究成果大都是面向人用的,很难直接应用于自然语言处理的研究。申请人从计算语言学的观点出发,根据目前汉语虚词知识的研究成果以及对《人民日报》中虚词用法的真实分布信息,着力改进现有的现代汉语虚词知识库,通过附加概率信息的虚词用法规则库,并利用ME、SVM以及CRF等统计模型,探讨规则与统计相结合的现代汉语虚词用法的自动识别。本项目研究成果可直接应用于机器翻译、信息检索、信息抽取、文本情感计算等自然语言处理领域,为中文文本内容的机器理解提供数据基础和技术支持。
结项摘要
在国家自然科学基金项目“规则与统计相结合的现代汉语虚词用法自动识别研究”(60970083)的资助下,郑州大学及北京大学的有关人员,经过多年的合作研究探索,在现代汉语虚词用法自动识别及相关知识库构建方面取得了较为丰富的研究成果。具体要点如下:. (1)将语言学理论与计算机应用的具体需求相结合,设计并构建了包括现代汉语虚词用法词典、现代汉语虚词用法规则库以及现代汉语虚词用法标注语料库三位一体的现代汉语虚词用法知识库,为中文信息处理的相关研究和应用提供数据基础。. (2)研究现代汉语虚词用法的自动识别技术,设计了现代汉语虚词用法自动标注系统,实现了规则模型、统计模型以及规则与统计相结合的模型及识别算法,提高了现代汉语虚词自动识别的准确率。. (3)研发虚词用法知识库辅助构建工具包、语料库自动标注工具包及知识库查询工具包,降低了知识库构建的人工投入,提高了质量,推广应用前景广阔。. (4)发表相关学术文章30余篇,相关研究成果通过河南省科学技术厅科技成果鉴定,鉴定意见为“国际先进”。培养青年教师及硕士研究生近20名。. 汉语虚词在现代汉语中承担着尤其重要的语法表现和语义辨析任务,现代汉语虚词用法的自动识别问题研究,是以现代汉语虚词知识库为基础,根据虚词在真实文本中的具体表现特征,人工总结其中的规律并进行形式化规则描述,再结合统计方法,对真实文本中汉语虚词用法进行机器学习,训练得到合适的语言模型,从而实现虚词用法的自动识别,对部分常用虚词用法的自动识别达到了80%以上准确率。本项目研究成果已初步应用于句法分析、情感计算、信息抽取、对外汉语教学等自然语言处理领域,为中文文本内容的机器理解提供了一定数据基础和技术支持。
项目成果
期刊论文数量(15)
专著数量(0)
科研奖励数量(0)
会议论文数量(17)
专利数量(0)
副词 '就' 的用法及其自动识别研究
- DOI:--
- 发表时间:--
- 期刊:中文信息学报
- 影响因子:--
- 作者:昝红英;张军珲;朱学锋;俞士汶
- 通讯作者:俞士汶
基于统计的介词短语边界识别研究
- DOI:--
- 发表时间:--
- 期刊:河南大学学报
- 影响因子:--
- 作者:张坤丽;韩英杰;昝红英;柴玉梅
- 通讯作者:柴玉梅
面向自然语言处理的汉语虚词研究与广义虚词知识库构建
- DOI:--
- 发表时间:--
- 期刊:当代语言学
- 影响因子:--
- 作者:昝红英;朱学锋
- 通讯作者:朱学锋
新闻报道文本的情感倾向性研究
- DOI:--
- 发表时间:--
- 期刊:计算机工程
- 影响因子:--
- 作者:昝红英;郭明;柴玉梅;吴云芳
- 通讯作者:吴云芳
面向多种语料的语气词用法规则问题研究
- DOI:--
- 发表时间:--
- 期刊:计算机工程与应用
- 影响因子:--
- 作者:周溢辉;昝红英;穆玲玲
- 通讯作者:穆玲玲
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
基于多源知识和Ranking SVM的中文微博命名实体链接
- DOI:--
- 发表时间:2015
- 期刊:中文信息学报
- 影响因子:--
- 作者:陈万礼;昝红英;吴泳钢
- 通讯作者:吴泳钢
基于LDA的弱监督文本分类方法
- DOI:10.16208/j.issn1000-7024.2017.01.017
- 发表时间:2017
- 期刊:计算机工程与设计
- 影响因子:--
- 作者:张金瑞;柴玉梅;昝红英;高明磊
- 通讯作者:高明磊
网络用语词典的构建及问题分析
- DOI:--
- 发表时间:2016
- 期刊:中文信息学报
- 影响因子:--
- 作者:昝红英;许鸿飞;张坤丽;穗志方
- 通讯作者:穗志方
基于SVM与RNN的文本情感关键句判定与抽取
- DOI:--
- 发表时间:2014
- 期刊:山东大学学报(理学版)
- 影响因子:--
- 作者:刘铭;昝红英;原慧斌
- 通讯作者:原慧斌
基于极性转移和LSTM递归网络的情感分析
- DOI:--
- 发表时间:2015
- 期刊:中文信息学报
- 影响因子:--
- 作者:柴玉梅;原慧斌;高明磊;昝红英
- 通讯作者:昝红英
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}