自然语言模糊语义形式化表达、定量分析与应用研究
项目介绍
AI项目解读
基本信息
- 批准号:61201352
- 项目类别:青年科学基金项目
- 资助金额:25.0万
- 负责人:
- 依托单位:
- 学科分类:F0113.信息获取与处理
- 结题年份:2015
- 批准年份:2012
- 项目状态:已结题
- 起止时间:2013-01-01 至2015-12-31
- 项目参与者:符川; 李业刚; 廖黎姿; 闫春雷; 苏超; 庄琨; 王博; 赵兴建;
- 关键词:
项目摘要
Fuzziness is an attribute of natural language, while the essential of fuzziness on Natural Language Understanding (NLU) is based on semantics. As the kernel of acquirement and abstraction for deep knowledge,both academic exploration and mathematical description of fuzzy semantics are scientific researches to be undertaken that are worthy of our discussing in-depth..This project focused on the formalization and quantitative analysis of fuzzy semantics in Chinese, furthermore, prepared to carry out the following specific works based on fuzzy logic from three levels mainly, that is, in theoretical, technical and applied perspective:.i.To distinguish and clarify the differences among fuzziness, polysemy, ambiguity and generality,.ii.To improve the existing traditional quantitative methods for semantic fuzziness and study the quantitative analysis of linguistic hedges in Chinese,.iii.In a particular problem domain, namely Computing With Words or Computation with Natural Language problems (CWW or CNL-problems), To formalize the semantic fuzziness and achieve its mathematical abstraction,.iv. To explore a viable application mode in order to support formalize the fuzzy semantics in short texts (eg. microblog) which have emerged as a new social media..No doubt that semantic fuzziness plays a pivotal role in many disciplines, such as Artificial Intelligence, Cognitive Science, Computational Linguistics, and so on. Expected research results of this project which will expand the classical frame of fuzzy semantics and logic semantics for Chinese, enrich academic content of NLU, and promote intellectualization applications in above realms has the high academic value and practical significance.
模糊性是自然语言的特征之一,而语言理解的模糊本质是以语义为基础的。作为自然语言深层知识获取与抽象的核心,模糊语义的理论研究和数学描述是一项值得我们深入探讨和解决的关键科学问题。本项目着眼于汉语模糊语义形式化表达与定量分析,基于fuzzy logic从理论探索、方法改进和应用支持三个层面开展研究。具体包括:语义模糊性与多义性、歧义性,及概括性的厘清与界定;传统模糊语义定量研究方法改进与模糊限制成分量化分析;特定问题域下自然语言模糊语义的形式化表达与数学抽象;新型社会媒体(微博)语言环境下,网络短文本模糊语义的形式化描述与语言工程应用探索。语义模糊性是人工智能、认知科学、计算语言学等诸多学科交叉融合的"轴心",作为本项目研究成果的方法和解决方案将扩展汉语模糊语义学和逻辑语义学的经典框架,充实自然语言理解领域的理论内容,并推动其在上述学科领域的智能应用,具有很高的学术价值和现实意义。
结项摘要
模糊性是自然语言的特征之一。语义模糊性是人工智能、认知科学、计算语言学等诸多学科交叉融合的“轴心”。模糊语义的理论研究和形式化描述是一项值得深入探讨的关键科学问题。.本项目着眼于自然语言的模糊语义形式化表达、定量分析与应用研究。主要针对汉语、英语和藏语三个语种,围绕各语种自身特点、结合现有资源情况,基于语言学基础、fuzzy logic理论及机器学习方法,从理论探索、方法改进和应用验证三个层面进行研究。具体内容包括:自然语言模糊性现象及规律分析与验证;汉语模糊限定成分的语法属性及形式化表达与数学抽象;选取深层语义粒度,汉英双语MNP形式化描述与识别;拓展建立可重复性研究的问题集,探索开展藏语功能组块形式化分析与识别;及资源建设、语言特征建模及其他关键技术研究。.本项目厘清了语义模糊性与多义性、歧义性及概括性等语言现象的异同,有助于业界对相关概念的理解。以汉语情感词为语义模糊性分析重点,根据语言成词结构特点,分类细化,将情感词划分为基础类和复合类,分别量化其模糊语义。针对基础情感词,提出了基于高斯分布的汉语情感词模糊语义量化方法;针对复合情感词,着重考虑修饰词对其情感倾向的影响,提出了融合七种结构形式化表达的多策略的情感倾向强度量化策略,情感词模糊语义的量化准确率大幅提高。针对资源丰富的英语,根据最大名词短语自身涵盖形式化语义的结构属性,提出了基于半监督学习的英汉双语最大名词短语识别方法,利用汉英最大名词短语的互译性和识别的互补性,把平行的汉语句子和英语句子看作一个数据集的两个不同视图,而不是传统方法下两个独立集,进行双语协同训练,显著提高了识别能力,一定程度上达到了语义分析的目的。针对资源匮乏的现代藏语,结合其语言学理论基础,依据句法分类标注体系,以功能块作为研究切入点,并将组块形式化分析任务细化为功能块边界识别和类型标注。提出基于条件随机场模型以音节为单位的功能组块边界识别方法;并将错误驱动学习思想引入组块边界识别研究,充分探索了不经分词及词性标注直接进行藏语语义分析的可行性。.本项目所提出的研究方法和解决方案扩展了模糊语义学和逻辑语义学的经典框架,具有较高的学术价值。在藏汉机器翻译和面向微博的互联网内容分析等应用领域的验证结果充分表明所提出方法和研究框架的有效性与可行性,对于推动不同语种模糊语义形式化表达与量化分析研究具有积极作用和现实意义。
项目成果
期刊论文数量(5)
专著数量(0)
科研奖励数量(0)
会议论文数量(5)
专利数量(0)
基于错误驱动学习策略的藏语句法功能组块边界识别
- DOI:--
- 发表时间:2014
- 期刊:中文信息学报
- 影响因子:--
- 作者:史树敏;龙从军;黄河燕;李琳
- 通讯作者:李琳
基于双语协同训练的最大名词短语识别研究
- DOI:--
- 发表时间:2015
- 期刊:软件学报
- 影响因子:--
- 作者:黄河燕;史树敏;鉴萍;苏超
- 通讯作者:苏超
Theoretical studies on the high-spin binuclear cyclopentadienyliron derivatives Cp2Fe2(CN)n (Cp = η5-C5H5; n = 6, 5,4,3,2,1)
高自旋双核环戊二烯基铁衍生物Cp2Fe2(CN)n (Cp = η5-C5H5; n = 6, 5,4,3,2,1)的理论研究
- DOI:--
- 发表时间:2013
- 期刊:Molecular Physics
- 影响因子:1.7
- 作者:Na Wang;Yang Bai;Shumin Shi;Qianshu Li
- 通讯作者:Qianshu Li
Theoretical studies on the high-spin binuclear cyclopentadienyliron derivatives Cp2Fe2(CN)(n) (Cp =eta(5)- C5H5; n=6, 5, 4, 3, 2, 1)
高自旋双核环戊二烯基铁衍生物Cp2Fe2(CN)(n) (Cp =eta(5)- C5H5; n=6, 5, 4, 3, 2, 1)的理论研究
- DOI:--
- 发表时间:2014
- 期刊:Molecular Physics
- 影响因子:1.7
- 作者:Wang, Na;Bai, Yang;Shi, Shumin;Li, Qianshu
- 通讯作者:Li, Qianshu
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
基于ERNIE的命名实体识别
- DOI:--
- 发表时间:2020
- 期刊:智能计算机与应用
- 影响因子:--
- 作者:张晓;李业刚;王栋;史树敏
- 通讯作者:史树敏
基于本体的汉语领域命名实体识别
- DOI:--
- 发表时间:--
- 期刊:情报学报
- 影响因子:--
- 作者:史树敏;黄河燕;冯冲
- 通讯作者:冯冲
自然语言文本共指消解性能评测算法研究
- DOI:--
- 发表时间:--
- 期刊:计算机科学
- 影响因子:--
- 作者:刘东升;黄河燕;史树敏
- 通讯作者:史树敏
多策略机器翻译研究综述
- DOI:--
- 发表时间:2015
- 期刊:中文信息学报
- 影响因子:--
- 作者:黄河燕;史树敏;冯冲;苏超
- 通讯作者:苏超
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
史树敏的其他基金
基于Restriction-Centered Theory的自然语言模糊语义理论研究及应用
- 批准号:61671064
- 批准年份:2016
- 资助金额:65.0 万元
- 项目类别:面上项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}