基于Restriction-Centered Theory的自然语言模糊语义理论研究及应用
项目介绍
AI项目解读
基本信息
- 批准号:61671064
- 项目类别:面上项目
- 资助金额:65.0万
- 负责人:
- 依托单位:
- 学科分类:F0113.信息获取与处理
- 结题年份:2020
- 批准年份:2016
- 项目状态:已结题
- 起止时间:2017-01-01 至2020-12-31
- 项目参与者:李业刚; 苏超; 吴昊; 周新宇; 苏日海; 张露; 史胜清;
- 关键词:
项目摘要
Human knowledge and natural language across a wide of array of domains have a big deal of imprecision and fuzziness. Therefore, as typical ill-posed problem, from theoretical, methodological and applicative aspects, researches on exploring the mathematical formalization and precisiation of semantics based on Restriction-Centered Theory on sentence level have been increasingly involved in Natural Language Understanding (NLU). Particularly, the elasticity of meaning cannot be ignored. To bridge the gap between human-understanding and machine-readable, especially, on common sense of language expression that almost imply fuzzy semantics, this project will focus on the following concrete points. i.to distinguish and clarify the differences between fuzziness and polysemy, ambiguity, metaphor both from lexical and pragmatics perspectives; ii.to study formalization and quantitative analysis of fuzzy semantics in Chinese and English phenomena under the machine-computable scheme in specific domains, namely Computing With Words or Computation with Natural Language problems; iii.to probe into the elasticity of semantics amid daily reasoning language expressions, then put forward the method of precisiation of fuzziness meanings through treating such expressions as fuzzy propositions with linguistic variables and generalized semantic constraints based on Restriction-Centered Theory; iv.to apply the expected studying results of this project to information retrieval with linguistic hedges which always play a role of syntactical function in sentence, and canonical forms and descriptions for construction of common sense knowledge which primarily impact the performance of automatic question and answering system.Furthermore, to support the deeply parsing logic form of natural language. This project will expand typical fields on fuzzy semantics and logic semantics for Chinese community, enrich academic disciplines in NLU, and promote intellectualization applications in above realms. The main tenor does provide more or less positive effect for those aspiring to contribute to semantic computing in the area of through the lenses of rationalism. Hence,it has the highly theoretical significances, practical prospects, and academic challenges.
人类知识和自然语言普遍存在不准确与模糊性。探索作为不适定问题的自然语言处理中,句子级语义的抽象表示与精确化是当前语义计算的难题,其中弹性语义的精准表达与计算分析不容被忽视。为了跨越人机在蕴含模糊语义的常识类语言命题理解上的鸿沟,本项目基于Restriction-Centered Theory(RCT)深入开展自然语言模糊语义的理论研究与应用验证。具体包括模糊性与歧义、多义及比喻手法的厘清与界定;在特定域开展计算机可计算视角下的、以汉语、英语为主的自然语言模糊性语义量化对比研究,基于RCT探索并提出符合汉语特点的包括弹性语义在内的模糊语义精确化表达与语义计算分析方法,并在信息检索、自动问答常识知识推理等应用中进行验证,为更深层次自然语言逻辑形式分析提供直接支持。本项目所提出的分析理论、研究方法及工程应用解决方案将进一步扩展模糊语义学和模糊逻辑的经典框架,具有很高的学术价值和实用意义与挑战性。
结项摘要
机器理解自然语言的能力受限于语义自动分析处理的水平。语义表达与模糊语义的精确计算是目前的难点问题,探索真实语言工程应用中弹性语义空间下句子级语义计算与语义模糊性有效度量具有重要的研究价值与实用意义。本项目基于中心限制理论(Restriction-Centered Theory)深入开展了自然语言模糊语义的理论研究、关键技术探索及多应用场景验证。.在自然语言(包含语义在内)自身特征挖掘方面,率先设计实现了藏语短语结构树-依存树自动转换算法,首次提出了自底向上的多组块粒度藏语短语树-依存树转换方法;创新性地提出了融合越南语音调、发音相关性特征的汉越SMT模型等;首次提出了基于众包模式构建蒙语口语语料库的解决方案,相关成果在提升稀缺资源型语言智能处理系统性能、改善研究资源生态方面发挥了积极作用。.特定问题域抽象语义表示与精确化方面,本项目基于中心限制理论探索了不同场景的弹性语义空间中解释性集合ED的产生模式及语义关系表示。提出了结合外部情感知识的情绪原因识别模型、基于富知识的隐式情绪及原因联合抽取模型;面向多文档阅读理解的粗-细粒度文档排序方法及答案补全策略;多维度群体情绪分析及可视化;基于加权聚合器的开放知识图谱补全等模型与方法,通过语义约束关系量化句子级模糊语义,成功实现了多个领域的应用验证。.在核心应用场景机器翻译领域,提出了融合目标端语义结构的串-树模型、融合词性特征的平行RNN语言模型、融合隐式树的神经网络翻译模型、基于Pre-training的多策略神经翻译模型、基于组块的汉法神经翻译模型及面向低资源神经网络机器翻译的数据增强方法等一系列关键技术,显著提升了相关领域的翻译系统性能。.本项目发表论文21篇,出版专著2部;申请发明专利8项(授权2项),获授权软件著作权1项;获省部级科技进步一等奖1项,先后培养研究生29名。部分成果已在国家安全部门及解放军某部部署应用。
项目成果
期刊论文数量(10)
专著数量(2)
科研奖励数量(4)
会议论文数量(11)
专利数量(8)
Preordering for Chinese-Vietnamese Statistical Machine Translation
中越统计机器翻译预订
- DOI:10.1587/transinf.2018edp7211
- 发表时间:2019-02
- 期刊:IEICE Transactions on Information and Systems
- 影响因子:0.7
- 作者:Huu-Anh TRAN;Heyan HUANG;Phuoc TRAN;Shumin SHI;Huu NGUYEN
- 通讯作者:Huu NGUYEN
融合用户特征优化聚类的协同过滤算法
- DOI:--
- 发表时间:2019
- 期刊:智能系统学报
- 影响因子:--
- 作者:梁丽君;李业刚;张娜娜;张晓;王栋
- 通讯作者:王栋
Multi-level Chunk-based Constituent-to-Dependency Treebank Transformation for Tibetan Dependency Parsing
藏文依存分析中基于多级块的成分到依存树库转换
- DOI:10.1145/3424247
- 发表时间:2021-03
- 期刊:ACM Transactions on Asian and Low-Resource Language Information Processing
- 影响因子:2
- 作者:Shumin Shi;Dan Luo;Xing Wu;Congjun Long;Heyan Huang
- 通讯作者:Heyan Huang
An Improved Immune Genetic Algorithm for New Word Identification
一种改进的新词识别免疫遗传算法
- DOI:--
- 发表时间:2017
- 期刊:International Journal of Advanced Intelligence
- 影响因子:--
- 作者:Shumin Shi;Shengqing Shi;Xinyu Zhou;Meng Zhao;Heyan Huang
- 通讯作者:Heyan Huang
基于ERNIE的命名实体识别
- DOI:--
- 发表时间:2020
- 期刊:智能计算机与应用
- 影响因子:--
- 作者:张晓;李业刚;王栋;史树敏
- 通讯作者:史树敏
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
基于本体的汉语领域命名实体识别
- DOI:--
- 发表时间:--
- 期刊:情报学报
- 影响因子:--
- 作者:史树敏;黄河燕;冯冲
- 通讯作者:冯冲
基于错误驱动学习策略的藏语句法功能组块边界识别
- DOI:--
- 发表时间:2014
- 期刊:中文信息学报
- 影响因子:--
- 作者:史树敏;龙从军;黄河燕;李琳
- 通讯作者:李琳
自然语言文本共指消解性能评测算法研究
- DOI:--
- 发表时间:--
- 期刊:计算机科学
- 影响因子:--
- 作者:刘东升;黄河燕;史树敏
- 通讯作者:史树敏
基于双语协同训练的最大名词短语识别研究
- DOI:--
- 发表时间:2015
- 期刊:软件学报
- 影响因子:--
- 作者:黄河燕;史树敏;鉴萍;苏超
- 通讯作者:苏超
多策略机器翻译研究综述
- DOI:--
- 发表时间:2015
- 期刊:中文信息学报
- 影响因子:--
- 作者:黄河燕;史树敏;冯冲;苏超
- 通讯作者:苏超
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
史树敏的其他基金
自然语言模糊语义形式化表达、定量分析与应用研究
- 批准号:61201352
- 批准年份:2012
- 资助金额:25.0 万元
- 项目类别:青年科学基金项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}