融合多特征的藏文事件属性信息抽取理论与方法研究
项目介绍
AI项目解读
基本信息
- 批准号:61762076
- 项目类别:地区科学基金项目
- 资助金额:37.0万
- 负责人:
- 依托单位:
- 学科分类:F0211.信息检索与社会计算
- 结题年份:2021
- 批准年份:2017
- 项目状态:已结题
- 起止时间:2018-01-01 至2021-12-31
- 项目参与者:万福成; 李亚超; 孟祥和; 杨东伟; 格日多杰; 丁海兰; 夏吾措;
- 关键词:
项目摘要
This project focuses on the theory and method for extraction of Tibetan events, with the aim to provide technical support for Tibetan public opinion anlysis, Tibetan semantic mining and Tibetan question answering. Main contents of this project are as follows: Tibetan part-of-speech tagging, entity recognition and normalization, so as to form integration tools for morphological analysis with Tibetan characteristics; extracting the trigger words of Tibetan event, establishment of the binary table for Tibetan trigger-type of event to relize the recognition and classification model of event; the construction of theoretical system for argument roles of Tibetan event to provide theoretical fundamental basis for representation and extraction model of event; constructing the system of Tibetan event to provide unified service interface. Key scientific problems needed to be solved are: Tibetan syntactic treebank constructing strategy; recognition of Tibetan tirgger for event; Tibetan sematic information expression and labeling; recognition algorithm of event type; theoretical system for argument structure of Tibetan event; argument role labeling algorithm of Tibetan event; generalization of event mode.Innovations from this project are: normative approach of Tibetan text under the environment of free-domain; automatic Segmentation for Tibetan Sentence integrating analysis of compound sentences; recognize Tibetan event based on rules and statictics ;labeling the argument role for event combining the Tibetan syntactic feature; Integrating syntactic and sematic features into Tibetan event extraction.
本课题针对藏文事件的抽取理论与方法开展研究工作,预期为藏文舆情分析、藏文语义挖掘、藏语自动问答等领域提供藏语言处理理论及技术支持。研究内容包括:研究词性标注、藏文实体识别和实体正则化,形成具有藏文特色的词法分析集成工具;抽取藏文事件触发词,建立藏文触发词-事件类别二元表,完成藏文事件的识别及其分类模型;构建藏文事件论元语义角色的理论体系,为事件表示、事件抽取模式提供理论基础;搭建藏文事件抽取系统,提供统一服务接口。拟解决的关键科学问题有:藏语短语句法树库构建策略;藏语语义信息表示及标注方案;藏文事件触发词识别;藏文事件论元结构的理论体系;事件论元角色标注算法;藏语事件表示方案及分类识别。创新点:开放域环境下藏文文本资源的规范化处理;融入藏文复句分析的藏文文本自动断句模型;基于规则和统计相结合的藏文候选事件类别识别算法;结合藏文句法特点的事件论元角色标注;融合句法和语义特征的藏文事件抽取。
结项摘要
事件抽取是从文本中自动地抽取特定类型的事件及其事件要素,并以结构化的形式呈现出来。事件抽取作为信息处理领域的关键技术,在信息检索、自动问答、文本挖掘等领域有着广泛的应用。融合句法和语义线索的藏文事件抽取算法可实际运用到藏文舆情监控、藏文文本关联检测、藏文热点话题识别与跟踪等信息安全系统中,具有较好的学术价值和广阔的应用前景。对基于藏文数据库和知识库的自动生成、藏文问答系统、藏文信息检索等领域研究有着积极的意义。.本项目针对事件抽取任务开展语义角色标注任务,语义角色标注旨在标注出句子中所有与谓语相关的语义成分,是进行语义分析的基础和关键技术.使用传统的机器学习方法进行语义角色标注,需要人工设定特征,特征稀疏且工作繁琐沉重,同时传统方法对句法解析精度有较高要求,所以语义角色标注发展缓慢.针对上述情况,采取基于双向长短时记忆(BiLSTM)网络-注意力机制(attention)-条件随机场(CRF)模型进行汉语语义角色标注,同时尝试针对性引入其他资源优化模型性能.在训练阶段,将词性、依存句法特征以及短语结构句法特征组成的多线索特征组共同送入模型.经过多组对照实验论证,相比于BiLSTM-CRF模型,融合注意力机制的模型性能显著提升,并且引入的多线索特征组可以进一步提升模型性能。.本项目在藏语短语句法分析的基础上,融入功能语义信息线索,采用在藏语短语句法树库的基础上加入语义角色标注的方法,并融合事件触发词信息,对藏文信息进行抽取,并通过实验进行了对比分析,事件特征融合与已标注信息对藏文信息抽取有帮助,模型可以很好的应用于藏文信息抽取工作。
项目成果
期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(4)
专利数量(0)
融合多层次特征的中文语义角色标注
- DOI:10.11992/tis.201910012
- 发表时间:2020
- 期刊:智能系统学报
- 影响因子:--
- 作者:王一成;万福成;马宁
- 通讯作者:马宁
基于条件随机场的多线索中文语义角色标注
- DOI:10.7540/j.ynu.20190397
- 发表时间:2020
- 期刊:云南大学学报( 自然科学版)
- 影响因子:--
- 作者:王一成;万福成;马宁
- 通讯作者:马宁
一种融合性格线索的微博情感分类
- DOI:10.7540/j.ynu.20190598
- 发表时间:2020
- 期刊:云南大学学报. 自然科学版
- 影响因子:--
- 作者:贾莉;江涛;马宁;孟家豪
- 通讯作者:孟家豪
结合注意力机制的多策略汉语语义角色标注
- DOI:--
- 发表时间:2021
- 期刊:厦门大学学报(自然科学版)
- 影响因子:--
- 作者:朱傲;万福成;马宁;车郭怡
- 通讯作者:车郭怡
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
基于关联的零件特征尺寸更改传播方法
- DOI:10.13349/j.cnki.jdxbn.20200603.001
- 发表时间:2020
- 期刊:济南大学学报(自然科学版)
- 影响因子:--
- 作者:尚俊芝;杨波;马宁;高常青
- 通讯作者:高常青
基底动脉粥样硬化斑块磁共振成像
- DOI:--
- 发表时间:2011
- 期刊:中华医学会第十八次全国放射学学术会议论文汇编
- 影响因子:--
- 作者:娄昕;马林;姜卫剑;马宁
- 通讯作者:马宁
基于网络舆论生态的微博舆论生态位研究
- DOI:--
- 发表时间:2016
- 期刊:情报杂志
- 影响因子:--
- 作者:姜景;沈乾;马宁;刘怡君
- 通讯作者:刘怡君
新型冠状病毒肺炎疫情时期急性 缺血性卒中的急诊取栓治疗
- DOI:--
- 发表时间:2020
- 期刊:中国卒中杂志
- 影响因子:--
- 作者:常青;宋立刚;刘爱华;周保元;张宝瑞;张义森;葛慧剑;高峰;莫大鹏;马宁;缪中荣
- 通讯作者:缪中荣
肢体远端缺血预处理对肺叶切除术患者的肺保护作用
- DOI:--
- 发表时间:2020
- 期刊:中华胸心血管外科杂志
- 影响因子:--
- 作者:吐尔逊阿依.买买提;阿布力克木.艾买提;马宁;马海平
- 通讯作者:马海平
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}

内容获取失败,请点击重试

查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图

请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}