维语实体指代消歧关键技术研究
项目介绍
AI项目解读
基本信息
- 批准号:61563051
- 项目类别:地区科学基金项目
- 资助金额:40.0万
- 负责人:
- 依托单位:
- 学科分类:F03.自动化
- 结题年份:2019
- 批准年份:2015
- 项目状态:已结题
- 起止时间:2016-01-01 至2019-12-31
- 项目参与者:田生伟; 赵建国; 阿布都沙拉木·阿不力米提; 史新宇; 高双印; 阿地里江·阿力木江; 努儿古丽·买买江; 古丽巴哈尔·麦麦提; 穆合塔尔·阿布力孜;
- 关键词:
项目摘要
Uyghur entity anaphora disambiguation is the keypoint of intelligent information processing based on Uyghur natural language. The purpose of the project is to establish a set of theory system about entity anaphora disambiguation in Uyghur natural language processing, which combines with the language rules of Uyghur for text comprehension. The project can develop the corresponding key technique and construct the relevant language resource. In addition, it can also set up the laboratory platform and solve the important problems which hinder its development. In particular, 1) for the problem of lacking in corpora resource, we construct the resource platform for Uyghur entity anaphora disambiguation, which possesses large-scale and high-quality corpora resource so that the project can go well. 2) For the problem of linguistic specificity, a series of Uyghur rule sets are created combining with the language rules and features. The rule sets can not only provide reference standard for rule-based method, but also provide effective feature sets for method based on machine learning. 3)For the numerous types of entity anaphora and the high disparities among various coreferences, the resolution model applied to different anaphora types is built based on studying each case of coreference deeply. Thus, these various anaphora types can be disambiguated effectively by the model. The project lays the technology foundation for the research and development of Uyghur information extraction, Uyghur to Chinese machine translation, Uyghur automatic summarization, question-answering system and so on.
维吾尔语实体指代消歧是维吾尔语自然语言智能信息处理的关键点。本项目旨在面向维吾尔语篇章理解、结合维吾尔语语言规律,建立一套适用于维吾尔语自然语言处理的实体指代消歧的理论方法体系,开发相应关键技术,构建相关语言资源,建设实验平台,解决阻碍其发展的重要科学问题。特别是:1)针对语料资源匮乏问题,构建面向维语实体指代消歧的资源建设平台,建设大规模、高质量语料资源,保障本项目的顺利开展。2)针对语言特殊性问题,充分分析维吾尔语语言规律和特点,构建一系列维语语言规则集,既为基于规则的方法提供参照标准,也为基于机器学习的方法提供有效的特征集。3)针对维吾尔语中实体指代类型多、各种指代之间差异大的问题,在对每一种指代现象都进行深入研究的基础上,建立适用于不同指代类型的消歧模型,实现对不同类型指代的有效消歧。为维语信息抽取、维-汉机器翻译、维语自动文摘、问答系统等上层应用的研究与发展奠定技术基础。
结项摘要
项目总体进展顺利,所有研究计划已按要求完成,达到预期目标。特别是:.1)收集了包含新闻评论、人物评论以及产品评论等领域的生语料,标注了包含人称代词、名词短语和零指代在内的727个篇章,采用系统性、一致性的解决方案,规范文本的标注。.2)人称代词待消解项识别方面:提出一种基于深度置信网络的人称代词待消解项识别方法。总结出包含10项特征的维吾尔语人称代词待消解项特征集。结果表明,该方法识别维吾尔语人称代词待消解项的准确率达95.17%,比SVM算法提高了9%,验证了其有效性和可行性。.3)人称代词指代消歧方面:提出一种结合语境多注意力独立循环神经网络的人称代词指代消解方法。该方法结合多注意力机制,弥补了仅依赖内容层面特征的不足。模型在维吾尔语人称代词指代消解任务中的准确率为90.79%,召回率为83.25%,结果表明,该模型能显著提升维吾尔语指代消解性能。.4)名词短语待消解项识别方面:提出一种利用栈式非负约束自编码器完成基于语义特征的待消解项识别方法。提取出15个特征,利用SNCAE提取出深层语义特征。结果表明基于SNCAE的名词短语待消解项识别方法比SVM和SAE更适合维吾尔语的待消解项识别任务。.5)名词短语指代消歧方面:提出了一种利用栈式自编码深度学习算法进行基于语义特征的指代消解方法。提取出13项特征并引入Word embedding。该方法在指代消解任务中的准确率为74.5%,召回率为70.6%,F值为72.4%。结果证明,深度学习模型较浅层的支持向量机更合适于指代消解任务。.6)零代词指代消歧方面:提出采用栈式降噪自编码的深度学习机制进行维吾尔语零指代消解。抽取14项针对零指代消解任务的手工设计特征;融合word embedding特征和14项hand-crafted特征作为输入。结果验证了该方法的有效性及栈式降噪自编码在任务中具备挖掘高层面鲁棒性语义特征的优势。. 发表论文15篇,其中EI收录源期刊5篇,中文核心期刊论文10篇(中文信息学报6篇);获得软件著作权4项;获得省部级优秀论文1项,培养硕士研究生8人。
项目成果
期刊论文数量(13)
专著数量(0)
科研奖励数量(1)
会议论文数量(0)
专利数量(0)
细粒度意见挖掘中维吾尔语文本情感分析研究
- DOI:--
- 发表时间:2016
- 期刊:中文信息学报
- 影响因子:--
- 作者:罗亚伟;田生伟;禹龙;吐尔根·依布拉音;艾斯卡尔·艾木都拉
- 通讯作者:艾斯卡尔·艾木都拉
注意力机制的LSTM-DBN维语人称代词指代消解
- DOI:--
- 发表时间:2019
- 期刊:计算机技术与发展
- 影响因子:--
- 作者:李东欣;禹龙;田生伟;李圃;赵建国
- 通讯作者:赵建国
维吾尔语名词短语待消解项识别
- DOI:--
- 发表时间:2017
- 期刊:中文信息学报
- 影响因子:--
- 作者:陶豆豆;禹龙;田生伟;赵建国;吐尔根·依布拉音;艾斯卡尔·艾木都拉
- 通讯作者:艾斯卡尔·艾木都拉
深度学习的维吾尔语语句隐式情感分类
- DOI:10.16208/j.issn1000-7024.2016.09.053
- 发表时间:2016
- 期刊:计算机工程与设计
- 影响因子:--
- 作者:李冬白;田生伟;禹龙;艾斯卡尔·艾木都拉;吐尔根·依布拉音
- 通讯作者:吐尔根·依布拉音
基于Bi-LSTM的维吾尔语人称代词指代消解
- DOI:--
- 发表时间:2018
- 期刊:电子学报
- 影响因子:--
- 作者:田生伟;秦越;禹龙;吐尔根·依布拉音;冯冠军
- 通讯作者:冯冠军
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
MD-MLI: Prediction of miRNA-lncRNA Interaction by Using Multiple Features and Hierarchical Deep Learning
MD-MLI:利用多重特征和分层深度学习预测 miRNA-lncRNA 相互作用
- DOI:10.1016/j.media.2017.11.011
- 发表时间:2020
- 期刊:IEEE/ACM Transactions on Computational Biology and Bioinformatics
- 影响因子:--
- 作者:宋金淼;田生伟;禹龙;杨启萌;邢艳;张超;代启国;段晓东
- 通讯作者:段晓东
汉维语短语搭配的识别和对齐
- DOI:--
- 发表时间:--
- 期刊:计算机应用与软件
- 影响因子:--
- 作者:禹龙;田生伟;杨飞宇
- 通讯作者:杨飞宇
结合注意力机制的Bi-LSTM维吾尔语事件时序关系识别
- DOI:--
- 发表时间:2018
- 期刊:东南大学学报(自然科学版)
- 影响因子:--
- 作者:田生伟;胡伟;禹龙;吐尔根·依布拉音;赵建国;李圃
- 通讯作者:李圃
Anaphoricity Determination of Anaphora Resolution in Uygur Pronoun Based on CNN-LSTM Model
基于CNN-LSTM模型的维吾尔代词照应消解的照应判定
- DOI:10.1142/s146902681750016x
- 发表时间:2017
- 期刊:International Journal of Computational Intelligence and Applications
- 影响因子:1.8
- 作者:田生伟;李冬白;禹龙;冯冠军;赵建国;李圃
- 通讯作者:李圃
维吾尔语意见挖掘关系抽取研究
- DOI:--
- 发表时间:2013
- 期刊:计算机工程与设计
- 影响因子:--
- 作者:禹龙;田生伟;吐尔根·依布拉音;艾斯卡尔·艾木都拉
- 通讯作者:艾斯卡尔·艾木都拉
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
禹龙的其他基金
多模态皮肤病辅助诊断关键技术研究
- 批准号:62362061
- 批准年份:2023
- 资助金额:32 万元
- 项目类别:地区科学基金项目
面向内容安全的情感隐喻分析研究
- 批准号:61962057
- 批准年份:2019
- 资助金额:38 万元
- 项目类别:地区科学基金项目
细颗粒度维吾尔语文本意见挖掘方法的研究
- 批准号:61262064
- 批准年份:2012
- 资助金额:45.0 万元
- 项目类别:地区科学基金项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}