特定领域实体关系获取与实体链接
项目介绍
AI项目解读
基本信息
- 批准号:61562052
- 项目类别:地区科学基金项目
- 资助金额:39.0万
- 负责人:
- 依托单位:
- 学科分类:F0211.信息检索与社会计算
- 结题年份:2019
- 批准年份:2015
- 项目状态:已结题
- 起止时间:2016-01-01 至2019-12-31
- 项目参与者:王红斌; 张志坤; 文永华; 陈玮; 洪旭东; 邵发; 尚琪; 汪沛; 刘丽佳;
- 关键词:
项目摘要
It is the key point and difficult to extract the domain-specific entity relation and to link them,which is the basis for the domain-specific knowledge graph to be used.The research take the Chinese entity as the object.The research can effectively deal with many tackled problems,such as the entity hierarchical relationship obtaining、the entity relationship obtaining and entity linkage which domain-specific knowledge graph building are faced with. On the aspect of the domain concept hierarchical relations obtaining, proposed a method combined with LDA and MLN, firstly ,using topic models to find the distribution of candidate features of areas of theme and concept, then by use of the advantage of the MLN to correlate features with an entity hierarchy; in the field of entity relations learning, proposed the DBN-based and incorpration of domain knowledge into entity-relationship deep learning model ,which can solve complex field samples relation extraction problem and does not depend on artificial selection feature; in entity linkage , proposed the method based on the model PSL( probability of soft logic) to Link entity, through domain knowledge and entity attributes related feature modeling, combined with the knowledge of the ambiguity entity disambiguation can realize the entity links..The research achievement will be applied to domain knowledge learning platform and contribute to promoting the construction and application of the domain knowledge graph.
特定领域实体关系的获取与实体链接是领域知识库构建中的关键部分和难点,也是领域知识图谱走向应用的基础。本课题以中文为对象,研究能有效处理特定领域知识图谱构建所面临的领域概念层级关系、实体关系获取和实体链接等关键技术。在领域概念层级关系获取方面,提出融合LDA和MLN模型的方法,利用主题模型发现领域主题及概念的分布候选特征集,再利用MLN关联特征的优势识别出实体层级关系;在领域实体关系学习方面,提出基于深度信任网并融合领域知识的实体关系深度学习方法,能够解决领域复杂样本的关系抽取问题且不依赖人工选择特征;在领域实体连接方面,提出基于概率软逻辑模型的实体链接方法,通过对领域知识和实体属性等相关特征建模,联合这些知识对歧义实体消歧,实现领域实体的知识库链接,研究成果将用于领域知识库学习平台,有助于推动领域知识图谱构建与应用。
结项摘要
项目面向特定领域实体关系的获取与实体链接的关键问题,围绕领域概念层级关系,领域实体关系学习及领域实体链接等方面开展深入研究,取得以下成果:在领域概念层级关系识别方面,针对复杂命名实体识别问题,提出一种基于最大熵模型的命名实体识别方法,为开展领域层级关系研究提供了技术支撑,针对中文复杂句中实体上下位关系抽取困难的问题,提出基于CRFs的多特征模板实体上下位关系识别方法,根据领域上下位概念实体语义、语法相近的特性,提出一种结合词向量和Bootstrapping的领域实体上下位关系的识别方法。在领域实体属性关系抽取方面,针对人工选取分类特征困难的问题,提出基于深度信念网络的领域实体属性关系抽取方法,实现分类特征自动抽取;针对特定领域实体属性关系识别中的知识迁移问题,提出融合FastText词向量和字向量的基于双向GRU远程监督的中文领域实体属性关系抽取方法;在领域实体关系抽取方面,针对不同核函数对相同特征的抽取性能差异性的问题,提出多核函数融合的领域实体关系抽取方法;针对领域实体关系数据标注困难的问题,提出融合多特征的远程监督抽取领域实体关系方法。在领域实体链接方面,针对传统词向量一词多义的问题,结合文档上下文信息,提出融合词向量和主题模型的领域实体消歧方法;针对中文实体一对一的实体链接效率低的问题,提出一种融合词向量的主题图模型及语义重要性排序的中文集成实体链接方法;针对领域实体链接缺乏领域知识信息的问题,提出了基于关系指数和表示学习的领域集成实体链接方法。基于以上成果,构建涵盖旅游景点、野生菌、茶叶、中国及云南少数民族、小吃、药材、交通方式和住宿等7大领域的知识图谱原型。项目在国内外核心期刊或会议发表论文13篇,其中EI收录5篇,申请发明专利9项,其中授权2项。研究成果将为领域知识图谱构建提供技术支撑。
项目成果
期刊论文数量(12)
专著数量(0)
科研奖励数量(0)
会议论文数量(1)
专利数量(9)
基于多核融合的中文领域实体关系抽取
- DOI:--
- 发表时间:2016
- 期刊:中文信息学报
- 影响因子:--
- 作者:郭剑毅;陈鹏;余正涛;线岩团;毛存礼;赵君
- 通讯作者:赵君
融合实体特性识别越南语复杂命名实体的混合方法
- DOI:--
- 发表时间:2016
- 期刊:智能系统学报
- 影响因子:--
- 作者:刘艳超;郭剑毅;余正涛;周兰江;严馨;陈秀琴
- 通讯作者:陈秀琴
Extracting hyponymy of domain entity using Cascaded Conditional Random Fields
使用级联条件随机字段提取领域实体的下位关系
- DOI:10.1134/s1054661817030208
- 发表时间:2017-11
- 期刊:Pattern Recognition and Image Analysis
- 影响因子:1
- 作者:Ma Xiaojun;Guo Jianyi;Yu Zhengtao;Mao Cunli;Xian Yantuan;Chen Wei
- 通讯作者:Chen Wei
基于CRFs和歧义模型的越南语分词
- DOI:10.16337/j.1004-9037.2017.03.024
- 发表时间:2017
- 期刊:数据采集与处理
- 影响因子:--
- 作者:熊明明;李英;郭剑毅;毛存礼;余正涛
- 通讯作者:余正涛
基于关系指数和表示学习的领域集成实体链接
- DOI:10.16383/j.aas.c180705
- 发表时间:--
- 期刊:自动化学报
- 影响因子:--
- 作者:蒋胜臣;王红斌;余正涛;线岩团;王红涛
- 通讯作者:王红涛
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
基于图的新闻事件主题句抽取方法
- DOI:10.14177/j.cnki.32-1397n.2016.40.04.010
- 发表时间:2016
- 期刊:南京理工大学学报
- 影响因子:--
- 作者:王雍凯;毛存礼;余正涛;郭剑毅;洪旭东;罗林
- 通讯作者:罗林
领域本体概念实例、属性和属性值的抽取及关系预测
- DOI:--
- 发表时间:2012
- 期刊:南京大学学报(自然科学版)
- 影响因子:--
- 作者:郭剑毅;李真;余正涛;张志坤
- 通讯作者:张志坤
融合句法特征的汉-老双语词语对齐算法研究
- DOI:--
- 发表时间:2018
- 期刊:软件导刊
- 影响因子:--
- 作者:李思卓;周兰江;周枫;郭剑毅
- 通讯作者:郭剑毅
基于双向长短期记忆神经网络的老挝语分词方法
- DOI:--
- 发表时间:2019
- 期刊:计算机工程与科学
- 影响因子:--
- 作者:何力;周兰江;周枫;郭剑毅
- 通讯作者:郭剑毅
基于最大熵模型的越南语交叉歧义消解
- DOI:--
- 发表时间:2017
- 期刊:中文信息学报
- 影响因子:--
- 作者:熊明明;刘艳超;郭剑毅;余正涛;周兰江;陈秀琴
- 通讯作者:陈秀琴
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
郭剑毅的其他基金
汉越双语语料库建设及词对齐方法研究
- 批准号:61262041
- 批准年份:2012
- 资助金额:43.0 万元
- 项目类别:地区科学基金项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}