基于隐含知识挖掘与时间敏感的知识图谱补全关键技术研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61772040
  • 项目类别:
    面上项目
  • 资助金额:
    60.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0211.信息检索与社会计算
  • 结题年份:
    2021
  • 批准年份:
    2017
  • 项目状态:
    已结题
  • 起止时间:
    2018-01-01 至2021-12-31

项目摘要

With the booming development of the Internet intelligence, knowledge graph (KG), as a fundamental knowledge infrastructure, has become more and more useful for many NLP related applications such as Content Understanding, Semantic Search, Question Answering and Machine Translation etc. Although KGs are large in size, they are far from complete. In order to solve the problem of the knowledge graph incompleteness, this project will focus on the research of the knowledge graph completion technology. We propose to improve KG completion through inferring implicit knowledge and utilizing the temporal aspects of the facts. The former uses the embedding based method to mine the association rules based on distributed representation and aims to encode each object (entities and relations) in knowledge graphs into a continuous vector space. This kind of approach has shown strong feasibility and robustness. Furthermore, we use the Markov Logic Network (MLN) which is constructed using the inference rules to infer the correctness of the implicit facts. Each rule has a weight which should be trained by real world facts. Using this framework, we can probabilistically evaluate the implicit knowledge recognition to get more accurate prediction. The later presents a novel time-aware knowledge graph completion model that is able to predict links in a KG using both the existing facts and the temporal information of the facts. To incorporate the happening time of facts, we propose a time-aware KG embedding model using temporal order information among facts. To incorporate the valid time of facts, we propose a joint time-aware inference model based on Integer Linear Programming (ILP) using temporal consistency information as constraints. We further integrate two models to make full use of global temporal information. The achievements of the research will be expected to provide the key technology for the large scale knowledge engineering.
在互联网智能化时代,知识图谱是支撑内容理解、智能搜索、自动问答、机器翻译等应用的知识基础。本申请针对知识图谱不完备性问题,研究高效准确的知识图谱补全关键技术。通过隐含知识挖掘和时间维度拓展这两方面对知识图谱本身蕴含的信息进行深入挖掘和充分利用。前者通过基于嵌入式表示的关联规则挖掘方法,在低维语义空间中对于实体关系以及逻辑规则等知识元素进行隐式表示和学习,进而,基于马尔科夫逻辑网对隐含知识进行概率化赋值,以扩充知识图谱。后者将实体关系的关联建模拓展到时间维度,通过融合时序信息和持续时间的联合模型提升知识图谱补全任务的性能。其中,基于时序信息的嵌入式模型假设时间敏感的关系之间具有时序依赖性,其分布式表示可随时间演进而转换,进而将关系时序信息有效编码到知识表示的向量空间;基于持续时间的模型提炼多项时间约束条件,利用整数线性规划进行全局推理和预测。本研究将为大规模知识图谱构建提供关键技术储备。

结项摘要

在互联网智能化时代,知识图谱是支撑内容理解、智能搜索、自动问答、机器翻译等应用的知识基础。本项目针对知识图谱不完备性问题,研究高效准确的知识图谱补全关键技术。通过隐含知识挖掘和时间维度拓展这两方面对知识图谱本身蕴含的信息进行深入挖掘和充分利用。本项目的主要研究工作包括:基于时间信息的知识图谱补全技术、面向知识图谱补全的隐含知识挖掘技术、知识图谱构建核心工具、知识图谱构建相关评测。课题组按项目预订的计划进行,圆满完成了课题任务书预订的各项指标,在理论模型、关键技术、核心工具、规范与评测等方面取得了一系列研究成果。在理论与方法层面,提出了隐含知识挖掘与知识图谱补全的系列方法,包括时间已知的知识图谱嵌入式模型、融合时间信息的联合模型、基于归纳式表达新实体的知识图谱补全技术、基于知识图谱Schema的关系提取、基于依存桥和张量网络的事件提取等方法,在自然语言处理领域高水平学术会议(ACL,IJCAI,EMNLP,COLING等)发表学术论文17篇,授权专利1项、软件著作权3项。在工具与评测层面,以医学领域知识图谱构建为应用示范和验证,研发了知识图谱构建核心工具,包括:多视图、交互式可视化方法及系统、医学领域命名实体识别、关系提取核心工具等,在中国健康信息处理大会CHIP2020组织了中文医学文本命名实体识别和中文医学文本实体关系抽取2项评测任务。在人才培养方面,培养博士研究生4名,硕士研究生4名,其中刘天宇同学获中国中文信息学会优秀博士论文提名奖。项目负责人穗志方教授被评为北京市“智源学者”。本项目的研究成果将为大规模知识图谱构建及应用提供关键技术储备。

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(1)
会议论文数量(13)
专利数量(0)
中文医学知识图谱 CMeKG 构建初探
  • DOI:
    --
  • 发表时间:
    2019
  • 期刊:
    中文信息学报
  • 影响因子:
    --
  • 作者:
    奥德玛;杨云飞;穗志方;代达劢;常宝宝;李素建;昝红英
  • 通讯作者:
    昝红英

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

基于专业术语词典的自动领域本体构造
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    情报学报
  • 影响因子:
    --
  • 作者:
    李素建;段慧明;穗志方;何燕
  • 通讯作者:
    何燕
基于浅层句法分析的中文语义角色标注研究
  • DOI:
    --
  • 发表时间:
    2011
  • 期刊:
    中文信息学报
  • 影响因子:
    --
  • 作者:
    王鑫;孙薇薇;穗志方
  • 通讯作者:
    穗志方
网络用语词典的构建及问题分析
  • DOI:
    --
  • 发表时间:
    2016
  • 期刊:
    中文信息学报
  • 影响因子:
    --
  • 作者:
    昝红英;许鸿飞;张坤丽;穗志方
  • 通讯作者:
    穗志方
基于Web弱指导的本体概念实例及属性的同步提取
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    中文信息学报
  • 影响因子:
    --
  • 作者:
    康为;穗志方
  • 通讯作者:
    穗志方
基于并列结构的概念实例和属性的同步提取方法
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    中文信息学报
  • 影响因子:
    --
  • 作者:
    李文杰;穗志方
  • 通讯作者:
    穗志方

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

穗志方的其他基金

文本语言表达到概念关系的映射方法研究与资源建设
  • 批准号:
    61375074
  • 批准年份:
    2013
  • 资助金额:
    79.0 万元
  • 项目类别:
    面上项目
基于Web的概念实例及其属性值提取方法研究
  • 批准号:
    61075067
  • 批准年份:
    2010
  • 资助金额:
    37.0 万元
  • 项目类别:
    面上项目
基于结构化学习的语义角色标注方法研究
  • 批准号:
    60873156
  • 批准年份:
    2008
  • 资助金额:
    32.0 万元
  • 项目类别:
    面上项目
汉语动词子语类框架的自动获取技术研究
  • 批准号:
    60503071
  • 批准年份:
    2005
  • 资助金额:
    23.0 万元
  • 项目类别:
    青年科学基金项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码