面向特定领域的知识图谱构建与应用关键技术研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    U1836118
  • 项目类别:
    联合基金项目
  • 资助金额:
    65.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0606.自然语言处理
  • 结题年份:
    2021
  • 批准年份:
    2018
  • 项目状态:
    已结题
  • 起止时间:
    2019-01-01 至2021-12-31

项目摘要

In recent years, the Knowledge Graph has received extensive attention from academia and industry, mainly due to the fact that it can describe the complex relationships between the entities in the objective world with a form close to human cognition. At the same time, the machine reading comprehension technology based on the deep neural network model has a fast development recently, and it begins to obtain an increased accuracy in general domain Q&A tasks when combining the external knowledge. However, in the specific domain (such as Internet-based terrorism information analysis and tracking), there are no mature Knowledge Graph products. Faced with a large number of real-time external open data mainly from internet news articles, there is also no effective technical support for text semantic extraction, clue mining, and threat assessment of key entities. It has great significance to China's domestic security, overseas interest security, and the strategic safety of the One Belt One Road, when we have the ability to grasp terrorism information, track terrorist organization trends, and identify threatened terrorist. Above all, our team try to take a deep research in the terrorism domain in order to tackle above problems, by means of our own business accumulation and academic advantages. Specifically, we will pay more attentions on the following four aspects based on the MRC models and Knowledge Graph technology: domain Knowledge Graph, domain task customization and solution, efficient semantic data pipeline, and domain test dataset. We always believe that our research will help the domain work become more automatic, intelligent, and efficient.
知识图谱在近几年受到了学术界和产业界的广泛关注,主要得益于其可以以接近人类认知的形式描述客观世界实体间的复杂关系。与此同时,近期兴起的机器阅读理解技术在结合外部知识后,在通用领域的QA问答任务中的性能有了较大提升。但在互联网涉恐信息分析与跟踪领域,目前尚无较为成熟的知识图谱产品,面对大量的实时外部开放数据,缺乏有效的针对语义抽取、线索挖掘和威胁评估等业务工作的技术支撑。考虑到开展涉恐领域知识图谱的相关工作对于我国国内安全、海外利益安全以及一带一路大战略安全都具有非常重要的意义,项目组拟以自身业务积累和学术优势,尝试深入结合涉恐领域需求和领域特色,借助MRC模型和知识图谱相关技术,从领域知识图谱构造、领域任务定制与求解、高效语义数据管道设计以及测试数据集生成四个方面开展深入研究,以达到领域大规模文本语义抽取自动化、业务流程知识化、线索挖掘智能化的业务目标,有效提升业务效率和工作水平。

结项摘要

近期兴起的机器阅读理解技术在结合外部知识后,能较好实现通用领域QA。但在网络涉恐信息分析与跟踪领域尚无相关成熟应用。开展涉恐领域知识图谱的相关工作对于我国战略安全具有重大意义。项目组结合涉恐领域需求和特色,从领域知识构建、问题求解、知识动态推理以及评测数据集生成4方面开展研究。.在知识构建方面,项目组提出实体对校验、实体关系抽取、事件抽取等领域知识构建方案。结果表明,实体对校验任务可提升关系抽取查准率7.1%,查全率4.0%,F1值提升5.6%;规则泛化后可进一步提升关系抽取准确率,平均提升了F1值7.67%;课题组采用基于层级Blocking方法对新闻事件属性进行抽取,并能比传统方法更准确的识别出重复新闻事件。.在问题求解方面,项目组提出了结合预训练与知识图谱的KG-ATT-BERT模型,对问题和知识建立互注意力机制,从而丰富句子的语义信息,提升了阅读理解模型的EM指标2.16%,F1约0.7%。此外,通过构建领域特殊词表,在模型中加入问题和新闻文本的双向注意力,并通过集束搜索策略生成答案。在ARCMRC数据集上的对比试验表明,AT-MT5在ROUGE-L指标上达到57.10%,性能明显优于BART和GPT-2模型。在威胁评估方面,采用面向复杂网络的多层领域模型对重要节点和社区进行发现,并在真实数据集上验证其有效性。.在动态知识推理方面,项目组提出面向确定性推理场景的前向后向链式语义数据流推理平方案,实现32K三元组每秒吞吐量下,查询延迟小于1秒。同时,面向不确定性推理场景提出基于联合嵌入模型的多语义空间推理方案,实现64K三元组每秒吞吐量下查询延迟为200ms以内,MRR值0.546,HIT@10值为66.4。.在领域数据集构建方面,项目组构建涉恐事件库约为19万条,恐怖组织约2000多个,人物超过3000个。其中,项目组采集报道文本、经过聚合和标注后入库的事件数为2900余条。在此基础上,构建面向机器阅读理解的测评数据集SecMRC,包含2000条新闻文本,9300个问答对,总字符数4766264。.基于以上研究,项目组构建了领域信息采集、标注平台和领域知识问答系统两项示范应用,为相关研究的落地提供了基础。

项目成果

期刊论文数量(22)
专著数量(0)
科研奖励数量(1)
会议论文数量(4)
专利数量(5)
基于机器阅读理解模型的事件抽取方法
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    计算机研究与发展
  • 影响因子:
    --
  • 作者:
    刘露平;周欣;何小海;卿粼波;王美玲;程军军
  • 通讯作者:
    程军军
基于概念图谱与BiGRU-Att模型的突发事件演化关系抽取
  • DOI:
    10.3969/j.issn.1674-3644.2020.02.009
  • 发表时间:
    2020
  • 期刊:
    武汉科技大学学报
  • 影响因子:
    --
  • 作者:
    余蓓;刘宇;顾进广
  • 通讯作者:
    顾进广
A Maximizing Influence of Multiple Nodes Propagation Algorithm Based on Optimal Neighbor Discovery
基于最优邻居发现的多节点影响力最大化传播算法
  • DOI:
    10.53106/199115992021083204015
  • 发表时间:
    2021-08
  • 期刊:
    Journal of Computers
  • 影响因子:
    --
  • 作者:
    Yun Liu;Ling Sun;Fei Xiong;Junjun Cheng
  • 通讯作者:
    Junjun Cheng
基于 Transformer 交叉注意力的文本生成图像技术
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    计算机科学
  • 影响因子:
    --
  • 作者:
    谈馨悦;何小海;王正勇;罗晓东;卿粼波
  • 通讯作者:
    卿粼波
Bayesian personalized ranking based on multiple-layer neighborhoods
基于多层邻域的贝叶斯个性化排序
  • DOI:
    10.1016/j.ins.2020.06.067
  • 发表时间:
    2021-01
  • 期刊:
    Information Sciences
  • 影响因子:
    8.1
  • 作者:
    Hu Yutian;Xiong Fei;Pan Shirui;Xiong Xi;Wang Liang;Chen Hongshu
  • 通讯作者:
    Chen Hongshu

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

鸡神经肽Y(NPY)基因在毕赤酵母中的表达
  • DOI:
    --
  • 发表时间:
    2017
  • 期刊:
    安徽农业大学学报
  • 影响因子:
    --
  • 作者:
    张鑫;程军军;姜勋平;刘桂琼
  • 通讯作者:
    刘桂琼
微博网络中用户特征量和增长率分布的研究
  • DOI:
    --
  • 发表时间:
    2014
  • 期刊:
    计算机学报
  • 影响因子:
    --
  • 作者:
    苑卫国;刘云;程军军
  • 通讯作者:
    程军军
微博双向“关注”网络节点中心性及传播影响力的分析
  • DOI:
    --
  • 发表时间:
    2013
  • 期刊:
    物理学报
  • 影响因子:
    --
  • 作者:
    苑卫国;刘云;程军军;熊菲
  • 通讯作者:
    熊菲

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码