III: Small: Revisiting Experimental Evaluation Protocols for Link Prediction in Knowledge Graphs

III:小:重新审视知识图中链接预测的实验评估协议

基本信息

  • 批准号:
    2346959
  • 负责人:
  • 金额:
    $ 39.35万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2024
  • 资助国家:
    美国
  • 起止时间:
    2024-06-01 至 2027-05-31
  • 项目状态:
    未结题

项目摘要

This project aims to advance the understanding of link prediction in knowledge graphs. Knowledge graphs connect information through links. For example, a person is linked to a movie because they acted in the movie. This allows that person to be linked to other actors in the movie or to link the movie to the actor's other movies. These links create a knowledge graph. Many services like search engines increasingly rely on knowledge graphs, resulting in millions of users interacting with these graphs daily. Knowledge graphs are typically incomplete; that is, there are many missing links between entities that are in fact related. These missing links hinder graphs' effectiveness. For example, a search engine with missing links cannot completely or accurately answer a user question. Link prediction algorithms aim to make knowledge graphs more complete and therefore more accurate. Current evaluation protocols ignore the nature of the links predicted by a link prediction algorithm (interpretability), and rely on datasets crafted using random selection and arbitrary thresholds (bias). The current understanding of benefits and drawbacks of link prediction algorithms is thus quite limited. Without such understanding, the field of link prediction in knowledge graphs cannot properly advance as there is no clear direction on how to do so.Link prediction algorithms commonly rely on machine learning, so they train link prediction models to complete knowledge graphs. There are three main issues hindering our understanding of what link prediction models can accomplish: 1) The lack of methods to interpret a set of link predictions rather than individual predictions, and to quantify model interpretability; 2) The use of random selection and arbitrary thresholds to evaluate link prediction that introduce biases; and 3) The lack of homogeneous comparisons that hinder replicability due to variations in the experimental evaluation protocol. This project proposes the following advances: 1) New methods to compute global interpretations of the link predictions that a model deems correct; 2) New methods to detect and interpret the link prediction rules a model has learned, such as "if actor A acts in movie M, then A is in M's cast;" 3) New interpretation metrics and analyses considering various strategies to generate incorrect knowledge and its expected plausibility; 4) New definitions of anomalies, a.k.a. data redundancy, to understand biases in benchmarking datasets while taking link prediction rules into account; 5) New methods to partition datasets into splits that preserve graph features with statistical guarantees; 6) New statistically sound methods to select subgraphs from real-world knowledge graphs for use as benchmarking datasets; 7) An open-source link prediction framework to reduce barriers when replicating results; and 8) A link prediction evaluation module available through Google Colab, and publicly-available link prediction models to promote open comparisons.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
该项目旨在增进对知识图中链接预测的理解。知识图谱通过链接连接信息。例如,一个人因为在电影中表演而被链接到一部电影。这允许该人链接到电影中的其他演员或将该电影链接到该演员的其他电影。这些链接创建了一个知识图。搜索引擎等许多服务越来越依赖知识图,导致每天有数百万用户与这些图进行交互。知识图谱通常是不完整的;也就是说,实际上相关的实体之间存在许多缺失的链接。这些缺失的链接阻碍了图表的有效性。例如,缺少链接的搜索引擎无法完整或准确地回答用户问题。链接预测算法旨在使知识图谱更加完整,从而更加准确。当前的评估协议忽略了链接预测算法预测的链接的性质(可解释性),并依赖于使用随机选择和任意阈值(偏差)制作的数据集。因此,目前对链路预测算法的优点和缺点的理解非常有限。如果没有这样的理解,知识图谱中的链接预测领域就无法正常推进,因为没有明确的方向。链接预测算法通常依赖于机器学习,因此它们训练链接预测模型来完成知识图谱。三个主要问题阻碍了我们对链接预测模型的理解:1)缺乏解释一组链接预测而不是单个预测的方法,以及量化模型可解释性的方法; 2)使用随机选择和任意阈值来评估引入偏差的链接预测; 3) 缺乏同质比较,由于实验评估方案的变化而阻碍了可重复性。该项目提出了以下进展:1)计算模型认为正确的链接预测的全局解释的新方法; 2)检测和解释模型学到的链接预测规则的新方法,例如“如果演员 A 在电影 M 中表演,那么 A 就在 M 的演员阵容中;” 3)新的解释指标和分析考虑了产生不正确知识及其预期合理性的各种策略; 4) 异常的新定义,又称数据冗余,以了解基准数据集的偏差,同时考虑链接预测规则; 5)将数据集划分为多个片段的新方法,在统计保证下保留图特征; 6)新的统计上合理的方法,从现实世界的知识图中选择子图用作基准数据集; 7) 开源链接预测框架,减少复制结果时的障碍; 8) 通过 Google Colab 提供链接预测评估模块,以及公开可用的链接预测模型,以促进开放比较。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Carlos Rivero其他文献

Tarsal tunnel syndrome: Outcome of surgery in longstanding cases
跗管综合征:长期病例的手术结果
  • DOI:
    10.1097/00003086-199710000-00025
  • 发表时间:
    1997-10-01
  • 期刊:
  • 影响因子:
    4.2
  • 作者:
    Ibrahim Turan;Carlos Rivero;P. Guntner;Christer Rolf
  • 通讯作者:
    Christer Rolf
HUOM! TÄMÄ ON RINNAKKAISTALLENNE
哼!
  • DOI:
  • 发表时间:
    2024-09-14
  • 期刊:
  • 影响因子:
    10.4
  • 作者:
    Cristina del Campo;David Pascual Ezama;Carlos Rivero;Elena Urquia Gr;e;e;Murat Akpinar
  • 通讯作者:
    Murat Akpinar
Hermite and Gabor transforms for noise reduction and handwriting classification in ancient manuscripts
Hermite 和 Gabor 变换用于古代手稿中的降噪和笔迹分类
The Value and Partisanship Basis of Left-Right Placement after the Financial Crisis
金融危机后左右布局的价值与党派基础
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Carlos Rivero;H. Kotzé
  • 通讯作者:
    H. Kotzé
Automated convective and stratiform precipitation estimation in a small mountainous catchment using X-band radar data in central Spain.
使用西班牙中部 X 波段雷达数据自动估算小型山区流域的对流和层状降水。
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    C. Guardiola‐Albert;Carlos Rivero;R. Monjo;A. Díez;C. Yagüe;J. Bodoque;F. Tapiador
  • 通讯作者:
    F. Tapiador

Carlos Rivero的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Carlos Rivero', 18)}}的其他基金

Using Program Dependence Graphs to Propagate Feedback to Students on Programming Assignments and Promote Responsive Teaching
使用程序依赖图向学生传播有关编程作业的反馈并促进响应式教学
  • 批准号:
    1915404
  • 财政年份:
    2019
  • 资助金额:
    $ 39.35万
  • 项目类别:
    Standard Grant

相似国自然基金

小分子代谢物Catechin与TRPV1相互作用激活外周感觉神经元介导尿毒症瘙痒的机制研究
  • 批准号:
    82371229
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
DHEA抑制小胶质细胞Fis1乳酸化修饰减轻POCD的机制
  • 批准号:
    82301369
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
SETDB1调控小胶质细胞功能及参与阿尔茨海默病发病机制的研究
  • 批准号:
    82371419
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
PTBP1驱动H4K12la/BRD4/HIF1α复合物-PKM2正反馈环路促进非小细胞肺癌糖代谢重编程的机制研究及治疗方案探索
  • 批准号:
    82303616
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

NeTS: Small: Revisiting Network Algorithmics using the CRAM Model
NeTS:小型:使用 CRAM 模型重新审视网络算法
  • 批准号:
    2333587
  • 财政年份:
    2024
  • 资助金额:
    $ 39.35万
  • 项目类别:
    Standard Grant
CNS Core:Small:Revisiting Process Isolation with Compound Processes
CNS 核心:小:重新审视复合进程的进程隔离
  • 批准号:
    2210616
  • 财政年份:
    2022
  • 资助金额:
    $ 39.35万
  • 项目类别:
    Standard Grant
SHF: Small: Revisiting Elementary Denotational Semantics
SHF:小:重新审视基本指称语义
  • 批准号:
    1814460
  • 财政年份:
    2018
  • 资助金额:
    $ 39.35万
  • 项目类别:
    Standard Grant
NeTS: Small: Collaborative Research: Revisiting Network QoS in the Cloud-based Era
NeTS:小型:协作研究:重新审视云时代的网络 QoS
  • 批准号:
    1815016
  • 财政年份:
    2018
  • 资助金额:
    $ 39.35万
  • 项目类别:
    Standard Grant
NeTS: Small: Collaborative Research: Revisiting Network QoS in the Cloud-based Era
NeTS:小型:协作研究:重新审视云时代的网络 QoS
  • 批准号:
    1815046
  • 财政年份:
    2018
  • 资助金额:
    $ 39.35万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了