喵ID:ZHXU5l免责声明

Comprehensive Analysis of Negative Sampling in Knowledge Graph Representation Learning

基本信息

DOI:
10.48550/arxiv.2206.10140
发表时间:
2022-06
期刊:
影响因子:
--
通讯作者:
Hidetaka Kamigaito;Katsuhiko Hayashi
中科院分区:
其他
文献类型:
--
作者: Hidetaka Kamigaito;Katsuhiko Hayashi研究方向: -- MeSH主题词: --
关键词: --
来源链接:pubmed详情页地址

文献摘要

Negative sampling (NS) loss plays an important role in learning knowledge graph embedding (KGE) to handle a huge number of entities. However, the performance of KGE degrades without hyperparameters such as the margin term and number of negative samples in NS loss being appropriately selected. Currently, empirical hyperparameter tuning addresses this problem at the cost of computational time. To solve this problem, we theoretically analyzed NS loss to assist hyperparameter tuning and understand the better use of the NS loss in KGE learning. Our theoretical analysis showed that scoring methods with restricted value ranges, such as TransE and RotatE, require appropriate adjustment of the margin term or the number of negative samples different from those without restricted value ranges, such as RESCAL, ComplEx, and DistMult. We also propose subsampling methods specialized for the NS loss in KGE studied from a theoretical aspect. Our empirical analysis on the FB15k-237, WN18RR, and YAGO3-10 datasets showed that the results of actually trained models agree with our theoretical findings.
负采样(NS)损失在学习知识图谱嵌入(KGE)以处理大量实体方面起着重要作用。然而,如果没有恰当地选择如NS损失中的边际项和负样本数量等超参数,KGE的性能就会下降。目前,经验性的超参数调整是以计算时间为代价来解决这个问题的。为了解决这个问题,我们从理论上分析了NS损失,以辅助超参数调整,并理解在KGE学习中更好地使用NS损失。我们的理论分析表明,像TransE和RotatE这样取值范围受限的评分方法,需要对边际项或负样本数量进行适当调整,这与像RESCAL、ComplEx和DistMult这些取值范围不受限的方法不同。我们还从理论角度提出了专门针对KGE中NS损失的子采样方法。我们在FB15k - 237、WN18RR和YAGO3 - 10数据集上的实证分析表明,实际训练模型的结果与我们的理论发现相符。
参考文献(24)
被引文献(11)

数据更新时间:{{ references.updateTime }}

Hidetaka Kamigaito;Katsuhiko Hayashi
通讯地址:
--
所属机构:
--
电子邮件地址:
--
免责声明免责声明
1、猫眼课题宝专注于为科研工作者提供省时、高效的文献资源检索和预览服务;
2、网站中的文献信息均来自公开、合规、透明的互联网文献查询网站,可以通过页面中的“来源链接”跳转数据网站。
3、在猫眼课题宝点击“求助全文”按钮,发布文献应助需求时求助者需要支付50喵币作为应助成功后的答谢给应助者,发送到用助者账户中。若文献求助失败支付的50喵币将退还至求助者账户中。所支付的喵币仅作为答谢,而不是作为文献的“购买”费用,平台也不从中收取任何费用,
4、特别提醒用户通过求助获得的文献原文仅用户个人学习使用,不得用于商业用途,否则一切风险由用户本人承担;
5、本平台尊重知识产权,如果权利所有者认为平台内容侵犯了其合法权益,可以通过本平台提供的版权投诉渠道提出投诉。一经核实,我们将立即采取措施删除/下架/断链等措施。
我已知晓