Extending knowledge graph structures through deep text understanding

通过深度文本理解扩展知识图结构

基本信息

  • 批准号:
    22K12044
  • 负责人:
  • 金额:
    $ 2.75万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2022
  • 资助国家:
    日本
  • 起止时间:
    2022-04-01 至 2025-03-31
  • 项目状态:
    未结题

项目摘要

Wikipediaなどの知識蓄積型コンテンツからは構造的データが知識グラフとして抽出され,検索結果の分類や種々の知識処理に活用されている.知識グラフを充実させるためには,Wikipediaやツィート,文書から新たな知識を抽出して知識グラフを拡張することが必要であり,そのためにはウェブコンテンツの構造情報やテキスト情報を統合的に分析する必要がある.本研究では,(1)少量の訓練データのもとでの多ラベル文書分類タスク, (2)学習済み言語モデルを活用したキーフレーズ抽出・生成,(3)知識グラフの構造的拡張の3つのテーマについて,テキストおよびグラフ構造の深層分析に基づく新たな情報抽出手法を開発するのが目的である.本年度は,(1)については,訓練データを全く与えない,つまりzero-shotでありかつラベル名のテキストのみと,ラベルのない文書集合のみが与えられているという厳しい条件であるclass name only classificationという問題に取り組んだ.ここでは多クラス分類問題について検討している.クラス名から連想される関連語を,prompt tuningと呼ばれる手法で予測し,これらの関連語を用いてラベルなし文書に疑似ラベルを与え,分類器をself trainingする手法により,従来手法を上回る精度を示すことができた.(2)のキーフレーズ抽出・生成は,訓練データなしの条件に対し,マスク言語モデルと生成型言語モデルの2つの手法を組み合わせた方法が有効であることを示した.(3)の知識グラフの構造的拡張は,Wikipediaのリストとカテゴリーがどのような意味的な型を持つ要素からなるかを判定する問題について,知識グラフの構造と言語モデルを組み合わせた手法の開発を行った.
从维基百科等知识存储内容中提取结构数据作为知识图谱,用于对搜索结果进行分类和各种知识处理。为了丰富知识图谱,需要通过从维基百科、推文和文档中提取新知识来扩展知识图谱,而要做到这一点,就需要综合分析网页内容的结构信息和文本信息。是一种需要。在本研究中,我们重点关注三个任务:(1)基于少量训练数据的多标签文档分类任务,(2)使用经过训练的语言模型提取和生成关键短语,以及(3)知识的结构扩展目的是开发一种基于对主题的文本和图形结构的深入分析的新信息提取方法。今年,关于(1),我们将引入完全不给出训练数据的严格条件,即仅类名分类,这是零样本并且只有标签名称的文本和一组文档我已经解决了这个问题。这里我们正在考虑多类分类问题。通过使用一种称为提示调整的方法来预测与类名相关的相关单词,使用这些相关单词为未标记的文档提供伪标签,并自我训练分类器,我们已经实现了比传统方法更高的准确性。 。对于(2)中的关键短语提取和生成,我们证明了一种结合两种方法(掩码语言模型和生成语言模型)的方法对于没有训练数据的情况是有效的。 (3)知识图谱的结构扩展涉及开发一种结合知识图谱和语言模型的方法来解决我所做的确定维基百科列出的元素和类别所包含的语义类型的问题。

项目成果

期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Utilizing Keyphrase Generation and Semantic Similarity for Extreme Multi- Label Text Classification
利用关键短语生成和语义相似性进行极端多标签文本分类
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Dai Xiangting;Mizuho Iwaihara
  • 通讯作者:
    Mizuho Iwaihara
Extractive Summarization Utilizing Keyphrases by Finetuning BERT-Based Model
通过微调基于 BERT 的模型,利用关键短语进行提取摘要
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Xiaoye Wang;Mizuho Iwaihara
  • 通讯作者:
    Mizuho Iwaihara
Unsupervised Keyphrase Generation by Utilizing Masked Words Prediction and Pseudo-label BART Finetuning
利用屏蔽词预测和伪标签 BART 微调来生成无监督关键词
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Xiaoye Wang;Mizuho Iwaihara;Yingchao Ju and Mizuho Iwaihara
  • 通讯作者:
    Yingchao Ju and Mizuho Iwaihara
Capsule Network Over Pre-Trained Language Model and User Writing Styles for Authorship Attribution on Short Texts
Mapping Wikipedia Categories and Lists to DBPedia Ontology Based on Structural and Semantic Features
基于结构和语义特征将 Wikipedia 类别和列表映射到 DBPedia 本体
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Zhang Zhenyang;Wang Zhaoyi;Mizuho Iwaihara
  • 通讯作者:
    Mizuho Iwaihara
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

岩井原 瑞穂其他文献

学習によるXML文書のコンテンツベースフィルタリング
通过学习对 XML 文档进行基于内容的过滤
高等学校におけるSqueakを用いた課題解決型情報教育の実践と評価
利用Squeak解决问题的信息教育在高中的实施与评价
Discovering Action Rules that are Highly Achievable from Massive Data
从海量数据中发现高度可实现的行动规则
Ni-Nb-Zr系三元ガラス合金の過冷却液体状態での水素透過性
Ni-Nb-Zr三元玻璃合金过冷液态氢渗透率
  • DOI:
  • 发表时间:
    2005
  • 期刊:
  • 影响因子:
    0
  • 作者:
    藤岡 健史;高田 秀志;岩井原 瑞穂;福山透;Praprudee Piyaviriyakul・廣野育生・青木宙;中田崇平
  • 通讯作者:
    中田崇平
複数ユーザの嗜好を推測し快適性を実現するスマートスペースの提案
提出预测多个用户的喜好并实现舒适度的智能空间
  • DOI:
  • 发表时间:
    2010
  • 期刊:
  • 影响因子:
    0
  • 作者:
    呉 建民;岩井原 瑞穂;山本眞也
  • 通讯作者:
    山本眞也

岩井原 瑞穂的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('岩井原 瑞穂', 18)}}的其他基金

情報流通におけるアクセス制御ルールを考慮したXML文書の変換
信息分发中考虑访问控制规则的XML文档转换
  • 批准号:
    16650018
  • 财政年份:
    2004
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
動的制約代数に基づく高機能電子商取引データベース
基于动态约束代数的高性能电子商务数据库
  • 批准号:
    13780246
  • 财政年份:
    2001
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
動的・対話的データベースビューの研究
动态交互数据库视图研究
  • 批准号:
    11780231
  • 财政年份:
    1999
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
プログラム・スライシングに基づくハードウェア設計記述支援環境
基于程序切片的硬件设计描述支撑环境
  • 批准号:
    09780294
  • 财政年份:
    1997
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
ハードウェア記述言語におけるプログラム・スライシングの研究
硬件描述语言中的程序切片研究
  • 批准号:
    08780294
  • 财政年份:
    1996
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
演繹オブジェクト指向データベースのための記憶効率のよいデータ構造
用于演绎面向对象数据库的存储高效数据结构
  • 批准号:
    07780280
  • 财政年份:
    1995
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

Early Alzheimers Forecasting from Multimodal Data via Deep Transfer Learning, Evaluated on a Large-Scale Prospective Cohort Study
通过深度迁移学习从多模式数据预测早期阿尔茨海默病,并在大规模前瞻性队列研究中进行评估
  • 批准号:
    10732306
  • 财政年份:
    2023
  • 资助金额:
    $ 2.75万
  • 项目类别:
Information extraction accumulating graph-formed knowledge with deep learning
通过深度学习积累图形化知识的信息提取
  • 批准号:
    22KJ2983
  • 财政年份:
    2023
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
Constructing and representing Ontologies from Ontology-oriented Annotations
从面向本体的注释构建和表示本体
  • 批准号:
    23K11237
  • 财政年份:
    2023
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
深層学習技術を用いた動的情報からの化合物ータンパク質結合親和性の抽出
使用深度学习技术从动态信息中提取化合物-蛋白质结合亲和力
  • 批准号:
    22K06112
  • 财政年份:
    2022
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Deep learning Based Phenotyping and Treatment Optimization for Heart Failure with Preserved Ejection Fraction
基于深度学习的射血分数保留的心力衰竭表型分析和治疗优化
  • 批准号:
    10592341
  • 财政年份:
    2022
  • 资助金额:
    $ 2.75万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了