述語間・フレーム間の関係を捉えたフレーム知識の自動構築

自动构建框架知识,捕获谓词和框架之间的关系

基本信息

  • 批准号:
    22J14993
  • 负责人:
  • 金额:
    $ 0.58万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2022
  • 资助国家:
    日本
  • 起止时间:
    2022-04-22 至 2023-03-31
  • 项目状态:
    已结题

项目摘要

本研究課題の目的は、文脈化単語ベクトルを利用して、大規模なテキストコーパスから述語間・フレーム間の関係を捉えた意味役割付きの高品質なフレーム知識を自動構築することである。本年度の目標は、昨年度開発した動詞の意味フレーム推定手法を、既存のラベル付きのリソースであるFrameNetによる実験を行うのではなく、大規模なテキストコーパスに適用できるか検証し、その上でフレーム知識リソースの一部を構築することであった。しかし、本年度の初めに、その手法を大規模テキストコーパスに適用したところ、期待する性能を示さなかった。そこで、本年度は、更なる性能向上に向けて、引き続き動詞の意味フレーム推定に取り組んだ。以前開発した意味フレーム手法は、事前学習のみに基づく文脈化単語埋め込みモデルを活用していた。しかし、このようなモデルの汎用的な埋め込み空間は、意味的に類似したフレームの事例が近くに位置しているという人間の直観と必ずしも一致しているわけではないため、事前学習のみに基づく文脈化単語埋め込みを用いる手法の性能には限界があることが確認された。そこで、意味フレーム推定をコーパス内の一部の動詞についてのラベル付きデータの存在を仮定した教師ありタスクとして取り組み、深層距離学習に基づき文脈化単語埋め込みモデルをfine-tuningすることで高精度な意味フレーム推定を実現する手法を考案した。クラスタリングタスクによる実験を通し、深層距離学習を適用することで8ポイント以上スコアが向上することを示した。さらに、教師データが極めて少量である場合でも、提案手法が有効であることを示し、実際にフレーム知識を構築する際にも有用であることが期待される。
该研究项目的目的是自动构建具有语义角色的高质量框架知识,使用上下文化词向量从大型文本语料库中捕获谓词和框架之间的关系。今年的目标是验证去年开发的动词语义框架估计方法是否可以应用于大规模文本语料库,而不是使用FrameNet这种现有的标记资源进行实验,然后使用框架知识。是为了建立一些资源。然而,当我们今年年初将该方法应用于大型文本语料库时,并没有表现出预期的性能。因此,今年我们继续致力于动词语义框架估计,以进一步提高性能。先前开发的语义框架方法利用仅基于先验学习的上下文化词嵌入模型。然而,此类模型的通用嵌入空间不一定符合人类直觉,即语义相似的帧的实例位于附近,因此仅基于先验学习的上下文已经证实,使用单词的方法的性能存在限制嵌入。因此,我们将语义框架估计作为一项监督任务,假设语料库中某些动词存在标记数据,并微调基于深度远程学习的上下文词嵌入模型,以实现高度准确的含义。实现帧估计。通过使用聚类任务的实验,我们表明应用深度远程学习可以将分数提高 8 分以上。此外,我们表明,即使训练数据量极小,所提出的方法也是有效的,并且预计它在实际构建框架知识时将是有用的。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Semantic Frame Induction with Deep Metric Learning
  • DOI:
    10.48550/arxiv.2304.14286
  • 发表时间:
    2023-04
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kosuke Yamada;Ryohei Sasano;Koichi Takeda
  • 通讯作者:
    Kosuke Yamada;Ryohei Sasano;Koichi Takeda
マスクされた単語埋め込みと2段階クラスタリングを用いた動詞の意味フレーム推定
使用掩码词嵌入和两阶段聚类进行动词语义框架估计
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yamada Kosuke;Sasano Ryohei;Takeda Koichi;山田 康輔
  • 通讯作者:
    山田 康輔
武田・笹野研究室
武田/笹野实验室
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Semantic Frame Induction using Masked Word Embeddings and Two-Step Clustering
使用屏蔽词嵌入和两步聚类进行语义框架归纳
深層距離学習を用いた動詞の意味フレーム推定
使用深度远程学习的动词语义框架估计
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yamada Kosuke;Sasano Ryohei;Takeda Koichi;山田 康輔;山田 康輔
  • 通讯作者:
    山田 康輔
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

山田 康輔其他文献

山田 康輔的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('山田 康輔', 18)}}的其他基金

述語間・フレーム間の関係を捉えたフレーム知識の自動構築
自动构建框架知识,捕获谓词和框架之间的关系
  • 批准号:
    23KJ1052
  • 财政年份:
    2023
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows

相似海外基金

文脈化単語埋め込みによる1億語規模の比喩表現実態調査
使用上下文词嵌入对 1 亿个词语比喻表达进行调查
  • 批准号:
    22K18483
  • 财政年份:
    2022
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
文脈化単語埋め込みを用いた意味フレームの自動構築
使用上下文词嵌入自动构建语义框架
  • 批准号:
    21K12012
  • 财政年份:
    2021
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
A Study of Language Questions for Assessing Ability in Language Learning Systems
用于评估语言学习系统能力的语言问题的研究
  • 批准号:
    18K18118
  • 财政年份:
    2018
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了