複数の事前学習モデルを利用した語義曖昧性解消のドメイン適応

使用多个预训练模型进行词义消歧的领域适应

基本信息

  • 批准号:
    22K12145
  • 负责人:
  • 金额:
    $ 2.75万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2022
  • 资助国家:
    日本
  • 起止时间:
    2022-04-01 至 2025-03-31
  • 项目状态:
    未结题

项目摘要

語義曖昧性解消の論文として、異なった古文と現代文という二つの基準の語義タグを使った研究を行い、分散表現(word2vec)を利用した手法でジャーナルを1報、現代文のBERTを利用したレキシカル・サンプルタスクの研究で国際会議を1報、さらに現代文のBERTを利用したコーパス中の全単語を対象とした語義曖昧性解消の研究で、研究会の論文を1報執筆し、発表を行った。研究会の論文はブラシュアップして国際会議に投稿予定である。さらに、日本語歴史コーパスの語義曖昧性解消の関連論文として、日本語歴史コーパスの古文から現代文への翻訳を事前学習モデルであるT5を用いて行った研究について国内学会で発表を行った。こちらについても、2023年度以降に国際会議に投稿予定である。また、関連論文として、異なった区切りの異なった単語に関係して、ある複合語の単語の分散表現(word2vec)をそれぞれの構成語から合成する研究について、執筆したジャーナル論文が公開された。また、副次的な研究として、語義曖昧性解消ではないが、同じ手法を用いた、単語の読みを付与するシステムを作成する研究を行った。こちらについても、異なったタグと皆さえる疑似データがシステムの正解率を上昇させるという結果を示した。この研究は、国内学会で発表済みであるが、2023年度以降に国際会議に投稿予定である。さらに、関連論文として、「日本語 PromptBERT におけるプロンプトベース対照学習の有効性とプロンプトの性質の調査」の発表を行った。
As a paper on word ambiguity disambiguation, we conducted research using two criteria: different classical and modern Japanese, and published a journal using a method using distributed expression (word2vec), an international conference was conducted on a study of lexical sample tasks using modern Japanese BERT, and an international conference was written and presented on a study on word ambiguity disambiguity disambiguity for all words in the corpus using modern Japanese BERT.研究小组的论文将被刷新并提交国际会议。此外,作为关于日本历史语料库中有意义的歧义歧义的相关论文,在日本会议上提出了一项研究,该研究使用了前学习模型T5将日本历史语料库从古典日本历史语料库转化为现代日本。此信息还计划在2023年以后发布在国际会议上。此外,与不同单词的不同单词相关的不同单词,与不同的单词相关的不同单词,该文章已经发表了一篇期刊文章,该文章撰写了有关综合一个复合词的分布式表示(Word2Vec)的研究。此外,作为一项二级研究,我们进行了研究,以创建一种使用相同方法授予单词阅读的系统,尽管不是对单词模仿的歧义。这也表明,所有使用的不同标签和伪数据都会提高系统的正确答案率。这项研究是在国内学术会议上提出的,但计划在2023年之后提交国际会议。此外,作为一份相关论文,我们介绍了一项研究“调查了“调查基于迅速的控制学习的有效性以及日本提示中提示的性质”。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Word Sense Disambiguation of Corpus of Historical Japanese Using Japanese BERT Trained with Contemporary Texts
使用受当代文本训练的日语 BERT 对历史日语语料库进行词义消歧
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kanako Komiya;Nagi Oki and Masayuki Asahara
  • 通讯作者:
    Nagi Oki and Masayuki Asahara
日本語歴史コーパスのAll-words WSD
日本历史语料库全词WSD
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    臼井久生;古宮嘉那子
  • 通讯作者:
    古宮嘉那子
Composing Word Embeddings for Compound Words Using Linguistic Knowledge
疑似訓練データを用いたone-shot 設定における同形異音語の読み推定
使用伪训练数据进行一次性设置的同形异义词阅读估计
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    小林汰一郎;古宮嘉那子; 新納浩幸
  • 通讯作者:
    新納浩幸
Diachronic Domain Adaptation of Word Sense Disambiguation in Corpus of Historical Japanese Using Word Embeddings
使用词嵌入对历史日语语料库中的词义消歧进行历时域适应
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

古宮 嘉那子其他文献

固有表現抽出におけるタグセットの相互適応
命名实体提取中标签集的相互适应
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    鈴木雅也;古宮 嘉那子;佐々木 稔;新納 浩幸
  • 通讯作者:
    新納 浩幸
語義曖昧性解消の領域適応のための訓練データの選択法 ~複数ドメインからの選択~
词义消歧领域适应的训练数据选择方法~多领域选择~
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    堀内 浩史郎;古宮 嘉那子;小谷 善行
  • 通讯作者:
    小谷 善行
順方向多層 LSTM と分散表現を用いた教師あり学習による語義曖昧性解消
使用前向多层 LSTM 和分布式表示通过监督学习进行词义消歧
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    新納 浩幸;古宮 嘉那子;佐々木 稔
  • 通讯作者:
    佐々木 稔
All-words WSDとfine-tuningを利用した分類語彙表の語義の分散表現の構築
使用 All-words WSD 和微调构建分类词典中单词含义的分布式表示
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    柳沼 大輝;古宮 嘉那子;新納 浩幸
  • 通讯作者:
    新納 浩幸
固有表現抽出におけるアノテーション手法の比較
命名实体提取标注方法比较
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    鈴木 雅也;古宮 嘉那子;岩倉 友哉;佐々木 稔;新納 浩幸
  • 通讯作者:
    新納 浩幸

古宮 嘉那子的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('古宮 嘉那子', 18)}}的其他基金

語義曖昧性解消技術と領域適応手法を利用した情報抽出手法の研究開発
利用词义消歧技术和领域适应方法的信息抽取方法研究与开发
  • 批准号:
    17KK0002
  • 财政年份:
    2018
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Fund for the Promotion of Joint International Research (Fostering Joint International Research)

相似海外基金

大規模事前学習モデルを活用した生成型複数テキスト要約に関する研究
使用大规模预训练模型的生成式多文本摘要研究
  • 批准号:
    24K02997
  • 财政年份:
    2024
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Hierarchical Sentiment Polarity Judgement and Explainability for Paragraphs and Sentences in Securities Reports
证券报告段落、句子的层次情感极性判断及解释
  • 批准号:
    23H03459
  • 财政年份:
    2023
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
漸進的な知識の拡張を行う汎用自然言語生成モデルの研究
一种逐步扩展知识的通用自然语言生成模型研究
  • 批准号:
    23H03458
  • 财政年份:
    2023
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
3次元医用画像タスクに汎用利用可能な事前学習モデルの確立と公開
建立并发布可普遍用于3D医学图像任务的预学习模型
  • 批准号:
    23K17234
  • 财政年份:
    2023
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Development of Deep Machine Learning Method for Generalized State Space Models Using Prior Knowledge Constraints and Weak Learning
使用先验知识约束和弱学习的广义状态空间模型深度机器学习方法的开发
  • 批准号:
    23H00471
  • 财政年份:
    2023
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了