複数の事前学習モデルを利用した語義曖昧性解消のドメイン適応

使用多个预训练模型进行词义消歧的领域适应

基本信息

  • 批准号:
    22K12145
  • 负责人:
  • 金额:
    $ 2.75万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2022
  • 资助国家:
    日本
  • 起止时间:
    2022-04-01 至 2025-03-31
  • 项目状态:
    未结题

项目摘要

語義曖昧性解消の論文として、異なった古文と現代文という二つの基準の語義タグを使った研究を行い、分散表現(word2vec)を利用した手法でジャーナルを1報、現代文のBERTを利用したレキシカル・サンプルタスクの研究で国際会議を1報、さらに現代文のBERTを利用したコーパス中の全単語を対象とした語義曖昧性解消の研究で、研究会の論文を1報執筆し、発表を行った。研究会の論文はブラシュアップして国際会議に投稿予定である。さらに、日本語歴史コーパスの語義曖昧性解消の関連論文として、日本語歴史コーパスの古文から現代文への翻訳を事前学習モデルであるT5を用いて行った研究について国内学会で発表を行った。こちらについても、2023年度以降に国際会議に投稿予定である。また、関連論文として、異なった区切りの異なった単語に関係して、ある複合語の単語の分散表現(word2vec)をそれぞれの構成語から合成する研究について、執筆したジャーナル論文が公開された。また、副次的な研究として、語義曖昧性解消ではないが、同じ手法を用いた、単語の読みを付与するシステムを作成する研究を行った。こちらについても、異なったタグと皆さえる疑似データがシステムの正解率を上昇させるという結果を示した。この研究は、国内学会で発表済みであるが、2023年度以降に国際会議に投稿予定である。さらに、関連論文として、「日本語 PromptBERT におけるプロンプトベース対照学習の有効性とプロンプトの性質の調査」の発表を行った。
作为一篇关于词义消歧的论文,我们使用古代和现代文本两种不同标准的词义标签进行了研究,使用分布式表示(word2vec)的方法发表了一篇期刊,并将 BERT 用于现代文本,他提出了一篇国际论文。会议上他对词汇样本任务的研究,并撰写并发表了一篇研究小组论文,研究使用 BERT 对语料库中所有单词的现代句子进行词义消歧。研究小组的论文将被完善并提交给国际会议。此外,作为日语历史语料库语义消歧的相关论文,我在国内学术会议上提出了利用预学习模型T5将日语历史语料库从古代文本翻译成现代文本的研究。我们还计划从 2023 年起将其提交给国际会议。此外,作为相关论文,发表了一篇期刊论文,研究从某个复合词的组成词与不同片段中的不同词的关系合成某个复合词的分布式词表示(word2vec)。此外,作为二次研究,我们进行了研究,以创建一个使用相同方法分配单词发音的系统,尽管它不是词义消歧。同样在这个案例中,结果表明,每个人共享的不同标签和伪数据提高了系统的准确率。该研究已在国内学术会议上发表,计划从2023年起提交国际会议。此外,作为相关论文,“调查基于提示的对比学习的有效性和日语 PromptBERT 中提示的性质”。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Diachronic Domain Adaptation of Word Sense Disambiguation in Corpus of Historical Japanese Using Word Embeddings
使用词嵌入对历史日语语料库中的词义消歧进行历时域适应
  • DOI:
    10.15084/00003566
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    古宮 嘉那子;田邊 絢;新納 浩幸
  • 通讯作者:
    新納 浩幸
疑似訓練データを用いたBERTによる同形異音語の読み推定
使用伪训练数据使用 BERT 进行同形异义词阅读估计
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    小林汰一郎; 古宮嘉那子; 新納浩幸
  • 通讯作者:
    新納浩幸
Composing Word Embeddings for Compound Words Using Linguistic Knowledge
使用语言知识为复合词构建词嵌入
  • DOI:
    10.1145/3561299
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    2
  • 作者:
    Komiya Kanako;Kono Shinji;Seito Takumi;Hirabayashi Teruo
  • 通讯作者:
    Hirabayashi Teruo
日本語歴史コーパスのAll-words WSD
日本历史语料库全词WSD
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    浅田宗磨; 古宮嘉那子
  • 通讯作者:
    古宮嘉那子
T5を用いた古文から現代文への翻訳
使用 T5 将古代文本翻译成现代文本
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    臼井久生; 古宮嘉那子
  • 通讯作者:
    古宮嘉那子
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

古宮 嘉那子其他文献

CRFを用いたアニメ関連用語の固有表現抽出
使用CRF提取动漫相关术语的命名实体
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    高瀬 真記;古宮 嘉那子;小谷 善行
  • 通讯作者:
    小谷 善行
機械学習教本
机器学习教科书
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    柴原 一友;築地 毅;古宮 嘉那子;宮武孝尚;小谷 善行
  • 通讯作者:
    小谷 善行
all-words WSD のための概念辞書の自動作成
自动创建全词概念词典 WSD
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    新納 浩幸;古宮 嘉那子;佐々木 稔
  • 通讯作者:
    佐々木 稔
機械学習教本
机器学习教科书
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    柴原 一友;築地 毅;古宮 嘉那子;宮武孝尚;小谷 善行
  • 通讯作者:
    小谷 善行
Diachronic Domain Adaptation of Word Sense Disambiguation in Corpus of Historical Japanese Using Word Embeddings
使用词嵌入对历史日语语料库中的词义消歧进行历时域适应
  • DOI:
    10.15084/00003566
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    古宮 嘉那子;田邊 絢;新納 浩幸
  • 通讯作者:
    新納 浩幸

古宮 嘉那子的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('古宮 嘉那子', 18)}}的其他基金

語義曖昧性解消技術と領域適応手法を利用した情報抽出手法の研究開発
利用词义消歧技术和领域适应方法的信息抽取方法研究与开发
  • 批准号:
    17KK0002
  • 财政年份:
    2018
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Fund for the Promotion of Joint International Research (Fostering Joint International Research)

相似海外基金

Combating Fake News: Early Detection, Potential Intent and Model Interpretability
打击假新闻:早期检测、潜在意图和模型可解释性
  • 批准号:
    22K12271
  • 财政年份:
    2022
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Development of end-to-end speech recognition techniques for super-elderly that can deal with the cause of recognition errors
开发针对高龄老人的端到端语音识别技术,可处理识别错误的原因
  • 批准号:
    22K12084
  • 财政年份:
    2022
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Implementing Home Care Assistant System Understanding Intentions and Minds
实施家庭护理助理系统了解意图和想法
  • 批准号:
    22J13217
  • 财政年份:
    2022
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
Integrated Ensemble Learning with Embedded Vectors in Authorship Attribution
作者归属中使用嵌入式向量的集成集成学习
  • 批准号:
    22K12726
  • 财政年份:
    2022
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
経済シナリオ分析のための因果関係インスタンス認識技術の確立
经济情景分析因果实例识别技术的建立
  • 批准号:
    21K12010
  • 财政年份:
    2021
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了