文脈理解可能な「AI話しことばチェッカー」の開発と実証評価

能理解语境的“AI口语查词器”的开发与实证评估

基本信息

  • 批准号:
    22H03706
  • 负责人:
  • 金额:
    $ 10.07万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
  • 财政年份:
    2022
  • 资助国家:
    日本
  • 起止时间:
    2022-04-01 至 2027-03-31
  • 项目状态:
    未结题

项目摘要

2021年度までの研究で、判定対象の文章内に含まれる話し言葉を、作成した話し言葉の分類カテゴリに沿って検出し、修正文例を提示する機能を搭載した話し言葉検出システム「話しことばチェッカー」を開発した。今年度からの研究では、反転と協調学習を組み合わせた授業モデルの構築と大規模な実践を図り、そこで得られる文脈の影響を受けるあいまいな話し言葉事例ベースに基づき、最適化された文脈理解可能な「AI話しことばチェッカー」を有する知的学習支援システムの実現を目指す。2022年度は主に、あいまいな表現(グレーゾーン)の抽出作業およびそれらを検出できるよう、システムのAI化に向けた検証を行った。あいまいな表現(グレーゾーン)とは、対象となる言葉が話し言葉であるか否かの文脈判断が必要な表現を指す。その例として、「てしまう」が挙げられる。この表現は、主語が「私」であれば主観的になりやすく、主語が第三者であれば客観性が保たれやすい。他には、「残念」「面倒」「つらい」「厳しい」など、個人の感情が介入しやすい表現や若者言葉や流行語として口語的に使われる表現などである。今年度は、「てしまう」を題材に、機械学習モデルを構築し、Amazonレビューや査読論文などから作成した4種類のデータセットを用いて評価を行った。まず、抽出した「てしまう」を含む主観的な文と客観的な文それぞれ250文ずつを、ファインチューニングしたデータセットに研究代表者の分類した「てしまう」データセットを推論させたところ、77%の精度を出すことができた。このことから、Amazonレビューと学会の査読論文の文章が、研究代表者の作成した「てしまう」データセットの分類と近い可能性が示唆された。
在2021年度的研究中,我们开发了一种名为“Spoken Word Checker”的口语检测系统,该系统具有根据创建的口语分类类别检测要判断的句子中包含的口语单词并呈现纠正后的句子示例的功能。在今年开始的研究中,我们将构建翻转学习和合作学习相结合的课程模型,并根据受上下文影响的歧义口语示例,创建优化的模型。基于受上下文影响的歧义口语示例的上下文可理解模型,旨在实现具有“AI口语单词检查器”的智能学习支持系统。 2022财年,我们主要进行了验证工作,以提取歧义表达(灰色区域)并使系统AI能够检测它们。歧义表达(灰色区域)是指需要上下文判断来确定目标词是否是口语词的表达。 “teshuru”就是一个例子。如果主语是“我”,则这种表达往往是主观的,但如果主语是第三人称,则这种表达往往是客观的。其他表达方式包括容易受个人情绪影响的表达方式,例如“遗憾”、“麻烦”、“艰难”和“严重”以及年轻人口语或流行语等口语表达方式。今年,我们以“temasu”为主题构建了一个机器学习模型,并使用根据亚马逊评论、同行评审论文等创建的四种数据集对其进行了评估。首先,当我们将提取的 250 个包含“teshuru”的主观句子和客观句子微调到数据集中时,我们推断了研究人员分类的“teshuru”数据集,发现 77 个能够达到准确率的 %。这表明亚马逊评论和学术同行评审论文的文本可能与首席研究员创建的“Teshuru”数据集的分类类似。

项目成果

期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
日本語を母語とする大学生の話し言葉・書き言葉に対する意識と学習観
日语为母语的大学生口语意识及学习视角
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Miyahara;Y.;Kaneko;K.;Fujibuchi;T.;Okada;Y.;秋山英治
  • 通讯作者:
    秋山英治
A Study of an Online Collaborative Learning Course to Correct Colloquial Writing in Students’ Essays
学生作文口语写作在线协作学习课程的研究
AI話しことばチェッカーを想定した機械学習モデリングの実験
假设人工智能口语单词检查器的机器学习建模实验
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    新井田響;川越颯亮;山川広人;山下由美子;小松川浩
  • 通讯作者:
    小松川浩
話しことばチェッカー
口语检查器
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
文脈理解可能な「AI話しことばチェッカー」開発および知的学習支援システムへの拡張
开发可理解上下文的“AI口语单词检查器”并扩展到智能学习支持系统
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    山下由美子;加藤竜哉;湯川治敏;日永龍彦;小松川浩;仲道雅輝;秋山英治;川越颯亮
  • 通讯作者:
    川越颯亮
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

山下 由美子其他文献

栄養教諭が行う児童生徒を対象とした野菜摂取に関する指導の効果
营养教师对学生蔬菜摄入指导的效果
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    臼田 典子;山下 由美子;藤田 浩子;川原 昌士;齋藤 七絵;森田 裕代;永田 桂子;松原 恵子;伊藤 裕子;遠山 致得子;金田 雅代;饗場 直美
  • 通讯作者:
    饗場 直美
ハンチントン病関連蛋白質(HAP1)が形成する神経細胞質封入体"stigmoid body"の細胞内ダイナミクス
亨廷顿病相关蛋白(HAP1)形成的神经元细胞质包涵体“柱状体”的细胞内动力学
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    藤永 竜太郎;山下 由美子;菊池 悠次郎;今井 智子;栁井 章江;國分 啓司;篠田 晃;藤永竜太郎
  • 通讯作者:
    藤永竜太郎

山下 由美子的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('山下 由美子', 18)}}的其他基金

文脈理解可能な「AI話しことばチェッカー」の開発と実証評価
能理解语境的“AI口语查词器”的开发与实证评估
  • 批准号:
    23K24961
  • 财政年份:
    2024
  • 资助金额:
    $ 10.07万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)

相似海外基金

初期ドイツモード雑誌テクストの言語的特徴とはー話し言葉性とテクストタイプの研究
早期德国时尚杂志文本的语言特征是什么?口语和文本类型的研究。
  • 批准号:
    24K16056
  • 财政年份:
    2024
  • 资助金额:
    $ 10.07万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
子ども会話コーパスの開発とコミュニケーション能力の発達に関する実証的研究
儿童会话语料库开发与沟通能力发展的实证研究
  • 批准号:
    23H00630
  • 财政年份:
    2023
  • 资助金额:
    $ 10.07万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
ポルトガル語を中心とするロマンス諸語における口語の歴史的推移について
罗曼语系口语(主要是葡萄牙语)的历史变迁
  • 批准号:
    23K00477
  • 财政年份:
    2023
  • 资助金额:
    $ 10.07万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
日本人中国語学習者の書き言葉と話し言葉における言語特徴の分析
日本汉语学习者书面语和口语的语言特征分析
  • 批准号:
    23K18866
  • 财政年份:
    2023
  • 资助金额:
    $ 10.07万
  • 项目类别:
    Grant-in-Aid for Research Activity Start-up
日本語音素の異音における喉頭制御と口腔内制御に関する総合的研究
日语音素中音位变体的喉部和口部控制综合研究
  • 批准号:
    22K00544
  • 财政年份:
    2022
  • 资助金额:
    $ 10.07万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了