未習熟ユーザを補助するマルチモーダル対話システムの研究

辅助无经验用户的多模态对话系统研究

基本信息

  • 批准号:
    14J03989
  • 负责人:
  • 金额:
    $ 1.22万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2014
  • 资助国家:
    日本
  • 起止时间:
    2014-04-25 至 2016-03-31
  • 项目状态:
    已结题

项目摘要

平成27年度より,ユーザを補助する対話システムに有用なユーザの状態として,システムが提示した話題に関するユーザの対話意欲を定義し,人間同士のインタビュー対話を用いて識別に有効なマルチモーダル特徴量の分析を行っている. 以前の検討では,音声データの収録に関して問題があったため,7名の人間同士のインタビュー対話データを新たに収集し,マルチモーダル特徴量を抽出した.分析では,昨年度同様,言語情報として回答者の発話の書き起こしから得られた品詞情報,音声情報として基本周波数 (F0)およびパワー,画像情報として表情と身振りの変動を採用した.結果から,新しいデータセットにおいてもユーザの表情と身振りの変動量,対話中のユーザ発話のF0の変動幅や最大値,最小値などが対話意欲の識別に有効であることが明らかになり,これらの特徴量を用いて対話意欲の自動推定を実施した.結果として,音声画像特徴量を用いた場合に Leave-one-out 条件で 80.4% ,Subjective-open条件で 77.1% の識別精度を達成した.これは事前に調査をおこなった人間による判断と同程度かそれ以上の識別精度である.これらの成果は1件の査読付き国際会議,2件の国内学会での発表を行っている.また,ここまでの検討では人間同士のインタビュー対話を利用していることから,機械と人間との対話においても同様に対話意欲が表出されるかどうかは不明瞭であるため,特徴量及び識別手法の有効性を確かめる目的で,Wizard of Oz (WOZ)法による対話データの収録を行った.5 名の実験参加者の対話によって集計されたアンケートの分析から, 1)興味と対話意欲の評定は必ずしも等しくないこと, 2)機械との対話では人間同士の対話よりも対話意欲が表出されにくいことが示唆されたが,実際の識別実験までは行えず,課題として残された.こちらの検討に関しては1件の国内学会での発表を行った.
自2015财年以来,我们将用户对系统呈现的主题进行对话的愿望定义为帮助用户的对话系统的有用用户状态,并且我们开发了可有效使用人类访谈对话进行识别的多模态功能。 。 在之前的研究中,记录语音数据存在问题,因此我们新收集了七个人之间的采访对话数据并提取了多模态特征。在分析中,与去年一样,我们使用从受访者的话语记录中获得的词性信息作为语言信息,使用基频(F0)和功率作为音频信息,使用面部表情和手势的变化作为图像信息。结果表明,即使在新的数据集中,用户面部表情和手势的变化量、对话期间用户话语的变化范围、最大值和最小值也能有效识别对话动机。互动意愿的估计是利用 的特征进行的。结果,当使用音频图像特征时,我们在留一条件下实现了 80.4% 的分类准确率,在主题开放条件下实现了 77.1% 的分类准确率。这是与人类预先进行研究的判断处于相同水平或更好的识别准确度。这些结果已在一次同行评审的国际会议和两次国内会议上公布。此外,由于迄今为止的研究使用的是人类之间的访谈对话,因此尚不清楚机器与人类之间的对话是否也表达了类似的对话愿望。为了确认该方法的有效性,我们使用Wizard记录了对话数据。盎司 (WOZ) 方法。通过对五位实验参与者的对话编制的问卷进行分析,我们发现:1)互动的兴趣和意愿的评分不一定相等,2)与机器的互动比人与人之间的互动更能表达互动的愿望。尽管有人认为这种方法很困难,但不可能进行实际的歧视实验,这仍然是一个问题。关于这项研究,我们在国内的一个学术会议上做了报告。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
マルチモーダル情報を用いたユーザの対話意欲推定のための音声特徴量の効果の分析
分析语音特征对使用多模态信息估计用户交互意愿的影响
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    千葉祐弥;伊藤彰則
  • 通讯作者:
    伊藤彰則
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

千葉 祐弥其他文献

感情情報に基づくボトルネック特徴量を用いた対話意欲の推定に関する検討
基于情感信息的瓶颈特征估计交互意愿的研究
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    千葉 祐弥
  • 通讯作者:
    千葉 祐弥
クラウド型汎用音声認識APIとドメイン依存音声認識器の出力統合による認識精度向上
通过集成基于云的通用语音识别 API 和域相关语音识别器输出来提高识别准确性
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    木村 崇;千葉 祐弥;能勢 隆;伊藤 彰則
  • 通讯作者:
    伊藤 彰則
転移学習とAttention-based LSTMに基づく英語自動韻律評価
基于迁移学习和基于注意力的LSTM的英语自动韵律评估
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    植田 翔太;千葉 祐弥;能勢 隆;伊藤 彰則
  • 通讯作者:
    伊藤 彰則
クラウド型汎用音声認識APIとドメイン依存音声認識器の出力統合による認識精度向上
通过集成基于云的通用语音识别 API 和域相关语音识别器输出来提高识别准确性
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    木村 崇;千葉 祐弥;能勢 隆;伊藤 彰則
  • 通讯作者:
    伊藤 彰則
大規模感情音声データベースJTESへの聞き手ラベルの付与と音声感情認識での利用
为大规模情感语音数据库JTES分配听者标签及其在语音情感识别中的应用
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    山中 麻衣;能勢 隆;千葉 祐弥;伊藤 彰則
  • 通讯作者:
    伊藤 彰則

千葉 祐弥的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似海外基金

違和感の判断と同時性判断の乖離に注目した多感覚情報処理メカニズムの解明
以不适判断与同时性判断差异为重点的多感官信息处理机制的阐释
  • 批准号:
    22K03198
  • 财政年份:
    2022
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
技術者の認知・判断・行動プロセスに基づくハイパーマルチモーダル画像分類技術の構築
基于工程师认知、判断和行为过程的超多模态图像分类技术构建
  • 批准号:
    20K19856
  • 财政年份:
    2020
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
A study on a response generation method based on simultaneous generation of speech and physical expression for conversational AI
基于语音和肢体表达同时生成的对话式人工智能响应生成方法研究
  • 批准号:
    20K19903
  • 财政年份:
    2020
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
マルチモーダル情報処理による「気配」知覚のメカニズムの解明
通过多模态信息处理阐明“存在”感知机制
  • 批准号:
    20J00130
  • 财政年份:
    2020
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
Comprehensive study on fostering active learning using an intelligent tutoring System for collaborative learning
利用协作学习的智能辅导系统促进主动学习的综合研究
  • 批准号:
    20H04299
  • 财政年份:
    2020
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了