複数話者の音声コミュニケーションの意図・状況理解

了解多说话者语音通信的意图和情况

基本信息

  • 批准号:
    16016250
  • 负责人:
  • 金额:
    $ 5.95万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
  • 财政年份:
    2004
  • 资助国家:
    日本
  • 起止时间:
    2004 至 2005
  • 项目状态:
    已结题

项目摘要

人間と共生する機械を実現するためには、システムがユーザのモデルを知覚し、それに応じて適応的に行動することが重要であると考えられる。本研究ではまず、音声対話によるインタフェースにおいて、協調的な応答を生成するためのユーザモデルについて検討を進めてきた。具体的には、システムに対する習熟度、タスクドメインに関する知識レベル、性急度の3つのユーザモデルを導入し、それに応じて対話制御を行う戦略を提案した。京都市バス運行情報案内システム(現在試験運用中:075-326-3116)において実装・評価を行った結果、各ユーザに適応した協調的応答が、習熟したユーザに対する対話時間を増加させることなく、初心者に対して適切なガイダンスとなることが示された。本研究で用いているユーザモデルは自動判別を行うが、そのための特徴として音声認識結果に含まれる意味情報以外に、発話間間隔やバージインの有無などの音声対話特有の特徴も用いている。特に、習熟度と性急度の学習・判別に用いる特徴はドメイン知識に依存していないため、これらのユーザデルは他のドメインにも応用できる汎用的なものである。ただし、対話制御については人手で規則を記述する必要があり、大規模なドメインやモデルへの適用が困難であった。そこで次に、ユーザや状況のモデルに基づいて、プランニングにより対話制御・応答生成を行う枠組みを考え、このプランニング(プランを動的に選択する機構)を機械学習により行うことを研究した。プランはドメインプランと発話プランの2階層からなり、ドメインプランを決定することで次に提供する情報内容を決定し、発話プランを決定して具体的な応答を生成する。これらのプランは、前記のようなユーザ・状況のモデルをパラメータとする線形の評価関数で規定される。ロールプレイ形式で行う模擬対話サンプルによりこの学習を行うことにより、ユーザに適応した対話プランの選択を実現することができた。
为了实现与人类共存的机器,系统感知用户的模型并相应地自适应行动被认为很重要。在这项研究中,我们首先研究了在语音对话界面中生成合作响应的用户模型。具体来说,我们引入了三种用户模型:对系统的熟悉程度、任务领域的知识水平和紧迫性,并提出了相应的控制交互的策略。在京都市巴士运行信息引导系统(目前正在试运行:075-326-3116)中实施和评估的结果表明,适合每个用户的协作响应可以让初学者轻松使用,而无需增加交互时间事实证明,它为有经验的用户提供了适当的指导。本研究中使用的用户模型进行自动判别,为此,除了语音识别结果中包含的语义信息外,还使用了口语对话特有的特征,例如话语之间的间隔以及是否存在打断。特别是,用于学习和确定熟练程度和紧急程度的特征不依赖于领域知识,因此这些用户模型是通用的,可以应用于其他领域。然而,对话控制的规则必须手动编写,这使得它很难应用于大规模领域和模型。接下来,我们考虑了一个通过基于用户和情况模型的规划来控制对话和生成响应的框架,并研究了如何使用机器学习来执行该规划(动态选择计划的机制)。计划由两层组成:领域计划和话语计划,通过确定领域计划,确定接下来要提供的信息内容,通过确定话语计划,生成具体的响应。这些计划由线性评估函数定义,其参数是上述用户/情境模型。通过使用以角色扮演形式执行的模拟对话样本进行学习,我们能够选择适合用户的对话计划。

项目成果

期刊论文数量(28)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
話し言葉による音声対話システム
使用口语的语音对话系统
  • DOI:
  • 发表时间:
    2004
  • 期刊:
  • 影响因子:
    0
  • 作者:
    相良直樹;砂山渡;谷内田正彦;河原達也
  • 通讯作者:
    河原達也
音声対話システムにおける適応的な応答生成を行うためのユーザモデル
口语对话系统中自适应响应生成的用户模型
Automatic indexing of lecture presentations using unsupervised learning of presumed discourse markers
  • DOI:
    10.1109/tsa.2004.828701
  • 发表时间:
    2004-06
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Tatsuya Kawahara;Masahiro Hasegawa;Kazuya Shitaoka;T. Kitade;H. Nanjo
  • 通讯作者:
    Tatsuya Kawahara;Masahiro Hasegawa;Kazuya Shitaoka;T. Kitade;H. Nanjo
Example-based training of dialogue planning incorporating user and situation models
结合用户和情境模型的基于示例的对话规划训练
  • DOI:
  • 发表时间:
    2004
  • 期刊:
  • 影响因子:
    0
  • 作者:
    S.Ueno;I.R.Lane;T.Kawahara
  • 通讯作者:
    T.Kawahara
Trigger-based language model adaptation for automatic transcription of panel discussions.
基于触发器的语言模型自适应,用于自动转录小组讨论。
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

河原 達也其他文献

京都市バス運行情報案内システムにおける実ユーザのふるまいの分析
京都市公交车运营信息引导系统的实际用户行为分析
多様な相槌をうつ傾聴対話システムのための相槌形態の予測
支持多种宜人内容的听力对话系统的宜人形式预测
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    山口 貴史;井上 昂治;吉野 幸一郎;高梨 克也;Nigel G. Ward;河原 達也
  • 通讯作者:
    河原 達也
原子核をプローブとした地球核周辺の局所構造探査
使用原子核作为探测器探索地核周围的局部结构
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    坂東 宜昭;糸山 克寿;昆陽 雅司;田所 諭;中臺 一博;吉井 和佳;河原 達也;奥乃 博;三井隆也
  • 通讯作者:
    三井隆也
音声対話システムにおけるユーザのふるまいの経時的変化の分析
分析语音对话系统中用户行为随时间的变化
モバイルMRシステム構築のための機能分散型フレームワーク(8)-アニメーションの表現力向上-
构建移动MR系统的功能分布式框架(8)-提高动画表现力-
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    平山 高嗣;角 康之;河原 達也;松山隆司;加藤芳秀,松原茂樹;川端大輔,木村朝子,柴田史久
  • 通讯作者:
    川端大輔,木村朝子,柴田史久

河原 達也的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('河原 達也', 18)}}的其他基金

End-to-End Model for Task-Independent Speech Understanding and Dialogue
与任务无关的语音理解和对话的端到端模型
  • 批准号:
    20H00602
  • 财政年份:
    2020
  • 资助金额:
    $ 5.95万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
仮想空間のチームスポーツを介したコミュニケーションスキルの知的学習支援
通过虚拟空间中的团队运动来智能学习支持沟通技巧
  • 批准号:
    15F15049
  • 财政年份:
    2015
  • 资助金额:
    $ 5.95万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
強化学習に基づく適応的な音声対話システム
基于强化学习的自适应口语对话系统
  • 批准号:
    10F00050
  • 财政年份:
    2010
  • 资助金额:
    $ 5.95万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
用例に基づく対話制御を用いたコンピュータ支援型言語学習システム
使用基于示例的对话控制的计算机辅助语言学习系统
  • 批准号:
    10F00361
  • 财政年份:
    2010
  • 资助金额:
    $ 5.95万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
ユーザ・状況に適応的な音声対話による大規模情報の検索・提示
通过适应用户和情况的语音对话搜索和呈现大规模信息
  • 批准号:
    19024044
  • 财政年份:
    2007
  • 资助金额:
    $ 5.95万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
ユーザ・状況に適応的な音声対話による大規模情報の検索・提示
通过适应用户和情况的语音对话搜索和呈现大规模信息
  • 批准号:
    18049047
  • 财政年份:
    2006
  • 资助金额:
    $ 5.95万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
複数話者の音声コミュニケーションの意図・状況理解
了解多说话者语音通信的意图和情况
  • 批准号:
    15017252
  • 财政年份:
    2003
  • 资助金额:
    $ 5.95万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
複数話者の音声コミュニケーションの意図・状況理解
了解多说话者语音通信的意图和情况
  • 批准号:
    14019052
  • 财政年份:
    2002
  • 资助金额:
    $ 5.95万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
複数話者の音声コミュニケーションの意図・状況理解
了解多说话者语音通信的意图和情况
  • 批准号:
    13224057
  • 财政年份:
    2001
  • 资助金额:
    $ 5.95万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas (C)
キーフレーズ認識とその信頼度計算に基づく柔軟な音声対話理解
基于关键词识别的灵活语音对话理解及其可靠性计算
  • 批准号:
    09780328
  • 财政年份:
    1997
  • 资助金额:
    $ 5.95万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

Studies on Multimodal Dialogue Control using Multimedia Corpus and Probability Model
基于多媒体语料库和概率模型的多模态对话控制研究
  • 批准号:
    18500115
  • 财政年份:
    2006
  • 资助金额:
    $ 5.95万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
複数話者の音声コミュニケーションの意図・状況理解
了解多说话者语音通信的意图和情况
  • 批准号:
    15017252
  • 财政年份:
    2003
  • 资助金额:
    $ 5.95万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
Development of corpus-based technologies for robust spoken dialogue systems
开发基于语料库的强大口语对话系统技术
  • 批准号:
    15300045
  • 财政年份:
    2003
  • 资助金额:
    $ 5.95万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
複数話者の音声コミュニケーションの意図・状況理解
了解多说话者语音通信的意图和情况
  • 批准号:
    14019052
  • 财政年份:
    2002
  • 资助金额:
    $ 5.95万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
複数話者の音声コミュニケーションの意図・状況理解
了解多说话者语音通信的意图和情况
  • 批准号:
    13224057
  • 财政年份:
    2001
  • 资助金额:
    $ 5.95万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了