複数話者の音声コミュニケーションの意図・状況理解

了解多说话者语音通信的意图和情况

基本信息

  • 批准号:
    15017252
  • 负责人:
  • 金额:
    $ 3.26万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
  • 财政年份:
    2003
  • 资助国家:
    日本
  • 起止时间:
    2003 至 无数据
  • 项目状态:
    已结题

项目摘要

人間と共生する機械を実現するためには、システムがユーザのモデルを知覚し、それに応じて適応的に行動することが重要であると考えられる。本研究では、音声対話によるインタフェースにおいて、協調的な応答を生成するためのユーザモデルについて検討を進めてきた。具体的には、システムに対する習熟度、タスクドメインに関する知識レベル、性急度の3つのユーザモデルを導入し、それに応じて対話制御を行う戦略を提案した。京都市バス運行情報案内システム(現在試験運用中:075-326-3116)において実装・評価を行った結果、各ユーザに適応した協調的応答が、習熟したユーザに対する対話時間を増加させることなく、初心者に対して適切なガイダンスとなることが示された。本研究で用いているユーザモデルの判別には、音声認識結果に含まれる意味情報以外に、発話間間隔やバージインの有無などの音声対話特有の特徴も用いている。特に、習熟度と性急度の学習・判別に用いる特徴はドメイン知識に依存していないため、これらのユーザモデルは他のドメインにも応用できる汎用的なものである。これらの研究成果に関しては、自然言語処理の分野で最も権域があるAssociation for Computational Linguistics (ACL)において発表論文として採択され、人工知能学会全国大会においても優秀賞を授与された。さらに、国内外の雑誌論文に掲載される予定である。また、新聞での報道もされた。
为了实现与人共存的机器,人们认为对于系统而言,要感知用户的模型并相应地采取行动很重要。在这项研究中,我们一直在研究使用语音对话在接口中生成协作响应的用户模型。具体来说,我们提出了一种实施三个用户模型的策略:系统熟练度,有关任务域的知识水平和敏捷性,并相应地实施对话控制。实施和评估是在京都城市巴士运营信息系统(目前正在测试的:075-326-3116)中进行的,并且显示出适合每个用户的合作响应,为初学者提供了适当的指导,而无需增加熟悉用户的对话时间。除了语音识别结果中包含的语义信息外,本研究中使用的用户模型还使用语音对话独有的特征,例如语音之间的间隔以及是否有驳船。特别是,用于学习和鉴别能力和敏捷性的功能不取决于领域知识,这些用户模型是通用的,并且可以应用于其他领域。这些研究发现被选为计算语言学协会(ACL)的演讲论文,该论文是自然语言处理领域中最特权的论文,并在人工智能学会全国会议上也获得了卓越奖。此外,它将在国内和国际上发表在期刊论文中。在报纸上也有报道。

项目成果

期刊论文数量(12)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
山肩洋子, 河原達也, 奥乃博, 美濃導彦: "音声対話システムにおける物体指示のための信念ネットワークを用いた曖昧性の解消"人工知能学会誌. Vol.19, No.1. 47-56 (2004)
Yoko Yamashita、Tatsuya Kawahara、Hiroshi Okuno、Norihiko Mino:“在口语对话系统中使用信念网络消除歧义”,日本人工智能学会杂志,第 19 卷,第 47-56 期(2004 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
T.Kawahara, M.Hasegawa, K.Shitaoka, T.Kitade, H.Nanjo.: "Automatic indexing of lecture presentation using unsupervised learning of presumed discourse markers."IEEE Trans.Speech & Audio Processing. (採録決定). (2004)
T.Kawahara、M.Hasekawa、K.Shitaoka、T.Kitade、H.Nanjo.:“使用假定话语标记的无监督学习自动索引讲座演示。”IEEE Trans.Speech & Audio Processing(已接受)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
南條浩輝, 河原達也: "講演音声認識のための教師なし言語モデル適応と発話速度に適応したデコーディング"電子情報通信学会論文誌. (採録決定). (2004)
Hiroki Nanjo、Tatsuya Kawahara:“适用于演讲语音识别和解码的无监督语言模型适应语速”电子、信息和通信工程师学会汇刊(2004 年已接受)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
秋田祐哉, 河原達也: "多数話者モデルを用いた討論音声の教師なし話者インデキシング"電子情報通信学会論文誌. Vol.J87-DII, No.2. 495-503 (2004)
Yuya Akita、Tatsuya Kawahara:“使用多发言者模型对讨论演讲进行无监督的发言者索引”,电子、信息和通信工程师学会汇刊,第 J87-DII 卷,第 2 期(2004 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
駒谷和範, 鹿島博晶, 田中克明, 河原達也: "複合的言語制約に基づくキーフレーズ検出を用いた汎用的なデータベース検索音声対話プラットフォーム"情報処理学会論文誌. Vol.44, No.5. 1333-1342 (2003)
Kazunori Komatani、Hiroaki Kashima、Katsuaki Tanaka、Tatsuya Kawahara:“基于复杂语言约束的使用关键短语检测的通用数据库搜索语音对话平台”,日本信息处理学会汇刊第 44 卷,第 1333 期。 1342 (2003)
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

河原 達也其他文献

京都市バス運行情報案内システムにおける実ユーザのふるまいの分析
京都市公交车运营信息引导系统的实际用户行为分析
多様な相槌をうつ傾聴対話システムのための相槌形態の予測
支持多种宜人内容的听力对话系统的宜人形式预测
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    山口 貴史;井上 昂治;吉野 幸一郎;高梨 克也;Nigel G. Ward;河原 達也
  • 通讯作者:
    河原 達也
原子核をプローブとした地球核周辺の局所構造探査
使用原子核作为探测器探索地核周围的局部结构
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    坂東 宜昭;糸山 克寿;昆陽 雅司;田所 諭;中臺 一博;吉井 和佳;河原 達也;奥乃 博;三井隆也
  • 通讯作者:
    三井隆也
音声対話システムにおけるユーザのふるまいの経時的変化の分析
分析语音对话系统中用户行为随时间的变化
モバイルMRシステム構築のための機能分散型フレームワーク(8)-アニメーションの表現力向上-
构建移动MR系统的功能分布式框架(8)-提高动画表现力-
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    平山 高嗣;角 康之;河原 達也;松山隆司;加藤芳秀,松原茂樹;川端大輔,木村朝子,柴田史久
  • 通讯作者:
    川端大輔,木村朝子,柴田史久

河原 達也的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('河原 達也', 18)}}的其他基金

End-to-End Model for Task-Independent Speech Understanding and Dialogue
与任务无关的语音理解和对话的端到端模型
  • 批准号:
    20H00602
  • 财政年份:
    2020
  • 资助金额:
    $ 3.26万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
仮想空間のチームスポーツを介したコミュニケーションスキルの知的学習支援
通过虚拟空间中的团队运动来智能学习支持沟通技巧
  • 批准号:
    15F15049
  • 财政年份:
    2015
  • 资助金额:
    $ 3.26万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
強化学習に基づく適応的な音声対話システム
基于强化学习的自适应口语对话系统
  • 批准号:
    10F00050
  • 财政年份:
    2010
  • 资助金额:
    $ 3.26万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
用例に基づく対話制御を用いたコンピュータ支援型言語学習システム
使用基于示例的对话控制的计算机辅助语言学习系统
  • 批准号:
    10F00361
  • 财政年份:
    2010
  • 资助金额:
    $ 3.26万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
ユーザ・状況に適応的な音声対話による大規模情報の検索・提示
通过适应用户和情况的语音对话搜索和呈现大规模信息
  • 批准号:
    19024044
  • 财政年份:
    2007
  • 资助金额:
    $ 3.26万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
ユーザ・状況に適応的な音声対話による大規模情報の検索・提示
通过适应用户和情况的语音对话搜索和呈现大规模信息
  • 批准号:
    18049047
  • 财政年份:
    2006
  • 资助金额:
    $ 3.26万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
複数話者の音声コミュニケーションの意図・状況理解
了解多说话者语音通信的意图和情况
  • 批准号:
    16016250
  • 财政年份:
    2004
  • 资助金额:
    $ 3.26万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
複数話者の音声コミュニケーションの意図・状況理解
了解多说话者语音通信的意图和情况
  • 批准号:
    14019052
  • 财政年份:
    2002
  • 资助金额:
    $ 3.26万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
複数話者の音声コミュニケーションの意図・状況理解
了解多说话者语音通信的意图和情况
  • 批准号:
    13224057
  • 财政年份:
    2001
  • 资助金额:
    $ 3.26万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas (C)
キーフレーズ認識とその信頼度計算に基づく柔軟な音声対話理解
基于关键词识别的灵活语音对话理解及其可靠性计算
  • 批准号:
    09780328
  • 财政年份:
    1997
  • 资助金额:
    $ 3.26万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

Studies on Multimodal Dialogue Control using Multimedia Corpus and Probability Model
基于多媒体语料库和概率模型的多模态对话控制研究
  • 批准号:
    18500115
  • 财政年份:
    2006
  • 资助金额:
    $ 3.26万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
複数話者の音声コミュニケーションの意図・状況理解
了解多说话者语音通信的意图和情况
  • 批准号:
    16016250
  • 财政年份:
    2004
  • 资助金额:
    $ 3.26万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
Development of corpus-based technologies for robust spoken dialogue systems
开发基于语料库的强大口语对话系统技术
  • 批准号:
    15300045
  • 财政年份:
    2003
  • 资助金额:
    $ 3.26万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
複数話者の音声コミュニケーションの意図・状況理解
了解多说话者语音通信的意图和情况
  • 批准号:
    14019052
  • 财政年份:
    2002
  • 资助金额:
    $ 3.26万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
複数話者の音声コミュニケーションの意図・状況理解
了解多说话者语音通信的意图和情况
  • 批准号:
    13224057
  • 财政年份:
    2001
  • 资助金额:
    $ 3.26万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了