複数話者の音声コミュニケーションの意図・状況理解

了解多说话者语音通信的意图和情况

基本信息

批准号：
15017252
负责人：
河原達也
金额：
$ 3.26万
依托单位：
Kyoto University
依托单位国家：
日本
项目类别：
Grant-in-Aid for Scientific Research on Priority Areas
财政年份：
2003
资助国家：
日本
起止时间：
2003 至无数据
项目状态：
已结题

项目摘要

人間と共生する機械を実現するためには、システムがユーザのモデルを知覚し、それに応じて適応的に行動することが重要であると考えられる。本研究では、音声対話によるインタフェースにおいて、協調的な応答を生成するためのユーザモデルについて検討を進めてきた。具体的には、システムに対する習熟度、タスクドメインに関する知識レベル、性急度の3つのユーザモデルを導入し、それに応じて対話制御を行う戦略を提案した。京都市バス運行情報案内システム(現在試験運用中:075-326-3116)において実装・評価を行った結果、各ユーザに適応した協調的応答が、習熟したユーザに対する対話時間を増加させることなく、初心者に対して適切なガイダンスとなることが示された。本研究で用いているユーザモデルの判別には、音声認識結果に含まれる意味情報以外に、発話間間隔やバージインの有無などの音声対話特有の特徴も用いている。特に、習熟度と性急度の学習・判別に用いる特徴はドメイン知識に依存していないため、これらのユーザモデルは他のドメインにも応用できる汎用的なものである。これらの研究成果に関しては、自然言語処理の分野で最も権域があるAssociation for Computational Linguistics (ACL)において発表論文として採択され、人工知能学会全国大会においても優秀賞を授与された。さらに、国内外の雑誌論文に掲載される予定である。また、新聞での報道もされた。

为了实现与人共存的机器，人们认为对于系统而言，要感知用户的模型并相应地采取行动很重要。在这项研究中，我们一直在研究使用语音对话在接口中生成协作响应的用户模型。具体来说，我们提出了一种实施三个用户模型的策略：系统熟练度，有关任务域的知识水平和敏捷性，并相应地实施对话控制。实施和评估是在京都城市巴士运营信息系统（目前正在测试的：075-326-3116）中进行的，并且显示出适合每个用户的合作响应，为初学者提供了适当的指导，而无需增加熟悉用户的对话时间。除了语音识别结果中包含的语义信息外，本研究中使用的用户模型还使用语音对话独有的特征，例如语音之间的间隔以及是否有驳船。特别是，用于学习和鉴别能力和敏捷性的功能不取决于领域知识，这些用户模型是通用的，并且可以应用于其他领域。这些研究发现被选为计算语言学协会（ACL）的演讲论文，该论文是自然语言处理领域中最特权的论文，并在人工智能学会全国会议上也获得了卓越奖。此外，它将在国内和国际上发表在期刊论文中。在报纸上也有报道。