キーフレーズ認識とその信頼度計算に基づく柔軟な音声対話理解

基于关键词识别的灵活语音对话理解及其可靠性计算

基本信息

  • 批准号:
    09780328
  • 负责人:
  • 金额:
    $ 1.28万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
  • 财政年份:
    1997
  • 资助国家:
    日本
  • 起止时间:
    1997 至 1998
  • 项目状态:
    已结题

项目摘要

キーフレーズの検出・検証の高精度化のために、ドメインに独立な語彙・言語モデルの構成方法について研究した。このフィラーモデルは、キーワードやキーフレーズ以外の区間を近似することにより、検出や検証のためのスコアの正規化を行うものである。そのためには、できるだけ小さいサイズで十分なカバレージを持つことが望ましい。また、話題やキーワード語彙の変化に対して頑健であることが望ましい。そこで、ドメインに依存した語彙やコーパスを前提とする代りに、会話スタイル(講演調、情報検索対話など)に依存したモデルを考える。例えば講演調スタイルモデルは、講演の内容に関わらず講演というスタイルに固有の話し言葉の特徴をとらえる。これにより、同一のスタイルからなる大規模なコーパスを利用して学習できる。話題(ドメイン)独立性の尺度として、単語wと話題集合T{t_1,...,t_n}との相互情報量I(T;w)を定義し、この値が小さい単語集合を抽出する。このモデルにより,従来の音節連接モデルに基づく手法に比べて、はるかに高い発話検証性能を得ることができ、講演をしながら音声で操作できるスライドプロジェクタを設計・実装できた。
为了提高关键短语检测和验证的准确性,我们研究了一种构建领域无关的词汇和语言模型的方法。该填充模型通过近似关键词和关键短语以外的部分来标准化检测和验证的分数。为此,希望以尽可能小的尺寸获得足够的覆盖范围。还希望能够对主题和关键词词汇的变化保持鲁棒性。因此,我们不考虑依赖于领域的词汇和语料库,而是考虑一个依赖于对话风格(讲座风格、信息搜索对话等)的模型。例如,讲座风格模型捕捉了讲座风格所特有的口语特征,无论讲座内容如何。这允许使用相同风格的大型语料库进行学习。作为主题(领域)独立性的度量,我们定义单词 w 和主题集 T{t_1,...,t_n} 之间的互信息 I(T;w),并提取具有较小值的单词集。使用该模型,我们能够获得比基于音节串联模型的传统方法更高的语音验证性能,并且能够设计和实现可以在演讲时通过语音操作的幻灯片投影仪。

项目成果

期刊论文数量(13)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
T.Kawahara: "Combining Key-phrase Detection and Subword-based Verification for Flexible Speech Understanding" Proc.IEEE Int'l Conf.Acoust.,Speech & Signal Processing. 1. 1159-1162 (1997)
T.Kawahara:“结合关键短语检测和基于子字的验证以实现灵活的语音理解”Proc.IEEE Intl Conf.Acoust.,演讲
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
H.Masataki: "Task adaptation using MAP estimation in n-gram language modeling" Proc.IEEE Int'l Conf.Acoust.,Speech & Signal Processing. 1. 783-786 (1997)
H.Masataki:“在 n-gram 语言建模中使用 MAP 估计进行任务自适应”Proc.IEEE Intl Conf.Acoust.,演讲
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
T.Kawahara: "Flexible speech understanding based on combined key-phrase detection and verification" IEEE Trans.Speech & Audio Processing. 採録決定. (1998)
T.Kawahara:“基于组合关键短语检测和验证的灵活语音理解”IEEE 语音和音频处理已接受(1998 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
C-H.Jo: "Japanese pronunciation training system with HMM segmentation and distinctive feature classification" Proc.Int'l Conf.on Speech Processing. 341-346 (1997)
C-H.Jo:“具有 HMM 分割和独特特征分类的日语发音训练系统”Proc.Intl Conf.on Speechprocessing。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
T.Kawahara: "Speaking-Style dependent lexicalized filler model for key-phrase detection and verification" 電子情報通信学会技術研究報告. SP97-78. (1997)
T.Kawahara:“用于关键短语检测和验证的说话风格相关词汇填充模型”IEICE 技术研究报告(1997)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

河原 達也其他文献

京都市バス運行情報案内システムにおける実ユーザのふるまいの分析
京都市公交车运营信息引导系统的实际用户行为分析
多様な相槌をうつ傾聴対話システムのための相槌形態の予測
支持多种宜人内容的听力对话系统的宜人形式预测
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    山口 貴史;井上 昂治;吉野 幸一郎;高梨 克也;Nigel G. Ward;河原 達也
  • 通讯作者:
    河原 達也
原子核をプローブとした地球核周辺の局所構造探査
使用原子核作为探测器探索地核周围的局部结构
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    坂東 宜昭;糸山 克寿;昆陽 雅司;田所 諭;中臺 一博;吉井 和佳;河原 達也;奥乃 博;三井隆也
  • 通讯作者:
    三井隆也
音声対話システムにおけるユーザのふるまいの経時的変化の分析
分析语音对话系统中用户行为随时间的变化
モバイルMRシステム構築のための機能分散型フレームワーク(8)-アニメーションの表現力向上-
构建移动MR系统的功能分布式框架(8)-提高动画表现力-
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    平山 高嗣;角 康之;河原 達也;松山隆司;加藤芳秀,松原茂樹;川端大輔,木村朝子,柴田史久
  • 通讯作者:
    川端大輔,木村朝子,柴田史久

河原 達也的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('河原 達也', 18)}}的其他基金

End-to-End Model for Task-Independent Speech Understanding and Dialogue
与任务无关的语音理解和对话的端到端模型
  • 批准号:
    20H00602
  • 财政年份:
    2020
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
仮想空間のチームスポーツを介したコミュニケーションスキルの知的学習支援
通过虚拟空间中的团队运动来智能学习支持沟通技巧
  • 批准号:
    15F15049
  • 财政年份:
    2015
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
強化学習に基づく適応的な音声対話システム
基于强化学习的自适应口语对话系统
  • 批准号:
    10F00050
  • 财政年份:
    2010
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
用例に基づく対話制御を用いたコンピュータ支援型言語学習システム
使用基于示例的对话控制的计算机辅助语言学习系统
  • 批准号:
    10F00361
  • 财政年份:
    2010
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
ユーザ・状況に適応的な音声対話による大規模情報の検索・提示
通过适应用户和情况的语音对话搜索和呈现大规模信息
  • 批准号:
    19024044
  • 财政年份:
    2007
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
ユーザ・状況に適応的な音声対話による大規模情報の検索・提示
通过适应用户和情况的语音对话搜索和呈现大规模信息
  • 批准号:
    18049047
  • 财政年份:
    2006
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
複数話者の音声コミュニケーションの意図・状況理解
了解多说话者语音通信的意图和情况
  • 批准号:
    16016250
  • 财政年份:
    2004
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
複数話者の音声コミュニケーションの意図・状況理解
了解多说话者语音通信的意图和情况
  • 批准号:
    15017252
  • 财政年份:
    2003
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
複数話者の音声コミュニケーションの意図・状況理解
了解多说话者语音通信的意图和情况
  • 批准号:
    14019052
  • 财政年份:
    2002
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
複数話者の音声コミュニケーションの意図・状況理解
了解多说话者语音通信的意图和情况
  • 批准号:
    13224057
  • 财政年份:
    2001
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas (C)

相似海外基金

グローバルコミュニケーションに資する大脳皮質の音声情報処理機能単位の解明
阐明有助于全球交流的大脑皮层声音信息处理功能单元
  • 批准号:
    24K15685
  • 财政年份:
    2024
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
多様な英語の音声理解のメカニズムの研究:アジア・アフリカの英語を中心に
各种英语语言的语音理解机制研究——以亚洲和非洲英语为中心
  • 批准号:
    23K20468
  • 财政年份:
    2024
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
脳刺激型補聴器の実現に向けた、コミュニケーション音声脳内処理機構の解明
阐明交流语音的大脑处理机制,实现脑刺激助听器
  • 批准号:
    23K27933
  • 财政年份:
    2024
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
感情伝達文末詞の音声的実現と理解の機序と個人差:日本語と中国語の検証
情感句韵母的语音实现和理解的机制和个体差异:日语和汉语考试
  • 批准号:
    24K00059
  • 财政年份:
    2024
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Imaging Life with Light and Sound: State-of-the-art Photoacoustic Imaging For Mechanistic Understanding Of Human Disease
用光和声音成像生命:最先进的光声成像用于理解人类疾病的机制
  • 批准号:
    MR/X012549/1
  • 财政年份:
    2023
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Research Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了