文脈を含む多角的な発話検証を可能にする対話音声理解システムの開発

开发对话语音理解系统,可实现包括上下文在内的多方面话语验证

基本信息

  • 批准号:
    17700181
  • 负责人:
  • 金额:
    $ 1.92万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
  • 财政年份:
    2005
  • 资助国家:
    日本
  • 起止时间:
    2005 至 2007
  • 项目状态:
    已结题

项目摘要

本研究は、発話検証法や発話の曖昧さの要因の定量化法の開発を目的としている。前者においては、自然な対話音声に対する多角的な分析結果をもとに、発話検証性能の改善を試みた。まず、前年度までに開発した韻律的特徴の併用による発話検証法では、発話中に含まれるキーワード数の検証のみに注目したものであったため、新たにキーワード内容を含めた発話検証法へと拡張した。モーラ毎の高低アクセント特徴をHMMでモデル化して韻律信頼度を求め、従来の音響信頼度と併用する方法について評価実験を行った。語彙約1万6千単語のランドマーク入力タスクにおいて、発話中のキーワードスポッティング結果に対する発話検証実験を行った結果、韻律的特徴を併用することで認識結果の単語毎の正誤判定の誤りを約4.3%削減した。もう一つの観点として、文脈を考慮した発話検証法として、音声文書中に含まれるキーワード(名詞単語)の関連度を用いた方法を提案した。相互情報量の観点から単語間の関連度をあらかじめ算出し、一つの音声文書の認識結果において共起するキーワード対に対して、その相互情報量の値を適用した。評価実験では、話し言葉コーパス(CSJ)から10講演を評価用データとして用い、講演音声に含まれる名詞単語に対する検証性能の評価において、単語毎の認識結果の正誤判定の誤りを約5.4%削減した。後者の発話の曖昧さの要因の定量化法の開発の目的においては、話者や発話様式の違い、未知語の発声などの誤認識の要因について多角的な評価を行った。音響モデル(HMM)の情報のみを用いて、モデル間の距離の定量化方法の違いと音声認識性能との関係を分析した。結果として、発話様式の違いを考慮したモデル間距離を併用して認識性能への影響の違いがより明確に説明できることが分かった。また、単語間距離を考慮することによって未知語検証性能の改善を試み、改善の可能性を示した。
本研究的目的是开发一种验证话语的方法和量化话语歧义原因的方法。前者,我们尝试根据自然对话语音的多方面分析结果来提高语音验证性能。首先,前一年开发的结合韵律特征的话语验证方法仅专注于验证话语中包含的关键字数量,因此我们将其扩展为包含关键字内容的新话语验证方法。我们使用HMM对每个音拍的音高重音特征进行建模以获得韵律可靠性,并对可以与传统声学可靠性结合使用的方法进行了评估实验。在一个词汇量约为16000个单词的地标输入任务中,我们对语音时的关键词识别结果进行了语音验证实验,发现通过组合韵律特征,识别中每个单词的正确/错误判断误差结果减少至约 4.3%。作为另一个观点,我们提出了一种使用音频文档中包含的关键字(名词词)的相关性作为考虑上下文的​​话语验证方法的方法。从互信息的角度预先计算单词之间的关联度,并将互信息值应用于在一个音频文档的识别结果中同时出现的关键词对。在评估实验中,我们使用来自口语语料库(CSJ)的10个讲座作为评估数据,在评估讲座音频中包含的名词词的验证性能时,我们将每个词的识别结果的正确性误差降低了约5.4%。为了开发一种量化言语歧义原因的方法,我们对误识别的原因进行了多方面的评估,例如说话者和言语风格的差异以及未知单词的发音。仅使用声学模型(HMM)信息,我们分析了量化模型之间距离的方法差异与语音识别性能之间的关系。结果,我们发现,通过使用考虑了语音风格差异的模型之间的距离,可以更清楚地解释对识别性能的影响差异。我们还尝试通过考虑单词之间的距离来提高未知单词验证性能,并证明了改进的可能性。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Spoken Language Understanding Method Using Confidence Measure and Dialogue History
使用置信度测量和对话历史的口语理解方法
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    N.Fujiwara;T.Itoh;K.Araki;A.Kai;T.Konishi and Y.Itoh
  • 通讯作者:
    T.Konishi and Y.Itoh
認識信頼度と対話履歴を用いた音声言語理解手法
使用识别可靠性和对话历史的口语理解方法
キーワード主体の頑健な音声インタフェースのための韻律的特徴を用いた発話検証
使用韵律特征进行基于关键字的鲁棒语音接口的话语验证
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

甲斐 充彦其他文献

甲斐 充彦的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('甲斐 充彦', 18)}}的其他基金

方言音声データの分析と検索を可能にする諸方言に普遍な音声言語処理基盤モデルの構築
构建多种方言的通用语音语言处理平台模型,实现方言语音数据的分析和检索
  • 批准号:
    24K00450
  • 财政年份:
    2024
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Feature Representation Learning and Imagined Speech Recognition by Simultaneous Recording of Spoken Language Stimuli and EEG
通过同时记录口语刺激和脑电图进行特征表示学习和想象语音识别
  • 批准号:
    22K19828
  • 财政年份:
    2022
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
音声・言語現象の個人性モデルに基づく対話音声理解システムの開発
基于语音和语言现象的个性模型的对话语音理解系统的开发
  • 批准号:
    14780272
  • 财政年份:
    2002
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
WWW情報検索サービスのための音声言語インタフェースシステムの開発
WWW信息搜索服务口语接口系统的开发
  • 批准号:
    11780267
  • 财政年份:
    1999
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

Improvement of large vocabulary speech recognition performance based on high-precision lexical prosody prediction
基于高精度词汇韵律预测的大词汇量语音识别性能提升
  • 批准号:
    25540064
  • 财政年份:
    2013
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
文節境界を考慮した統計的言語モデルの高度化と音声認識への利用
推进考虑子句边界及其在语音识别中的使用的统计语言模型
  • 批准号:
    16650034
  • 财政年份:
    2004
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
発声上の癖の推定に基づく英語音声の発音評価・教示手法の開発
基于发声习惯估计的英语语音发音评价与教学方法开发
  • 批准号:
    11780265
  • 财政年份:
    1999
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
モーラ遷移確率モデルによる韻律の表現と音声認識への利用に関する研究
基于mora转移概率模型的韵律表达及其在语音识别中的应用研究
  • 批准号:
    11878058
  • 财政年份:
    1999
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
連続音声の自動認識における韻律的特徴の利用
韵律特征在连续语音自动识别中的利用
  • 批准号:
    57580017
  • 财政年份:
    1982
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了