文脈を含む多角的な発話検証を可能にする対話音声理解システムの開発

开发对话语音理解系统,可实现包括上下文在内的多方面话语验证

基本信息

  • 批准号:
    17700181
  • 负责人:
  • 金额:
    $ 1.92万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
  • 财政年份:
    2005
  • 资助国家:
    日本
  • 起止时间:
    2005 至 2007
  • 项目状态:
    已结题

项目摘要

本研究は、発話検証法や発話の曖昧さの要因の定量化法の開発を目的としている。前者においては、自然な対話音声に対する多角的な分析結果をもとに、発話検証性能の改善を試みた。まず、前年度までに開発した韻律的特徴の併用による発話検証法では、発話中に含まれるキーワード数の検証のみに注目したものであったため、新たにキーワード内容を含めた発話検証法へと拡張した。モーラ毎の高低アクセント特徴をHMMでモデル化して韻律信頼度を求め、従来の音響信頼度と併用する方法について評価実験を行った。語彙約1万6千単語のランドマーク入力タスクにおいて、発話中のキーワードスポッティング結果に対する発話検証実験を行った結果、韻律的特徴を併用することで認識結果の単語毎の正誤判定の誤りを約4.3%削減した。もう一つの観点として、文脈を考慮した発話検証法として、音声文書中に含まれるキーワード(名詞単語)の関連度を用いた方法を提案した。相互情報量の観点から単語間の関連度をあらかじめ算出し、一つの音声文書の認識結果において共起するキーワード対に対して、その相互情報量の値を適用した。評価実験では、話し言葉コーパス(CSJ)から10講演を評価用データとして用い、講演音声に含まれる名詞単語に対する検証性能の評価において、単語毎の認識結果の正誤判定の誤りを約5.4%削減した。後者の発話の曖昧さの要因の定量化法の開発の目的においては、話者や発話様式の違い、未知語の発声などの誤認識の要因について多角的な評価を行った。音響モデル(HMM)の情報のみを用いて、モデル間の距離の定量化方法の違いと音声認識性能との関係を分析した。結果として、発話様式の違いを考慮したモデル間距離を併用して認識性能への影響の違いがより明確に説明できることが分かった。また、単語間距離を考慮することによって未知語検証性能の改善を試み、改善の可能性を示した。
这项研究旨在开发语音验证方法和方法来量化引起语音歧义的因素。在前者中,我们试图根据自然对话演讲的多方面分析的结果来改善话语验证绩效。首先,到上一年开发的语音验证方法,涉及将韵律特征组合起来,仅着眼于验证语音中包含的关键字数量,因此已将其扩展到包括关键字内容的新的语音验证方法。我们使用HMM对每个MORA的高重音特征进行了建模,以确定韵律可靠性,并进行了一项评估实验,介绍了如何与常规声学可靠性结合使用它们。在具有大约16,000个单词的地标输入任务中,我们在语音期间进行了一个关于关键字发现结果的话语验证实验,并且通过一起使用韵律特征,我们将识别中每个单词的正确和错误判断中的错误减少了约4.3%。另一个方面是提出一种验证语音的方法,该方法使用语音文档中包含的关键字(名词单词)的相关程度来考虑上下文。从相互信息数量的角度来看,单词之间的关系程度是预先计算出来的,并将相互信息量的价值应用于一个语音文档识别结果中共发生的关键字对。在评估实验中,将10个来自口语语料库(CSJ)的讲座用作评估数据,并评估语音语音中包含的名词单词的验证性能,确定每个单词识别结果的正确性和虚假性的错误降低了约5.4%。为了开发一种量化言语歧义的因素的方法,我们对引起误解的因素进行了多方面的评估,例如说话者和语音模式的差异以及未知单词的发声。仅使用来自声学模型(HMM)的信息,分析了模型之间距离和语音识别性能之间差异方法之间的关系。结果,发现使用语音样式差异的使用模型间距离可用于更清楚地解释对识别性能的影响差异。此外,通过考虑了内词的距离,我们试图提高未知单词验证的性能,表明改进的可能性。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Spoken Language Understanding Method Using Confidence Measure and Dialogue History
使用置信度测量和对话历史的口语理解方法
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    N.Fujiwara;T.Itoh;K.Araki;A.Kai;T.Konishi and Y.Itoh
  • 通讯作者:
    T.Konishi and Y.Itoh
認識信頼度と対話履歴を用いた音声言語理解手法
使用识别可靠性和对话历史的口语理解方法
キーワード主体の頑健な音声インタフェースのための韻律的特徴を用いた発話検証
使用韵律特征进行基于关键字的鲁棒语音接口的话语验证
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

甲斐 充彦其他文献

甲斐 充彦的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('甲斐 充彦', 18)}}的其他基金

方言音声データの分析と検索を可能にする諸方言に普遍な音声言語処理基盤モデルの構築
构建多种方言的通用语音语言处理平台模型,实现方言语音数据的分析和检索
  • 批准号:
    24K00450
  • 财政年份:
    2024
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Feature Representation Learning and Imagined Speech Recognition by Simultaneous Recording of Spoken Language Stimuli and EEG
通过同时记录口语刺激和脑电图进行特征表示学习和想象语音识别
  • 批准号:
    22K19828
  • 财政年份:
    2022
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
音声・言語現象の個人性モデルに基づく対話音声理解システムの開発
基于语音和语言现象的个性模型的对话语音理解系统的开发
  • 批准号:
    14780272
  • 财政年份:
    2002
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
WWW情報検索サービスのための音声言語インタフェースシステムの開発
WWW信息搜索服务口语接口系统的开发
  • 批准号:
    11780267
  • 财政年份:
    1999
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

Improvement of large vocabulary speech recognition performance based on high-precision lexical prosody prediction
基于高精度词汇韵律预测的大词汇量语音识别性能提升
  • 批准号:
    25540064
  • 财政年份:
    2013
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
文節境界を考慮した統計的言語モデルの高度化と音声認識への利用
推进考虑子句边界及其在语音识别中的使用的统计语言模型
  • 批准号:
    16650034
  • 财政年份:
    2004
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
発声上の癖の推定に基づく英語音声の発音評価・教示手法の開発
基于发声习惯估计的英语语音发音评价与教学方法开发
  • 批准号:
    11780265
  • 财政年份:
    1999
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
モーラ遷移確率モデルによる韻律の表現と音声認識への利用に関する研究
基于mora转移概率模型的韵律表达及其在语音识别中的应用研究
  • 批准号:
    11878058
  • 财政年份:
    1999
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
連続音声の自動認識における韻律的特徴の利用
韵律特征在连续语音自动识别中的利用
  • 批准号:
    57580017
  • 财政年份:
    1982
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了