音声・言語現象の個人性モデルに基づく対話音声理解システムの開発

基于语音和语言现象的个性模型的对话语音理解系统的开发

基本信息

  • 批准号:
    14780272
  • 负责人:
  • 金额:
    $ 1.92万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
  • 财政年份:
    2002
  • 资助国家:
    日本
  • 起止时间:
    2002 至 2004
  • 项目状态:
    已结题

项目摘要

本年度は、対話音声において音響韻律的な現象に注目した対話音声処理に関する研究を行い、下記の研究成果を得た。1.対話音声の個人性の扱い前年度に引き続いて、発話様式の変動や個人性の違いによる対話音声認識性能の低下の問題に対して、繰り返しの訂正発話の検出法に焦点を当てた。本年度は新たに、音響・韻律的特徴の併用やモデル化に注目して、訂正発話の同定精度の改善を検討した。一つのアプローチとして、従来は2発話間の音響的特徴の類似性のみに注目していた繰り返し発話検出において、対数化基本周波数とその時間変化特徴を併用したパターンマッチングに基づくスポッティング法の適用を試み、従来法と比較して検出性能を4%ほど改善した。結果として80%程度の検出性能が得られた。2.発話様式と個人性の違いの定量化音声・言語現象のモデル化において、一般的な音響的な特徴表現での音声の個人性及び発話様式の違いの影響を明らかにするため、複数回の訂正入力を想定して発話様式の異なる発話を複数名の被験者で収録した。キーワード入力タスクを設定して、普通に発話してもらう場合と、訂正のために誇張して発話する場合とで複数の発話様式で発声してもらい、同一キーワードの発話様式の違いや個人差の影響の大きさと音響特徴空間での統計的な距離尺度との関係を分析した。分析において、母音間のBhattacharyya距離に基づく音韻構造間の距離との関係を分析した結果、個人間の差異や発話様式間での差異および、標準音響モデルと各個人・各発話様式との差異において、音韻構造間の距離に基づいて定量化された指標が発話様式や認識精度の違いに対してより相関が高い指標となることが示された。
今年,我们针对对话语音中的声学韵律现象开展了对话语音处理研究,并获得了以下研究成果。 1. 处理对话语音的个性化 继去年之后,我们重点研究了一种检测重复校正话语的方法,以解决由于语音风格变化和个性差异而导致对话语音识别性能下降的问题。今年,我们新研究了通过关注声学和韵律特征的组合和建模来提高纠正话语的识别准确性的方法。作为一种方法,我们尝试应用基于模式匹配的识别方法,该方法结合对数基频及其时变特征来检测重复的话语,该方法以前仅关注两个话语之间的声学​​特征的相似性。与传统方法相比,检测性能提高约4%。结果,获得了约80%的检测性能。 2. 语音风格和个性差异的量化在对语音和语言现象进行建模时,我们进行了多次测试,以阐明语音个性和语音风格差异对一般声学特征表达的影响。假设纠正输入。通过设置关键词输入任务,要求学生以多种言语风格说出同一个关键词,包括正常言语和用于纠正的夸张言语,我们调查了同一关键词的言语风格差异与个体差异大小之间的关系。分析了声学特征空间中的影响和统计距离测量。在分析中,我们基于元音之间的Bhattacharyya距离来分析音系结构之间的距离之间的关系,发现个体之间、语音风格之间以及标准声学模型与每个个体、每个语音风格之间都存在差异。结果表明,基于语音结构之间的距离量化的指标与语音风格和识别准确性的差异具有较高的相关性。

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Atsuhiko Kai: "Influence of different dialogue situation on user's behavior in spoken corrections"Proceedings of International Conference on Spoken Language Processing. 1189-1192 (2002)
Atsuhiko Kai:“不同对话情境对口语纠正中用户行为的影响”国际口语处理会议论文集。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

甲斐 充彦其他文献

甲斐 充彦的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('甲斐 充彦', 18)}}的其他基金

方言音声データの分析と検索を可能にする諸方言に普遍な音声言語処理基盤モデルの構築
构建多种方言的通用语音语言处理平台模型,实现方言语音数据的分析和检索
  • 批准号:
    24K00450
  • 财政年份:
    2024
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Feature Representation Learning and Imagined Speech Recognition by Simultaneous Recording of Spoken Language Stimuli and EEG
通过同时记录口语刺激和脑电图进行特征表示学习和想象语音识别
  • 批准号:
    22K19828
  • 财政年份:
    2022
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
文脈を含む多角的な発話検証を可能にする対話音声理解システムの開発
开发对话语音理解系统,可实现包括上下文在内的多方面话语验证
  • 批准号:
    17700181
  • 财政年份:
    2005
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
WWW情報検索サービスのための音声言語インタフェースシステムの開発
WWW信息搜索服务口语接口系统的开发
  • 批准号:
    11780267
  • 财政年份:
    1999
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

音声環境を可視化可能な対話型聴導犬ロボットに関する研究
可视化音频环境的交互式助听狗机器人研究
  • 批准号:
    24K20875
  • 财政年份:
    2024
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
セキュアな音声対話のための実環境なりすまし音声コーパス構築
构建真实世界的欺骗语音语料库以实现安全语音对话
  • 批准号:
    24K14993
  • 财政年份:
    2024
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
意図を的確に伝える音声対話翻訳の基盤技術の創出
创造准确传达意图的语音对话翻译基础技术
  • 批准号:
    23K28144
  • 财政年份:
    2024
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
音声対話系の統一的モデリングに基づくユーザへのモデル自動適応
基于口语对话系统统一建模的自动模型适应用户
  • 批准号:
    23K28147
  • 财政年份:
    2024
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
九州・沖縄方言の継承支援に資する音声対話型生成系AIの開発
开发支持九州、冲绳方言传承的语音对话生成系统AI
  • 批准号:
    24K00074
  • 财政年份:
    2024
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了