音声・言語現象の個人性モデルに基づく対話音声理解システムの開発

基于语音和语言现象的个性模型的对话语音理解系统的开发

基本信息

  • 批准号:
    14780272
  • 负责人:
  • 金额:
    $ 1.92万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
  • 财政年份:
    2002
  • 资助国家:
    日本
  • 起止时间:
    2002 至 2004
  • 项目状态:
    已结题

项目摘要

本年度は、対話音声において音響韻律的な現象に注目した対話音声処理に関する研究を行い、下記の研究成果を得た。1.対話音声の個人性の扱い前年度に引き続いて、発話様式の変動や個人性の違いによる対話音声認識性能の低下の問題に対して、繰り返しの訂正発話の検出法に焦点を当てた。本年度は新たに、音響・韻律的特徴の併用やモデル化に注目して、訂正発話の同定精度の改善を検討した。一つのアプローチとして、従来は2発話間の音響的特徴の類似性のみに注目していた繰り返し発話検出において、対数化基本周波数とその時間変化特徴を併用したパターンマッチングに基づくスポッティング法の適用を試み、従来法と比較して検出性能を4%ほど改善した。結果として80%程度の検出性能が得られた。2.発話様式と個人性の違いの定量化音声・言語現象のモデル化において、一般的な音響的な特徴表現での音声の個人性及び発話様式の違いの影響を明らかにするため、複数回の訂正入力を想定して発話様式の異なる発話を複数名の被験者で収録した。キーワード入力タスクを設定して、普通に発話してもらう場合と、訂正のために誇張して発話する場合とで複数の発話様式で発声してもらい、同一キーワードの発話様式の違いや個人差の影響の大きさと音響特徴空間での統計的な距離尺度との関係を分析した。分析において、母音間のBhattacharyya距離に基づく音韻構造間の距離との関係を分析した結果、個人間の差異や発話様式間での差異および、標準音響モデルと各個人・各発話様式との差異において、音韻構造間の距離に基づいて定量化された指標が発話様式や認識精度の違いに対してより相関が高い指標となることが示された。
今年,我们对对话演讲的对话演讲处理进行了研究,并在对话演讲中进行了研究,并获得了以下研究结果。 1。上一年对话演讲中对个性的处理,我们重点介绍如何检测反复的校正话语,以应对言语风格和个性差异导致对话言语识别表现不佳的问题。今年,我们研究了提高校正语音识别的准确性,重点是声学和韵律特征和建模的组合。作为一种方法,在检测重复的语音(以前仅集中在两个语音之间的声学​​特征的相似性上,我们试图使用对数基本频率及其时间变化的特征以及与常规方法相比,使用对数基本频率及其时间变化的特征,并将检测性能提高了约4%。结果,获得了约80%的检测性能。 2。为了阐明一般声学特征表示语音个性和言语风格的差异,量化语音风格和个性之间的差异,以阐明言语个性和语音风格的差异,假设多个校正输入,则记录了具有多个主题的不同语音样式的话语。设置了一个关键字输入任务,以具有多种语音样式,例如,当该人获得正常语音或夸张的语音以进行校正时,以及对同一关键字的语音样式差异与个体差异的影响的差异与声学特征空间中的统计距离的影响。在分析中,我们根据元音之间的bhattacharyya距离分析了语音结构之间的距离之间的关系,并表明,就个人与语音样式之间的差异而言,标准声学模型与每个个体模型与语音样式之间的差异,基于语音结构之间的距离量化指标与语音样式和识别精度的差异更加相关。

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Atsuhiko Kai: "Influence of different dialogue situation on user's behavior in spoken corrections"Proceedings of International Conference on Spoken Language Processing. 1189-1192 (2002)
Atsuhiko Kai:“不同对话情境对口语纠正中用户行为的影响”国际口语处理会议论文集。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

甲斐 充彦其他文献

甲斐 充彦的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('甲斐 充彦', 18)}}的其他基金

方言音声データの分析と検索を可能にする諸方言に普遍な音声言語処理基盤モデルの構築
构建多种方言的通用语音语言处理平台模型,实现方言语音数据的分析和检索
  • 批准号:
    24K00450
  • 财政年份:
    2024
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Feature Representation Learning and Imagined Speech Recognition by Simultaneous Recording of Spoken Language Stimuli and EEG
通过同时记录口语刺激和脑电图进行特征表示学习和想象语音识别
  • 批准号:
    22K19828
  • 财政年份:
    2022
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
文脈を含む多角的な発話検証を可能にする対話音声理解システムの開発
开发对话语音理解系统,可实现包括上下文在内的多方面话语验证
  • 批准号:
    17700181
  • 财政年份:
    2005
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
WWW情報検索サービスのための音声言語インタフェースシステムの開発
WWW信息搜索服务口语接口系统的开发
  • 批准号:
    11780267
  • 财政年份:
    1999
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似国自然基金

基于CFHTLenS和VOICE巡天的若干弱引力透镜宇宙学研究
  • 批准号:
    11333001
  • 批准年份:
    2013
  • 资助金额:
    320.0 万元
  • 项目类别:
    重点项目

相似海外基金

Opening Spaces and Places for the Inclusion of Indigenous Knowledge, Voice and Identity: Moving Indigenous People out of the Margins
为包容土著知识、声音和身份提供开放的空间和场所:使土著人民走出边缘
  • 批准号:
    477924
  • 财政年份:
    2024
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Salary Programs
音声環境を可視化可能な対話型聴導犬ロボットに関する研究
可视化音频环境的交互式助听狗机器人研究
  • 批准号:
    24K20875
  • 财政年份:
    2024
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Women's voice: A new theory for characterizing the nature of female employee behavior
女性的声音:描述女性员工行为本质的新理论
  • 批准号:
    24K16417
  • 财政年份:
    2024
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
セキュアな音声対話のための実環境なりすまし音声コーパス構築
构建真实世界的欺骗语音语料库以实现安全语音对话
  • 批准号:
    24K14993
  • 财政年份:
    2024
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Acoustic parametric modeling of laryngeal voice quality
喉部语音质量的声学参数化建模
  • 批准号:
    24K15013
  • 财政年份:
    2024
  • 资助金额:
    $ 1.92万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了