複数の共有構造を用いたアニーリングに基づく音響モデリング

使用多个共享结构的基于退火的声学建模

基本信息

  • 批准号:
    11J05301
  • 负责人:
  • 金额:
    $ 0.83万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2011
  • 资助国家:
    日本
  • 起止时间:
    2011 至 2012
  • 项目状态:
    已结题

项目摘要

本研究では,複数のパラメータ共有構造を用い,確定的アニーリングEMアルゴリズムとベイズ基準を学習アルゴリズムに適用することで音声認識のための新しい音響モデリングの枠組みを提案する.初年度には,学習アルゴリズムの導出・実験及び考察を行い,国内外でその結果を発表してきた.今年度は提案法に関してさらに実験を重ねることで提案法の特徴や問題点等を考察・改善してきた.また,これまで提案法は音声認識に関しての統計的なモデリング手法として発表を行ってきているが,話者認識や音声合成といった統計モデルを基盤に用いる分野にも適用が可能である.そのため,話者認識や音声合成において提案法を適用するために,それぞれの最新の動向を調査し知見を広げるための研究活動も行った.話者認識に関しては,5ヶ月間エジンバラ大学の研究所に滞在し,話者認識の最新の動向や最新のデータ,問題点など様々な知見を得ることができた.また,海外の様々な分野の研究者とも議論を交わすことができ提案法に対する知見も深まった.さらに,音声合成の研究にも従事し,言語に依存しない話者の特徴をモデル化する研究を行ってきた.これにより話者性についての研究についても知識を深めることができ,かつ提案法の音声合成への適用についても検討することができた.今年度の研究活動の成果の国内外への発表件数は控えめではあるが,提案法について実験等をまとめ投稿した論文は採択され掲載されたため,当初の予定としては順調に進めることができたと言える.
在这项研究中,我们通过将确定性退火算法和贝叶斯标准应用于学习算法,提出了一个新的声学建模框架,以识别语音识别。在第一年,我们得出,实验和考虑学习算法,并在国内和国际上介绍了结果。今年,我们对提出的方法进行了进一步的实验,以检查和改善所提出方法的特征和问题。此外,尽管已提出的方法已作为语音识别的统计建模方法提出,但也可以使用诸如扬声器识别和语音综合等统计模型将其应用于字段。因此,为了在说话者的识别和语音综合中应用拟议的方法,我们研究了最新趋势并扩大了我们的知识。他还进行了研究活动。关于演讲者的认可,他在爱丁堡大学度过了五个月,在那里他获得了各种知识,包括说话者识别,最新数据和问题的最新趋势。他还与来自海外各个领域的研究人员进行了讨论,他对拟议方法的了解得到了加深。此外,他还参与了语音综合研究,他进行了研究,以独立语言的说话者的特征进行了建模。这使他能够加深对说话者对说话者综合的研究的了解,并且他能够考虑提出的方法在语音综合中的应用。尽管今年的研究活动的结果数量是在国内和国际上介绍的,但选择并发布了对拟议方法的实验的论文,因此可以说最初的计划是成功的。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Cross-lingual Speaker Adaptation for HMM-based speech synthesis using speaker interpolation based on perceptual characteristics
使用基于感知特征的说话人插值进行基于 HMM 的语音合成的跨语言说话人自适应
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Viviane de Franca Oliveira;Sayaka Shiota;Yoshihiko Nankaku;Keiichi Tokuda
  • 通讯作者:
    Keiichi Tokuda
Speech recognition based on statistical models including multiple phonetic decision trees
基于统计模型(包括多个语音决策树)的语音识别
  • DOI:
    10.1250/ast.32.236
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    0.7
  • 作者:
    Sayaka Shiota;Kei Hashimoto;Yoshihiko Nankaku;Keiichi Tokuda
  • 通讯作者:
    Keiichi Tokuda
Cross-lingual speaker adaptation for HMM-based speech synthesis using joint-eigenvoices with a space of perceptual characteristics
使用具有感知特征空间的联合特征语音进行基于 HMM 的语音合成的跨语言说话人自适应
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Viviane de Franca Olivera;Sayaka shiota;Kei Hashimoto;Yoshihiko Nankaku;Keiichi Tokuda
  • 通讯作者:
    Keiichi Tokuda
A Bayesian Framework Using Multiple Model Structures for Speech Recognition
使用多个模型结构进行语音识别的贝叶斯框架
個人性を考慮した異言語音声合成に対する知覚評価
考虑个性的跨语言语音合成感知评价
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    津崎実;徳田恵一;河井恒;志賀芳則;大浦圭一郎;塩田さやか
  • 通讯作者:
    塩田さやか
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

塩田 さやか其他文献

系列分類型ニューラルネットワークを用いた日本語方言識別の検討
基于顺序分类神经网络的日语方言识别研究
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    今泉 遼;増村 亮;塩田 さやか;貴家 仁志
  • 通讯作者:
    貴家 仁志
音学シンポジウム2018の開催にあたって
关于举办2018音韵学研讨会
低周波成分への影響を考慮した非線形帯域拡張法と音声認識への応用
考虑低频分量影响的非线性频带扩展方法及其在语音识别中的应用
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    塩田 さやか;貴家 仁志
  • 通讯作者:
    貴家 仁志
拡張ラプラス変換型機械学習による自動運転車とドライバーの協調制御に関する一考察
基于增强拉普拉斯变换机器学习的自动驾驶车辆与驾驶员协同控制研究
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    宋 裕進;塩田 さやか;高道 慎之介;村上 大輔;松井 知子;猿渡 洋;安部 博枝,Luis Diago,南畑 淳史,萩原 一郎
  • 通讯作者:
    安部 博枝,Luis Diago,南畑 淳史,萩原 一郎
HMMおよびEnd-to-End音声認識における非線形帯域拡張法の性能調査
HMM 和端到端语音识别中非线性频带扩展方法的性能研究
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    今泉 遼;塩田 さやか;貴家 仁志
  • 通讯作者:
    貴家 仁志

塩田 さやか的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('塩田 さやか', 18)}}的其他基金

セキュアな音声対話のための実環境なりすまし音声コーパス構築
构建真实世界的欺骗语音语料库以实现安全语音对话
  • 批准号:
    24K14993
  • 财政年份:
    2024
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)

相似海外基金

Construction of practical boundary modeling for wave acoustic simulation in a room
室内波浪声学模拟实用边界模型的构建
  • 批准号:
    23K04144
  • 财政年份:
    2023
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
A socio-psychological study on the occurrence factors of discomfort in very quiet situations considering individual differences in emotional reactions
考虑情绪反应个体差异的非常安静情境下不适发生因素的社会心理学研究
  • 批准号:
    20K04804
  • 财政年份:
    2020
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Modeling and application of energy-efficient behavior in calling animals
动物呼叫节能行为建模及应用
  • 批准号:
    18K18005
  • 财政年份:
    2018
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Development of music archiving method enabling reproduction of spatial sound
开发能够再现空间声音的音乐存档方法
  • 批准号:
    17K00714
  • 财政年份:
    2017
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Sound field modelling on the basis of in-situ measurement of boundary conditions using a parametric loudspeaker
使用参数扬声器进行边界条件现场测量的声场建模
  • 批准号:
    17K18920
  • 财政年份:
    2017
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了