複数の共有構造を用いたアニーリングに基づく音響モデリング

使用多个共享结构的基于退火的声学建模

基本信息

批准号：
11J05301
负责人：
塩田さやか
金额：
$ 0.83万
依托单位：
Nagoya Institute of Technology
依托单位国家：
日本
项目类别：
Grant-in-Aid for JSPS Fellows
财政年份：
2011
资助国家：
日本
起止时间：
2011 至 2012
项目状态：
已结题

项目摘要

本研究では,複数のパラメータ共有構造を用い,確定的アニーリングEMアルゴリズムとベイズ基準を学習アルゴリズムに適用することで音声認識のための新しい音響モデリングの枠組みを提案する.初年度には,学習アルゴリズムの導出・実験及び考察を行い,国内外でその結果を発表してきた.今年度は提案法に関してさらに実験を重ねることで提案法の特徴や問題点等を考察・改善してきた.また,これまで提案法は音声認識に関しての統計的なモデリング手法として発表を行ってきているが,話者認識や音声合成といった統計モデルを基盤に用いる分野にも適用が可能である.そのため,話者認識や音声合成において提案法を適用するために,それぞれの最新の動向を調査し知見を広げるための研究活動も行った.話者認識に関しては,5ヶ月間エジンバラ大学の研究所に滞在し,話者認識の最新の動向や最新のデータ,問題点など様々な知見を得ることができた.また,海外の様々な分野の研究者とも議論を交わすことができ提案法に対する知見も深まった.さらに,音声合成の研究にも従事し,言語に依存しない話者の特徴をモデル化する研究を行ってきた.これにより話者性についての研究についても知識を深めることができ,かつ提案法の音声合成への適用についても検討することができた.今年度の研究活動の成果の国内外への発表件数は控えめではあるが,提案法について実験等をまとめ投稿した論文は採択され掲載されたため,当初の予定としては順調に進めることができたと言える.

在这项研究中，我们通过将确定性退火算法和贝叶斯标准应用于学习算法，提出了一个新的声学建模框架，以识别语音识别。在第一年，我们得出，实验和考虑学习算法，并在国内和国际上介绍了结果。今年，我们对提出的方法进行了进一步的实验，以检查和改善所提出方法的特征和问题。此外，尽管已提出的方法已作为语音识别的统计建模方法提出，但也可以使用诸如扬声器识别和语音综合等统计模型将其应用于字段。因此，为了在说话者的识别和语音综合中应用拟议的方法，我们研究了最新趋势并扩大了我们的知识。他还进行了研究活动。关于演讲者的认可，他在爱丁堡大学度过了五个月，在那里他获得了各种知识，包括说话者识别，最新数据和问题的最新趋势。他还与来自海外各个领域的研究人员进行了讨论，他对拟议方法的了解得到了加深。此外，他还参与了语音综合研究，他进行了研究，以独立语言的说话者的特征进行了建模。这使他能够加深对说话者对说话者综合的研究的了解，并且他能够考虑提出的方法在语音综合中的应用。尽管今年的研究活动的结果数量是在国内和国际上介绍的，但选择并发布了对拟议方法的实验的论文，因此可以说最初的计划是成功的。