状態と出力に相互依存関係を有する確率モデルの構造最適化と頑健性強化に関する研究

状态与输出相互依赖的随机模型结构优化及鲁棒性增强研究

基本信息

批准号：
17700208
负责人：
小川哲司
金额：
$ 1.6万
依托单位：
Waseda University
依托单位国家：
日本
项目类别：
Grant-in-Aid for Young Scientists (B)
财政年份：
2005
资助国家：
日本
起止时间：
2005 至 2006
项目状态：
已结题

项目摘要

本年度は,以下の2点について検討を行った.(1)部分隠れマルコフモデル(PHMM)のモデル構造最適選択PHMMのモデル構造を音韻毎に最適化する枠組みとして,昨年度は,評価基準として重み付き尤度比最大化基準を,最適化アルゴリズムとして遺伝的アルゴリズムを導入し,講演音声認識において従来法の誤りを削減した.本年度は,下記A)〜C)について詳細な検討を行った.A)評価関数:重み付き尤度比基準,最尤基準,ベイズ基準など複数の評価基準を導入し認識性能を評価したところ,識別的な基準である尤度比基準が最良の性能を与えることがわかった.B)最適化アルゴリズム:遺伝的アルゴリズムとタブサーチを用いたときの性能を評価したところ,タブサーチは局所解に陥りやすく,遺伝的アルゴリズムの方が高速に最適解に到達することがわかった.C)識別クラスの共有:探索の効率化のため音韻のクラスタリングを行ったが,最適化の段階でクラスを共有してしまうと,共有しない場合と同程度の性能を得られないことがわかった.(2)環境の変動に頑健な特徴量の検討PHMMのように高精度な確率モデルは,HMMなどの単純なモデルと比較して発話者や環境の変動の影響を受け易い.したがって,音響特徴量から発話者の情報や環境の情報を取り除き,識別に必要な情報である音韻情報のみを抽出する手法(識別情報抽出)について検討を行った.識別情報抽出として,HLDAやそれを拡張したManifold HLDA(MHLDA)を提案し,単語音声認識により評価を行ったところ,HLDAとMHLDAにより抽出されたパラメータを統合することで,環境の変動に対して頑健な性能を与えることがわかった.この知見を発展させ,HLDAにブースティングを導入した確率モデルの統合手法についても検討を行い,最尤識別に比べ頑健性の高い認識が可能になるという予備的な知見も得た.

今年，我们研究了以下两点：（1）部分隐马尔可夫模型（PHMM）的最优模型结构选择作为针对每个音素优化PHMM模型结构的框架，去年我们使用加权模型作为评估标准。介绍了遗传算法作为优化算法，使用似然比最大化准则来减少讲座语音识别中传统方法的错误。 2017年，我们对下面的A）到C）进行了详细的研究： A）评估函数：我们引入了加权似然比准则、最大似然准则、贝叶斯准则等多种评估标准来评估识别性能。似然比准则（一种判别准则）给出了最佳性能。B）优化算法：我们评估了使用遗传算法和选项卡搜索时的性能。 ,发现选项卡搜索容易陷入局部解,,遗传算法更快地达到最优解。,C) 识别类共享:,我们对音素进行聚类以提高搜索效率,但是最佳结果发现，如果在构造阶段共享类，则不可能获得与不共享时相同的性能。（2）检查对环境PHMM变化具有鲁棒性的特征HMM 等高精度概率模型比 HMM 等简单模型更容易受到说话者和环境变化的影响，因此，我们研究了一种方法（识别信息），从声学特征中删除有关说话者和环境的信息。提取）只提取语音信息，这是必要的信息当我们提出 HLDA (MHLDA) 并使用单词语音识别对其进行评估时，我们发现集成 HLDA 和 MHLDA 提取的参数可以提供针对环境波动的鲁棒性能。这一知识我们还研究了一种将 boosting 纳入 HLDA 的集成概率模型，并获得了初步发现，它比最大似然识别能够实现更稳健的识别。

项目成果

期刊论文数量（0）

专著数量（0）

科研奖励数量（0）

会议论文数量（0）

专利数量（0）

ロボット頭部に設置した4系統指向性マイクロホンによる音源定位におけるHLDA利用の効果

使用安装在机器人头部的四个定向麦克风使用 HLDA 进行声源定位的效果

DOI：
发表时间：
2005
期刊：
日本音響学会秋季研究発表会講演論文集
影响因子：
0
作者：
久保俊明;持木南生也;小川哲司;小林哲則
通讯作者：
小林哲則

ロボット頭部に設置したマイクロホンによる環境変動に頑健な音源定位

使用安装在机器人头部的麦克风针对环境变化进行稳健的声源定位

DOI：
发表时间：
2005
期刊：
人工知能学会研究会資料 SIG-Challenge-0522
影响因子：
0
作者：
久保俊明;持木南生也;小川哲司;小林哲則
通讯作者：
小林哲則

重み付きHLDAを用いた相補的識別器の構成

使用加权 HLDA 构建互补分类器

DOI：
发表时间：
2007
期刊：
日本音響学会春季研究発表会講演論文集
影响因子：
0
作者：
加藤健一;小川哲司;小林哲則
通讯作者：
小林哲則

Optimizing the Structure of Partly-Hidden Markov Models Using Weighted Likelihood-Ratio Maximization Criterion

使用加权似然比最大化准则优化部分隐马尔可夫模型的结构

DOI：
发表时间：
2005
期刊：
Proc.of Interspeech
影响因子：
0
作者：
Tetsuji Ogawa;Tetsunori Kobayashi
通讯作者：
Tetsunori Kobayashi

A Method for Solving the Permutation Problem of Frequency-Domain Blind Source Separation Usign Reference Signal

利用参考信号解决频域盲源分离排列问题的方法

DOI：
发表时间：
2005
期刊：
Proc.of Biennial on Digital Signal Processing For In-Veicle and Mobile Systems
影响因子：
0
作者：
Takashi Isa;Toshiyuki Sekiya;Tetsuji Ogawa;Tetsunori Kobayashi
通讯作者：
Tetsunori Kobayashi

DOI：
{{ item.doi }}
发表时间：
{{ item.publish_year }}
期刊：
{{ item.journal_name }}
影响因子：
{{ item.factor }}
作者：
{{ item.authors }}
通讯作者：
{{ item.author }}

数据更新时间：{{ journalArticles.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ monograph.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ sciAawards.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ conferencePapers.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ patent.updateTime }}

小川哲司其他文献

Calving Sign Detection of Breeding Cows Based on Video Monitoring - How to Construct and Operate a Video Monitoring System that Enables Users to Make Decisions with Conviction?

基于视频监控的种牛产犊征兆检测——如何构建和运营让用户有信心决策的视频监控系统？

DOI：
10.11499/sicejl.61.746
发表时间：
2022
期刊：
Journal of The Society of Instrument and Control Engineers
影响因子：
0
作者：
Terao Hayato;Noguchi Wataru;Iizuka Hiroyuki;Yamamoto Masahito;小山大嘉，青山一真，鳴海拓志，葛岡英明，雨宮智浩;小川哲司
通讯作者：
小川哲司