Development of Noise Robust Speech Recognition and Its Application on Mobile Environment
噪声鲁棒语音识别的发展及其在移动环境下的应用
基本信息
- 批准号:16500097
- 负责人:
- 金额:$ 1.86万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:2004
- 资助国家:日本
- 起止时间:2004 至 2006
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
1) Noisy speech recognition using DMHMMsWe have proposed new methods of robust speech recognition using discrete-mixture HMMs (DMHMMs). The aim of this work is to develop robust speech recognition for adverse conditions that contain both stationary and non-stationary noise. In particular, we focus on the issue of impulsive noise, which is a major problem in practical speech recognition system. In order to solve the problem, we have proposed two methods. First, an estimation method of DMHMM parameters based on MAP has been proposed aiming to improve trainability. The second is a method of compensating the observation probabilities of DMHMMs by threshold to reduce adverse effect of outlier values. Experimental evaluations on Japanese LVCSR for read newspaper speech showed that the proposed method achieved the average error rate reduction of 28.1% in adverse conditions that contain both stationary and impulsive noises.2) Model Based Histogram Equalization for Noise Robust Speech Recognition by Using DMHMMsTowards further improvement of noisy speech recognition, we have proposed a novel normalization method for codebooks of DMHMMs in this paper. The codebook normalization method is based on histogram equalization (HEQ) and it can compensate the non-linear effects of additive noise in model space. The proposed method was compared with both conventional continuous-mixture HMMs (CHMMs) and DMHMMs. It showed that the proposed method obtained the best performance, and obtained an average relative improvement of 29.2% over the CHMM baseline.
1)使用DMHMMSWE的嘈杂语音识别已提出了使用离散混合HMMS(DMHMM)的新方法的新方法。这项工作的目的是针对包含固定噪声和非平稳噪声的不利条件发展强大的语音识别。特别是,我们专注于冲动噪声的问题,这是实际语音识别系统的主要问题。为了解决问题,我们提出了两种方法。首先,已经提出了基于MAP的DMHMM参数的估计方法,以提高训练性。第二种方法是通过阈值补偿DMHMM的观察概率以减少异常值的不利影响。 Experimental evaluations on Japanese LVCSR for read newspaper speech showed that the proposed method achieved the average error rate reduction of 28.1% in adverse conditions that contain both stationary and impulsive noises.2) Model Based Histogram Equalization for Noise Robust Speech Recognition by Using DMHMMsTowards further improvement of noisy speech recognition, we have proposed a novel normalization method for codebooks of DMHMMs in this paper. CodeBook归一化方法基于直方图均衡(HEQ),它可以补偿模型空间中加性噪声的非线性效应。将提出的方法与常规连续混合HMM(CHMM)和DMHMM进行了比较。它表明该方法获得了最佳性能,并且在CHMM基线上获得了29.2%的平均相对提高。
项目成果
期刊论文数量(64)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Noisy Speech recognition Based on Codebook Normalization of Discrete-Mixture HMMs
基于离散混合 HMM 码本归一化的噪声语音识别
- DOI:
- 发表时间:2006
- 期刊:
- 影响因子:0
- 作者:T.Kosaka;M.Katoh;M.Kohda
- 通讯作者:M.Kohda
日本語話し言葉コーパスを用いた教師なし適応による講演音声認識の性能改善
使用日语口语语料库通过无监督适应提高讲座语音识别的性能
- DOI:
- 发表时间:2006
- 期刊:
- 影响因子:0
- 作者:R.Tsutsumi;M.Katoh;T.Kosaka;M.Kohda;加藤正治;阿部拓也
- 通讯作者:阿部拓也
Robust speech recognition under non-stationary noise using discrete-mixture HMMs
使用离散混合 HMM 在非平稳噪声下进行鲁棒语音识别
- DOI:
- 发表时间:2005
- 期刊:
- 影响因子:0
- 作者:R.Tsutsumi;M.Katoh;T.Kosaka;M.Kohda;加藤正治;阿部拓也;遠藤大悟;熊倉拓哉;赤津達也;草間隆;梅本真模;宇野涼子;T.Kosaka
- 通讯作者:T.Kosaka
コードブック適応を用いた離散混合分布型HMMによる講演音声認識
使用离散混合分布 HMM(使用码本自适应)进行讲座语音识别
- DOI:
- 发表时间:2006
- 期刊:
- 影响因子:0
- 作者:山本明祥;熊倉拓哉;加藤正治;小坂哲夫;好田正紀
- 通讯作者:好田正紀
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
KOSAKA Tetsuo其他文献
KOSAKA Tetsuo的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('KOSAKA Tetsuo', 18)}}的其他基金
Development of high-accuracy system for recognizing spontaneous speech
高精度自发语音识别系统的开发
- 批准号:
22500144 - 财政年份:2010
- 资助金额:
$ 1.86万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
相似国自然基金
下丘Hcy通过PKC/CREB调控GABAAR在噪音性耳鸣发生中的作用与耳聋左慈丸干预机制研究
- 批准号:82304854
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于MFSD2A调控血迷路屏障跨细胞囊泡转运机制的噪声性听力损失防治研究
- 批准号:82371144
- 批准年份:2023
- 资助金额:49.00 万元
- 项目类别:面上项目
非线性噪音驱动的非自治BBM方程拉回随机吸引子的稳定性
- 批准号:12301303
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
开放系统演化中环境噪音的表征及其在精密测量中的应用
- 批准号:12374337
- 批准年份:2023
- 资助金额:53 万元
- 项目类别:面上项目
基于变分法的噪音三维曲面恢复技术研究
- 批准号:62302350
- 批准年份:2023
- 资助金额:30.00 万元
- 项目类别:青年科学基金项目
相似海外基金
Changes in apical cochlear mechanics after cochlear implantation
人工耳蜗植入后耳蜗顶端力学的变化
- 批准号:
10730981 - 财政年份:2023
- 资助金额:
$ 1.86万 - 项目类别:
Age and hearing loss effects on subcortical neural encoding
年龄和听力损失对皮层下神经编码的影响
- 批准号:
10652139 - 财政年份:2023
- 资助金额:
$ 1.86万 - 项目类别:
Therapeutic hypothermia to preserve residual hearing in veterans receiving cochlear implantation
低温治疗可保护接受人工耳蜗植入的退伍军人的残余听力
- 批准号:
10314602 - 财政年份:2022
- 资助金额:
$ 1.86万 - 项目类别:
Enhanced auditory prosthesis using a penetrating auditory-nerve electrode
使用穿透性听觉神经电极的增强型听觉假体
- 批准号:
10599903 - 财政年份:2019
- 资助金额:
$ 1.86万 - 项目类别:
Enhanced auditory prosthesis using a penetrating auditory-nerve electrode
使用穿透性听觉神经电极的增强型听觉假体
- 批准号:
10375480 - 财政年份:2019
- 资助金额:
$ 1.86万 - 项目类别: