Development of high-accuracy system for recognizing spontaneous speech
高精度自发语音识别系统的开发
基本信息
- 批准号:22500144
- 负责人:
- 金额:$ 2.5万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:2010
- 资助国家:日本
- 起止时间:2010 至 2012
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
In our research, we aimed to improve the system performance for recognizing spontaneousspeech, which was considered to be more difficult than recognizing read speech. We focused on three technical issues: (1) acoustic and language models, (2) system combinationtechniques, and (3) speaker indexing. For improving the performance of acoustic models,we investigated a discrete-mixture hidden Markov model based on discriminative training, speaker-class model, quinphone, and a reverberation-class model. Some systemco(a) mbinationtechniquesw(a) ere investigated, such as the combination of continuous anddiscrete models, the combination of various quinphones, and the combination of reverberation-class models. For the issues of language models, we proposed the cross adaptation and cross-validation adaptation techniques. In addition, we improved theperformance of speaker indexing techniques based on speaker vectors required during theexecution of speaker adaptation.
在我们的研究中,我们旨在提高识别自发性语言的系统性能,这比识别阅读语音更加困难。我们专注于三个技术问题:(1)声学和语言模型,(2)系统组合以及(3)扬声器索引。为了提高声学模型的性能,我们研究了基于判别训练,扬声器级模型,Quinphone和Reverberation-Class级模型的离散混合模型。研究了一些Systemco(A)MbinationTechniquesw(a),例如连续和旋转模型的组合,各种Quinphone的组合以及混响级模型的组合。对于语言模型的问题,我们提出了交叉适应和交叉验证适应技术。此外,我们改善了基于说话者的执行过程中所需的扬声器向量的说话者索引技术的性能。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
識別学習を用いた離散混合分布HMMによる音声認識
使用离散混合分布 HMM 进行判别学习的语音识别
- DOI:
- 发表时间:2013
- 期刊:
- 影响因子:0
- 作者:Miyazaki;K.;小坂哲夫,加藤正治
- 通讯作者:小坂哲夫,加藤正治
入力音声の韻律情報を用いたHMM音声合成
使用输入语音的韵律信息进行 HMM 语音合成
- DOI:
- 发表时间:2013
- 期刊:
- 影响因子:0
- 作者:Tomoko Nariai;Kazuyo Tanaka;Tatsuya Kawahara;栗原大樹,加藤正治,小坂哲夫
- 通讯作者:栗原大樹,加藤正治,小坂哲夫
Lecture Speech Recognition by Combining Word Graphs of Various Acoustic Models
结合各种声学模型的词图进行讲座语音识别
- DOI:
- 发表时间:2010
- 期刊:
- 影响因子:0
- 作者:Tetsuo Kosaka;Keisuke Goto;Takashi Ito and Masaharu Kato
- 通讯作者:Takashi Ito and Masaharu Kato
Unsupervised Speaker Adaptation Using Speaker-Class Models for Lecture Speech Recognition
使用说话者类模型进行讲座语音识别的无监督说话者适应
- DOI:
- 发表时间:2010
- 期刊:
- 影响因子:0.7
- 作者:Tetsuo Kosaka;Yuui Takeda;Takashi Ito;Masaharu Kato;Masaki Kohda
- 通讯作者:Masaki Kohda
Speaker Adaptation Based on System Combination Using Speaker-Class Models
基于使用扬声器类模型的系统组合的扬声器自适应
- DOI:
- 发表时间:2010
- 期刊:
- 影响因子:0
- 作者:Tetsuo Kosaka;Takashi Ito;Masaharu Kato and Masaki Kohda
- 通讯作者:Masaharu Kato and Masaki Kohda
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
KOSAKA Tetsuo其他文献
KOSAKA Tetsuo的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('KOSAKA Tetsuo', 18)}}的其他基金
Development of Noise Robust Speech Recognition and Its Application on Mobile Environment
噪声鲁棒语音识别的发展及其在移动环境下的应用
- 批准号:
16500097 - 财政年份:2004
- 资助金额:
$ 2.5万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
相似国自然基金
图像分类方法研究及其在色情监测中的应用
- 批准号:61172103
- 批准年份:2011
- 资助金额:62.0 万元
- 项目类别:面上项目
相似海外基金
初期ドイツモード雑誌テクストの言語的特徴とはー話し言葉性とテクストタイプの研究
早期德国时尚杂志文本的语言特征是什么?口语和文本类型的研究。
- 批准号:
24K16056 - 财政年份:2024
- 资助金额:
$ 2.5万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Lost For Words: Cognitive Ageing And Language Control In Bilingual Older Adults With And Without Cognitive Impairment
失语:有或没有认知障碍的双语老年人的认知衰老和语言控制
- 批准号:
EP/Y036522/1 - 财政年份:2024
- 资助金额:
$ 2.5万 - 项目类别:
Research Grant
Exploratory research on "words" and "concepts" for cross-curricular citizenship education
跨课程公民教育的“言语”与“观念”探索性研究
- 批准号:
23K17613 - 财政年份:2023
- 资助金额:
$ 2.5万 - 项目类别:
Grant-in-Aid for Challenging Research (Exploratory)
An empirical study of the borrowing process of foreign words in Japanese from the perspective of English and French phonetics
英法语音学视角下日语外来词借用过程的实证研究
- 批准号:
23K00549 - 财政年份:2023
- 资助金额:
$ 2.5万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Plaintive Words: Legal and Literary Complaints, 1550-1625
哀怨的话语:法律和文学的抱怨,1550-1625
- 批准号:
2877040 - 财政年份:2023
- 资助金额:
$ 2.5万 - 项目类别:
Studentship