Continuous speech recognition with adaptabilty to the speaking rate of an input speech

连续语音识别,可适应输入语音的语速

基本信息

  • 批准号:
    07458064
  • 负责人:
  • 金额:
    $ 4.1万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
  • 财政年份:
    1995
  • 资助国家:
    日本
  • 起止时间:
    1995 至 1997
  • 项目状态:
    已结题

项目摘要

This tesearch developed a spoken word recognition system which used phoneme duration information estimated from the speaking rate of an input speech. In this research, the speaking rate is assumed to be reflected to the average vowel length. The acoustic processor transforms the input speech into a similarity matrix using the modified LVQ2. The average vowel length is computed from the preliminary recognition result. The duration of each phoneme in each word template is estimated from the average length of vowels in the input speech. By taking into account the estimated phoneme duration, the spoken word recognition experiments were carried out using the DTW.The word recognition score was 97.3% for the 212 word vocabulary uttered by 5 male speakers (test set). The phoneme duration information is collected from the 212 word vocabulary uttered by another 5 male and 10 female speakers (training set). The hybrid combination of the prceiding phoneme dependent estimation and the follwoing phoneme dependent estimation gave the best performance.The above-mentioned method was extended to phoneme recognition. The phoneme accuracy increased from 71.8% to 86.3% for phonemes in the 212 word vocabulary uttered by 5 male speakers (test set).
该研究开发了一种口语单词识别系统,该系统使用根据输入语音的语速估计的音素持续时间信息。在这项研究中,假设语速反映了平均元音长度。声学处理器使用修改后的 LVQ2 将输入语音转换为相似度矩阵。平均元音长度是根据初步识别结果计算的。每个单词模板中每个音素的持续时间是根据输入语音中元音的平均长度估计的。考虑到估计的音素持续时间,使用DTW进行口语单词识别实验。对于5名男性说话者(测试集)说出的212个单词词汇,单词识别得分为97.3%。音素持续时间信息是从另外 5 名男性和 10 名女性说话者(训练集)说出的 212 个单词词汇中收集的。前面的音素相关估计和后面的音素相关估计的混合组合给出了最好的性能。将上述方法扩展到音素识别。 5 位男性说话者(测试集)说出的 212 个单词词汇中,音素准确度从 71.8% 提高到 86.3%。

项目成果

期刊论文数量(22)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
沖本,牧野: "可変長パターンと識別学習を用いた音素認識" 信学技報. Vol. 96 No. 93. 7-14 (1996)
Okimoto, Makino:“使用可变长度模式和判别性学习的音素识别”,IEICE 技术报告,第 96 卷,第 93 期。7-14 (1996)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
原田, 鈴木, 牧野: "離散型HMnetによる新聞記事からの文節モデルの獲得" 電子情報通信学会技術報告. SP97・24. 45-50 (1997)
Harada、Suzuki、Makino:“使用离散 HMnet 从报纸文章中获取短语模型”SP97·24 (1997)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
S.MAKIKO, M.SUZUKI, A.HARADA: "Automatic Acquistion of Language Model using HMnet" Proc.Int.Conf Speech Processing'97. I. 47-54 (1997)
S.MAKIKO、M.SUZUKI、A.HARADA:“使用 HMnet 自动获取语言模型”Proc.Int.Conf 语音处理97。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
大坂,牧野: "発声速度に基づく音素持続時間予測を用いた音素認識" 信学技報. Vol. 96 No. 93. 1-6 (1996)
Osaka, Makino:“基于语速的音素持续时间预测的音素识别”IEICE 技术报告,第 96 卷第 93. 1-6 (1996)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
M.SUZUKI,S.MAKINO,A.ITO,H.ASO,H.SHIMODAIRA: "A New HMnet Construction Algorithm Requiring No Contextual Factors" IEICE Trans.on Information and Systems. E78-D,6. 662-668 (1995)
M.SUZUKI、S.MAKINO、A.ITO、H.ASO、H.SHIMODAIRA:“一种不需要上下文因素的新 HMnet 构建算法”IEICE Trans.on 信息和系统。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

MAKINO Shozo其他文献

MAKINO Shozo的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('MAKINO Shozo', 18)}}的其他基金

Japanese text dictation system for official reports
官方报告的日语文本听写系统
  • 批准号:
    07558042
  • 财政年份:
    1995
  • 资助金额:
    $ 4.1万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Study on utilization and effectiveness of linguistic information in the word recognition based on phoneme, syllable or character sequence with errors
基于音素、音节或错误字符序列的单词识别中语言信息的利用和有效性研究
  • 批准号:
    63460222
  • 财政年份:
    1988
  • 资助金额:
    $ 4.1万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (B)
Shape Estimation and Detection of Defects of a Structural Object from Acoustic Signal Using Digital Signal Processing and Intellectual Processing
使用数字信号处理和智能处理从声学信号中估计结构物体的形状并检测其缺陷
  • 批准号:
    63420037
  • 财政年份:
    1988
  • 资助金额:
    $ 4.1万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (A)

相似国自然基金

发音错误自动检测方法的研究及其在语言学习中的应用
  • 批准号:
    60772165
  • 批准年份:
    2007
  • 资助金额:
    25.0 万元
  • 项目类别:
    面上项目

相似海外基金

Research and Production of a Manual on English Phoneme Recognition for International Students
留学生英语音素识别手册的研究与制作
  • 批准号:
    23K12201
  • 财政年份:
    2023
  • 资助金额:
    $ 4.1万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Development of spoken word recognition and phoneme awareness in young children
幼儿口语单词识别和音素意识的发展
  • 批准号:
    341588-2008
  • 财政年份:
    2012
  • 资助金额:
    $ 4.1万
  • 项目类别:
    Discovery Grants Program - Individual
Development of spoken word recognition and phoneme awareness in young children
幼儿口语单词识别和音素意识的发展
  • 批准号:
    341588-2008
  • 财政年份:
    2011
  • 资助金额:
    $ 4.1万
  • 项目类别:
    Discovery Grants Program - Individual
Development of spoken word recognition and phoneme awareness in young children
幼儿口语单词识别和音素意识的发展
  • 批准号:
    341588-2008
  • 财政年份:
    2010
  • 资助金额:
    $ 4.1万
  • 项目类别:
    Discovery Grants Program - Individual
Development of spoken word recognition and phoneme awareness in young children
幼儿口语单词识别和音素意识的发展
  • 批准号:
    341588-2008
  • 财政年份:
    2009
  • 资助金额:
    $ 4.1万
  • 项目类别:
    Discovery Grants Program - Individual
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了