混合仮説検証型並列音素ラベリング(PPL)方式による話者独立音声認識システム

使用混合假设检验并行音素标记(PPL)方法的与说话人无关的语音识别系统

基本信息

  • 批准号:
    07455157
  • 负责人:
  • 金额:
    $ 4.03万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for General Scientific Research (B)
  • 财政年份:
    1995
  • 资助国家:
    日本
  • 起止时间:
    1995 至 无数据
  • 项目状态:
    已结题

项目摘要

混合仮説検証型並列音素ラベリング方式に基づく単語音声認識システムによる認識・実験を通して、話者独立システムの認識率向上と大語彙化に対する問題点を明らかにし、その解決を試みた。(1)これまでに得られている並列音素ラベリング方式による単語音声認識システムで、辞書の単語数を1845語にして、さまざまなタイプの話者独立型のシステムの性能評価を行った。従来のタイプの話者独立型システムのエラーレートは20.7%であったが、本研究で提案のシステムのエラーレートは16.2%であり、PPL方式の有効性が確かめられた。(2)提案のPPL方式のシステムのエラーレートは、2000語程度で16%程度で一応満足できる性能であったが、エラーレートが必ずしも十分低くないので、エラーの解析を行っている。セグメンテーションとラベリングのエラーが主な原因であることは明らかであるので、それらのシステムの性能改善を試みている。(3)音素リファレンスセットの構成法として、声質の似た話者の基本セットは混合し、似ていない話者の基本セットは混合しないで並列に使用する形の構成法によるシステムが最も認識率が高いことを確かめた。
通过基于单词语音识别系统的识别和实验,基于混合的假设验证类型标签系统,我们试图通过提高说话者独立系统和大词汇的识别率来解决问题。 (1)在使用迄今为止获得的平行标记系统的语音识别系统中,字典中的单词数设置为1845个单词,并评估了各种类型的扬声器独立系统的性能。常规类型的扬声器独立系统的错误率为20.7%,但本研究中提出的系统的错误为16.2%,并且确认了PPL系统。 (2)提出的PPL系统错误率是约16%的令人满意的性能,但错误率不一定较低,因此分析了错误。显然,细分和标记错误是主要原因,因此他们试图改善这些系统的性能。 (3)作为语音参考集的结构,具有相似语音质量的扬声器的基本集合是混合的,并且基本的未标记扬声器集合在并行使用。

项目成果

期刊论文数量(13)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Keiichi TOKUDA: "Adaptive Cepstral Analysis of Speech" IEEE Tranis Speech and Audio Processing. 3. 481-489 (1995)
Keiichi TOKUDA:“语音的自适应倒谱分析”IEEE Tranis 语音和音频处理。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Ming-Sheng WANG: "Speech Parsing by Downward Request Search Based on the Divide and Conguer Method" Proc. EUROSPEECH '95. 905-908 (1995)
王明生:“基于分治法的向下请求搜索语音解析”,论文集:
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
胡力游: "中国語連続音声の声調認識" 電子情報通信学会論文誌. J78-A. 763-768 (1995)
胡立宇:《连续汉语语音的声调识别》电子信息与通信工程师学会学报J78-768(1995)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Toshiko ABE: "Harmonic Estimation Based on Instantaneous Frequency and Its Application to Pitch Determination" IEICE Trans. Inf. & Syst.E78-D. 1188-1194 (1995)
Toshiko ABE:“基于瞬时频率的谐波估计及其在音调确定中的应用”IEICE Trans。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
今井聖: "音声信号処理-聴覚の特性を考慮したケプストラム法" 森北出版, 240 (1996)
今井清:《语音信号处理-考虑听觉特征的倒谱法》森北出版,240(1996)
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

今井 聖其他文献

今井 聖的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('今井 聖', 18)}}的其他基金

Research on the Professional Socialization of Legal Instructors in Juvenile Training Schools and its Social Structural Conditions
未成年人培训学校法律辅导员职业社会化及其社会结构条件研究
  • 批准号:
    22K13657
  • 财政年份:
    2022
  • 资助金额:
    $ 4.03万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
A Qualitative Research Study on the Practices of Schools and Third-Party Committees Regarding Child Suicide Cases
学校和第三方委员会处理儿童自杀案件实践的定性研究
  • 批准号:
    21K20242
  • 财政年份:
    2021
  • 资助金额:
    $ 4.03万
  • 项目类别:
    Grant-in-Aid for Research Activity Start-up
変形ピリオドグラムの冪関数変換と非線形平滑化によるスペクトル推定
使用变形周期图的幂函数变换和非线性平滑进行频谱估计
  • 批准号:
    63460124
  • 财政年份:
    1988
  • 资助金额:
    $ 4.03万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (B)
生成系と聴取系の両者の特性を考慮した音声のモデル化
考虑生产系统和收听系统特征的语音建模
  • 批准号:
    57460116
  • 财政年份:
    1982
  • 资助金额:
    $ 4.03万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (B)
対数振幅特性近似フィルタを利用する改良ケプストラム法による音声の分析合成システム
采用对数幅度特性近似滤波器的改进倒谱方法的语音分析与合成系统
  • 批准号:
    X00080----346111
  • 财政年份:
    1978
  • 资助金额:
    $ 4.03万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (B)
振動系の統計的解析器の研究
振动系统统计分析仪研究
  • 批准号:
    X40440-----53130
  • 财政年份:
    1965
  • 资助金额:
    $ 4.03万
  • 项目类别:
    Particular Research
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了