CAREER: Breaking the phonetic code: novel acoustic-lexical modeling techniques for robust automatic speech recognition

职业:打破语音密码:用于鲁棒自动语音识别的新颖声学词汇建模技术

基本信息

项目摘要

Spontaneous speech, accented speech, and speech in noise continue to provide automatic speech recognition (ASR) technology with significant challenges; error rates of ASR systems are still unacceptably high for these types of speech. This project establishes a consistent framework that seeks to cope with all of these conditions. The novel approach to phonetic variability investigated here views the problem as one of phonetic information underspecification: some subset of information that the listener receives will be missing or uncertain. Lexical access is thus a phonetic code-breaking problem --- how can a system accumulate phonetic cues in each of these conditions to recognize words on the basis of incomplete evidence? The research program of this project takes a multidisciplinary approach to integrating linguistic theory with speech recognition technology; discriminative statistical models of linguistic features are employed to model nonlinear, overlapping phonological effects observed in speech. The framework allows derivation of new linguistic insights through analysis of trained systems. The educational program fosters interdisciplinary research (with cross-disciplinary graduate seminars) and increases participation of underrepresented students in Computer Science by introducing language technology topics early into the undergraduate curriculum and encouraging undergraduate research. Apart from cultivating a new way of thinking about pronunciation variation for ASR, the broader impacts of this research are to provide collaborative resources for the ASR and linguistics communities to discuss in tutorial and workshop settings. Addressing noise, accent, and speaking style in a consistent framework will also improve ASR technology for many who are underserved by current systems.
自然语音、重音语音和噪声中的语音继续给自动语音识别(ASR)技术带来重大挑战;对于这些类型的语音,ASR 系统的错误率仍然高得令人无法接受。 该项目建立了一个一致的框架,旨在应对所有这些条件。这里研究的语音变异的新颖方法将问题视为语音信息不规范之一:听者收到的某些信息子集将丢失或不确定。因此,词汇访问是一个语音密码破解问题——系统如何在这些条件下积累语音线索,以便在不完整的证据的基础上识别单词? 该项目的研究计划采用多学科方法将语言学理论与语音识别技术相结合;语言特征的判别统计模型被用来模拟在语音中观察到的非线性、重叠的语音效应。 该框架允许通过分析经过训练的系统得出新的语言见解。 该教育计划通过在本科课程中尽早引入语言技术主题并鼓励本科生研究来促进跨学科研究(通过跨学科研究生研讨会)并增加代表性不足的学生对计算机科学的参与。 除了培养一种新的 ASR 发音变化思考方式之外,这项研究更广泛的影响是为 ASR 和语言学界提供协作资源,以便在教程和研讨会中进行讨论。 在一致的框架中解决噪音、口音和说话风格问题也将改善许多当前系统服务不足的人的 ASR 技术。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Eric Fosler-Lussier其他文献

Eric Fosler-Lussier的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Eric Fosler-Lussier', 18)}}的其他基金

Deep Learning Based Complex Spectral Mapping for Multi-Channel Speaker Separation and Speech Enhancement
基于深度学习的复杂频谱映射,用于多通道说话人分离和语音增强
  • 批准号:
    2125074
  • 财政年份:
    2021
  • 资助金额:
    $ 50.3万
  • 项目类别:
    Standard Grant
RI: Small: Early Elementary Reading Verification in Challenging Acoustic Environments
RI:小:具有挑战性的声学环境中的早期小学阅读验证
  • 批准号:
    2008043
  • 财政年份:
    2020
  • 资助金额:
    $ 50.3万
  • 项目类别:
    Standard Grant
RI: Medium: Deep Neural Networks for Robust Speech Recognition through Integrated Acoustic Modeling and Separation
RI:中:通过集成声学建模和分离实现鲁棒语音识别的深度神经网络
  • 批准号:
    1409431
  • 财政年份:
    2014
  • 资助金额:
    $ 50.3万
  • 项目类别:
    Continuing Grant
CI-ADDO-NEW: Collaborative Research: The Speech Recognition Virtual Kitchen
CI-ADDO-NEW:协作研究:语音识别虚拟厨房
  • 批准号:
    1305319
  • 财政年份:
    2013
  • 资助金额:
    $ 50.3万
  • 项目类别:
    Standard Grant
CI-P:Collaborative Research:The Speech Recognition Virtual Kitchen
CI-P:协作研究:语音识别虚拟厨房
  • 批准号:
    1205424
  • 财政年份:
    2012
  • 资助金额:
    $ 50.3万
  • 项目类别:
    Standard Grant
RI: Medium: Collaborative Research: Explicit Articulatory Models of Spoken Language, with Application to Automatic Speech Recognition
RI:媒介:协作研究:口语显式发音模型及其在自动语音识别中的应用
  • 批准号:
    0905420
  • 财政年份:
    2009
  • 资助金额:
    $ 50.3万
  • 项目类别:
    Standard Grant
Workshop: Student Research in Computational Linguistics, at the HLT/NAACL 2004 Conference
研讨会:计算语言学学生研究,HLT/NAACL 2004 会议
  • 批准号:
    0422841
  • 财政年份:
    2004
  • 资助金额:
    $ 50.3万
  • 项目类别:
    Standard Grant

相似国自然基金

打破身份偏见:AI服务机器人的组织身份对消费决策的影响研究
  • 批准号:
    72372049
  • 批准年份:
    2023
  • 资助金额:
    42 万元
  • 项目类别:
    面上项目
何氏养巢方通过SIRT3打破年龄相关性“ROS恶性循环”改善高龄小鼠卵母细胞IVM及质量的机制研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
打破农业纵向分工的“季节性诅咒”:中国经验及其运行机理
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
构巢曲霉孢子打破休眠前后的基因转录调控机制研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
高温通过促进GA合成打破栓皮栎种子上胚轴休眠的机制研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

格子緩和層とType-II型ヘテロ材料を用いた半導体レーザによる高温動作限界の打破
利用晶格弛豫层和II型异质材料突破半导体激光器的高温工作极限
  • 批准号:
    24K07610
  • 财政年份:
    2024
  • 资助金额:
    $ 50.3万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
ウラシルを起点とする線虫の休眠打破機構の解明
从尿嘧啶出发阐明线虫休眠打破机制
  • 批准号:
    24K08701
  • 财政年份:
    2024
  • 资助金额:
    $ 50.3万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Collaborative Research: Topological Defects and Dynamic Motion of Symmetry-breaking Tadpole Particles in Liquid Crystal Medium
合作研究:液晶介质中对称破缺蝌蚪粒子的拓扑缺陷与动态运动
  • 批准号:
    2344490
  • 财政年份:
    2024
  • 资助金额:
    $ 50.3万
  • 项目类别:
    Standard Grant
CAS: Highly Interacting Panchromatic Push-Pull Systems: Symmetry Breaking and Quantum Coherence in Electron Transfer
CAS:高度交互的全色推拉系统:电子转移中的对称破缺和量子相干性
  • 批准号:
    2345836
  • 财政年份:
    2024
  • 资助金额:
    $ 50.3万
  • 项目类别:
    Standard Grant
倍加半数体作出によるニンニク育種停滞打破の可能性検討
研究通过加倍单倍体生产打破大蒜育种停滞的可能性
  • 批准号:
    24K08847
  • 财政年份:
    2024
  • 资助金额:
    $ 50.3万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了