CAREER: Breaking the phonetic code: novel acoustic-lexical modeling techniques for robust automatic speech recognition
职业:打破语音密码:用于鲁棒自动语音识别的新颖声学词汇建模技术
基本信息
- 批准号:0643901
- 负责人:
- 金额:$ 50.3万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2006
- 资助国家:美国
- 起止时间:2006-12-15 至 2012-11-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Spontaneous speech, accented speech, and speech in noise continue to provide automatic speech recognition (ASR) technology with significant challenges; error rates of ASR systems are still unacceptably high for these types of speech. This project establishes a consistent framework that seeks to cope with all of these conditions. The novel approach to phonetic variability investigated here views the problem as one of phonetic information underspecification: some subset of information that the listener receives will be missing or uncertain. Lexical access is thus a phonetic code-breaking problem --- how can a system accumulate phonetic cues in each of these conditions to recognize words on the basis of incomplete evidence? The research program of this project takes a multidisciplinary approach to integrating linguistic theory with speech recognition technology; discriminative statistical models of linguistic features are employed to model nonlinear, overlapping phonological effects observed in speech. The framework allows derivation of new linguistic insights through analysis of trained systems. The educational program fosters interdisciplinary research (with cross-disciplinary graduate seminars) and increases participation of underrepresented students in Computer Science by introducing language technology topics early into the undergraduate curriculum and encouraging undergraduate research. Apart from cultivating a new way of thinking about pronunciation variation for ASR, the broader impacts of this research are to provide collaborative resources for the ASR and linguistics communities to discuss in tutorial and workshop settings. Addressing noise, accent, and speaking style in a consistent framework will also improve ASR technology for many who are underserved by current systems.
噪音中自发的言语,重音语音和语音继续为自动语音识别(ASR)技术带来重大挑战。对于这些类型的语音,ASR系统的错误率仍然很高。 该项目建立了一个一致的框架,旨在应对所有这些条件。这里研究的新型语音变异方法将问题视为语音信息的指定之一:听众收到的某些信息将缺失或不确定。因此,词汇访问是一个语音代码的问题---系统如何在每个条件中积累语音提示以基于不完整的证据识别单词? 该项目的研究计划采用了多学科方法,将语言理论与语音识别技术融为一体。语言特征的歧视性统计模型用于模拟语音中观察到的非线性,重叠的语音效应。 该框架可以通过分析受过训练的系统来推导新的语言见解。 教育计划促进了跨学科研究(包括跨学科研究生研讨会),并通过将语言技术主题引入本科课程并鼓励本科生研究来增加代表性不足的学生参与计算机科学的参与。 除了培养关于ASR的发音变化的新思维方式外,这项研究的更广泛影响还旨在为ASR和语言学社区提供协作资源,以在教程和讲习班环境中讨论。 在一致的框架中解决噪音,口音和口语风格也将改善许多因当前系统服务不足的人的ASR技术。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Eric Fosler-Lussier其他文献
Eric Fosler-Lussier的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Eric Fosler-Lussier', 18)}}的其他基金
Deep Learning Based Complex Spectral Mapping for Multi-Channel Speaker Separation and Speech Enhancement
基于深度学习的复杂频谱映射,用于多通道说话人分离和语音增强
- 批准号:
2125074 - 财政年份:2021
- 资助金额:
$ 50.3万 - 项目类别:
Standard Grant
RI: Small: Early Elementary Reading Verification in Challenging Acoustic Environments
RI:小:具有挑战性的声学环境中的早期小学阅读验证
- 批准号:
2008043 - 财政年份:2020
- 资助金额:
$ 50.3万 - 项目类别:
Standard Grant
RI: Medium: Deep Neural Networks for Robust Speech Recognition through Integrated Acoustic Modeling and Separation
RI:中:通过集成声学建模和分离实现鲁棒语音识别的深度神经网络
- 批准号:
1409431 - 财政年份:2014
- 资助金额:
$ 50.3万 - 项目类别:
Continuing Grant
CI-ADDO-NEW: Collaborative Research: The Speech Recognition Virtual Kitchen
CI-ADDO-NEW:协作研究:语音识别虚拟厨房
- 批准号:
1305319 - 财政年份:2013
- 资助金额:
$ 50.3万 - 项目类别:
Standard Grant
CI-P:Collaborative Research:The Speech Recognition Virtual Kitchen
CI-P:协作研究:语音识别虚拟厨房
- 批准号:
1205424 - 财政年份:2012
- 资助金额:
$ 50.3万 - 项目类别:
Standard Grant
RI: Medium: Collaborative Research: Explicit Articulatory Models of Spoken Language, with Application to Automatic Speech Recognition
RI:媒介:协作研究:口语显式发音模型及其在自动语音识别中的应用
- 批准号:
0905420 - 财政年份:2009
- 资助金额:
$ 50.3万 - 项目类别:
Standard Grant
Workshop: Student Research in Computational Linguistics, at the HLT/NAACL 2004 Conference
研讨会:计算语言学学生研究,HLT/NAACL 2004 会议
- 批准号:
0422841 - 财政年份:2004
- 资助金额:
$ 50.3万 - 项目类别:
Standard Grant
相似国自然基金
益气活血方启动免疫级联反应促进破裂型腰椎间盘突出后重吸收的机制
- 批准号:82374220
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
内皮KRAS基因突变诱导平滑肌炎性表型转化在脑动静脉畸形破裂中的作用和分子机制研究
- 批准号:82371297
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
利用弹性散射和破裂反应实验探索10Be的集团结构
- 批准号:12305132
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
冰岩斜坡地震非协调变形与拉剪破裂机制研究
- 批准号:42377194
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
破裂岩体内非线性渗流机制与突水危险性量化方法研究
- 批准号:52304238
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
相似海外基金
Collaborative Research: Topological Defects and Dynamic Motion of Symmetry-breaking Tadpole Particles in Liquid Crystal Medium
合作研究:液晶介质中对称破缺蝌蚪粒子的拓扑缺陷与动态运动
- 批准号:
2344489 - 财政年份:2024
- 资助金额:
$ 50.3万 - 项目类别:
Standard Grant
脂質代謝を介した脳動脈瘤形成・破裂機序の解明と治療へのアプローチ
通过脂质代谢阐明脑动脉瘤形成和破裂的机制及治疗方法
- 批准号:
24K12218 - 财政年份:2024
- 资助金额:
$ 50.3万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
α7受容体を標的としたコリン作動性薬剤による脳動脈瘤破裂予防の新たな薬物療法開発
使用针对α7受体的胆碱能药物开发预防脑动脉瘤破裂的新药物疗法
- 批准号:
24K12259 - 财政年份:2024
- 资助金额:
$ 50.3万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
CAS: Highly Interacting Panchromatic Push-Pull Systems: Symmetry Breaking and Quantum Coherence in Electron Transfer
CAS:高度交互的全色推拉系统:电子转移中的对称破缺和量子相干性
- 批准号:
2345836 - 财政年份:2024
- 资助金额:
$ 50.3万 - 项目类别:
Standard Grant
AI技術を用いた大動脈瘤破裂リスクモデルの構築に関する総合的研究
利用AI技术构建主动脉瘤破裂风险模型的综合研究
- 批准号:
24K11950 - 财政年份:2024
- 资助金额:
$ 50.3万 - 项目类别:
Grant-in-Aid for Scientific Research (C)