EAGER: Collaborative Research: Towards Modeling Human Speech Confusions in Noise

EAGER:协作研究:对噪声中的人类语音混乱进行建模

基本信息

  • 批准号:
    1248047
  • 负责人:
  • 金额:
    $ 10万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2012
  • 资助国家:
    美国
  • 起止时间:
    2012-08-01 至 2015-07-31
  • 项目状态:
    已结题

项目摘要

This EArly-concept Grant for Exploratory Research (EAGER) supports an exploratory study to evaluate model components for prediction of human speech recognition in the presence of noise. Such a model has the potential to predict confusions between fine phonetic distinctions in different levels of background noise and at different speaking rates. The study takes advantage of modern physiological results that indicate that the primary auditory cortex performs spectro-temporal filtering; that is, that there are cells that are sensitive to particular spectro-temporal modulations at each auditory frequency. In this project, perceptual experiments in the presence of both stationary and non-stationary additive noise and at different signal-to-noise ratios for a database of CVC syllables recorded at 2 different speaking rates yield confusion statistics. These statistics are then compared to those resulting from an auditory model enhanced by elements incorporating these spectro-temporal filters. Successful results from this study will suggest enhancements to current hearing models and ultimately, after a broader study for which this EAGER is a pilot, advance the understanding of human speech perception. Background noise presents a challenging problem for a variety of speech and hearing devices including hearing aids and automatic speech recognition (ASR) systems. Since normal-hearing human listeners are extremely adept at perceiving speech in noise, this improved understanding of human models could lead to better artificial systems for speech processing. The databases and tools developed for this study will be disseminated to the research community.
这项探索性研究(急切)的早期概念赠款支持一项探索性研究,以评估模型组成部分,以预测在存在噪声下人类语音识别的。这样的模型有可能预测不同级别的背景噪声和不同语言速率的精细语音区分之间的混乱。该研究利用了现代的生理结果,表明主要的听觉皮层执行光谱式滤波。也就是说,在每个听觉频率下,有些细胞对特定的光谱传统调制敏感。在这个项目中,在存在固定和非平稳添加噪声的情况下,以及以不同的信噪比的比率进行的感知实验,对于以2种不同的口语速率记录的CVC音节数据库产生了混淆统计。然后,将这些统计数据与通过结合这些光谱频率过滤器的元素增强的听觉模型产生的统计数据进行比较。这项研究的成功结果将提出对当前听力模型的增强,并最终在一项更广泛的研究之后,这是一项渴望的飞行员,可以提高人们对人类语音感知的理解。背景噪声为各种语音和听力设备提供了一个具有挑战性的问题,包括助听器和自动语音识别(ASR)系统。由于正常听力的人听众非常擅长感知噪音中的语音,因此对人类模型的这种改善的理解可能会导致更好的人工系统进行语音处理。为这项研究开发的数据库和工具将被传播到研究界。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Nelson Morgan其他文献

Updated MINDS report on speech recognition and understanding, Part 2 [DSP Education]
关于语音识别和理解的最新 MINDS 报告,第 2 部分 [DSP 教育]
  • DOI:
    10.1109/msp.2009.932707
  • 发表时间:
    2009
  • 期刊:
  • 影响因子:
    0
  • 作者:
    J. Baker;Li Deng;S. Khudanpur;Chin;James R. Glass;Nelson Morgan;Douglas D. O'Shaughnessy
  • 通讯作者:
    Douglas D. O'Shaughnessy
Updated MINDS Report on Speech Recognition and Understanding
更新后的 MINDS 关于语音识别和理解的报告
  • DOI:
    10.1016/s1567-4231(09)70205-9
  • 发表时间:
    2009
  • 期刊:
  • 影响因子:
    14.9
  • 作者:
    J. Baker;Li Deng;S. Khudanpur;Chin;James R. Glass;Nelson Morgan
  • 通讯作者:
    Nelson Morgan
Writing programs that scale with increasing numbers of cores should be as easy as writing programs for sequential computers
编写随着内核数量的增加而扩展的程序应该像为顺序计算机编写程序一样简单
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    K. Asanović;Rastislav Bodík;James Demmel;T. Keaveny;K. Keutzer;J. Kubiatowicz;Nelson Morgan;David A. Patterson;Koushik Sen;J. Wawrzynek;David Wessel;K. Yelick
  • 通讯作者:
    K. Yelick

Nelson Morgan的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Nelson Morgan', 18)}}的其他基金

RI: Small: Collaborative Research: Towards Modeling Source Separation from Measured Cortical Responses
RI:小型:协作研究:根据测量的皮质反应对源分离进行建模
  • 批准号:
    1320260
  • 财政年份:
    2013
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
International: An Analysis of Speaker Diarization Systems Errors
国际:说话人二值化系统误差分析
  • 批准号:
    1135365
  • 财政年份:
    2011
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
CI-P: Towards a Consensus Representation for Understanding Structure of Multiparty Conversations
CI-P:走向理解多方对话结构的共识表示
  • 批准号:
    0958561
  • 财政年份:
    2010
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
OIA/MRI: Acquisition of a Computational Server for Large Vocabulary Connectionist Speech Recognition
OIA/MRI:购买用于大词汇量联结语音识别的计算服务器
  • 批准号:
    0521210
  • 财政年份:
    2005
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
ITR/PE+SY:Mapping Meetings: Language Technology to make Sense of Human Interaction
ITR/PE SY:映射会议:理解人类互动的语言技术
  • 批准号:
    0121396
  • 财政年份:
    2001
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
SGER: Incorporating Higher-Level Information into Dynamic Pronounciation Modeling for ASR
SGER:将高级信息纳入 ASR 动态发音建模
  • 批准号:
    9713346
  • 财政年份:
    1997
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
Robust Speech Recognition Using Vector Computing
使用矢量计算的鲁棒语音识别
  • 批准号:
    9612778
  • 财政年份:
    1997
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
Automatic Speech Recognition Based on Syllable-length Acoustic Models
基于音节长度声学模型的自动语音识别
  • 批准号:
    9712579
  • 财政年份:
    1997
  • 资助金额:
    $ 10万
  • 项目类别:
    Continuing Grant
A System for Connectionist Speech Recognition Research
联结主义语音识别研究系统
  • 批准号:
    9311980
  • 财政年份:
    1993
  • 资助金额:
    $ 10万
  • 项目类别:
    Continuing Grant
Application of Signal Processing CAD to the Digital Realization of Artificial Neural Networks
信号处理CAD在人工神经网络数字化实现中的应用
  • 批准号:
    8922354
  • 财政年份:
    1990
  • 资助金额:
    $ 10万
  • 项目类别:
    Continuing Grant

相似国自然基金

基于交易双方异质性的工程项目组织间协作动态耦合研究
  • 批准号:
    72301024
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
面向5G超高清移动视频传输的协作NOMA系统可靠性研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
面向协作感知车联网的信息分发时效性保证关键技术研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
数据物理驱动的车间制造服务协作可靠性机理与优化方法研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
医保基金战略性购买促进远程医疗协作网价值共创的制度创新研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    45 万元
  • 项目类别:
    面上项目

相似海外基金

Collaborative Research: EAGER: The next crisis for coral reefs is how to study vanishing coral species; AUVs equipped with AI may be the only tool for the job
合作研究:EAGER:珊瑚礁的下一个危机是如何研究正在消失的珊瑚物种;
  • 批准号:
    2333604
  • 财政年份:
    2024
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
EAGER/Collaborative Research: An LLM-Powered Framework for G-Code Comprehension and Retrieval
EAGER/协作研究:LLM 支持的 G 代码理解和检索框架
  • 批准号:
    2347624
  • 财政年份:
    2024
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
EAGER/Collaborative Research: Revealing the Physical Mechanisms Underlying the Extraordinary Stability of Flying Insects
EAGER/合作研究:揭示飞行昆虫非凡稳定性的物理机制
  • 批准号:
    2344215
  • 财政年份:
    2024
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
Collaborative Research: EAGER: Designing Nanomaterials to Reveal the Mechanism of Single Nanoparticle Photoemission Intermittency
合作研究:EAGER:设计纳米材料揭示单纳米粒子光电发射间歇性机制
  • 批准号:
    2345581
  • 财政年份:
    2024
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
Collaborative Research: EAGER: Designing Nanomaterials to Reveal the Mechanism of Single Nanoparticle Photoemission Intermittency
合作研究:EAGER:设计纳米材料揭示单纳米粒子光电发射间歇性机制
  • 批准号:
    2345582
  • 财政年份:
    2024
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了