EAGER: A Research Infrastructure for Analyzing Speech-based Interfaces

EAGER:用于分析基于语音的界面的研究基础设施

基本信息

  • 批准号:
    1247368
  • 负责人:
  • 金额:
    $ 10万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2012
  • 资助国家:
    美国
  • 起止时间:
    2012-08-01 至 2014-01-31
  • 项目状态:
    已结题

项目摘要

The research community's understanding of the speech-to-text problem has reached a point at which most challenges can in principle be met, given a baseline system, enough data from the target domain, and an expert, who knows how to develop or adapt a recognizer for the target context-of-use. Unfortunately, this approach does not scale: despite the growing interest in speech-user interfaces, there are a limited number of experts equipped to analyze and develop an accurate speech recognizer.This Early Grant for Exploratory Research explores the possibility of formalizing a speech recognition expert's implicit knowledge of the required analysis and development steps in a rule-based knowledge base, which can help a speech recognition non-expert develop a speech recognizer as part of an application, such as a dialog system in a rare dialect. Speech recognition experts adapt and improve recognizers by listening to data, aggregating error reports, and then adjusting parameters, retraining models, or applying adaptation techniques, based on their assessment of the mismatched context of use. This project extracts intuition from contextual interviews with such experts, develops a proof-of-concept expert system to predict the gains a system would see from specific adaptation techniques, and explores the factors which will make this approach feasible.This project creates ways to make development of speech-enabled applications more accessible to a broader class of researchers, students, and practitioners, particularly from the user interface area. It will make joint development of user interface and speech recognition feasible, without requiring large teams with varied skill-sets.
研究界对语音到文本问题的理解已经达到了原则上可以应对大多数挑战的程度,只要有基线系统、来自目标领域的足够数据以及知道如何开发或调整语音到文本的专家。目标使用上下文的识别器。不幸的是,这种方法无法扩展:尽管人们对语音用户界面的兴趣日益浓厚,但能够分析和开发准确语音识别器的专家数量有限。这项早期探索性研究资助探索了将语音识别专家的能力形式化的可能性。基于规则的知识库中所需分析和开发步骤的隐式知识,这可以帮助语音识别非专家开发语音识别器作为应用程序的一部分,例如罕见方言的对话系统。语音识别专家根据对不匹配的使用环境的评估,通过听取数据、汇总错误报告,然后调整参数、重新训练模型或应用适应技术来调整和改进识别器。该项目从与此类专家的情境访谈中提取直觉,开发概念验证专家系统来预测系统从特定适应技术中获得的收益,并探索使这种方法可行的因素。该项目创造了方法开发支持语音的应用程序,让更多的研究人员、学生和从业者更容易使用,尤其是用户界面领域的应用程序。它将使得用户界面和语音识别的联合开发变得可行,而不需要具有不同技能的大型团队。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Florian Metze其他文献

OPERA: Operations-oriented Probabilistic Extraction, Reasoning, and Analysis
OPERA:面向操作的概率提取、推理和分析
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    E. Hovy;Taylor Berg;J. Carbonell;Hans Chalupsky;A. Gershman;Alexander Hauptmann;Florian Metze;T. Mitamura;Aditi Chaudhary;Xianyang Chen;Bernie Huang;H. Liu;Xuezhe Ma;Shruti Palaskar;Dheeraj Rajagopal;Maria Ryskina;Ramon Sanabria
  • 通讯作者:
    Ramon Sanabria
Multimodal Speech Recognition with Unstructured Audio Masking
具有非结构化音频掩蔽的多模态语音识别
  • DOI:
    10.18653/v1/2020.nlpbt-1.2
  • 发表时间:
    2020-10-16
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Tejas Srinivasan;Ramon Sanabria;Florian Metze;Desmond Elliott
  • 通讯作者:
    Desmond Elliott
Comparison of Four Approaches to Age and Gender Recognition for Telephone Applications
电话应用中年龄和性别识别的四种方法的比较
Emotion classification in children's speech using fusion of acoustic and linguistic features
利用声学和语言特征融合对儿童言语进行情感分类
  • DOI:
    10.21437/interspeech.2009-110
  • 发表时间:
    2009
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Tim Polzehl;Shiva Sundaram;Hamed Ketabdar;M. Wagner;Florian Metze
  • 通讯作者:
    Florian Metze
On Advances in Text Generation from Images Beyond Captioning: A Case Study in Self-Rationalization
关于超越字幕的图像文本生成的进展:自我合理化的案例研究

Florian Metze的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Florian Metze', 18)}}的其他基金

CI-ADDO-NEW: Collaborative Research: The Speech Recognition Virtual Kitchen
CI-ADDO-NEW:协作研究:语音识别虚拟厨房
  • 批准号:
    1305365
  • 财政年份:
    2013
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
CI-P:Collaborative Research:The Speech Recognition Virtual Kitchen
CI-P:协作研究:语音识别虚拟厨房
  • 批准号:
    1205589
  • 财政年份:
    2012
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant

相似国自然基金

面向“双碳”目标的中国典型电厂基础设施气候变化适应技术研究
  • 批准号:
    72303126
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
大型交通基础设施建设行为与生态环境非对称耦合机理研究
  • 批准号:
    72371043
  • 批准年份:
    2023
  • 资助金额:
    41 万元
  • 项目类别:
    面上项目
“场域基础设施”与城市公共空间耦合机制研究
  • 批准号:
    52378035
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
基于生成性IT基础设施的组织敏捷性构建机制研究
  • 批准号:
    72302015
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于扰动情景模拟的山地城市生态基础设施韧性演变过程与影响机制研究——以重庆都市圈为例
  • 批准号:
    42301299
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

EAGER: SAI: Collaborative Research: Conceptualizing Interorganizational Processes for Supporting Interdependent Lifeline Infrastructure Recovery
EAGER:SAI:协作研究:概念化支持相互依赖的生命线基础设施恢复的组织间流程
  • 批准号:
    2411614
  • 财政年份:
    2023
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
Collaborative Research: EAGER: SAI: Participatory Design for Water Quality Monitoring of Highly Decentralized Water Infrastructure Systems
合作研究:EAGER:SAI:高度分散的水基础设施系统水质监测的参与式设计
  • 批准号:
    2120829
  • 财政年份:
    2022
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
Collaborative Research: EAGER: SAI: Participatory Design for Water Quality Monitoring of Highly Decentralized Water Infrastructure Systems
合作研究:EAGER:SAI:高度分散的水基础设施系统水质监测的参与式设计
  • 批准号:
    2121991
  • 财政年份:
    2022
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
Collaborative Research/EAGER: Toward Long-Distance Ocean and Seismic Sensing on Optical Telecommunications Infrastructure
合作研究/EAGER:在光通信基础设施上实现长距离海洋和地震传感
  • 批准号:
    2211068
  • 财政年份:
    2022
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
Collaborative Research/EAGER: Toward Long-Distance Ocean and Seismic Sensing on Optical Telecommunications Infrastructure
合作研究/EAGER:在光通信基础设施上实现长距离海洋和地震传感
  • 批准号:
    2211274
  • 财政年份:
    2022
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了