Computational Auditory Scene Analysis Using Active Audio-Visual Integration in a Dynamically Changing Environment

在动态变化的环境中使用主动视听集成进行计算听觉场景分析

基本信息

  • 批准号:
    22700165
  • 负责人:
  • 金额:
    $ 2.58万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
  • 财政年份:
    2010
  • 资助国家:
    日本
  • 起止时间:
    2010 至 2012
  • 项目状态:
    已结题

项目摘要

A framework for Audio-Visual Integration (AVI), which can provide optimal integration according to quality of audio and visual information obtained from a robot’s camera and microphone, was proposed and implemented. In addition, the proposed framework was extended by proposing “Active Audio Visual Integration (AAVI)”, which improves the quality of audio and visual information using active robot ’ s motion. Preliminary experiments on automatic speech recognition and voice activity detection showed that the AAVI framework worked effectively even in visually and/or auditorily noisy conditions.
提出并实现了视听集成(AVI)框架,该框架可以根据从机器人摄像头和麦克风获得的音频和视觉信息的质量提供最佳集成。此外,通过提出“主动音频”对所提出的框架进行了扩展。视觉集成(AAVI)”,利用主动机器人的运动来提高音频和视觉信息的质量。自动语音识别和语音活动检测的初步实验表明,AAVI 框架即使在视觉和/或听觉方面也能有效工作。嘈杂的环境。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Active Audio-Visual Integration for Voice Activity Detection based on A Causal Bayesian Network
基于因果贝叶斯网络的主动视听集成语音活动检测
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Takami Yoshida;Kazuhiro Nakadai
  • 通讯作者:
    Kazuhiro Nakadai
Assessment of General Applicability of Ego Noise Estimation-Applications to Automatic Speech Recognition and Sound Source Localization-
自我噪声估计的一般适用性评估-在自动语音识别和声源定位中的应用-
  • DOI:
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    0
  • 作者:
    G. Ince;K. Nakamura;F. Asano;H. Nakajima;K. Nakadai
  • 通讯作者:
    K. Nakadai
Audio-visual speech recognition system for a robot
机器人视听语音识别系统
  • DOI:
  • 发表时间:
    2010
  • 期刊:
  • 影响因子:
    0
  • 作者:
    T. Yoshida;K. Nakadai
  • 通讯作者:
    K. Nakadai
ロボット聴覚のための2階層視聴覚情報統合を用いた音声認識システムの検討
基于两层视听信息集成的机器人听觉语音识别系统研究
  • DOI:
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    0
  • 作者:
    吉田尚水;中臺一博;奥乃博
  • 通讯作者:
    奥乃博
SLAM-based Online Calibration for Asynchronous Microphone Array
基于SLAM的异步麦克风阵列在线校准
  • DOI:
    10.1080/01691864.2012.728690
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    2
  • 作者:
    H. Miura;T. Yoshida;K. Nakamura;K.Nakadai
  • 通讯作者:
    K.Nakadai
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

NAKADAI Kazuhiro其他文献

NAKADAI Kazuhiro的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('NAKADAI Kazuhiro', 18)}}的其他基金

audio-visual speech recognition for robots
机器人视听语音识别
  • 批准号:
    19700158
  • 财政年份:
    2007
  • 资助金额:
    $ 2.58万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)

相似海外基金

Seamless integration of Financial data into ESG data
将财务数据无缝集成到 ESG 数据中
  • 批准号:
    10099890
  • 财政年份:
    2024
  • 资助金额:
    $ 2.58万
  • 项目类别:
    Collaborative R&D
COMPAS: co integration of microelectronics and photonics for air and water sensors
COMPAS:微电子学和光子学的共同集成,用于空气和水传感器
  • 批准号:
    10108154
  • 财政年份:
    2024
  • 资助金额:
    $ 2.58万
  • 项目类别:
    EU-Funded
Linking the HTLV-1 pre-integration complex to the chromatin
将 HTLV-1 预整合复合物连接至染色质
  • 批准号:
    MR/Y002083/1
  • 财政年份:
    2024
  • 资助金额:
    $ 2.58万
  • 项目类别:
    Research Grant
MCA Pilot PUI: From glomeruli to pollination: vertical integration of neural encoding through ecologically-relevant behavior
MCA Pilot PUI:从肾小球到授粉:通过生态相关行为进行神经编码的垂直整合
  • 批准号:
    2322310
  • 财政年份:
    2024
  • 资助金额:
    $ 2.58万
  • 项目类别:
    Continuing Grant
Collaborative Research: Constraining next generation Cascadia earthquake and tsunami hazard scenarios through integration of high-resolution field data and geophysical models
合作研究:通过集成高分辨率现场数据和地球物理模型来限制下一代卡斯卡迪亚地震和海啸灾害情景
  • 批准号:
    2325311
  • 财政年份:
    2024
  • 资助金额:
    $ 2.58万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了