用于声源定位的双耳优先效应计算模型

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    11774380
  • 项目类别:
    面上项目
  • 资助金额:
    64.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    A2305.生物声学与语言声学
  • 结题年份:
    2021
  • 批准年份:
    2017
  • 项目状态:
    已结题
  • 起止时间:
    2018-01-01 至2021-12-31

项目摘要

Sound source localization plays a crucial part in machine hearing, especially in robotics, hearing aid and security monitoring systems. However, current sound source localization algorithms are usually unreliable in real environments with reverberation. In contrast, the human auditory system has a mechanism to deal with reverberation during sound localization, a phenomena called the "precedence effect". A computational model of the precedence effect, which estimates the dominance of direct sound in time-frequency regions, can not only improve the robustness of sound source localization in reverberant environments, but also provide valuable insight to the research in sound source separation, acoustic event detection and other related areas. The benefit of existing computational models of the precedence effect is limited largely because they do not fully utilize auditory cues and prior knowledge of sound. In this project, the multi-scale normalized binaural cross correlation is proposed in order to reflect the dominance level of direct sound in a multiple time scale. First, auditory cues are grouped in the time-frequency domain to enhance regions that are dominant by direct sound. As a result, the proposed computational model is self-adaptive to environment variability. Second, machine learning techniques such as the random regression forest are used to exploit prior information of sound so that the long-term experience of auditory system is accumulated. The methodology of research is based on a binaural sound source localization system with the proposed precedence effect model and includes sound localization listening tests, and the research result will be generalized to microphone array applications.
声源定位是机器听觉的重要组成部分,在人工智能、助听器和安全监控等领域有很大需求。但是,现有声源定位方法缺乏足够的抗混响能力,不足以适应实际环境。而听觉具有完善的抗混响机制,表现为“优先效应”,对此建立计算模型,从而根据输入声信号,估计每个时频点上直达声占优势的程度,不仅能够直接提高声源定位的抗混响性能,而且对声源分离、声学事件检测等其它研究都有参考意义。现有计算模型之所以不能满足需求,主要因为听觉信息利用不够充分,以及对先验知识利用不足。为此,本研究提出多尺度归一化双耳互相关作为基本听觉线索,在多个层次上反映出直达声的相对优势;通过组合多个听觉线索,检测优先声集中的时频区域,实现对环境的快速适应;在此基础上,利用随机回归森林等机器学习方法,引入更多先验信息,实现对混响环境的长期经验积累。研究以双耳声源定位平台为基础,同时结合主观听觉测试进行模型优化,并推广到传声器阵列应用。

结项摘要

声源空间定位作为智能语音处理的重要研究课题之一,其被广泛应用于助听器和安全监控领域。现有的声源定位方法缺乏复杂环境下的鲁棒性,难以满足实际应用的需求。从听觉中借鉴其处理方法,对此构建相应模型,能够提高声源定位模型的稳健性。以模拟耳蜗非线性处理的计算模型(即 DRNL)为基础,分析了其水平定位所采用的听觉线索,发现模型的非线性压缩能够有效增加双耳时间差(ITD)的稳健性。将人耳中的条件反射作用引入DRNL模型,量化成一个可变的时间-频率参数MOC,进一步扩展了原模型的效果。MOC可以等效为在每个时频点上,根据直达声占优势的程度进行时频选带操作,进而实现抗噪和抗混响。MOC的变化受每时刻两耳输出能量的联合作用,以及下游双耳定位问题的指导。通过听觉心理物理学启发的MOC值更新方式,并同时拟合双耳听觉事件检测、ITD/ILD trading现象,扩展的双耳MOC-DRNL模型能够解释双耳优先效应。为了建模长时特性,并利用海量数据,模拟人耳的长期经验积累过程,构建了基于卷积神经网络(CNN)的双耳空间定位系统。通过将两个模型结合,以期能够有效模拟“自底向上”和“自上而下”的联合作用,更准确的解释优先效应现象。相关算法已部分推广至传声器阵列。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(2)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

车用空载湿式离合器高速碰撞摩擦特性及带排转矩分析
  • DOI:
    --
  • 发表时间:
    2020
  • 期刊:
    兵工学报
  • 影响因子:
    --
  • 作者:
    张琳;魏超;胡纪滨;胡琦
  • 通讯作者:
    胡琦
2型重组腺相关病毒介导增强型绿
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    神经损伤与功能重建,2(6):336-339,2007,11
  • 影响因子:
    --
  • 作者:
    胡琦;康慧聪;许峰;刘晓艳;王
  • 通讯作者:
KDM3A inhibition attenuates high concentration insulininduced vascular smooth muscle cell injury by suppressing MAPK/NFkappaB pathways
KDM3A 抑制通过抑制 MAPK/NFkappaB 通路减轻高浓度胰岛素诱导的血管平滑肌细胞损伤
  • DOI:
    --
  • 发表时间:
    2018
  • 期刊:
    Int J Mol Med
  • 影响因子:
    --
  • 作者:
    张博方;江洪;陈静;郭鑫;胡琦;杨硕
  • 通讯作者:
    杨硕
析出相在铝镁合金Portevin-Le Chatelier效应中的作用研究
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    物理学报
  • 影响因子:
    --
  • 作者:
    龚明;张青川;胡琦;曹鹏涛;符师桦
  • 通讯作者:
    符师桦
RP105 ameliorates hypoxia/reoxygenation injury in cardiac microvascular endothelial cells by suppressing TLR4MAPKsNF-kappaB signaling
RP105 通过抑制 TLR4MAPKsNF-kappaB 信号传导改善心脏微血管内皮细胞缺氧/复氧损伤
  • DOI:
    --
  • 发表时间:
    2018
  • 期刊:
    Int J Mol Med,
  • 影响因子:
    --
  • 作者:
    郭鑫;江洪;陈静;张博方;胡琦;杨硕
  • 通讯作者:
    杨硕

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码