用于声源定位的双耳优先效应计算模型
项目介绍
AI项目解读
基本信息
- 批准号:11774380
- 项目类别:面上项目
- 资助金额:64.0万
- 负责人:
- 依托单位:
- 学科分类:A2305.生物声学与语言声学
- 结题年份:2021
- 批准年份:2017
- 项目状态:已结题
- 起止时间:2018-01-01 至2021-12-31
- 项目参与者:马宁; 王子腾; 战鸽; 姚鼎鼎;
- 关键词:
项目摘要
Sound source localization plays a crucial part in machine hearing, especially in robotics, hearing aid and security monitoring systems. However, current sound source localization algorithms are usually unreliable in real environments with reverberation. In contrast, the human auditory system has a mechanism to deal with reverberation during sound localization, a phenomena called the "precedence effect". A computational model of the precedence effect, which estimates the dominance of direct sound in time-frequency regions, can not only improve the robustness of sound source localization in reverberant environments, but also provide valuable insight to the research in sound source separation, acoustic event detection and other related areas. The benefit of existing computational models of the precedence effect is limited largely because they do not fully utilize auditory cues and prior knowledge of sound. In this project, the multi-scale normalized binaural cross correlation is proposed in order to reflect the dominance level of direct sound in a multiple time scale. First, auditory cues are grouped in the time-frequency domain to enhance regions that are dominant by direct sound. As a result, the proposed computational model is self-adaptive to environment variability. Second, machine learning techniques such as the random regression forest are used to exploit prior information of sound so that the long-term experience of auditory system is accumulated. The methodology of research is based on a binaural sound source localization system with the proposed precedence effect model and includes sound localization listening tests, and the research result will be generalized to microphone array applications.
声源定位是机器听觉的重要组成部分,在人工智能、助听器和安全监控等领域有很大需求。但是,现有声源定位方法缺乏足够的抗混响能力,不足以适应实际环境。而听觉具有完善的抗混响机制,表现为“优先效应”,对此建立计算模型,从而根据输入声信号,估计每个时频点上直达声占优势的程度,不仅能够直接提高声源定位的抗混响性能,而且对声源分离、声学事件检测等其它研究都有参考意义。现有计算模型之所以不能满足需求,主要因为听觉信息利用不够充分,以及对先验知识利用不足。为此,本研究提出多尺度归一化双耳互相关作为基本听觉线索,在多个层次上反映出直达声的相对优势;通过组合多个听觉线索,检测优先声集中的时频区域,实现对环境的快速适应;在此基础上,利用随机回归森林等机器学习方法,引入更多先验信息,实现对混响环境的长期经验积累。研究以双耳声源定位平台为基础,同时结合主观听觉测试进行模型优化,并推广到传声器阵列应用。
结项摘要
声源空间定位作为智能语音处理的重要研究课题之一,其被广泛应用于助听器和安全监控领域。现有的声源定位方法缺乏复杂环境下的鲁棒性,难以满足实际应用的需求。从听觉中借鉴其处理方法,对此构建相应模型,能够提高声源定位模型的稳健性。以模拟耳蜗非线性处理的计算模型(即 DRNL)为基础,分析了其水平定位所采用的听觉线索,发现模型的非线性压缩能够有效增加双耳时间差(ITD)的稳健性。将人耳中的条件反射作用引入DRNL模型,量化成一个可变的时间-频率参数MOC,进一步扩展了原模型的效果。MOC可以等效为在每个时频点上,根据直达声占优势的程度进行时频选带操作,进而实现抗噪和抗混响。MOC的变化受每时刻两耳输出能量的联合作用,以及下游双耳定位问题的指导。通过听觉心理物理学启发的MOC值更新方式,并同时拟合双耳听觉事件检测、ITD/ILD trading现象,扩展的双耳MOC-DRNL模型能够解释双耳优先效应。为了建模长时特性,并利用海量数据,模拟人耳的长期经验积累过程,构建了基于卷积神经网络(CNN)的双耳空间定位系统。通过将两个模型结合,以期能够有效模拟“自底向上”和“自上而下”的联合作用,更准确的解释优先效应现象。相关算法已部分推广至传声器阵列。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(2)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
车用空载湿式离合器高速碰撞摩擦特性及带排转矩分析
- DOI:--
- 发表时间:2020
- 期刊:兵工学报
- 影响因子:--
- 作者:张琳;魏超;胡纪滨;胡琦
- 通讯作者:胡琦
2型重组腺相关病毒介导增强型绿
- DOI:--
- 发表时间:--
- 期刊:神经损伤与功能重建,2(6):336-339,2007,11
- 影响因子:--
- 作者:胡琦;康慧聪;许峰;刘晓艳;王
- 通讯作者:王
KDM3A inhibition attenuates high concentration insulininduced vascular smooth muscle cell injury by suppressing MAPK/NFkappaB pathways
KDM3A 抑制通过抑制 MAPK/NFkappaB 通路减轻高浓度胰岛素诱导的血管平滑肌细胞损伤
- DOI:--
- 发表时间:2018
- 期刊:Int J Mol Med
- 影响因子:--
- 作者:张博方;江洪;陈静;郭鑫;胡琦;杨硕
- 通讯作者:杨硕
析出相在铝镁合金Portevin-Le Chatelier效应中的作用研究
- DOI:--
- 发表时间:--
- 期刊:物理学报
- 影响因子:--
- 作者:龚明;张青川;胡琦;曹鹏涛;符师桦
- 通讯作者:符师桦
RP105 ameliorates hypoxia/reoxygenation injury in cardiac microvascular endothelial cells by suppressing TLR4MAPKsNF-kappaB signaling
RP105 通过抑制 TLR4MAPKsNF-kappaB 信号传导改善心脏微血管内皮细胞缺氧/复氧损伤
- DOI:--
- 发表时间:2018
- 期刊:Int J Mol Med,
- 影响因子:--
- 作者:郭鑫;江洪;陈静;张博方;胡琦;杨硕
- 通讯作者:杨硕
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}