音频信号处理中基于模型的语音与音乐信号分离算法
项目介绍
AI项目解读
基本信息
- 批准号:60901061
- 项目类别:青年科学基金项目
- 资助金额:18.0万
- 负责人:
- 依托单位:
- 学科分类:F0111.信号理论与信号处理
- 结题年份:2012
- 批准年份:2009
- 项目状态:已结题
- 起止时间:2010-01-01 至2012-12-31
- 项目参与者:刘明辉; 陈泯融; 陈小红; 张亚磊; 肖海波; 冯智杰; 夏晓玲; 孟凡阳;
- 关键词:
项目摘要
基于内容的音频信息检索是网络多媒体信息服务的关键技术之一,具有广泛的应用前景。当前音频信息检索的主要技术瓶颈之一是语音与音乐混叠信号的分离。不同信号的混叠导致语音/音乐识别与归类准确率的下降,从而降低检索结果的可靠性。本项目拟研究一种可靠的信号分离算法,用于从混叠信号中分离出语音与音乐,从而提高语音识别的准确率,最终达到可靠、高效的音频检索的目标。针对本项目所处理的音频文件的特性,我们提出一种基于模型的分离算法。首先通过音频分割算法在一个音频文件中分割出纯语音、纯音乐、以及语音与音乐混叠信号。在此基础上,通过信号分析与建模技术,获得关于纯语音的和纯音乐的可区分、可分离的特征参数及其模型。根据同一段音频流内同类信号之间的相关性,这些模型提供了混叠信号对应成分的先验知识。利用这些先验知识,实现语音与音乐信号的有效分离。
结项摘要
以语音识别、音乐分类等为基础的音频内容的分析与识别是网络多媒体信息服务的关键技术之一。不同音频源信号的混叠与相互干扰是该技术广泛应用的主要瓶颈。本项目针对这一关键问题,从可靠的音频分割、噪声估计与分析建模、语音与音乐信号的特征空间矩阵分析、语音与干扰信号源分离等方面进行了深入的研究,针对不同的噪声源提出了若干个语音分离与增强算法。特别地,着眼于提高语音识别率这一最终目标,在基于非负矩阵分解的语音分离算法中,引入语音识别模型构造基于语音识别似然率成绩(Viterbi score)的代价函数,实现了有效的语音与音乐信号的分离。一般来说,语音分离算法在剔除干扰信号的同时往往带来一定程度的语音失真,这导致增强后的语音并不能直接带来语音识别率的提高。本项目所提算法实现了语音增强和语音识别的有机统一。进一步揭示了语音识别似然率成绩作为语音识别结果置信测度的科学性,对基于统计模型的现代模式识别具有普遍性的指导意义。.本项目具体研究成果包括出版语音处理专著1本,期刊论文3篇,会议论文9篇;论文检索方面:SCI 检索1篇,EI 检索7篇;培养青年学术骨干2人,硕士研究生6人(毕业3人、在读3人)。
项目成果
期刊论文数量(3)
专著数量(1)
科研奖励数量(0)
会议论文数量(9)
专利数量(0)
Robust Speaker Recognition Using Denoised Vocal Source and Vocal Tract Features
使用去噪声源和声道特征的鲁棒说话人识别
- DOI:10.1109/tasl.2010.2045800
- 发表时间:2011-01-01
- 期刊:IEEE TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING
- 影响因子:--
- 作者:Wang, Ning;Ching, P. C.;Lee, Tan
- 通讯作者:Lee, Tan
基于模型在线更新和平滑处理的音乐分割算法
- DOI:--
- 发表时间:--
- 期刊:深圳大学学报(理工版)
- 影响因子:--
- 作者:郑能恒;张亚磊;李霞
- 通讯作者:李霞
自适应GMM聚类的SVM话者确认
- DOI:--
- 发表时间:--
- 期刊:小型微型计算机系统
- 影响因子:--
- 作者:刘明辉;戴蓓倩;黄中伟
- 通讯作者:黄中伟
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
基于多目标联合优化的语音增强方法研究
- DOI:--
- 发表时间:2021
- 期刊:信号处理
- 影响因子:--
- 作者:谢福仕;康迂勇;施明月;郑能恒
- 通讯作者:郑能恒
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
郑能恒的其他基金
基于电刺激信号信噪比估计与电听觉机理的电子耳蜗降噪算法
- 批准号:61771320
- 批准年份:2017
- 资助金额:60.0 万元
- 项目类别:面上项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}