音频信号处理中基于模型的语音与音乐信号分离算法

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    60901061
  • 项目类别:
    青年科学基金项目
  • 资助金额:
    18.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0111.信号理论与信号处理
  • 结题年份:
    2012
  • 批准年份:
    2009
  • 项目状态:
    已结题
  • 起止时间:
    2010-01-01 至2012-12-31

项目摘要

基于内容的音频信息检索是网络多媒体信息服务的关键技术之一,具有广泛的应用前景。当前音频信息检索的主要技术瓶颈之一是语音与音乐混叠信号的分离。不同信号的混叠导致语音/音乐识别与归类准确率的下降,从而降低检索结果的可靠性。本项目拟研究一种可靠的信号分离算法,用于从混叠信号中分离出语音与音乐,从而提高语音识别的准确率,最终达到可靠、高效的音频检索的目标。针对本项目所处理的音频文件的特性,我们提出一种基于模型的分离算法。首先通过音频分割算法在一个音频文件中分割出纯语音、纯音乐、以及语音与音乐混叠信号。在此基础上,通过信号分析与建模技术,获得关于纯语音的和纯音乐的可区分、可分离的特征参数及其模型。根据同一段音频流内同类信号之间的相关性,这些模型提供了混叠信号对应成分的先验知识。利用这些先验知识,实现语音与音乐信号的有效分离。

结项摘要

以语音识别、音乐分类等为基础的音频内容的分析与识别是网络多媒体信息服务的关键技术之一。不同音频源信号的混叠与相互干扰是该技术广泛应用的主要瓶颈。本项目针对这一关键问题,从可靠的音频分割、噪声估计与分析建模、语音与音乐信号的特征空间矩阵分析、语音与干扰信号源分离等方面进行了深入的研究,针对不同的噪声源提出了若干个语音分离与增强算法。特别地,着眼于提高语音识别率这一最终目标,在基于非负矩阵分解的语音分离算法中,引入语音识别模型构造基于语音识别似然率成绩(Viterbi score)的代价函数,实现了有效的语音与音乐信号的分离。一般来说,语音分离算法在剔除干扰信号的同时往往带来一定程度的语音失真,这导致增强后的语音并不能直接带来语音识别率的提高。本项目所提算法实现了语音增强和语音识别的有机统一。进一步揭示了语音识别似然率成绩作为语音识别结果置信测度的科学性,对基于统计模型的现代模式识别具有普遍性的指导意义。.本项目具体研究成果包括出版语音处理专著1本,期刊论文3篇,会议论文9篇;论文检索方面:SCI 检索1篇,EI 检索7篇;培养青年学术骨干2人,硕士研究生6人(毕业3人、在读3人)。

项目成果

期刊论文数量(3)
专著数量(1)
科研奖励数量(0)
会议论文数量(9)
专利数量(0)
Robust Speaker Recognition Using Denoised Vocal Source and Vocal Tract Features
使用去噪声源和声道特征的鲁棒说话人识别
  • DOI:
    10.1109/tasl.2010.2045800
  • 发表时间:
    2011-01-01
  • 期刊:
    IEEE TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING
  • 影响因子:
    --
  • 作者:
    Wang, Ning;Ching, P. C.;Lee, Tan
  • 通讯作者:
    Lee, Tan
基于模型在线更新和平滑处理的音乐分割算法
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    深圳大学学报(理工版)
  • 影响因子:
    --
  • 作者:
    郑能恒;张亚磊;李霞
  • 通讯作者:
    李霞
自适应GMM聚类的SVM话者确认
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    小型微型计算机系统
  • 影响因子:
    --
  • 作者:
    刘明辉;戴蓓倩;黄中伟
  • 通讯作者:
    黄中伟

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

基于多目标联合优化的语音增强方法研究
  • DOI:
    --
  • 发表时间:
    2021
  • 期刊:
    信号处理
  • 影响因子:
    --
  • 作者:
    谢福仕;康迂勇;施明月;郑能恒
  • 通讯作者:
    郑能恒

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

郑能恒的其他基金

基于电刺激信号信噪比估计与电听觉机理的电子耳蜗降噪算法
  • 批准号:
    61771320
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码