基于零空间追踪的单通道语音分离方法研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61861005
  • 项目类别:
    地区科学基金项目
  • 资助金额:
    39.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0111.信号理论与信号处理
  • 结题年份:
    2022
  • 批准年份:
    2018
  • 项目状态:
    已结题
  • 起止时间:
    2019-01-01 至2022-12-31

项目摘要

Speech separation is an important and basic task of machine hearing, single channel speech separation, especially unsupervised single-channel speech blind source separation method, is the most difficult problems in speech separation. Through the analysis of the classical computational auditory scene analysis of CASA method, it is found that the time-frequency unit inflexibility problem and the defect of its frequency domain resolution are not high, In view of the existing problems, we propose NSP-CASA method based on Null space pursuit to give NSP time-frequency expression. To simulate the human auditory process, after a period of preprocessing of speech data, the multi-pitch information or multi-voice characteristics (such as resonance peak information) are obtained,and then, by using the prior information constraint of these fundamental frequency or speech characteristics, an NSP set operator with adaptive decomposition attribute will be constructed to realize high resolution speech separation. The results of pre-research show that NSP design and implementation with narrow band and determined frequency constraint are feasible technology ideas. This method can be applied to the automatic speech separation and recognition of simultaneous voice environment, human voice and music sound separation, voice denoising, the application of intelligent hearing aid, and the web-based multimedia retrieval, It has an important and extensive application prospect.
语音分离是实现机器听觉的一个重要而基础性的任务,单通道语音分离,特别是无监督的单通道语音盲源分离方法,是语音分离中最为困难的问题。我们通过对经典的计算听觉场景分析CASA方法的研究发现其存在时频表达的时频单元僵化问题以及其频域分辨率不高的缺陷,针对其存在的问题,我们提出了基于零空间追踪NSP时频表达的NSP-CASA方法,拟模拟人类的听觉过程,先经过一段时间的语音数据预处理,得到其中所包含的多基频信息或多语音特征(例如共振峰信息),利用这些基频或语音特征的先验信息约束,去构造具有自适应分解属性的基于先验信息约束的NSP集合算子,以实现高分辨率的语音分离。预研的结果表明,应用窄带和确知频率约束的NSP设计与实现是可行的技术思路。 该方法可以应用于多人同时发声环境的自动语音分离和识别,人声和音乐声分离,语音去噪,智能助听器的应用,以及基于网络的多媒体检索;具有重要而广泛的应用前景

结项摘要

我们首先完成了基于小波/基于同步压缩小波变换/VMD的双说话人基频提取及识别,可以有效提取混合语音的基频信息和帧属性信息,为后续的单通道语音分离提供具有先验信息的指导;其次我们完成了基于确知频率的NSP(α-NSP)分解方法的研究;完成了基于α-NSP方法的单通道语音分离研究;更进一步的针对语音信号准周期谱约束的特点,我们完成了针对语音信号本质分解的基于多算子和频谱约束的MOSC-NSP (Multi-Operator and Spectrum Constraint based NSP)分解方法研究;在MOSC-NSP 分解方法的基础上, 应用集合MOSC-NSP算子,我们进行了双说话人语音分离研究;实验结果表明,该方法最高可实现SAR (Signal to Artifact Ratio,信号伪像比)为 7.33dB,SIR(Signal to Interference Ratio,信号干扰比)为6.69dB,SDR(Signal-to-distortion ratio,信号失真比)为6.58的分离效果,优于经典的CASA/NMF等单通道语音分离方法。同时为了参照对比,我们开展了基于深度学习的单通道语音分离方法研究,着重于研究不同结构的深度学习神经网络和深度网络自编码解码的相关构架,取得了非常好的单通道语音分离效果。深度网络方向的研究,给我们在信号的特征提取、特征空间的表达方向提供了更深刻的理解和更广阔的更有效的技术手段;而NSP相关的分解方法研究成果,给我们提供了信号及语音信号本质分解的新的有效的工具。

项目成果

期刊论文数量(7)
专著数量(0)
科研奖励数量(0)
会议论文数量(5)
专利数量(1)
基于端到端深度神经网络的语音情感识别研究
  • DOI:
    --
  • 发表时间:
    2021
  • 期刊:
    广西师范大学学报( 自然科学版)
  • 影响因子:
    --
  • 作者:
    吕惠炼;胡维平
  • 通讯作者:
    胡维平
基于深度学习的语声抑郁识别
  • DOI:
    10.11684/j.issn.1000-310x.2022.05.020
  • 发表时间:
    2022
  • 期刊:
    应用声学
  • 影响因子:
    --
  • 作者:
    吴情;胡维平;陈丹丹;肖婷
  • 通讯作者:
    肖婷
基于NSP的微弱频率确知信号的提取
  • DOI:
    10.12263/dzxb.20190147
  • 发表时间:
    2021
  • 期刊:
    电子学报
  • 影响因子:
    --
  • 作者:
    胡维平;胡晰远
  • 通讯作者:
    胡晰远
Pathological Voice Detection Based on Phase Reconstitution and Convolutional Neural Network
基于相位重构和卷积神经网络的病态语音检测
  • DOI:
    10.1016/j.jvoice.2022.08.028
  • 发表时间:
    2022
  • 期刊:
    Journal of Voice
  • 影响因子:
    2.2
  • 作者:
    Deli Fu;Xuehui Zhang;D;an Chen;Weiping Hu
  • 通讯作者:
    Weiping Hu
一种基于聚类的门控卷积网络语声分离方法
  • DOI:
    --
  • 发表时间:
    2022
  • 期刊:
    应用声学
  • 影响因子:
    --
  • 作者:
    罗宇;胡维平
  • 通讯作者:
    胡维平

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

湖泊水动力对水生植物分布的影响
  • DOI:
    --
  • 发表时间:
    2019
  • 期刊:
    生态学报
  • 影响因子:
    --
  • 作者:
    朱金格;胡维平;刘鑫;邓建才
  • 通讯作者:
    邓建才
不同水深和底质对太湖马来眼子菜(Potamogeton malaianus)生长的影响
  • DOI:
    --
  • 发表时间:
    2008
  • 期刊:
    生态学报
  • 影响因子:
    --
  • 作者:
    陈桥;胡维平;翟水晶;邓建才;刘伟龙;韩红娟
  • 通讯作者:
    韩红娟
长荡湖近61a降水量演化特征
  • DOI:
    --
  • 发表时间:
    2016
  • 期刊:
    长江流域资源与环境
  • 影响因子:
    --
  • 作者:
    彭俊翔;伍永年;胡维平;邓建才
  • 通讯作者:
    邓建才
不同底质和透明度下马来眼子菜的表型可塑性研究
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    生态环境
  • 影响因子:
    --
  • 作者:
    胡维平;刘伟龙;陈桥
  • 通讯作者:
    陈桥
太湖水体中碱性磷酸酶的空间分布及生态意义
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    环境科学
  • 影响因子:
    --
  • 作者:
    胡维平;翟淑华;陈效民;周小平;邓建才;路娜
  • 通讯作者:
    路娜

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

胡维平的其他基金

基于正常及病态嗓音的声带代偿功能研究
  • 批准号:
    61362003
  • 批准年份:
    2013
  • 资助金额:
    43.0 万元
  • 项目类别:
    地区科学基金项目
基于零空间追踪的信号自适应分解及其应用方法研究
  • 批准号:
    61062011
  • 批准年份:
    2010
  • 资助金额:
    19.0 万元
  • 项目类别:
    地区科学基金项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码