基于稀疏时频分析与二元掩蔽估计的耳语音可懂度增强研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61301295
  • 项目类别:
    青年科学基金项目
  • 资助金额:
    24.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0117.多媒体信息处理
  • 结题年份:
    2016
  • 批准年份:
    2013
  • 项目状态:
    已结题
  • 起止时间:
    2014-01-01 至2016-12-31

项目摘要

Whisper is a special voicing style with very low energy, and the conveyed information is easily concealed by noise in an adverse environment. The conventional speech enhancement algorithms, however, do not improve the intelligibility of the enhanced speech, the supervised machine learning based binary mask estimation methods also have some disadvantages. This project studies single channel speech enhancement method which aims to improve the intelligibility of the whisper in noise environment. Based on the previous work in which we find that sparse time-frequency spectrum is beneficial to whisper intelligibility improvement, this project explores theories and technologies of extracting speech energy dominated time-frequency unit through estimating the binary mask of each time-frequency unit and then reconstructing the enhanced whisper from these sparse time-frequency units in the joint sparse time-frequency domain. Major research contents include: based on oversample real-valued discrete Gabor time-frequency analysis, studying the under sample real-valued discrete Gabor transform and expansion theories to solve the stable signal reconstruction problem, and thereafter build the sparse time-frequency spectrum representation model of whisper; in order to overcome the defect of the binary mask estimation method which is based on supervised machine learning, this project will study an unsupervised binary mask estimation method using the convolution non-negative matrix factorization theory,to this end, an enhanced whisper which has large gains of intelligibility is obtained.
耳语是一种能量极低的特殊发音方式,其传递的信息易受噪声干扰而被掩蔽。传统语音增强方法无法提高耳语音可懂度,而现有的基于机器学习的二元掩蔽方法仍有不足。本项目研究噪声环境下通过去噪提高耳语音可懂度的单通道语音增强方法。该项目在我们前期工作观察到稀疏时频谱有助于提高耳语音可懂度基础上,拟于稀疏联合时频域,探索通过估计时频块的二元掩蔽值提取语音能量为主的时频块,进而利用这些稀疏时频块稳定重建增强后的耳语音的相关理论和技术。主要研究内容包括: 以过抽样实值离散Gabor时频分析为基础,研究欠抽样实值离散Gabor变换及展开理论,解决欠抽样时信号稳定重建难题,从而建立耳语音稀疏时频谱表示模型;为了克服基于有监督机器学习的二元掩蔽值估计方法的缺点,本项目还将利用卷积非负矩阵分解理论研究基于稀疏时频谱表示的无监督二元掩蔽值学习方法,最终获得可懂度得到大幅度提高的干净耳语音。

结项摘要

耳语音是一种重要信息交流方式,其发音时声带不振动,基频缺失,能量较正常音低,在噪声环境更容易受噪声干扰,因而如何提高噪声环境耳语音可懂度吸引了众多研究人员关注。本项目针对耳语音去噪进行理论分析,技术创新和系统实现。主要研究了噪声环境下时频谱密度和不同信噪比的频谱区域对耳语音可懂度的影响;为了利用实值离散Gabor变换进行耳语音频谱的更精确表示,研究了实值离散Gabor变换中稀疏分析窗的上下界,并设计和实现了一种寻找稀疏分析窗的算法。为了利用帧间相关性和噪声特性,研究出一种基于稀疏卷积非负矩阵分解的无监督耳语音去噪方法,该方法利用预先训练的噪声信息,从含噪耳语音中学习耳语音时频基,并重建耳语音,结果表明该方法可有效提高耳语音可懂度。为了更加精确估计语音能量为主的时频块,提出一种基于噪声谱约束的二值掩码估计语音增强算法,分别对先验信噪比和噪声谱估计函数进行修正;最后,根据修正后的噪声谱估计函数和先验信噪比判断出噪声谱被欠估的时频单元,估计出二值掩码值,并对相应的增强后语音时频单元进行幅度谱约束。在几种常见背景噪声的低信噪比情况下,所提算法能有效的提高耳语音可懂度。针对传统语音增强方法对压缩失真和放大失真同等对待的缺点,我们研究了一类基于非对称代价函数的单通道语音增强方法,非对称代价函数对压缩失真和放大失真区分对待,从而更有利于抑制增强后耳语音的放大失真,提高增强后语音可懂度。为了进一步提高听觉舒适性和可懂度,本项目对将增强后耳语音重建为正常音进行了初步研究,通过建立平行的正常音和耳语音的时频字典,利用卷积非负矩阵分解将增强后耳语音在耳语音时频基上进行线性表示,然后利用表示系数和正常音的时频字典重建正常音,研究结果表明,耳语音转换为正常音后,其主观听觉特性和可懂度有了一定程度改善。

项目成果

期刊论文数量(11)
专著数量(0)
科研奖励数量(0)
会议论文数量(1)
专利数量(0)
Intelligibility evaluation of enhanced whisper in joint time-frequency domain
联合时频域增强耳语清晰度评估
  • DOI:
    --
  • 发表时间:
    2014
  • 期刊:
    Journal of Southeast University (english Edition)
  • 影响因子:
    --
  • 作者:
    Zhou, Jian;Wei, Xin;Liang, Ruiyu;Zhao, Li
  • 通讯作者:
    Zhao, Li
仿人耳听觉的助听器双耳声源定位算法
  • DOI:
    10.15949/j.cnki.0371-0025.2015.03.012
  • 发表时间:
    2015
  • 期刊:
    声学学报
  • 影响因子:
    --
  • 作者:
    梁瑞宇;周健;王青云;奚吉;赵力
  • 通讯作者:
    赵力
基于噪声谱约束的二值掩码估计语音增强算法
  • DOI:
    --
  • 发表时间:
    2016
  • 期刊:
    信号处理
  • 影响因子:
    --
  • 作者:
    叶琪;陶亮;周健;王华彬
  • 通讯作者:
    王华彬
提高耳语音可懂度的非对称压缩语音增强方法
  • DOI:
    --
  • 发表时间:
    2014
  • 期刊:
    声学学报(中文版)
  • 影响因子:
    --
  • 作者:
    周健;郑文明;王青云;赵力
  • 通讯作者:
    赵力
非对称代价函数的稀疏卷积非负矩阵分解方法
  • DOI:
    --
  • 发表时间:
    2015
  • 期刊:
    信号处理
  • 影响因子:
    --
  • 作者:
    张倩敏;陶亮;周健;王华彬
  • 通讯作者:
    王华彬

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

ANAMMOX菌利用零价铁转化氨和硝酸盐实验
  • DOI:
    10.13227/j.hjkx.2015.12.029
  • 发表时间:
    2015
  • 期刊:
    环境科学
  • 影响因子:
    --
  • 作者:
    周健;黄勇;袁怡;刘忻;李祥;沈杰;杨朋兵
  • 通讯作者:
    杨朋兵
截叶铁扫帚化学成分及药理作用研究进展
  • DOI:
    10.13422/j.cnki.syfjx.2017010228
  • 发表时间:
    2017
  • 期刊:
    中国实验方剂学杂志
  • 影响因子:
    --
  • 作者:
    周健;张创峰;吕燕妮;陈芳有;张东明;魏筱华
  • 通讯作者:
    魏筱华
国土空间规划的自然要素评价与集成:进展与展望
  • DOI:
    10.16258/j.cnki.1674-5906.2021.12.019
  • 发表时间:
    2021
  • 期刊:
    生态环境学报
  • 影响因子:
    --
  • 作者:
    李平星;周健;刘申伟
  • 通讯作者:
    刘申伟
玄武岩纤维增强水泥基复合材料冲击压缩性能研究
  • DOI:
    10.13204/j.gyjz202005027
  • 发表时间:
    2020
  • 期刊:
    工业建筑
  • 影响因子:
    --
  • 作者:
    张娜;周健;徐名凤;李辉
  • 通讯作者:
    李辉
氮、磷浓度对太湖水华微囊藻(Microcystis flos-aquae)群体生长的影响
  • DOI:
    10.18307/2014.0207
  • 发表时间:
    2014
  • 期刊:
    湖泊科学
  • 影响因子:
    --
  • 作者:
    许慧萍;杨桂军;周健;秦伯强;张光生;邹华;胡细全
  • 通讯作者:
    胡细全

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码