会议音频中的声学事件检测及说话人分析方法研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61101160
  • 项目类别:
    青年科学基金项目
  • 资助金额:
    25.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0111.信号理论与信号处理
  • 结题年份:
    2014
  • 批准年份:
    2011
  • 项目状态:
    已结题
  • 起止时间:
    2012-01-01 至2014-12-31

项目摘要

针对目前会议音频内容分析策略所存在的声学事件检测缺乏普适性、重叠语音段及短语音段没被有效处理、重要语义信息丢失等问题,本项目主要探索会议音频内容分析与理解的新方法,重点研究以下四个方面的问题:1)普适的声学事件检测;2)重叠语音段检测及其主说话人提取;3)短语音段的说话人归类处理;4)重要人物分析。旨在通过上述四个问题的研究,进一步提高说话人分割聚类、语义分析系统的性能,弥补当前会议音频处理策略所存在的缺陷。. 本项目的研究内容是语音及音频信号处理、模式识别与理解等领域的研究热点,理论上具有一定的挑战性,在应用上是研发音频内容分析及检索系统的重要基础。同时,对提高音频处理系统的实用性,加快我国信息产业的发展具有重要作用。预期发表三大索引收录论文3~5篇,申报专利1项。

结项摘要

本项目主要探索了会议音频内容分析与理解的新方法,在音频事件检测、重叠语音检测、说话人聚类、多通道语音说话人日志、说话人角色聚类、关键说话人估计等方面做了较为深入的研究,并提出了一些具有借鉴意义的方法,有效解决了目前会议音频内容分析策略所存在的问题。本项目的研究成果能直接应用于音频内容检索系统、说话人检索系统及多说话人语音识别系统中,具有广泛的应用前景。. 本项目资助完成2篇SCI论文、21篇EI论文和6项国家发明专利,部分资助培养3名博士研究生和2名硕士研究生。通过开展本项目的研究工作,课题组成员特别是项目负责人积累了一定的项目研究经验,为日后开展科研工作奠定了坚实的基础。

项目成果

期刊论文数量(13)
专著数量(0)
科研奖励数量(0)
会议论文数量(10)
专利数量(0)
基于改进PNCC特征和两步区分性训练的录音设备识别方法
  • DOI:
    --
  • 发表时间:
    2014
  • 期刊:
    电子学报
  • 影响因子:
    --
  • 作者:
    贺前华;王志锋;Ale;er I Rudnicky;朱铮宇;李新超
  • 通讯作者:
    李新超
Collusion-resistant fingerprinting based on OFDM-IDMA modulation
基于 OFDM-IDMA 调制的防共谋指纹识别
  • DOI:
    10.1049/el.2012.3451
  • 发表时间:
    2013
  • 期刊:
    Electronics Letters
  • 影响因子:
    1.1
  • 作者:
    Pei Lin;Qianhua He;Yanxiong Li
  • 通讯作者:
    Yanxiong Li
基于随机映射的声纹模板保护方法
  • DOI:
    --
  • 发表时间:
    2013
  • 期刊:
    华南理工大学学报(自然科学版)
  • 影响因子:
    --
  • 作者:
    朱华虹;贺前华;李艳雄;张雪源
  • 通讯作者:
    张雪源
基于特征均值距离的短语音段说话人聚类算法
  • DOI:
    --
  • 发表时间:
    2012
  • 期刊:
    电子与信息学报
  • 影响因子:
    --
  • 作者:
    李艳雄;吴永;贺前华
  • 通讯作者:
    贺前华
Fast speaker clustering using distance of feature matrix mean and adaptive convergence threshold
使用特征矩阵均值距离和自适应收敛阈值进行快速说话人聚类
  • DOI:
    10.1049/iet-spr.2013.0340
  • 发表时间:
    2014
  • 期刊:
    IET Signal Processing
  • 影响因子:
    1.7
  • 作者:
    Yanxiong Li;Hai Jin;Wei Li;Qianhua He;Zhengyu Zhu;Xiaohui Feng
  • 通讯作者:
    Xiaohui Feng

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

使用多流分层深度神经网络抽取深层特征
  • DOI:
    --
  • 发表时间:
    2016
  • 期刊:
    Multimedia Tools and Applications
  • 影响因子:
    3.6
  • 作者:
    李艳雄
  • 通讯作者:
    李艳雄
复杂环境下基于准干净语音的音质评价方法
  • DOI:
    --
  • 发表时间:
    2016
  • 期刊:
    华中科技大学学报(自然科学版)
  • 影响因子:
    --
  • 作者:
    周伟力;贺前华;李艳雄;刘杨
  • 通讯作者:
    刘杨
基于时空相关度融合的语音唇动一致性检测算法
  • DOI:
    --
  • 发表时间:
    2014
  • 期刊:
    电子学报
  • 影响因子:
    --
  • 作者:
    奉小慧;叶婉玲;李艳雄;杨继臣
  • 通讯作者:
    杨继臣
基于特征子集和HMM参数同步优化的区分语音与非语音事件的遗传算法
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    International Journal of Speech Technology
  • 影响因子:
    --
  • 作者:
    李艳雄;Sam Kwong;贺前华;何俊;杨继臣
  • 通讯作者:
    杨继臣
一种基于倒排索引的音频检索方法
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    电子与信息学报
  • 影响因子:
    --
  • 作者:
    张雪源;贺前华;李艳雄;叶婉玲
  • 通讯作者:
    叶婉玲

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

李艳雄的其他基金

开放声学环境下小样本类增量声音事件识别方法研究
  • 批准号:
    62371195
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
复杂音频的声音事件无监督检测
  • 批准号:
    62111530145
  • 批准年份:
    2021
  • 资助金额:
    2.4 万元
  • 项目类别:
    国际(地区)合作与交流项目
复杂音频的声音事件无监督检测
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    万元
  • 项目类别:
    国际(地区)合作与交流项目
基于深度学习的复杂音频说话人分析关键技术研究
  • 批准号:
    61771200
  • 批准年份:
    2017
  • 资助金额:
    59.0 万元
  • 项目类别:
    面上项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码