会议音频中的声学事件检测及说话人分析方法研究
项目介绍
AI项目解读
基本信息
- 批准号:61101160
- 项目类别:青年科学基金项目
- 资助金额:25.0万
- 负责人:
- 依托单位:
- 学科分类:F0111.信号理论与信号处理
- 结题年份:2014
- 批准年份:2011
- 项目状态:已结题
- 起止时间:2012-01-01 至2014-12-31
- 项目参与者:潘伟锵; 林沛; 李韬; 何俊; 李威; 张雪源; 涂悦; 黄鹏飞; 陈芬;
- 关键词:
项目摘要
针对目前会议音频内容分析策略所存在的声学事件检测缺乏普适性、重叠语音段及短语音段没被有效处理、重要语义信息丢失等问题,本项目主要探索会议音频内容分析与理解的新方法,重点研究以下四个方面的问题:1)普适的声学事件检测;2)重叠语音段检测及其主说话人提取;3)短语音段的说话人归类处理;4)重要人物分析。旨在通过上述四个问题的研究,进一步提高说话人分割聚类、语义分析系统的性能,弥补当前会议音频处理策略所存在的缺陷。. 本项目的研究内容是语音及音频信号处理、模式识别与理解等领域的研究热点,理论上具有一定的挑战性,在应用上是研发音频内容分析及检索系统的重要基础。同时,对提高音频处理系统的实用性,加快我国信息产业的发展具有重要作用。预期发表三大索引收录论文3~5篇,申报专利1项。
结项摘要
本项目主要探索了会议音频内容分析与理解的新方法,在音频事件检测、重叠语音检测、说话人聚类、多通道语音说话人日志、说话人角色聚类、关键说话人估计等方面做了较为深入的研究,并提出了一些具有借鉴意义的方法,有效解决了目前会议音频内容分析策略所存在的问题。本项目的研究成果能直接应用于音频内容检索系统、说话人检索系统及多说话人语音识别系统中,具有广泛的应用前景。. 本项目资助完成2篇SCI论文、21篇EI论文和6项国家发明专利,部分资助培养3名博士研究生和2名硕士研究生。通过开展本项目的研究工作,课题组成员特别是项目负责人积累了一定的项目研究经验,为日后开展科研工作奠定了坚实的基础。
项目成果
期刊论文数量(13)
专著数量(0)
科研奖励数量(0)
会议论文数量(10)
专利数量(0)
基于改进PNCC特征和两步区分性训练的录音设备识别方法
- DOI:--
- 发表时间:2014
- 期刊:电子学报
- 影响因子:--
- 作者:贺前华;王志锋;Ale;er I Rudnicky;朱铮宇;李新超
- 通讯作者:李新超
Collusion-resistant fingerprinting based on OFDM-IDMA modulation
基于 OFDM-IDMA 调制的防共谋指纹识别
- DOI:10.1049/el.2012.3451
- 发表时间:2013
- 期刊:Electronics Letters
- 影响因子:1.1
- 作者:Pei Lin;Qianhua He;Yanxiong Li
- 通讯作者:Yanxiong Li
基于随机映射的声纹模板保护方法
- DOI:--
- 发表时间:2013
- 期刊:华南理工大学学报(自然科学版)
- 影响因子:--
- 作者:朱华虹;贺前华;李艳雄;张雪源
- 通讯作者:张雪源
基于特征均值距离的短语音段说话人聚类算法
- DOI:--
- 发表时间:2012
- 期刊:电子与信息学报
- 影响因子:--
- 作者:李艳雄;吴永;贺前华
- 通讯作者:贺前华
Fast speaker clustering using distance of feature matrix mean and adaptive convergence threshold
使用特征矩阵均值距离和自适应收敛阈值进行快速说话人聚类
- DOI:10.1049/iet-spr.2013.0340
- 发表时间:2014
- 期刊:IET Signal Processing
- 影响因子:1.7
- 作者:Yanxiong Li;Hai Jin;Wei Li;Qianhua He;Zhengyu Zhu;Xiaohui Feng
- 通讯作者:Xiaohui Feng
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
使用多流分层深度神经网络抽取深层特征
- DOI:--
- 发表时间:2016
- 期刊:Multimedia Tools and Applications
- 影响因子:3.6
- 作者:李艳雄
- 通讯作者:李艳雄
复杂环境下基于准干净语音的音质评价方法
- DOI:--
- 发表时间:2016
- 期刊:华中科技大学学报(自然科学版)
- 影响因子:--
- 作者:周伟力;贺前华;李艳雄;刘杨
- 通讯作者:刘杨
基于时空相关度融合的语音唇动一致性检测算法
- DOI:--
- 发表时间:2014
- 期刊:电子学报
- 影响因子:--
- 作者:奉小慧;叶婉玲;李艳雄;杨继臣
- 通讯作者:杨继臣
基于特征子集和HMM参数同步优化的区分语音与非语音事件的遗传算法
- DOI:--
- 发表时间:--
- 期刊:International Journal of Speech Technology
- 影响因子:--
- 作者:李艳雄;Sam Kwong;贺前华;何俊;杨继臣
- 通讯作者:杨继臣
一种基于倒排索引的音频检索方法
- DOI:--
- 发表时间:--
- 期刊:电子与信息学报
- 影响因子:--
- 作者:张雪源;贺前华;李艳雄;叶婉玲
- 通讯作者:叶婉玲
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
李艳雄的其他基金
开放声学环境下小样本类增量声音事件识别方法研究
- 批准号:62371195
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
复杂音频的声音事件无监督检测
- 批准号:62111530145
- 批准年份:2021
- 资助金额:2.4 万元
- 项目类别:国际(地区)合作与交流项目
复杂音频的声音事件无监督检测
- 批准号:
- 批准年份:2020
- 资助金额:万元
- 项目类别:国际(地区)合作与交流项目
基于深度学习的复杂音频说话人分析关键技术研究
- 批准号:61771200
- 批准年份:2017
- 资助金额:59.0 万元
- 项目类别:面上项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}