基于迁移学习的跨信道说话人识别研究
项目介绍
AI项目解读
基本信息
- 批准号:61105026
- 项目类别:青年科学基金项目
- 资助金额:24.0万
- 负责人:
- 依托单位:
- 学科分类:F0605.模式识别与数据挖掘
- 结题年份:2014
- 批准年份:2011
- 项目状态:已结题
- 起止时间:2012-01-01 至2014-12-31
- 项目参与者:李琳; 童峰; 林贤明; 陈万里; 李稀敏; 黄晓丹; 王薇; 梁大为;
- 关键词:
项目摘要
识别语音与模型训练语音中信道畸变的不匹配,即说话人识别的跨信道(Intersession)问题,这种不匹配会对说话人识别的性能产生很大的负面影响。本项目首次引入迁移学习(Transfer Learning)的方法,并融合说话人模型合成(SMS)算法,来解决跨信道识别率急剧下降的问题。.首先采用SMS算法得到不同信道下的说话人模型,并通过大量的实验数据来验证其依赖的假设;然后在信道数据不足情况下引入迁移学习方法,将其与SMS算法融合,来构建一个可靠的特定信道通用背景模型,并验证迁移学习方法的实效性。.针对跨信道问题,本项目进一步提出基于支持向量机的迁移学习框架,力求取得理论和关键技术的创新和突破,所取得的成果对高性能说话人识别研究具有重要的学术意义。
结项摘要
课题组紧紧围绕说话人识别方向,研究如何解决跨信道导致说话人识别性能急剧下降这一问题,着重从模型域进行改进,分别深入研究并实现支持向量机(SVM),潜在因子分析(LFA),迁移学习(Transfer Learning)等算法。其中SVM、LFA均已顺利实现,并取得较理想的实验结果。迁移学习原先采用了无监督迁移分量分析(UTCA),结合SVM,结果并不理想,可能的原因是目标域数据的覆盖面太窄,没法很广的覆盖到所有测试样例的环境。.结合国外最新研究进展,课题组找到更有效的迁移学习方法,即基于i-vector的类内协方差归一化(WCCN)和概率线性判别分析(PLDA)算法,其中WCCN把i-vector迁移到没有信道因素的新的矢量空间,然后再做Cosine距离比对,而PLDA经过信道补偿后,在得分域直接进行判决。针对新领域,PLDA的说话人空间矩阵和残差矩阵,可进一步做迁移学习,从源域的PLDA映射到目标域的PLDA。这部分工作仍在进行中。.本项目期间,课题组共发表论文10篇,其中EI检索3篇,获得发明专利授权2项,制定公安部声纹标准1项,毕业硕士研究生5名。项目研究成果应用到公安司法、市场调查等行业,取得良好的社会经济效益。
项目成果
期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(3)
专利数量(0)
采用可调波束形成器的GSC麦克风阵列语音增强方法
- DOI:--
- 发表时间:2013
- 期刊:厦门大学学报(自然科学版)
- 影响因子:--
- 作者:李芳兰;周跃海;童峰;洪青阳
- 通讯作者:洪青阳
A Robust Speaker-Adaptive and Text-Prompted Speaker Verification System
强大的说话者自适应和文本提示说话者验证系统
- DOI:10.1007/978-3-319-12484-1_43
- 发表时间:2014
- 期刊:Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics)
- 影响因子:--
- 作者:Qingyang Hong;Sheng Wang;Zhijian Liu
- 通讯作者:Zhijian Liu
采用DTW算法和语音增强的嵌入式声纹识别系统
- DOI:--
- 发表时间:2012
- 期刊:厦门大学学报(自然科学版)
- 影响因子:--
- 作者:周跃海;童峰;洪青阳
- 通讯作者:洪青阳
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
基于端到端的多语种语音识别研究
- DOI:10.16798/j.issn.1003-0530
- 发表时间:2021
- 期刊:信号处理
- 影响因子:--
- 作者:胡文轩;王秋林;李松;洪青阳;李琳
- 通讯作者:李琳
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
洪青阳的其他基金
基于图结构建模的说话人日志研究
- 批准号:62276220
- 批准年份:2022
- 资助金额:53 万元
- 项目类别:面上项目
复杂场景下的说话人特征提取及识别研究
- 批准号:61876160
- 批准年份:2018
- 资助金额:62.0 万元
- 项目类别:面上项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}