基于迁移学习的跨信道说话人识别研究

结题报告

项目介绍

AI项目解读

基本信息

批准号：
61105026
项目类别：
青年科学基金项目
资助金额：
24.0万
负责人：
洪青阳
依托单位：
厦门大学
学科分类：
F0605.模式识别与数据挖掘
结题年份：
2014
批准年份：
2011
项目状态：
已结题
起止时间：
2012-01-01 至2014-12-31

项目参与者：
李琳；童峰；林贤明；陈万里；李稀敏；黄晓丹；王薇；梁大为；
关键词：
跨信道说话人识别说话人模型合成迁移学习支持向量机

项目摘要

识别语音与模型训练语音中信道畸变的不匹配，即说话人识别的跨信道（Intersession）问题，这种不匹配会对说话人识别的性能产生很大的负面影响。本项目首次引入迁移学习（Transfer Learning）的方法，并融合说话人模型合成(SMS）算法，来解决跨信道识别率急剧下降的问题。.首先采用SMS算法得到不同信道下的说话人模型，并通过大量的实验数据来验证其依赖的假设；然后在信道数据不足情况下引入迁移学习方法，将其与SMS算法融合，来构建一个可靠的特定信道通用背景模型，并验证迁移学习方法的实效性。.针对跨信道问题，本项目进一步提出基于支持向量机的迁移学习框架，力求取得理论和关键技术的创新和突破，所取得的成果对高性能说话人识别研究具有重要的学术意义。

结项摘要

课题组紧紧围绕说话人识别方向，研究如何解决跨信道导致说话人识别性能急剧下降这一问题，着重从模型域进行改进，分别深入研究并实现支持向量机(SVM)，潜在因子分析(LFA)，迁移学习（Transfer Learning）等算法。其中SVM、LFA均已顺利实现，并取得较理想的实验结果。迁移学习原先采用了无监督迁移分量分析（UTCA），结合SVM，结果并不理想，可能的原因是目标域数据的覆盖面太窄，没法很广的覆盖到所有测试样例的环境。.结合国外最新研究进展，课题组找到更有效的迁移学习方法，即基于i-vector的类内协方差归一化(WCCN)和概率线性判别分析(PLDA)算法，其中WCCN把i-vector迁移到没有信道因素的新的矢量空间，然后再做Cosine距离比对，而PLDA经过信道补偿后，在得分域直接进行判决。针对新领域，PLDA的说话人空间矩阵和残差矩阵，可进一步做迁移学习，从源域的PLDA映射到目标域的PLDA。这部分工作仍在进行中。.本项目期间，课题组共发表论文10篇，其中EI检索3篇，获得发明专利授权2项，制定公安部声纹标准1项，毕业硕士研究生5名。项目研究成果应用到公安司法、市场调查等行业，取得良好的社会经济效益。

项目成果

期刊论文数量（3）

专著数量（0）

科研奖励数量（0）

会议论文数量（3）

专利数量（0）

采用可调波束形成器的GSC麦克风阵列语音增强方法

DOI：
--
发表时间：
2013
期刊：
厦门大学学报(自然科学版)
影响因子：
--
作者：
李芳兰;周跃海;童峰;洪青阳
通讯作者：
洪青阳

A Robust Speaker-Adaptive and Text-Prompted Speaker Verification System

强大的说话者自适应和文本提示说话者验证系统

DOI：
10.1007/978-3-319-12484-1_43
发表时间：
2014
期刊：
Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics)
影响因子：
--
作者：
Qingyang Hong;Sheng Wang;Zhijian Liu
通讯作者：
Zhijian Liu

采用DTW算法和语音增强的嵌入式声纹识别系统

DOI：
--
发表时间：
2012
期刊：
厦门大学学报(自然科学版)
影响因子：
--
作者：
周跃海;童峰;洪青阳
通讯作者：
洪青阳

数据更新时间：{{ journalArticles.updateTime }}

DOI：
{{ item.doi || "--"}}
发表时间：
{{ item.publish_year || "--" }}
期刊：
{{ item.journal_name }}
影响因子：
{{ item.factor || "--"}}
作者：
{{ item.authors }}
通讯作者：
{{ item.author }}

数据更新时间：{{ journalArticles.updateTime }}

作者：
{{ item.authors }}

数据更新时间：{{ monograph.updateTime }}

作者：
{{ item.authors }}

数据更新时间：{{ sciAawards.updateTime }}

作者：
{{ item.authors }}

数据更新时间：{{ conferencePapers.updateTime }}

作者：
{{ item.authors }}

数据更新时间：{{ patent.updateTime }}

其他文献

基于端到端的多语种语音识别研究

DOI：
10.16798/j.issn.1003-0530
发表时间：
2021
期刊：
信号处理
影响因子：
--
作者：
胡文轩;王秋林;李松;洪青阳;李琳
通讯作者：
李琳

其他文献

DOI：
{{ item.doi || "--" }}
发表时间：
{{ item.publish_year || "--"}}
期刊：
{{ item.journal_name }}
影响因子：
{{ item.factor || "--" }}
作者：
{{ item.authors }}
通讯作者：
{{ item.author }}

内容获取失败，请点击重试

重试

联系客服

开始分析

查看分析示例

此项目为已结题，我已根据课题信息分析并撰写以下内容，帮您拓宽课题思路：

AI项目思路

AI技术路线图

洪青阳的其他基金

基于图结构建模的说话人日志研究

批准号：
62276220
批准年份：
2022
资助金额：
53 万元
项目类别：
面上项目

复杂场景下的说话人特征提取及识别研究

批准号：
61876160
批准年份：
2018
资助金额：
62.0 万元
项目类别：
面上项目

相似国自然基金

批准号：
{{ item.ratify_no }}
批准年份：
{{ item.approval_year }}
资助金额：
{{ item.support_num }}
项目类别：
{{ item.project_type }}

相似海外基金

批准号：
{{ item.ratify_no }}
财政年份：
{{ item.approval_year }}
资助金额：
{{ item.support_num }}
项目类别：
{{ item.project_type }}

会员权益说明：

基于迁移学习的跨信道说话人识别研究

基本信息

项目摘要

结项摘要

项目成果

其他文献

其他文献

AI项目摘要

AI项目思路

AI技术路线图

洪青阳的其他基金

相似国自然基金

相似海外基金

AI项目解读示例

AI项目摘要：

AI项目思路：

AI技术路线图