基于认知机理的情感语音识别基础研究
项目介绍
AI项目解读
基本信息
- 批准号:61371193
- 项目类别:面上项目
- 资助金额:78.0万
- 负责人:
- 依托单位:
- 学科分类:F0111.信号理论与信号处理
- 结题年份:2017
- 批准年份:2013
- 项目状态:已结题
- 起止时间:2014-01-01 至2017-12-31
- 项目参与者:孙颖; 张卫; 张奇萍; 宁爱平; 黄丽霞; 任鹏辉; 何淑琳; 刘星星; 畅江;
- 关键词:
项目摘要
Research on emotional speech recognition focuses on recognizing human emotions based on analyzing and processing speech signals. It has broad implications for harmonious human-computer interaction, distance education, robots, telemedicine and emotional adjustment etc. However, majority of current research on emotional speech recognition is approached by either the signal processing techniques or cognitive psychology perspective individually. Little research is reported by integrating two fields. The objective of the proposed project is to integrate cognitive mechanism with signal processing approaches in order to recognize human emotions effectively. Its major research contents lie in three-folds. First, a new emotional speech database will be established, and a new emotional speech feature based on human auditory perception with glottis compensation will be presented by analyzing and extracting prosodic features, auditory properties and voice mechanism. Second, the three-dimension model of emotions will be introduced into fuzzy cognitive map (FCM) to make sure the framework and initial values. Artificial bee colony (ABC) algorithm will be used to optimize the parameters of FCM. Third, on evaluation of emotional speech recognition, the proposed project will iteratively optimizing recognition network and emotional features by correlating participants' subjective results with signal processing results. In summary, the proposed project integrates theories in cognitive science and approaches in signal processing effectively. Its findings will have both theoretical contribution and practical implications.
语音情感识别是通过对人类的语音信号进行科学分析和处理以判断人的情感状态的研究,其研究成果在和谐人机交互、远程教育、机器人、远程医疗、情绪疏导等方面具有广泛的应用前景。目前关于语音情感识别的研究,多数是分别基于信号处理和认知心理学的独立研究,少见二者结合的研究报道。本项目将认知心理学和信号处理方法相结合,其主要研究内容包括:(1)构建基于认知心理学的情感语音数据库;通过分析韵律特征、听觉特性及发声机理,提出声门补偿的人耳听觉感知情感语音识别新特征;(2)将认知心理学的情感三维模型引入模糊认知图(FCM),确定FCM结构及初始权值,并用人工蜂群算法优化FCM网络的参数;(3)在识别结果评测方法方面,利用主观认知结果与信号处理结果的相关性分析,去调整优化识别网络及情感特征。总之本项目将体现认知理论与信号处理方法的有效融合,具有认知科学和信息科学的交叉研究特色,其研究成果具有理论意义和实用价值。
结项摘要
语音情感识别是目前人工智能领域的热点之一,在教育、公安、医疗、健康等方面具有广阔的应用前景。本项目主要从信号处理和认知心理学两个方向开展项目研究。按计划完成了任务,达到了预期目标。所做主要工作和创新点包括:①建立了一个实用的摘引型情感语音数据库TYUT2.0。提出了一种综合模糊评价方法对初建的情感语音库进行有效性评价和语句筛选,得到更有效的情感语音库;对每句情感语音进行PAD标注,得到对应的PAD值,用于后续研究中。②情感语音新特征的提取。考虑声门的影响,利用非线性动力学模型提取多种非线性特征,实验结果证明,使用这些特征的识别系统性能有显著提高,在德语数据库上平均识别率提高了16.49%;将HHT及Teager能量算子结合提取了多种不同的语音特征,得到了较好的结果;将新特征和传统特征融合,进一步提高了识别率。③情感语音识别模型的研究。将FCM模型和三维PAD情感模型相结合,用PAD数据来调整FCM网络权值,构成了新的e-FCM网络,实验结果表明所该模型不仅速度快,且识别率也有提高;对e-FCM网络进行了决策融合,实验结果证明,平均识别率提高了4.06%。④识别结果评测的相关性分析。从连续维度的角度利用识别网络对情感PAD值进行预测,并将预测结果与情感本身的PAD值作了相关性分析,得到相关系数分别为0.671,0.822和0.879,平均79.06%,说明了识别网络的有效性。⑤脑认知方面。从认知心理学和信号处理的角度,研究了基于EEG和ERP信号分析的情感脑认知机理。建立了TYUT2.1非言语情感数据库;研究了情感语音的时长和基频对 ERP 成分(N100,P200和N300)的影响;研究了言语的可理解性与非言语情感的 ERP 认知过程的差异;采用信号处理理论,改进压缩感知方法,并应用于单次事件ERP信号的分类中,结果表明了所提算法的有效性。本项目的特色就是体现了认知理论与信号处理方法的有效融合,具有认知科学和信息科学的交叉研究特色,其研究成果具有理论意义和实用价值。
项目成果
期刊论文数量(31)
专著数量(0)
科研奖励数量(0)
会议论文数量(8)
专利数量(2)
基于KELM决策融合的语音情感识别
- DOI:10.16157/j.issn.0258-7998.165055
- 发表时间:2017
- 期刊:电子技术应用
- 影响因子:--
- 作者:张雪英;张乐;孙颖;张卫
- 通讯作者:张卫
不同情感语音韵律参数间的曲线回归分析
- DOI:--
- 发表时间:2014
- 期刊:科学技术与工程
- 影响因子:--
- 作者:刘星星;张雪英;孙颖
- 通讯作者:孙颖
基于深度自编码网络语音识别噪声鲁棒性研究
- DOI:--
- 发表时间:2017
- 期刊:计算机工程与应用
- 影响因子:--
- 作者:黄丽霞;王亚楠;张雪英;王洪翠
- 通讯作者:王洪翠
相空间重构的情感语音特征提取及优化
- DOI:--
- 发表时间:2017
- 期刊:西安电子科技大学学报(自然科学版)
- 影响因子:--
- 作者:孙颖;宋春晓
- 通讯作者:宋春晓
不同语种及非言语情感声音的ERP研究
- DOI:10.16511/j.cnki.qhdxxb.2016.22.050
- 发表时间:2016
- 期刊:清华大学学报(自然科学版)
- 影响因子:--
- 作者:畅江;张雪英;张奇萍;陈宏涛;孙颖;胡凤云
- 通讯作者:胡凤云
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
OCS与烯、炔烃之间S...作用的电子密度拓扑分析
- DOI:--
- 发表时间:--
- 期刊:科学通报(Chinese Science Bulletin)
- 影响因子:--
- 作者:张雪英;郑世钧;曾艳丽;郝静;孟令鹏
- 通讯作者:孟令鹏
废水同步脱硫脱氮关键工艺参数及微生物群落结构的研究
- DOI:--
- 发表时间:2017
- 期刊:环境科学学报
- 影响因子:--
- 作者:曾勇;周俊;张雪英;董泰丽;袁月祥;李东;闫志英
- 通讯作者:闫志英
基于网络爬虫的地名数据库维护方法
- DOI:--
- 发表时间:--
- 期刊:地球信息科学学报
- 影响因子:--
- 作者:张春菊;张雪英;朱少楠;徐希涛
- 通讯作者:徐希涛
基于纠错输出编码的支持向量机在语音识别中的应用
- DOI:--
- 发表时间:2011
- 期刊:太原理工大学学报
- 影响因子:--
- 作者:刘晓峰;张雪英
- 通讯作者:张雪英
多类分类预选取的SVM在语音识别中的应用
- DOI:--
- 发表时间:2011
- 期刊:计算机工程与应用
- 影响因子:--
- 作者:贺元元;张雪英;刘晓峰
- 通讯作者:刘晓峰
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}

内容获取失败,请点击重试

查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图

请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
张雪英的其他基金
不同分区下EEG-fNIRS因果脑网络分析及情感识别研究
- 批准号:
- 批准年份:2022
- 资助金额:54 万元
- 项目类别:面上项目
不同分区下EEG-fNIRS因果脑网络分析及情感识别研究
- 批准号:62271342
- 批准年份:2022
- 资助金额:54.00 万元
- 项目类别:面上项目
面向语音识别的抗噪支持向量机优化算法
- 批准号:61072087
- 批准年份:2010
- 资助金额:32.0 万元
- 项目类别:面上项目
基于频率弯折小波和DZCPA特征的抗噪语音识别
- 批准号:60472094
- 批准年份:2004
- 资助金额:18.0 万元
- 项目类别:面上项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}