基于认知机理的情感语音识别基础研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61371193
  • 项目类别:
    面上项目
  • 资助金额:
    78.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0111.信号理论与信号处理
  • 结题年份:
    2017
  • 批准年份:
    2013
  • 项目状态:
    已结题
  • 起止时间:
    2014-01-01 至2017-12-31

项目摘要

Research on emotional speech recognition focuses on recognizing human emotions based on analyzing and processing speech signals. It has broad implications for harmonious human-computer interaction, distance education, robots, telemedicine and emotional adjustment etc. However, majority of current research on emotional speech recognition is approached by either the signal processing techniques or cognitive psychology perspective individually. Little research is reported by integrating two fields. The objective of the proposed project is to integrate cognitive mechanism with signal processing approaches in order to recognize human emotions effectively. Its major research contents lie in three-folds. First, a new emotional speech database will be established, and a new emotional speech feature based on human auditory perception with glottis compensation will be presented by analyzing and extracting prosodic features, auditory properties and voice mechanism. Second, the three-dimension model of emotions will be introduced into fuzzy cognitive map (FCM) to make sure the framework and initial values. Artificial bee colony (ABC) algorithm will be used to optimize the parameters of FCM. Third, on evaluation of emotional speech recognition, the proposed project will iteratively optimizing recognition network and emotional features by correlating participants' subjective results with signal processing results. In summary, the proposed project integrates theories in cognitive science and approaches in signal processing effectively. Its findings will have both theoretical contribution and practical implications.
语音情感识别是通过对人类的语音信号进行科学分析和处理以判断人的情感状态的研究,其研究成果在和谐人机交互、远程教育、机器人、远程医疗、情绪疏导等方面具有广泛的应用前景。目前关于语音情感识别的研究,多数是分别基于信号处理和认知心理学的独立研究,少见二者结合的研究报道。本项目将认知心理学和信号处理方法相结合,其主要研究内容包括:(1)构建基于认知心理学的情感语音数据库;通过分析韵律特征、听觉特性及发声机理,提出声门补偿的人耳听觉感知情感语音识别新特征;(2)将认知心理学的情感三维模型引入模糊认知图(FCM),确定FCM结构及初始权值,并用人工蜂群算法优化FCM网络的参数;(3)在识别结果评测方法方面,利用主观认知结果与信号处理结果的相关性分析,去调整优化识别网络及情感特征。总之本项目将体现认知理论与信号处理方法的有效融合,具有认知科学和信息科学的交叉研究特色,其研究成果具有理论意义和实用价值。

结项摘要

语音情感识别是目前人工智能领域的热点之一,在教育、公安、医疗、健康等方面具有广阔的应用前景。本项目主要从信号处理和认知心理学两个方向开展项目研究。按计划完成了任务,达到了预期目标。所做主要工作和创新点包括:①建立了一个实用的摘引型情感语音数据库TYUT2.0。提出了一种综合模糊评价方法对初建的情感语音库进行有效性评价和语句筛选,得到更有效的情感语音库;对每句情感语音进行PAD标注,得到对应的PAD值,用于后续研究中。②情感语音新特征的提取。考虑声门的影响,利用非线性动力学模型提取多种非线性特征,实验结果证明,使用这些特征的识别系统性能有显著提高,在德语数据库上平均识别率提高了16.49%;将HHT及Teager能量算子结合提取了多种不同的语音特征,得到了较好的结果;将新特征和传统特征融合,进一步提高了识别率。③情感语音识别模型的研究。将FCM模型和三维PAD情感模型相结合,用PAD数据来调整FCM网络权值,构成了新的e-FCM网络,实验结果表明所该模型不仅速度快,且识别率也有提高;对e-FCM网络进行了决策融合,实验结果证明,平均识别率提高了4.06%。④识别结果评测的相关性分析。从连续维度的角度利用识别网络对情感PAD值进行预测,并将预测结果与情感本身的PAD值作了相关性分析,得到相关系数分别为0.671,0.822和0.879,平均79.06%,说明了识别网络的有效性。⑤脑认知方面。从认知心理学和信号处理的角度,研究了基于EEG和ERP信号分析的情感脑认知机理。建立了TYUT2.1非言语情感数据库;研究了情感语音的时长和基频对 ERP 成分(N100,P200和N300)的影响;研究了言语的可理解性与非言语情感的 ERP 认知过程的差异;采用信号处理理论,改进压缩感知方法,并应用于单次事件ERP信号的分类中,结果表明了所提算法的有效性。本项目的特色就是体现了认知理论与信号处理方法的有效融合,具有认知科学和信息科学的交叉研究特色,其研究成果具有理论意义和实用价值。

项目成果

期刊论文数量(31)
专著数量(0)
科研奖励数量(0)
会议论文数量(8)
专利数量(2)
基于KELM决策融合的语音情感识别
  • DOI:
    10.16157/j.issn.0258-7998.165055
  • 发表时间:
    2017
  • 期刊:
    电子技术应用
  • 影响因子:
    --
  • 作者:
    张雪英;张乐;孙颖;张卫
  • 通讯作者:
    张卫
不同情感语音韵律参数间的曲线回归分析
  • DOI:
    --
  • 发表时间:
    2014
  • 期刊:
    科学技术与工程
  • 影响因子:
    --
  • 作者:
    刘星星;张雪英;孙颖
  • 通讯作者:
    孙颖
基于深度自编码网络语音识别噪声鲁棒性研究
  • DOI:
    --
  • 发表时间:
    2017
  • 期刊:
    计算机工程与应用
  • 影响因子:
    --
  • 作者:
    黄丽霞;王亚楠;张雪英;王洪翠
  • 通讯作者:
    王洪翠
相空间重构的情感语音特征提取及优化
  • DOI:
    --
  • 发表时间:
    2017
  • 期刊:
    西安电子科技大学学报(自然科学版)
  • 影响因子:
    --
  • 作者:
    孙颖;宋春晓
  • 通讯作者:
    宋春晓
不同语种及非言语情感声音的ERP研究
  • DOI:
    10.16511/j.cnki.qhdxxb.2016.22.050
  • 发表时间:
    2016
  • 期刊:
    清华大学学报(自然科学版)
  • 影响因子:
    --
  • 作者:
    畅江;张雪英;张奇萍;陈宏涛;孙颖;胡凤云
  • 通讯作者:
    胡凤云

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

OCS与烯、炔烃之间S...作用的电子密度拓扑分析
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    科学通报(Chinese Science Bulletin)
  • 影响因子:
    --
  • 作者:
    张雪英;郑世钧;曾艳丽;郝静;孟令鹏
  • 通讯作者:
    孟令鹏
废水同步脱硫脱氮关键工艺参数及微生物群落结构的研究
  • DOI:
    --
  • 发表时间:
    2017
  • 期刊:
    环境科学学报
  • 影响因子:
    --
  • 作者:
    曾勇;周俊;张雪英;董泰丽;袁月祥;李东;闫志英
  • 通讯作者:
    闫志英
基于网络爬虫的地名数据库维护方法
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    地球信息科学学报
  • 影响因子:
    --
  • 作者:
    张春菊;张雪英;朱少楠;徐希涛
  • 通讯作者:
    徐希涛
基于纠错输出编码的支持向量机在语音识别中的应用
  • DOI:
    --
  • 发表时间:
    2011
  • 期刊:
    太原理工大学学报
  • 影响因子:
    --
  • 作者:
    刘晓峰;张雪英
  • 通讯作者:
    张雪英
多类分类预选取的SVM在语音识别中的应用
  • DOI:
    --
  • 发表时间:
    2011
  • 期刊:
    计算机工程与应用
  • 影响因子:
    --
  • 作者:
    贺元元;张雪英;刘晓峰
  • 通讯作者:
    刘晓峰

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

张雪英的其他基金

不同分区下EEG-fNIRS因果脑网络分析及情感识别研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    54 万元
  • 项目类别:
    面上项目
不同分区下EEG-fNIRS因果脑网络分析及情感识别研究
  • 批准号:
    62271342
  • 批准年份:
    2022
  • 资助金额:
    54.00 万元
  • 项目类别:
    面上项目
面向语音识别的抗噪支持向量机优化算法
  • 批准号:
    61072087
  • 批准年份:
    2010
  • 资助金额:
    32.0 万元
  • 项目类别:
    面上项目
基于频率弯折小波和DZCPA特征的抗噪语音识别
  • 批准号:
    60472094
  • 批准年份:
    2004
  • 资助金额:
    18.0 万元
  • 项目类别:
    面上项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码