Development of emotion recognition system by transfer learning for various speeches

通过各种语音的迁移学习开发情感识别系统

基本信息

  • 批准号:
    22K12087
  • 负责人:
  • 金额:
    $ 2.58万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2022
  • 资助国家:
    日本
  • 起止时间:
    2022-04-01 至 2025-03-31
  • 项目状态:
    未结题

项目摘要

本年度は音声感情認識に関し以下の2点について検討した.1.言語的特徴および音響的特徴による感情認識の結果統合2.OGVC(オンラインゲームチャットコーパス)を対象とした音声認識1.について,従来我々は音声認識結果を深層学習モデルの一種であるBERTに入力し感情を認識する言語特徴を用いた方法と,音響特徴から時系列や統計量を用いて認識する2種類の出力を重み付き統合する方法を検討してきた.今回は2種類の特徴をディープニューラルネットワークで統合する方法を検討し,より高い性能を得ることができた.システムの概要としては,言語的特徴抽出のため,まず感情音声の音声認識を行い得られた誤りを含む音声認識結果を用いBERTで感情認識を行い4種類の感情に対する事後確率を得る.一方音響的特徴については,発話全体から各種特徴の統計量を得て認識する手法と,LSTMやGRUなどの時系列を表現できる深層学習モデルを用いて感情認識を行い,同様に事後確率を得る.その両者を統合してDNNに入力し最終的な認識結果を得る.日本語感情コーパスJTESを対象に評価を行った結果,4感情の識別タスクにおいて従来法では80.25%であったが提案法では82.25%を得ることができた.2.についてOGVCを対象に音声認識の検討を行い言語モデル適応が有効であることを示した.音響モデルにはJTESで適応したモデルを使用し,言語モデルはツイート文に適応したモデル,OGVCに適応したモデル,更にはツイート適応モデルを更にOGVCで適応したモデルの3種類を比較した.この結果いずれの方法も性能向上が得られることが分かったが,特にツイート適応が有効であることが分かった.
今年,我们针对语音情感识别研究了以下两点。 1. 使用语言特征和声学特征整合情感识别结果 2. OGVC(在线游戏聊天语料库)的语音识别 我们研究了两种方法:一种使用语言特征从输入中识别情感,另一种使用时间序列和统计数据声学特征可识别两种类型的输出。这次,我们研究了一种使用深度神经网络集成两种类型特征的方法,并且能够获得更高的性能。作为系统的概述,为了提取语言特征,我们首先对情感语音进行语音识别,然后使用包含错误的语音识别结果用 BERT 进行情感识别,并获得四种情感的后验概率。另一方面,对于声学特征,情感识别是使用从整个话语中获取和识别各种特征的统计数据的方法以及可以表达时间序列的深度学习模型(例如LSTM和GRU)来执行的,并且类似地获取后验概率。 ..两者整合后输入DNN,得到最终的识别结果。使用日本情感语料库 JTES 进行评估的结果是,传统方法在识别四种情感的任务中实现了 80.25%,而本文方法实现了 82.25%。关于2.,我们使用OGVC研究了语音识别,并表明语言模型自适应是有效的。我们使用 JTES 适配的模型作为声学模型,并比较了三种语言模型:适配推文文本的模型、适配 OGVC 的模型以及适配推文适配模型并进一步适配 OGVC 的模型。结果表明,两种方法都可以提高性能,但推文自适应尤其有效。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
深層学習モデルを用いた言語特徴と音響特徴の後期融合による音声感情認識
使用深度学习模型通过后期融合语言特征和声学特征进行语音情感识别
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    佐藤清秀;岸恵太;小坂哲夫
  • 通讯作者:
    小坂哲夫
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

小坂 哲夫其他文献

Unsupervised Cross Adaptation Using Deep Neural Networks in Speech Recognition Systems
在语音识别系统中使用深度神经网络的无监督交叉适应
  • DOI:
    10.14923/transinfj.2017jdp7076
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    冨田 健斗;高木 瑛;加藤 正治;小坂 哲夫
  • 通讯作者:
    小坂 哲夫
Robust speech recognition under non-stationary noise using discrete-mixture HMMs
使用离散混合 HMM 在非平稳噪声下进行鲁棒语音识别
  • DOI:
  • 发表时间:
    2005
  • 期刊:
  • 影响因子:
    0
  • 作者:
    小坂 哲夫
  • 通讯作者:
    小坂 哲夫
離散混合出力分布型HMMによる雑音下音声認識のMFCCでの評価
使用 MFCC 使用离散混合输出分布 HMM 评估噪声中的语音识别
  • DOI:
  • 发表时间:
    2005
  • 期刊:
  • 影响因子:
    0
  • 作者:
    小坂 哲夫
  • 通讯作者:
    小坂 哲夫
離散混合出力分布型HMMによる雑音下音声認識のMFCCでの評価
在 MFCC 上使用离散混合输出分布型 HMM 评估噪声中的语音识别
  • DOI:
  • 发表时间:
    2005
  • 期刊:
  • 影响因子:
    0
  • 作者:
    小坂 哲夫
  • 通讯作者:
    小坂 哲夫
Robust speech recognition under non-stationary noise using discrete-mixture HMMs
使用离散混合 HMM 在非平稳噪声下进行鲁棒语音识别
  • DOI:
  • 发表时间:
    2005
  • 期刊:
  • 影响因子:
    0
  • 作者:
    小坂 哲夫
  • 通讯作者:
    小坂 哲夫

小坂 哲夫的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似国自然基金

基于Deep-learning的三江源区冰川监测动态识别技术研究
  • 批准号:
    51769027
  • 批准年份:
    2017
  • 资助金额:
    38.0 万元
  • 项目类别:
    地区科学基金项目
基于异构医学影像数据的深度挖掘技术及中枢神经系统重大疾病的精准预测
  • 批准号:
    61672236
  • 批准年份:
    2016
  • 资助金额:
    64.0 万元
  • 项目类别:
    面上项目
具有时序处理能力的Spiking-Deep Learning(脉冲深度学习)方法研究
  • 批准号:
    61573081
  • 批准年份:
    2015
  • 资助金额:
    64.0 万元
  • 项目类别:
    面上项目

相似海外基金

Deep Learningを活用した超音波ガイドによる安全な静脈穿刺法の開発
利用深度学习的超声引导开发安全静脉穿刺方法
  • 批准号:
    24K13362
  • 财政年份:
    2024
  • 资助金额:
    $ 2.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
少数学習データ深層学習による肝細胞癌に対する陽子線治療計画自動生成システムの開発
利用深度学习和少量学习数据开发肝细胞癌质子束自动治疗计划生成系统
  • 批准号:
    24K10873
  • 财政年份:
    2024
  • 资助金额:
    $ 2.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
ウェスト症候群発症時脳波の深層学習による神経学的予後、MRI脳成熟の予測法の開発
West综合征发病时利用脑电图深度学习开发神经学预后和MRI脑成熟度预测方法
  • 批准号:
    24K10951
  • 财政年份:
    2024
  • 资助金额:
    $ 2.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
CAREER: Geometric Deep Learning to Facilitate Algorithmic and Scientific Advances in Therapeutics
职业:几何深度学习促进治疗学的算法和科学进步
  • 批准号:
    2339524
  • 财政年份:
    2024
  • 资助金额:
    $ 2.58万
  • 项目类别:
    Continuing Grant
CAREER: Accelerating Scientific Discovery via Deep Learning with Strong Physics Inductive Biases
职业:通过具有强物理归纳偏差的深度学习加速科学发现
  • 批准号:
    2338909
  • 财政年份:
    2024
  • 资助金额:
    $ 2.58万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了