Development of emotion recognition system by transfer learning for various speeches

通过各种语音的迁移学习开发情感识别系统

基本信息

  • 批准号:
    22K12087
  • 负责人:
  • 金额:
    $ 2.58万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2022
  • 资助国家:
    日本
  • 起止时间:
    2022-04-01 至 2025-03-31
  • 项目状态:
    未结题

项目摘要

本年度は音声感情認識に関し以下の2点について検討した.1.言語的特徴および音響的特徴による感情認識の結果統合2.OGVC(オンラインゲームチャットコーパス)を対象とした音声認識1.について,従来我々は音声認識結果を深層学習モデルの一種であるBERTに入力し感情を認識する言語特徴を用いた方法と,音響特徴から時系列や統計量を用いて認識する2種類の出力を重み付き統合する方法を検討してきた.今回は2種類の特徴をディープニューラルネットワークで統合する方法を検討し,より高い性能を得ることができた.システムの概要としては,言語的特徴抽出のため,まず感情音声の音声認識を行い得られた誤りを含む音声認識結果を用いBERTで感情認識を行い4種類の感情に対する事後確率を得る.一方音響的特徴については,発話全体から各種特徴の統計量を得て認識する手法と,LSTMやGRUなどの時系列を表現できる深層学習モデルを用いて感情認識を行い,同様に事後確率を得る.その両者を統合してDNNに入力し最終的な認識結果を得る.日本語感情コーパスJTESを対象に評価を行った結果,4感情の識別タスクにおいて従来法では80.25%であったが提案法では82.25%を得ることができた.2.についてOGVCを対象に音声認識の検討を行い言語モデル適応が有効であることを示した.音響モデルにはJTESで適応したモデルを使用し,言語モデルはツイート文に適応したモデル,OGVCに適応したモデル,更にはツイート適応モデルを更にOGVCで適応したモデルの3種類を比較した.この結果いずれの方法も性能向上が得られることが分かったが,特にツイート適応が有効であることが分かった.
今年,我们讨论了以下有关语音情感识别的两点。 1。使用语言和声学特征的情感识别结果2。针对OGVC(在线游戏聊天语料库)的语音识别1。过去,我们使用语言特征研究了一种方法,该方法将语音识别结果输入到BERT,一种深度学习模型,以及一种使用时间序列和统计信息通过声学特征识别的两种输出的加权方法。这次,我们研究了一种使用深神经网络整合两种特征的方法,并能够获得更高的性能。为了总结系统,为了提取语言特征,首先,认识到情感声音的语音识别,并使用伯特(Bert)识别情感,并获得了四种类型的情感的后验概率。另一方面,对于声学特征,使用一种从整个话语中获取各种特征并识别它们的统计的方法进行情感识别,并使用可以表达时间序列的深度学习模型,例如LSTM和GRU,以相同的方式获得后验概率。将这两个组合在一起并输入到DNN中,以获得最终的识别结果。由于对日本情感语料库的评估,对于四个情绪识别任务的常规方法为80.25%,但所提出的方法为82.25%。关于2。,我们调查了OGVC的语音识别,并表明语言模型适应是有效的。我们比较了三种类型的声学模型:适合推文语句的模型,适合OGVC的模型以及使用OGVC进一步适应推文适应模型的模型。该结果表明,两种方法都提供了提高的性能,但是推文适应性特别有效。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
深層学習モデルを用いた言語特徴と音響特徴の後期融合による音声感情認識
使用深度学习模型通过后期融合语言特征和声学特征进行语音情感识别
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Daiki Akiyama;Tomio Goto;杉尾達也,小篠裕子;岡田純京,小篠裕子;城所悠太,新田直子,中村和晃,馬場口登;佐藤清秀,岸恵太,小坂哲夫
  • 通讯作者:
    佐藤清秀,岸恵太,小坂哲夫
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

小坂 哲夫其他文献

Unsupervised Cross Adaptation Using Deep Neural Networks in Speech Recognition Systems
在语音识别系统中使用深度神经网络的无监督交叉适应
Business Application for Sales Transaction Data by Using Genome Analysis Technology
利用基因组分析技术进行销售交易数据的商业应用
オープンソース知識発見システム:MUSASHI
开源知识发现系统:MUSASHI
Noisy speech recognition with discrete-mixture HMMs based on MAP estimation
基于 MAP 估计的离散混合 HMM 噪声语音识别
  • DOI:
  • 发表时间:
    2004
  • 期刊:
  • 影响因子:
    0
  • 作者:
    T.Kosaka;M.Katoh;M.Kohda;小坂哲夫;阿部拓也;小坂哲夫;阿部拓也;小坂哲夫;加藤 正治;阿部 拓也;松本 和樹;小坂 哲夫;小坂 哲夫;T.Kosaka
  • 通讯作者:
    T.Kosaka
Language modeling by an ergodic HMM based on an N-gram
基于 N-gram 的遍历 HMM 的语言建模
  • DOI:
  • 发表时间:
    2004
  • 期刊:
  • 影响因子:
    0
  • 作者:
    T.Kosaka;M.Katoh;M.Kohda;小坂哲夫;阿部拓也;小坂哲夫;阿部拓也;小坂哲夫;加藤 正治;阿部 拓也;松本 和樹;小坂 哲夫;小坂 哲夫;T.Kosaka;A.Ito
  • 通讯作者:
    A.Ito

小坂 哲夫的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似国自然基金

基于Deep-learning的三江源区冰川监测动态识别技术研究
  • 批准号:
    51769027
  • 批准年份:
    2017
  • 资助金额:
    38.0 万元
  • 项目类别:
    地区科学基金项目
基于异构医学影像数据的深度挖掘技术及中枢神经系统重大疾病的精准预测
  • 批准号:
    61672236
  • 批准年份:
    2016
  • 资助金额:
    64.0 万元
  • 项目类别:
    面上项目
具有时序处理能力的Spiking-Deep Learning(脉冲深度学习)方法研究
  • 批准号:
    61573081
  • 批准年份:
    2015
  • 资助金额:
    64.0 万元
  • 项目类别:
    面上项目

相似海外基金

ハイパースペクトラルイメージングと深層学習を用いた皮膚病変鑑別システムの開発
利用高光谱成像和深度学习开发皮肤病变判别系统
  • 批准号:
    24K15777
  • 财政年份:
    2024
  • 资助金额:
    $ 2.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
深層学習を用いた超音波画像からのSPIDDM診断支援システムの開発
使用深度学习从超声图像开发 SPIDDM 诊断支持系统
  • 批准号:
    24K15775
  • 财政年份:
    2024
  • 资助金额:
    $ 2.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
深層学習を用いた拡散テンソル画像による腰椎疾患における疼痛の自動診断システム
基于深度学习的弥散张量图像腰椎疾病疼痛自动诊断系统
  • 批准号:
    24K15787
  • 财政年份:
    2024
  • 资助金额:
    $ 2.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
幾何学的深層学習による非線形力学系のグレーボックスモデル化技術の創出
使用几何深度学习创建非线性动力系统灰盒建模技术
  • 批准号:
    24K15105
  • 财政年份:
    2024
  • 资助金额:
    $ 2.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
アナログ回路に基づく進化計算手法による深層学習モデルの最適化
基于模拟电路的进化计算方法优化深度学习模型
  • 批准号:
    24K15115
  • 财政年份:
    2024
  • 资助金额:
    $ 2.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了