音声における感情情報の記述・分類と感情音声認識・合成
语音中情感信息的描述与分类及情感语音识别与合成
基本信息
- 批准号:09750435
- 负责人:
- 金额:$ 1.86万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Encouragement of Young Scientists (A)
- 财政年份:1997
- 资助国家:日本
- 起止时间:1997 至 1998
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
音声に含まれるノンバーバル情報のうち感情の特徴に着目して、無感情の音声に感情を付加する感情音声合成、さらに感情を込めて発話された音声を分析して感情のカテゴライズを行う感情音声認識を目的に研究を進めた。まず音声に含まれる感情特徴パラメータの決定のため、ピッチ、パワー、時間構造、アクセントを任意に変化させて、韻律変換できるツールを完成させた。このツールを用いて各パラメータを試行錯誤で変化させて、無感情で発話された音声に対して、喜び、怒り悲しみの感情をそれぞれ付加して、センテンスによらず、話者によらず感情音声合成が可能となった。次にピッチ、パワー、発話速度をパラメータとして音声を上記の3つの感情カテゴリーに分類するシステムを構築した。ピッチ抽出はケプストラムに基づき、また発話速度は分析フレーム間のスペクトル距離に基づいて独自の抽出アルゴリズムを開発し、リアルタイムで逐次認識結果を出力できるシステムを完成させた。感情カテゴリー分類には多重判別分析を用いた。このシステムと従来から検討を進めている3次元表情合成とをリンクし、入力された音声にリアルタイムに反応して、その時の感情状態にしたがって表情を変化させる擬人化エージェントシステムも完成させた。
情感语音合成侧重于语音中包含的非语言信息的情感特征,为无情感的语音添加情感;情感语音识别则对带有情感的语音进行分析并对情感进行分类。首先,为了确定语音中包含的情感特征参数,我们完成了一个可以通过任意改变音调、力度、时间结构和重音来进行韵律转换的工具。使用这个工具,我们通过反复试验来改变每个参数,将诸如喜悦、愤怒和悲伤之类的情感添加到没有情感的语音中,并且无论句子或说话者如何,都可以创建情感语音。接下来,我们构建了一个系统,使用音调、功率和语速作为参数,将语音分为上述三种情感类别。我们开发了一种独特的基于倒谱的基音提取和语速分析帧之间的谱距离的提取算法,并完成了一个可以实时顺序输出识别结果的系统。多重判别分析用于情绪类别分类。通过将该系统与已经研究了一段时间的3D面部表情合成相结合,我们完成了一个拟人化代理系统,可以实时响应输入的语音,并根据当时的情绪状态改变其面部表情。
项目成果
期刊论文数量(12)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Shigeo Morishima: "Expression Recognition and Synthesis for Face-to Face Communication" Advances in Human Factors/Ergonomics,21B. 415-418 (1997)
Shigeo Morishima:“面对面交流的表情识别和合成”人因/人体工程学进展,21B。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Shigeo Morishima, T.Ishikawa: "Facial Muscle Parameter Decision from 2D Frontal Image" IEEE Proc.of ICPR. 14巻. 160-162 (1998)
Shigeo Morishima,T. Ishikawa:“2D 正面图像的面部肌肉参数决策”ICPR 的 IEEE Proc。14. 160-162 (1998)
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
佐藤順, 森島繁生: "音声に含まれる感情の主観評価実験と感情音声の合成" 第3回知能情報メディアシンポジウム論文集. 1-8 (1997)
Jun Sato、Shigeo Morishima:“言语中包含的情感的主观评价实验和情感言语的合成”第三届智能信息媒体研讨会论文集1-8(1997)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Shigeo Morishima: "Real-time Talking Head Driven by Voice and its Application to Communication and Entertainment" Proc.of International Conf.on Auditory Visual Speach Processing. 2巻. 195-200 (1998)
Shigeo Morishima:“语音驱动的实时头部语音及其在通信和娱乐中的应用”Proc.of International Conf.on Auditory Visual Speech Processing 2 卷(1998 年)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
四倉達夫、藤井英史、森島繁生: "サイバースペース上の仮想人物による実時間対話システムの構築" 情報処理学会論文誌. 40巻2号. 677-686 (1999)
Tatsuo Shikura、Hidefumi Fujii、Shigeo Morishima:“在网络空间中使用虚拟角色构建实时对话系统”,《日本信息处理学会会刊》第 40 卷,第 2 期。677-686(1999 年)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
森島 繁生其他文献
自由曲線を境界形状とする平面光源の実時間レンダリング法
以自由曲线为边界形状的平面光源实时渲染方法
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
久家 隆宏;谷田川 達也;森島 繁生 - 通讯作者:
森島 繁生
主成分分析に基づく類似口形状検出によるビデオ翻訳動画の生成
基于主成分分析检测相似嘴型生成视频翻译
- DOI:
- 发表时间:
2015 - 期刊:
- 影响因子:0
- 作者:
古川 翔一;加藤 卓哉;野澤 直樹;サフキン パーベル;森島 繁生 - 通讯作者:
森島 繁生
ノイズを含むレンダリング動画に対する重み付き局所線形回帰によるイベント映像生成
使用加权局部线性回归生成包含噪声的渲染视频的事件视频
- DOI:
- 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
辻 雄太;谷田川 達也;久保 尋之;森島 繁生 - 通讯作者:
森島 繁生
基本材質の拡散プロファイル混合による実測BSSRDFデータの圧縮
通过混合基本材料扩散曲线来压缩测量的 BSSRDF 数据
- DOI:
- 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
谷田川 達也;藤堂 英樹;山口 泰;森島 繁生 - 通讯作者:
森島 繁生
Neural Progressive Photon Mapping: 深層学習による適応的フォトン散布を用いたフォトンマッピング法
Neural Progressive Photon Mapping:利用深度学习的自适应光子散射的光子映射方法
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
辻 雄太;谷田川 達也;森島 繁生 - 通讯作者:
森島 繁生
森島 繁生的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('森島 繁生', 18)}}的其他基金
音響情報からの感情情報抽出とそのヒューマンインタフェースへの応用
从声学信息中提取情感信息及其在人机界面中的应用
- 批准号:
05220221 - 财政年份:1993
- 资助金额:
$ 1.86万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
音響情報からの感情情報抽出とそのヒューマンインタフェースへの応用
从声学信息中提取情感信息及其在人机界面中的应用
- 批准号:
04236216 - 财政年份:1992
- 资助金额:
$ 1.86万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
音声と画像の知的インタラクティブ符号化の研究
音频图像智能交互编码研究
- 批准号:
01750299 - 财政年份:1989
- 资助金额:
$ 1.86万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
音声と画像の知的インタラクティブ符号化の研究
音频图像智能交互编码研究
- 批准号:
63750328 - 财政年份:1988
- 资助金额:
$ 1.86万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
相似海外基金
Development of emotion recognition system by transfer learning for various speeches
通过各种语音的迁移学习开发情感识别系统
- 批准号:
22K12087 - 财政年份:2022
- 资助金额:
$ 1.86万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
マルチタスク深層学習における補助損失の動的制御と音声コミュニケーションへの応用
多任务深度学习中辅助损失的动态控制及其在语音通信中的应用
- 批准号:
22K12105 - 财政年份:2022
- 资助金额:
$ 1.86万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
DeconDTN: Deconfounding Deep Transformer Networks for Clinical NLP
DeconDTN:为临床 NLP 解构深度 Transformer 网络
- 批准号:
10711315 - 财政年份:2022
- 资助金额:
$ 1.86万 - 项目类别:
An Emotional Recognition AI Mentoring System for Children with Intellectual Disabilities to Support their Self-Study through E-Learning
智障儿童情绪识别人工智能辅导系统,支持他们通过网络学习自学
- 批准号:
21K02872 - 财政年份:2021
- 资助金额:
$ 1.86万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Speech Emotion Recognition Based on Extracting Features for Emotion Expression
基于情感表达特征提取的语音情感识别
- 批准号:
20K11898 - 财政年份:2020
- 资助金额:
$ 1.86万 - 项目类别:
Grant-in-Aid for Scientific Research (C)