認知モデルと常識ベースに基づく情動を含む音声コミュニケーション
语音通信,包括基于认知模型和常识的情感
基本信息
- 批准号:08F08049
- 负责人:
- 金额:$ 1.02万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for JSPS Fellows
- 财政年份:2008
- 资助国家:日本
- 起止时间:2008 至 2009
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
昨年度、文の情動の程度を数値として表し、そこに含まれる感情の指標を抽出することを進めた。本年度は、その手法を高度化するとともに、得られる指標を合成音声に反映させることを中心に研究を進め、下記成果を達成した。1.ニュース文について、動詞に着目して各句の肯定/否定の程度を評点として数値化した上で、順接、逆節といった句間の関係から、文全体の肯定/否定の程度を評点として与える手法を開発した。評点を用いて、英語音声合成フリーウェアのMARY音声合成システムの韻律を制御することを行った。お祭りのニュースなど、文内容が肯定的な場合は基本周波数/発話速度を上げ、事故のような、否定的な場合は、下げることを基本とする制御を行うことにより、文内容にふさわしい合成音声を得た。2.認知モデルの立場から、喜び、悲しみなどの感情を、肯定/否定、興奮/抑制といった軸によって定式化し、文内容に含まれる感性情報を抽出する手法を開発した。肯定/否定、興奮/抑制の値によりMARY音声合成システムの韻律を制御することを行い、合成音声の聴取実験により抽出した感情が適切に反映されることを確認した。3.音声からそこに含まれる情動/感性を抽出する手法について、音響部分の構築として、スペクトルの周波数と時間方向の変化の特徴と韻律的特徴を用い、Support Vector Machine等による判別を行うことで、定型文に限定されているが、肯定と否定の情動の判別率90%を達成した。4.人間が生活する際に発生する種々の音から、人間の活動を推定する手法(Life Logging)の開発を進めた。音声認識で使われているMFCCを特徴量としたHMMを用いることで良好な音認識が可能なことを示した。
去年,我们在用数值表示句子中的情感程度并提取其中包含的情感指标方面取得了进展。今年,我们重点改进了方法,并将获得的指标反映在合成语音中,取得了以下成果。 1. 对于新闻句,以动词为中心,将各分句的肯定/否定程度量化为分数,然后根据直接从句、反演等从句之间的关系,对整个句子的肯定/否定程度进行打分我们开发了一种方法将其指定为我们使用分数来控制 MARY 语音合成系统的韵律,MARY 语音合成系统是一个免费的英语语音合成软件。当句子内容是积极的(例如有关节日的新闻)时,基本频率/语速会增加;而当内容是消极的(例如事故)时,基本频率/语速会降低,以创建适合句子内容的合成语音。 我得到了它。 2.从认知模型的角度出发,我们开发了一种沿着肯定/否定和兴奋/抑制轴表达喜悦和悲伤等情绪,并提取句子内容中包含的情绪信息的方法。我们使用肯定/否定和兴奋/抑制的值来控制MARY语音合成系统的韵律,并通过合成语音的听力实验确认提取的情绪得到了适当的反映。 3.关于提取语音中包含的情感/感性的方法,我们利用频谱的频率和时间变化特征以及韵律特征来构造声学部分,并使用支持向量机等进行判别。尽管该方法仅限于固定短语,其积极情绪和消极情绪的辨别率达到90%。 4. 我们开发了一种方法(生命记录),可以根据人类生活中产生的各种声音来估计人类活动。我们证明,通过使用 MFCC(语音识别中使用的 MFCC)作为特征的 HMM,可以实现良好的声音识别。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Assigning suitable phrasal tones and pitch accents by sensing affective information from text to synthesize human-like speech
通过感知文本中的情感信息来分配合适的短语语气和音高重音,以合成类似人类的语音
- DOI:
- 发表时间:2008
- 期刊:
- 影响因子:0
- 作者:Mostafa Al Masum Shaikh
- 通讯作者:Mostafa Al Masum Shaikh
Emotional Speech Synthesis by Sensing Affective Information from Text
通过从文本中感知情感信息来合成情感语音
- DOI:
- 发表时间:2009
- 期刊:
- 影响因子:0
- 作者:Mostafa A1 Masum Shaikh
- 通讯作者:Mostafa A1 Masum Shaikh
Easy Living in the Virtual World : A Noble Approach to Integrate Real World Activities to Virtual Worlds
在虚拟世界中轻松生活:将现实世界活动整合到虚拟世界的崇高方法
- DOI:
- 发表时间:2010
- 期刊:
- 影响因子:0
- 作者:Mostafa A1 Masum Shaikh
- 通讯作者:Mostafa A1 Masum Shaikh
Improving TTS Synthesis fbr Emotional Expressivity by a Prosodic Parameterization of Affect based on Linguistic Analysis
基于语言分析的情感韵律参数化提高 TTS 合成的情感表达能力
- DOI:
- 发表时间:2010
- 期刊:
- 影响因子:0
- 作者:Mostafa A1 Masum Shaikh
- 通讯作者:Mostafa A1 Masum Shaikh
An Approach for ambient communication by detecting real-world activities from environmental sound cues
一种通过环境声音线索检测现实世界活动的环境通信方法
- DOI:
- 发表时间:2008
- 期刊:
- 影响因子:0
- 作者:Mostafa Al Masum Shaikh
- 通讯作者:Mostafa Al Masum Shaikh
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
広瀬 啓吉其他文献
種々の調子の音声合成のための韻律制御-感情音声合成の視点から-(招待講演)
各种声调语音合成的韵律控制——从情感语音合成的角度——(特邀报告)
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
広瀬 啓吉 - 通讯作者:
広瀬 啓吉
広瀬 啓吉的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('広瀬 啓吉', 18)}}的其他基金
劣条件下の混合音響信号の分離とその音声認識への利用
恶劣条件下混合声信号的分离及其在语音识别中的应用
- 批准号:
06F06099 - 财政年份:2006
- 资助金额:
$ 1.02万 - 项目类别:
Grant-in-Aid for JSPS Fellows
フィンランド人日本語学習者による日本語語い音調の韻律研究
芬兰日语学习者对日语声调的韵律研究
- 批准号:
05F05756 - 财政年份:2005
- 资助金额:
$ 1.02万 - 项目类别:
Grant-in-Aid for JSPS Fellows
フィンランド人日本語学習者による日本語語い音調の韻律研究
芬兰日语学习者对日语声调的韵律研究
- 批准号:
06F05756 - 财政年份:2005
- 资助金额:
$ 1.02万 - 项目类别:
Grant-in-Aid for JSPS Fellows
中国語基本周波数パターンの分析、定式化と合成手法の開発
中国基频模式分析、合成方法的制定和发展
- 批准号:
04F04035 - 财政年份:2004
- 资助金额:
$ 1.02万 - 项目类别:
Grant-in-Aid for JSPS Fellows
モーラ遷移確率モデルによる韻律の表現と音声認識への利用に関する研究
基于mora转移概率模型的韵律表达及其在语音识别中的应用研究
- 批准号:
11878058 - 财政年份:1999
- 资助金额:
$ 1.02万 - 项目类别:
Grant-in-Aid for Exploratory Research
韻律に着目した音声言語情報処理の高度化に関する調査研究
以韵律为中心的口语信息处理进展研究
- 批准号:
10898014 - 财政年份:1998
- 资助金额:
$ 1.02万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
モデルの広がりを考慮した頑健な音声認識手法の研究
考虑模型扩散的鲁棒语音识别方法研究
- 批准号:
09878065 - 财政年份:1997
- 资助金额:
$ 1.02万 - 项目类别:
Grant-in-Aid for Exploratory Research
話者正規化による高精度多数話者単語音声認識システムとそのLSI化に関する研究
基于说话人归一化的高精度多说话人语音识别系统及其LSI实现研究
- 批准号:
03555070 - 财政年份:1991
- 资助金额:
$ 1.02万 - 项目类别:
Grant-in-Aid for Developmental Scientific Research (B)
光学的手段を用いた音声信号の分析と認識に関する研究
利用光学手段分析和识别音频信号的研究
- 批准号:
60580017 - 财政年份:1985
- 资助金额:
$ 1.02万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
韻律情報を用いた大語彙・連続単語音声認識
使用韵律信息的大词汇量/连续词语音识别
- 批准号:
58580019 - 财政年份:1983
- 资助金额:
$ 1.02万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
相似海外基金
パーキンソン病患者における認知機能の定量化と身体活動量のモデル化の試み
尝试量化帕金森病患者的认知功能并模拟身体活动
- 批准号:
24KJ1928 - 财政年份:2024
- 资助金额:
$ 1.02万 - 项目类别:
Grant-in-Aid for JSPS Fellows
非認知能力を育成する理科学習の環境モデル構築とその学習効果の検証
培养非认知能力的科学学习环境模型构建及学习效果验证
- 批准号:
24K06012 - 财政年份:2024
- 资助金额:
$ 1.02万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
中学校での数学学習に支援が必要な生徒の困難性とメタ認知の体系化と指導モデルの開発
将初中数学学习中需要支持的学生的困难和元认知系统化并开发教学模式
- 批准号:
24K05929 - 财政年份:2024
- 资助金额:
$ 1.02万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
社会的断絶モデルに基づく完全主義に対する認知行動療法プログラムの研究
基于社交脱节模型的完美主义认知行为治疗方案研究
- 批准号:
24K06534 - 财政年份:2024
- 资助金额:
$ 1.02万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
認知モデルの頑健性検証のための二次分析アプローチ
验证认知模型稳健性的二次分析方法
- 批准号:
22KJ1180 - 财政年份:2023
- 资助金额:
$ 1.02万 - 项目类别:
Grant-in-Aid for JSPS Fellows