感情や個人性を高品質に表現可能なDNNに基づく音声合成方式の研究

基于DNN的高质量表达情感和个性的语音合成方法研究

基本信息

  • 批准号:
    21K11963
  • 负责人:
  • 金额:
    $ 2.66万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2021
  • 资助国家:
    日本
  • 起止时间:
    2021-04-01 至 2024-03-31
  • 项目状态:
    已结题

项目摘要

研究計画調書に記載した課題に関して,令和4年度(2022年度)に実施した内容は下記の通り。(課題1)非言語情報の表現モデル 「①-2感情強度表現方式の検討」について,X-vectorを利用して感情強度を制御する方式を検討した。感情は曖昧な情報であり、感情音声を喜怒哀楽にカテゴライズし、さらにそれらの強度をモデル化することは難しい。そこで、感情カテゴリとその強度を推定すること無しに、感情音声からX-vectorを抽出して、合成音声に反映させる方式を検討した。評価実験の結果、「喜」では80%、「哀」では60%程度の感情が表現できた。「喜」「哀」の性能差は原音声の感情の強さに依存している。この点は、評価を含め今後検討を進める。(課題2)少量データによる学習方式 「②-2学習データ量と性能の検討」について、学習済みのモデルを操作して多様な話者性を持つ音声を合成する方式を検討した。提案方式は、限られた学習データを利用して、学習データに含まれない話者性で音声を合成できる。具体的には、複数の学習話者からX-vectorを抽出し、各X-vectorの重みづけ和によって、新しい話者性を表現する。また、平均基本周波数の影響を低減させてX-vectorを抽出する方式を提案した。評価実験の結果、重みの大きさに対応して、話者性を制御できることが明らとなった。(課題3)音声対話システムへの応用 「音声対話タスクの検討」について、課題1で検討した「X-vectorを利用して感情強度を制御する方式」を利用するタスクとして、生徒と教師の対話タスクを選定した。システムが教師役であり、生徒の発話に対して回答する。生徒が「喜」や「哀」の感情で発話すれば、教師も「喜」や「哀」の感情で応答する。評価実験の結果、生徒の感情に合わせて教師が応答できることが明らかとなった。今後は、この応答戦略の妥当性と有効性を検討する。
关于研究计划报告中提到的问题,2022年(2022年)进行的内容如下。 (状态1)用于表达非语言信息的模型:有关“ 1)情绪强度表达方案的研究”,我们研究了一种使用X-向量控制情绪强度的方法。情绪是模棱两可的信息,将情感语音分类为喜悦,愤怒,悲伤和幸福,并且很难对这些强度进行建模。因此,我们研究了一种方法,其中X向量是从情感语音中提取的,并反映在合成语音中,而无需估计情绪类别及其强度。通过评估实验,我们能够以“欢乐”的身份表达约80%的情绪,而“满足”的情绪为60%。 “欢乐”和“悲伤”之间的表现差异取决于原始声音的情感的力量。这一点将在将来讨论,包括评估。 (研究2)我们使用少量数据进行学习方法,以了解“学习数据和绩效量”,我们研究了一种方法,其中使用先前训练的模型来合成具有各种说话者特征的语音。所提出的方法允许使用有限的学习数据综合语音,这不包括在学习数据中。具体而言,从多个学习者中提取X-向量,并使用每个X-Vector的加权总和来表达新的扬声器。我们还提出了一种通过降低平均基本频率的影响来提取X-量的方法。评估实验的结果是,可以根据权重的大小来控制说话者的特性。 (研究3)针对“语音对话任务检查”的语音对话系统的应用,选择了一项学生教师对话任务作为一项任务,该任务使用了考试中讨论的“使用X-vector控制情绪强度的方法”。该系统扮演教师并回应学生的演讲。当学生以“喜悦”或“悲伤”的感觉说话时,老师还以“欢乐”或“悲伤”的感觉回应。评估实验表明,教师可以根据学生的情绪做出反应。将来,我们将研究此响应策略的有效性和有效性。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
音声対話システムのための入力音声の感情に同調する声質変換とx-vector 埋め込みを用いたテキストからの音声合成方式の検討
研究使用语音质量转换和 x 向量嵌入来调整口语对话系统输入语音情感的文本到语音合成方法
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    小原俊一;阿部匡伸;原直
  • 通讯作者:
    原直
小説オーディオブックの強調部分を学習に用いる抑揚制御可能なEnd-to-End 音声合成方式の検討
利用小说有声读物的强调部分进行语调控制的端到端语音合成方法的研究
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    小原俊一;阿部匡伸;原直;和田拓海,原直,阿部匡伸
  • 通讯作者:
    和田拓海,原直,阿部匡伸
感情や個人性を高品質に表現可能なDNNに基づく音声合成方式の研究
基于DNN的高质量表达情感和个性的语音合成方法研究
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Speech-Like Emotional Sound Generation Using WaveNet
使用 WaveNet 生成类似语音的情感声音
口唇特徴量を利用した知識蒸留による舌亜全摘出者の音韻明瞭度改善法の検討
利用唇部特征进行知识蒸馏,检查提高舌次全切除患者语音清晰度的方法
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Ryohei Teranishi;Takahiro Nagata;Tomio Goto and Satoshi Hirano;高島和嗣,阿部匡伸,原直
  • 通讯作者:
    高島和嗣,阿部匡伸,原直
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

阿部 匡伸其他文献

阿部 匡伸的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似国自然基金

利用表面钝化减少Cu2ZnSn(S1-x,Sex)4太阳电池界面复合的研究
  • 批准号:
    62274077
  • 批准年份:
    2022
  • 资助金额:
    53.00 万元
  • 项目类别:
    面上项目
利用表面钝化减少Cu2ZnSn(S1-x,Sex)4太阳电池界面复合的研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    53 万元
  • 项目类别:
    面上项目
氮掺杂诱导Co-Sex活性位点暴露促进MFC中硝酸根催化还原的电子传递途径解析
  • 批准号:
    21806031
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
基于Cu2ZnSn(S1-x,Sex)4-金属纳米异质结构的全固态量子点敏化太阳能电池
  • 批准号:
    61604086
  • 批准年份:
    2016
  • 资助金额:
    19.0 万元
  • 项目类别:
    青年科学基金项目
小分子RNA对原始生殖细胞定向分化的信号调控的研究
  • 批准号:
    31100932
  • 批准年份:
    2011
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Size matters, but at what cost? Role of male sex hormones in the placenta
规模很重要,但代价是什么?
  • 批准号:
    DP240102256
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Discovery Projects
Sex-specific fitness landscapes in the evolution of egg-laying vs live-birth
产卵与活产进化中的性别特异性适应性景观
  • 批准号:
    NE/Y001672/1
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Research Grant
Using Sex-reversed Chickens To Identify Core Spermatogenic Regulatory Genes
使用性别逆转鸡来鉴定核心生精调节基因
  • 批准号:
    BB/Y005465/1
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Research Grant
The Influence of Lifetime Occupational Experience on Cognitive Trajectories Among Mexican Older Adults
终生职业经历对墨西哥老年人认知轨迹的影响
  • 批准号:
    10748606
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
Role of intestinal serotonin transporter in post traumatic stress disorder
肠道血清素转运蛋白在创伤后应激障碍中的作用
  • 批准号:
    10590033
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了