Expressive Multi-language Speech Synthesis Based on the Generation Process Model and Its Use for Automatic Speech Translation

基于生成过程模型的表达性多语言语音合成及其在自动语音翻译中的应用

基本信息

  • 批准号:
    21300061
  • 负责人:
  • 金额:
    $ 11.23万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
  • 财政年份:
    2009
  • 资助国家:
    日本
  • 起止时间:
    2009 至 2011
  • 项目状态:
    已结题

项目摘要

A unified study on prosody control for multi-languages was conductedbased on the generation process model of fundamental frequency contours(F_0 model). We developeda method of prosody adaptation, where differences in F_0 model commands were learned from parallelspeech corpus and were applied to baseline speech. Focus control, style conversion and voiceconversion were realized. Furthermore, by approximating F_0 contours of training speech corpusand/or generated F_0 contours using the F_0 model, we improved the quality of synthetic speech by theHMM-based speech synthesis. Also, we added focus control. Based on the above results, experiments were conducted on conveying discourse information and intentions in speech Translation.
基于基本频率轮廓的生成过程模型(F_0模型)进行了对多语言韵律控制的统一研究。我们开发了韵律适应方法,其中F_0模型命令中的差异是从ParellesPeech语料库中学到的,并应用于基线语音。实现了焦点控制,样式转换和语音转换。此外,通过近似使用F_0模型的F_0训练语音语音/或生成的F_0轮廓,我们通过基于TheHMM的语音综合提高了合成语音的质量。另外,我们添加了焦点控制。基于上述结果,进行了实验,以传达语音翻译中的话语信息和意图。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Using F_0 contour generation process model for improved and flexible control of prosodic features in HMM-based speech synthesis
使用F_0轮廓生成过程模型改进和灵活控制基于HMM的语音合成中的韵律特征
  • DOI:
  • 发表时间:
    2010
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Keikichi Hirose;Keiko Ochi;Miaomiao Wang;Tatsuya Matsuda;Miaomiao Wen;and Nobuaki Minematsu
  • 通讯作者:
    and Nobuaki Minematsu
HMM-based synthesis of fundamental frequency contours using the generation process model
使用生成过程模型基于 HMM 的基频轮廓合成
  • DOI:
  • 发表时间:
    2010
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Tetsuya Matsuda;Keikichi Hirose and Nobuaki Minematsu
  • 通讯作者:
    Keikichi Hirose and Nobuaki Minematsu
Adaptation of prosody in speech synthesis by changing command values of the generation process model of fundamental frequency
通过改变基频生成过程模型的命令值来适应语音合成中的韵律
  • DOI:
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Keikichi Hirose;Keiko Ochi;Ryusuke Mihara;Hiroya Hashimoto;Daisuke Saito;and Nobuaki Minematsu
  • 通讯作者:
    and Nobuaki Minematsu
HMM-based F_0 contour synthesis using the generation process model
基于HMM的F_0轮廓合成使用生成过程模型
Control of prosodic features in corpus-based generation of fundamental frequency contours based on the generation process model
基于生成过程模型的基频轮廓语料库生成中韵律特征的控制
  • DOI:
  • 发表时间:
    2010
  • 期刊:
  • 影响因子:
    0
  • 作者:
    郡山知樹;能勢隆;小林隆夫;相澤彰子;Keikichi Hirose
  • 通讯作者:
    Keikichi Hirose
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

HIROSE Keikichi其他文献

HIROSE Keikichi的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('HIROSE Keikichi', 18)}}的其他基金

Pronunciation education system based on the systematization of non-mothor tongue speech prosody using generation process model and speech synthesis
基于生成过程模型和语音合成的非母语语音韵律系统化的发音教育系统
  • 批准号:
    24652115
  • 财政年份:
    2012
  • 资助金额:
    $ 11.23万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
Advanced method of prosody control in statistical-based speech synthesis using generation process model of fundamental frequency contours
使用基频轮廓生成过程模型的基于统计的语音合成中韵律控制的先进方法
  • 批准号:
    24300068
  • 财政年份:
    2012
  • 资助金额:
    $ 11.23万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Synthesis of speech in any speaking styles based on corpus-based generation of prosodic features using the generation process model
使用生成过程模型基于语料库生成韵律特征来合成任何说话风格的语音
  • 批准号:
    17300055
  • 财政年份:
    2005
  • 资助金额:
    $ 11.23万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
High-quality Speech Synthesis based on Accurate Analysis Method and Statistical Method
基于精确分析方法和统计方法的高质量语音合成
  • 批准号:
    12480079
  • 财政年份:
    2000
  • 资助金额:
    $ 11.23万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Naturally Sounding Speech Synthesis and Recognition Based on the Formulation of Prosody
基于韵律表述的自然语音合成与识别
  • 批准号:
    09480061
  • 财政年份:
    1997
  • 资助金额:
    $ 11.23万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Develoment of Spoken Dialogue System for Japanese and Chinese
日汉口语对话系统的开发
  • 批准号:
    08558028
  • 财政年份:
    1996
  • 资助金额:
    $ 11.23万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
Formulation of Prosodic Features of Speech and its Application to Continuous Speech Recognition
语音韵律特征的制定及其在连续语音识别中的应用
  • 批准号:
    06452397
  • 财政年份:
    1994
  • 资助金额:
    $ 11.23万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Rule-Synthesis of Spoken Sentences for the Speech Dialogue Systems
语音对话系统的口语句子规则合成
  • 批准号:
    03452288
  • 财政年份:
    1991
  • 资助金额:
    $ 11.23万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (B)
Development of Output System of Announcing Speech with Input of Kanji-Kana Sentences
输入汉字假名句子的语音播报输出系统的开发
  • 批准号:
    01850073
  • 财政年份:
    1989
  • 资助金额:
    $ 11.23万
  • 项目类别:
    Grant-in-Aid for Developmental Scientific Research (B).

相似海外基金

Pronunciation education system based on the systematization of non-mothor tongue speech prosody using generation process model and speech synthesis
基于生成过程模型和语音合成的非母语语音韵律系统化的发音教育系统
  • 批准号:
    24652115
  • 财政年份:
    2012
  • 资助金额:
    $ 11.23万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
Advanced method of prosody control in statistical-based speech synthesis using generation process model of fundamental frequency contours
使用基频轮廓生成过程模型的基于统计的语音合成中韵律控制的先进方法
  • 批准号:
    24300068
  • 财政年份:
    2012
  • 资助金额:
    $ 11.23万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
構造的不変表象を基盤とした柔軟な音声合成技術の構築
基于结构不变表示的灵活语音合成技术构建
  • 批准号:
    10J08861
  • 财政年份:
    2010
  • 资助金额:
    $ 11.23万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
音声言語情報処理を利用した韻律の自動学習
利用口语信息处理自动学习韵律
  • 批准号:
    07J04087
  • 财政年份:
    2007
  • 资助金额:
    $ 11.23万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
A study on an emotion model for prosody control and dialog management in speech communication
语音交流中韵律控制和对话管理的情感模型研究
  • 批准号:
    17500079
  • 财政年份:
    2005
  • 资助金额:
    $ 11.23万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了