同時通訳のための音声合成に関する研究

同声传译语音合成研究

基本信息

  • 批准号:
    14J10354
  • 负责人:
  • 金额:
    $ 1.02万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2014
  • 资助国家:
    日本
  • 起止时间:
    2014-04-25 至 2016-03-31
  • 项目状态:
    已结题

项目摘要

本年度は,① 高速かつ高音質な音声合成・声質変換の実現,及び,②元話者の声質をできる限り反映する英語音声合成に着手した.①は,同時通訳の実現に必要不可欠な技術である.現在の主流である統計的音声合成は,少ない計算時間で音声を合成する利点を持つが,著しく音質の低い音声を生成する.この音質劣化問題に対して,我々は昨年度までに,変調スペクトルに基づくフィルタ法と音声パラメータ生成法を提案し,有効性を確認した.しかしながら,これらの手法により生成時間の増加は免れない.そこで,本年度は,変調スペクトル制約の下で音声合成器を学習する手法を提案した.実験的評価により,従来の計算時間を保持しながら,変調スペクトルの考慮による音質改善効果を得られることを確認した.また,変調スペクトルの効果を多言語音声合成において確認するため,インド言語の音声を合成する国際コンペティションに参加した.その結果,いくつかの言語において,変調スペクトルに基づく手法が世界最高品質だと評価された.②は,同時通訳で生成される合成音声に,元話者(例えば,講演者)の声質を反映する技術である.ある言語の話者の声質を別言語(ターゲット言語)の音声に反映するクロスリンガル音声合成が従来存在するが,合成音声の声質は,元話者の声質と大きく異なる.そこで我々は,声質をできるだけ反映する方法として,元話者の発話した非流暢なターゲット言語音声を用いて,ターゲット言語の合成音声を生成する方法を提案した.本年度は,元話者を日本語話者,ターゲット言語を英語に絞り研究を実施した.実験的評価の結果,非流暢な英語音声の音韻・韻律的特徴を補正することで,声質を保存したまま,自然な英語音声を合成できることを確認した.
今年,我们开始1)实施高速,高质量的语音综合和语音质量转换,以及2)尽可能反映前演讲者的语音质量的英语语音综合。 1是实现同时解释的重要技术。统计语音合成目前是主流,具有综合语音的优势,几乎没有计算时间,但声音质量的质量明显降低。为了应对这种声音质量恶化的问题,我们提出了一种基于调制光谱和语音参数生成方法的过滤方法,从而确认了其有效性。但是,这些技术并不能避免生产时间的增加。因此,今年,我们提出了一种在调制光谱限制下学习语音合成器的方法。实验评估证实,通过考虑调制频谱,可以在保持常规计算时间的同时考虑到改善声音质量的效果。此外,为了确认调制光谱在多语言语音综合中的影响,我们参加了国际综合印度言论的竞争。结果,已经将基于调制光谱的方法评估为世界上某些语言中最高质量的方法。 ②是一种在同时解释产生的综合语音中反映前演讲者(例如演讲者)的语音质量的技术。有一种传统的跨语性语音综合,它反映了一种语言的说话者的语音质量在另一种语言(目标语言)的声音中,但是综合语音的语音质量与前说话者的语音质量明显不同。因此,我们提出了一种使用前演讲者说的非浮动目标语言语言来生成目标语言的综合语音的方法,作为一种尽可能反映语音质量的方式。今年,我们进行了一项研究,重点介绍了日本说话者的前演讲者和对英语的目标语言。实验评估表明,通过纠正非浮动英语语音的语音和韵律特征,可以在保留语音质量的同时综合自然的英语语音。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Modulation spectrum-based post-filter for GMM-based Voice Conversion
Blizzard Challenge 2015
2015 年暴雪挑战赛
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
日本人英語音声合成における話者性を保持した韻律補正
在日语-英语语音合成中保留说话人特征的韵律校正
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    大島 悠司;高道 慎之介;戸田 智基;Graham Neubig;Sakriani Sakti;中村 哲
  • 通讯作者:
    中村 哲
統計的パラメトリック音声合成のための変調スペクトルに基づく音質改善法
基于调制频谱的统计参数语音合成音质改善方法
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    高道 慎之介;戸田 智基;Alan W. Black;中村哲
  • 通讯作者:
    中村哲
コーヒーブレーク: z変換の概念と考え方を教えてください
茶歇:请告诉我们z变换的概念和思考方式。
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Y. Nakamura;K. Shimazoe;H. Takahashi;照屋絵理,吉永尚孝,東山幸司;岡田紅理子;高道 慎之介
  • 通讯作者:
    高道 慎之介
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

高道 慎之介其他文献

低電圧駆動単一磁束量子回路における論理ゲートのタイミングパラメータの解析
低压驱动单通量量子电路逻辑门时序参数分析
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    齋藤 佑樹;高道 慎之介;猿渡 洋;国吉真波
  • 通讯作者:
    国吉真波
変調スペクトルを考慮したHMM音声合成
考虑调制频谱的HMM语音合成
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Tomoyoshi Nakayama;Shigeto Seno;Yoichi Takenaka;Hideo Matsuda;清水 邦義 ら;高道 慎之介
  • 通讯作者:
    高道 慎之介
Moment-matching networkに基づく一期一会音声合成における発話間ゆらぎの評価
基于矩匹配网络的千载难逢的语音合成中话语间波动评估
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    高道 慎之介;郡山 知樹;齋藤 佑樹;猿渡 洋
  • 通讯作者:
    猿渡 洋
Transformerを用いたオノマトペからの環境音合成
使用 Transformer 从拟声词合成环境声音
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    岡本 悠希;井本 桂右;高道 慎之介;山西 良典;福森 隆寛;山下 洋一
  • 通讯作者:
    山下 洋一
Anytime Guarantees Under Heavy-Tailed Data
重尾数据下的随时保证

高道 慎之介的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('高道 慎之介', 18)}}的其他基金

音声音響ダークデータ採掘技術の研究
音频声学暗数据挖掘技术研究
  • 批准号:
    23K24895
  • 财政年份:
    2024
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Singing voice synthesis that can form ensemble with humans and computers
人机合奏的歌声合成
  • 批准号:
    23K18474
  • 财政年份:
    2023
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
Research on retriving speech and acoustic dark data
语音和声学暗数据检索研究
  • 批准号:
    22H03639
  • 财政年份:
    2022
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)

相似海外基金

I-Corps: Translation Potential of Simultaneous Musculoskeletal Assessment with Real-Time Ultrasound
I-Corps:实时超声同步肌肉骨骼评估的转化潜力
  • 批准号:
    2413735
  • 财政年份:
    2024
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Standard Grant
同時通訳における非コード置換処理の記述:技術的側面と基盤的側面
同声传译中非代码替换处理的描述:技术和基础方面
  • 批准号:
    24K04046
  • 财政年份:
    2024
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
省略と言い換えによる訳出時間の短縮機能を備えた同時通訳機の研究
具有缩略释义功能缩短翻译时间的同声传译机的研究
  • 批准号:
    24KJ1695
  • 财政年份:
    2024
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
Collaborative Research: SHF: Small: Architecture Innovations for Enabling Simultaneous Translation at the Edge
合作研究:SHF:小型:支持边缘同步翻译的架构创新
  • 批准号:
    2223484
  • 财政年份:
    2022
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Standard Grant
SBIR Phase I: Handheld Devices for Practical Simultaneous Translation
SBIR 第一阶段:用于实用同声翻译的手持设备
  • 批准号:
    2212978
  • 财政年份:
    2022
  • 资助金额:
    $ 1.02万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了