Pronunciation education system based on the systematization of non-mothor tongue speech prosody using generation process model and speech synthesis

基于生成过程模型和语音合成的非母语语音韵律系统化的发音教育系统

基本信息

  • 批准号:
    24652115
  • 负责人:
  • 金额:
    $ 2.33万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
  • 财政年份:
    2012
  • 资助国家:
    日本
  • 起止时间:
    2012-04-01 至 2014-03-31
  • 项目状态:
    已结题

项目摘要

Fundamental frequency (F0) contours of speech by natives and learners are analyzed using the generation process model. Several findings, such as phrase components being less affected by language differences, are shown. As for utterances by learners, influence of their mother tongue is observed. Since learners utterances involve F0 movements not observable in natives utterances, accent type identifier trained using native s utterances does not work well. To solve this problem, a series of perceptual experiments is conducted using synthetic speech with systematic control on F0 (points of F0 movements, slope coefficients). Based on the result, a threshold method of high-low decision of F0 is developed. Also, generation process model constraints are applied to HMM-based speech synthesis resulting in speech quality improvement. A pronunciation training system on Japanese accent type is developed and evaluated.
使用生成过程模型分析了当地人和学习者语音的基本频率(F0)轮廓。 显示了几个发现,例如较少受语言差异影响的短语组件。 至于学习者的话语,观察到母语的影响。 由于学习者的话语涉及在当地人说话中无法观察到的F0运动,因此使用本机话语训练的口音类型标识符无法很好地奏效。 为了解决这个问题,使用系统控制F0(F0运动点,斜率系数)的合成语音进行了一系列感知实验。 根据结果​​,开发了F0高低决策的阈值方法。 此外,生成过程模型的约束也应用于基于HMM的语音合成,从而改善语音质量。 开发和评估了关于日本口音类型的发音训练系统。

项目成果

期刊论文数量(37)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Generation of fundamental frequency contours for Thai speech synthesis using tone nucleus model
使用音调核模型生成泰语语音合成的基频轮廓
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Oraphan Krityakien;Nobuaki Minematsu;and Keikichi Hirose
  • 通讯作者:
    and Keikichi Hirose
Automatic recognition of gemination in Japanese motivated by perceptual experiments
由感知实验驱动的日语中双生的自动识别
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0.7
  • 作者:
    Greg Short;Keikichi Hirose;and Nobuaki Minematsu
  • 通讯作者:
    and Nobuaki Minematsu
RhythmicPatterns of Nonnative Mandarin Speech
非母语普通话的节奏模式
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Tomoyuki Mizukami;Hiroya Hashimoto;Keikichi Hirose;Daisuke Saito;and Nobuaki Minematsu;Wentao Gu and Keikichi Hirose;百武恭汰,橋本浩弥,齋藤大輔,峯松信明,広瀬啓吉;Wentao Gu and Keikichi Hirose
  • 通讯作者:
    Wentao Gu and Keikichi Hirose
Selection of training data for HMM-based speech synthesis from prosodic features - Use of generation process model of fundamental frequency contours
从韵律特征中选择用于基于 HMM 的语音合成的训练数据 - 基频轮廓生成过程模型的使用
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Tomoyuki Mizukami;Hiroya Hashimoto;Keikichi Hirose;Daisuke Saito;and Nobuaki Minematsu
  • 通讯作者:
    and Nobuaki Minematsu
Improved automatic extraction of generation process model commands and its use for generating fundamental frequency contours for training HMM-based speech synthesis
改进了生成过程模型命令的自动提取及其用于生成基频轮廓以训练基于 HMM 的语音合成的用途
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Hiroya Hashimoto;Keikichi Hirose;and Nobuaki Minematsu
  • 通讯作者:
    and Nobuaki Minematsu
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

HIROSE Keikichi其他文献

HIROSE Keikichi的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('HIROSE Keikichi', 18)}}的其他基金

Advanced method of prosody control in statistical-based speech synthesis using generation process model of fundamental frequency contours
使用基频轮廓生成过程模型的基于统计的语音合成中韵律控制的先进方法
  • 批准号:
    24300068
  • 财政年份:
    2012
  • 资助金额:
    $ 2.33万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Expressive Multi-language Speech Synthesis Based on the Generation Process Model and Its Use for Automatic Speech Translation
基于生成过程模型的表达性多语言语音合成及其在自动语音翻译中的应用
  • 批准号:
    21300061
  • 财政年份:
    2009
  • 资助金额:
    $ 2.33万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Synthesis of speech in any speaking styles based on corpus-based generation of prosodic features using the generation process model
使用生成过程模型基于语料库生成韵律特征来合成任何说话风格的语音
  • 批准号:
    17300055
  • 财政年份:
    2005
  • 资助金额:
    $ 2.33万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
High-quality Speech Synthesis based on Accurate Analysis Method and Statistical Method
基于精确分析方法和统计方法的高质量语音合成
  • 批准号:
    12480079
  • 财政年份:
    2000
  • 资助金额:
    $ 2.33万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Naturally Sounding Speech Synthesis and Recognition Based on the Formulation of Prosody
基于韵律表述的自然语音合成与识别
  • 批准号:
    09480061
  • 财政年份:
    1997
  • 资助金额:
    $ 2.33万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Develoment of Spoken Dialogue System for Japanese and Chinese
日汉口语对话系统的开发
  • 批准号:
    08558028
  • 财政年份:
    1996
  • 资助金额:
    $ 2.33万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
Formulation of Prosodic Features of Speech and its Application to Continuous Speech Recognition
语音韵律特征的制定及其在连续语音识别中的应用
  • 批准号:
    06452397
  • 财政年份:
    1994
  • 资助金额:
    $ 2.33万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Rule-Synthesis of Spoken Sentences for the Speech Dialogue Systems
语音对话系统的口语句子规则合成
  • 批准号:
    03452288
  • 财政年份:
    1991
  • 资助金额:
    $ 2.33万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (B)
Development of Output System of Announcing Speech with Input of Kanji-Kana Sentences
输入汉字假名句子的语音播报输出系统的开发
  • 批准号:
    01850073
  • 财政年份:
    1989
  • 资助金额:
    $ 2.33万
  • 项目类别:
    Grant-in-Aid for Developmental Scientific Research (B).

相似海外基金

非母語話者のスマートフォン音声認識機能での誤認識傾向を考慮した発音学習システム
使用智能手机语音识别功能,考虑到非母语人士的误识别倾向的发音学习系统。
  • 批准号:
    24K06231
  • 财政年份:
    2024
  • 资助金额:
    $ 2.33万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Error Detection of Utterances for Non-native Speakers Using Deep Anomaly Detection Technology
使用深度异常检测技术对非母语人士的话语进行错误检测
  • 批准号:
    23K11238
  • 财政年份:
    2023
  • 资助金额:
    $ 2.33万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
残響下の時間長知覚に対する残響曝露の効果
混响暴露对混响时间长度感知的影响
  • 批准号:
    21K12988
  • 财政年份:
    2021
  • 资助金额:
    $ 2.33万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
母語音声と非母語音声の処理能力の直接的関係
母语和非母语语音处理能力之间的直接关系
  • 批准号:
    20K00754
  • 财政年份:
    2020
  • 资助金额:
    $ 2.33万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Non-native Speech Perception: Behaviour, Electrophysiology, and Articulation
非母语语音感知:行为、电生理学和发音
  • 批准号:
    19K13166
  • 财政年份:
    2019
  • 资助金额:
    $ 2.33万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了