ビスポーク音声デザインの骨格形成と体系化

定制音频设计的骨架形成和系统化

基本信息

  • 批准号:
    21H04900
  • 负责人:
  • 金额:
    $ 27.37万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
  • 财政年份:
    2021
  • 资助国家:
    日本
  • 起止时间:
    2021-04-05 至 2025-03-31
  • 项目状态:
    未结题

项目摘要

2022年度は,2021年度に構築した音声データベースを用いて発話スタイルの音響特徴解析を行う研究や,音声デザインインタフェース開発を目指したGUIの試作,および様々な特徴を有する音声合成技術の研究等多面的な活動に取り組んだ.音声データベース用いたテキスト音声合成を実装することで,Deep learningベースの方法を用いた場合でも,データベースの量・質ともに問題が無いことを確認した.その後,音声デザインを重視した技術の実現を目指し,従来法の改良に取り組んだ.加えて,声優が意図的に変化させた発話スタイルが,音声の基本周波数やフォルマント周波数,および話速に影響を与えていることを確認した.コーパスの読みやすさを評価するため,2名の声優に4,600文のコーパスを朗読させ,全文のリテイク回数を記録し比較することで朗読が困難な文が無いか評価した.評価の結果,共通する文でリテイク数が増加する傾向は認められず,一文を構成するモーラ数とリテイク数が比例する傾向を確認した.音声分析や合成に関する研究では,避難呼びかけの音声の分析や合成,2話者の中間属性を有する音声の合成技術,およびささやき声の生成法などの実現を目指した研究を推進した.加えて,声質変換技術にも取り組み,Deep neural networks (DNN)による声質変換技術について論文を発表した.音声知覚についても,音声に対して知覚するポジティブ感情,および音声のみならず感情も含めた感情知覚に関する研究を推進した.音声デザインGUIについては,研究代表者の代表的な成果である音声分析合成基盤WORLDをGUIとして実装し,音声デザインインタフェース開発に向けた問題点の洗い出しに取り組んだ.現状では高さ(基本周波数)など物理量で近似できるパラメータの制御に絞り,柔軟に操作できることを優先してプロトタイプを実装した.
2022年,我们将进行多方面的研究,例如使用2021年建立的语音数据库分析语音风格的声学特征,制作旨在开发语音设计界面的GUI原型,以及研究具有各种特征的语音合成技术。 。通过使用语音数据库实现文本到语音合成,我们确认即使使用基于深度学习的方法,数据库的数量或质量也不存在问题。之后,我们致力于改进传统方法,旨在实现强调音频设计的技术。此外,我们确认配音演员故意改变的说话风格会影响声音的基频、共振峰频率和说话速度。为了评估语料库的可读性,我们让两名配音演员朗读了4600个句子的语料库,通过记录和比较整个文本的重读次数,我们评估是否存在难以阅读的句子。评估结果发现,对于普通句子,重考次数没有增加的趋势,并且组成句子的词素数有与重考次数成正比的趋势。在语音分析与合成研究方面,我们开展了疏散呼叫语音的分析与合成、两个说话人之间具有中间属性的语音合成技术、低语语音生成方法等研究。此外,他还致力于语音质量转换技术,并发表了一篇关于使用深度神经网络(DNN)的语音质量转换技术的论文。在言语感知方面,我们推动了对言语感知的积极情绪和情感感知的研究,其中不仅包括言语,还包括情感。关于音频设计GUI,我们将研究人员的代表性成果语音分析和合成平台WORLD实现为GUI,并致力于找出音频设计界面开发的问题。目前,我们重点控制高度(基频)等可以用物理量近似的参数,并实现了以灵活操作为优先的原型。

项目成果

期刊论文数量(82)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
声帯音源の群遅延特性に基づく特徴量を用いた励振源による有声音波形生成法の提案と評価
使用基于声带声源群延迟特性的激励源的浊音波形生成方法的提出和评估
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Hayashi;M.J.;Amano;K.;小口純矢,森勢将雅
  • 通讯作者:
    小口純矢,森勢将雅
The interaction of emotional information from the voice and touch
来自声音和触摸的情感信息的交互
プロ声優を対象とした大規模コーパス朗読におけるリテイク数の比較
专业配音演员大规模语料阅读重考次数对比
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Mahdi Khosravy;Isao Echizen;Noboru Babaguchi;山本泰我,小口純矢,森勢将雅
  • 通讯作者:
    山本泰我,小口純矢,森勢将雅
自己の発話に対する他人声のフィードバックが声の所有感に与える影響
其他声音对自己话语的反馈对声音所有权感的影响
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Tuan Nguyen Quoc,Katsumi Inoue;Chiaki Sakama;中川優奈,田中章浩
  • 通讯作者:
    中川優奈,田中章浩
A practical method for generating whisper voices: Improvements in phantom silhouette method and application to multiple languages
一种实用的耳语生成方法:幻影轮廓法的改进及其在多种语言中的应用
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Huy H. Nguyen;Trung-Nghia Le;Junichi Yamagishi;and Isao Echizen;T. Uchida and M. Morise
  • 通讯作者:
    T. Uchida and M. Morise
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

森勢 将雅其他文献

西夏の年号-西夏文字と西夏語の表現を中心に-,
西夏时代名称——聚焦西夏文字及西夏语言表达。
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    河原 英紀;榊原 健一;矢田部 浩平;北村 達也;坂野 秀樹;森勢 将雅;大津由紀雄;中村徳仁;Mika Eglinton;高野美千代;荒川 慎太郎
  • 通讯作者:
    荒川 慎太郎
身体完全性違和
身体完整性不适
基本周波数系列のケプストラムを用いたビブラートの速さを反映する距離尺度の検討
用基频级数倒谱检验反映颤音速度的距离尺度
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    鈴木 千文;坂野 秀樹;旭 健作;森勢 将雅
  • 通讯作者:
    森勢 将雅
座席のピッチ運動による擬似歩行運動感覚提示に関する研究,
座椅俯仰运动呈现伪步态动觉的研究,
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    大野 涼平;森勢 将雅;北原鉄朗;加藤隼輝,池井 寧,阿部浩二,島袋誠也,広田光一,雨宮智浩,
  • 通讯作者:
    加藤隼輝,池井 寧,阿部浩二,島袋誠也,広田光一,雨宮智浩,
ビブラートの深さと速さの変化を含む歌唱音声における基本周波数の微細変動の影響の調査
研究歌声基频微小波动的影响,包括颤音深度和速度的变化
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    鈴木 千文;坂野 秀樹;旭 健作;森勢 将雅
  • 通讯作者:
    森勢 将雅

森勢 将雅的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('森勢 将雅', 18)}}的其他基金

時間周波数表現の非線形変換に基づく音響システムの計測・制御手法の研究
基于时频表示非线性变换的声学系统测控方法研究
  • 批准号:
    06J02150
  • 财政年份:
    2006
  • 资助金额:
    $ 27.37万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows

相似海外基金

工学教育おけるデザイン学習達成度の定量的・定性的評価手法の提案および検証
工程教育设计学习成绩定量与定性评价方法的提出与验证
  • 批准号:
    20K03213
  • 财政年份:
    2020
  • 资助金额:
    $ 27.37万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
文字科学 ― 文字の機能の多面的解明
文字学——多方位阐释文字功能
  • 批准号:
    17H00736
  • 财政年份:
    2017
  • 资助金额:
    $ 27.37万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
Development of dynamic and static figured teaching materials support system for active learning in collegiate math class
大学数学课堂主动学习动静态教材支持系统的开发
  • 批准号:
    16K01152
  • 财政年份:
    2016
  • 资助金额:
    $ 27.37万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Design of sound environment for comfortable hospital wards
舒适医院病房声环境设计
  • 批准号:
    26350018
  • 财政年份:
    2014
  • 资助金额:
    $ 27.37万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
A method for identifying adult and child speaker based on auditory model for web system interface
一种基于Web系统界面听觉模型的成人儿童说话人识别方法
  • 批准号:
    25870438
  • 财政年份:
    2013
  • 资助金额:
    $ 27.37万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了