聴覚特性を考慮した音声信号の高品質補間に関する研究

考虑听觉特性的音频信号高质量插值研究

基本信息

项目摘要

1.補間方法の評価・検証音声補間の応用の一つである音声モーフィングは、通常、異なる話者間の補間を行うが、話者間の音声特徴量の違いが大きいため、劣化も大きい上、劣化の原因も特定しづらい。そこで、本研究では、異なる話者間に比べて難易度の低い、同一話者・同一発声におけるモーフィングについて検討し、問題点を明らかにしてきた。特に、同じ発声内容でもスペクトルや基本周波数の変化に富む感情音声並びに、テンポや音程が保たれているため話声よりも扱いの容易な歌唱音声の補間・モーフィングについて検討している。今年度は、より広範なデータを用いての補間方法の検討・評価を行った。特徴点の設定方法を検討する中で、我々は声道断面積関数を利用したスペクトルの補間方法に関する手法を開発した。更なる高品質化のためには、より詳細な検討が必要であるが、極めて柔軟な補間が可能な手法となり得ることが確認されている。2.音声補間を利用したシステムの構築デモシステムの構築及び評価を行った。感情モーフィングを利用した中間的な感情を生成するシステム、入力歌唱音声のテンポを変更して合成するシステム、入力した音声のスペクトル及び基本周波数を実時間で変換して高品質な合成を行う実時間声質変換システムなどを構築した。特に、実時間声質変換システムについては、主観評価実験等による評価を行った結果を論文として投稿し、採録が決定している。このシステムに用いられている分析合成部分では、高品質音声分析合成方式であるSTRAIGHTをベースとしたものを用いているが、高速化や様々な工夫の導入により、実時間処理が難しいと言われていたSTRAIGHTの実時間処理を可能としている。この分析合成部分の評価を行った所、元のSTRAIGHTに比べれば劣化するものの、既存の分析合成であるケプストラムボコーダに比べて主観評価値のMOSにおいて1程度の品質向上が見られている。
1.插值方法的评估和验证语音变形是语音插值的应用之一,通常在不同的说话人之间进行插值,但由于说话人之间的语音特征存在较大差异,因此也存在大量的劣化。很难确定恶化的原因。因此,在本研究中,我们研究了同一说话者和同一话语之间的变形,这比不同说话者之间的难度要小,并澄清了问题。特别是,我们正在研究情感声音的插值和变形,即使具有相同的话语内容,情感声音的频谱和基频也有很多变化,以及歌声,因为节奏和音调比口语声音更容易处理,所以我们正在研究这些声音的插值和变形。维持。今年,我们使用更广泛的数据检查和评估插值方法。在考虑如何设置特征点的同时,我们开发了一种利用声道横截面积函数进行频谱插值的方法。虽然还需要更详细的研究来进一步提高质量,但已经证实该方法可以作为一种极其灵活的插值方法。 2. 使用语音插值的系统的构建构建并评估了演示系统。使用情感变形产生中间情感的系统,通过改变输入歌声的节奏进行合成的系统,以及实时转换输入声音的频谱和基频以进行高质量合成的实时系统。建立了语音质量转换系统等。特别是针对实时语音质量转换系统,通过主观评价实验的评价结果​​以论文形式提交,并已接受发表。该系统中使用的分析和合成部分基于STRAIGHT,这是一种高质量的语音分析和合成方法,但据说由于速度的提高和各种创新的引入,实时处理变得困难。 STRAIGHT 的时间处理。当我们评估这个分析合成部分时,我们发现虽然与原来的STRAIGHT相比有所退化,但与现有的分析合成倒谱声码器相比,在MOS的主观评价值上,其质量提高了约1。

项目成果

期刊论文数量(7)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
歌唱音声の音量変化に伴うスペクトル変形の分析について
歌声音量变化引起的频谱变形分析
音声モーフィングにおける対応点の自動化に関する研究
语音变形对应点自动化研究
感情音声データベースにおける母音特徴に注目したSTRAIGHTによる声質・感情変換について
关于使用 STRAIGHT 进行语音质量和情感转换,重点关注情感语音数据库中的元音特征
母音スペクトル形状における音高・音量依存成分の分析について
元音频谱形状中音高/音量相关分量的分析
Procedure "Senza Vibrato" : A Key Component for Morphing Singing
“Senza Vibrato”程序:变形歌唱的关键组成部分
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

坂野 秀樹其他文献

アウトリーチではないバイオ(メディア)アートの勧め
非外展的生物(媒体)艺术推荐
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    河原 英紀;矢田部 浩平;榊原 健一;北村 達也;坂野 秀樹;森勢 将雅;斉藤了文;高田若葉・藤木淳;岩崎秀雄
  • 通讯作者:
    岩崎秀雄
サイドローブのない窓に基づく二種類の音源情報の表現について
基于无旁瓣窗的两类声源信息表示
『火星』の語史 -- 江戸・明治を中心に
“火星”一词的历史——以江户和明治时代为中心
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    河原 英紀;矢田部 浩平;榊原 健一;北村 達也;坂野 秀樹;森勢 将雅;米田達郎
  • 通讯作者:
    米田達郎
対数周波数領域における高調波成分抑圧処理に基づく多重音の基本周波数推定手法の評価
基于对数频域谐波分量抑制处理的多音基频估计方法评价
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    高島田 良介;坂野 秀樹;旭 健作
  • 通讯作者:
    旭 健作
スペクトル変動量を用いたスキャットの歌唱音声合成音の自然性向上手法に関する検討
利用频谱涨落提高散唱歌声合成自然度的方法研究
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    谷澤 啓介;坂野 秀樹;旭 健作
  • 通讯作者:
    旭 健作

坂野 秀樹的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('坂野 秀樹', 18)}}的其他基金

声道形状制御に基づく声質制御性および可視化性の高い音声分析合成手法の開発
基于声道形状控制的高音质可控可视化语音分析合成方法开发
  • 批准号:
    24K15000
  • 财政年份:
    2024
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)

相似海外基金

A research on perceptual changes in paralanguage information with aging
副语言信息感知随年龄变化的研究
  • 批准号:
    22K03193
  • 财政年份:
    2022
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Transfer characteristics of emotional speech information toward elderly persons with hearing loss and development of novel speech morphing methods
情感语音信息向听力损失老年人的传递特性及新型语音变形方法的开发
  • 批准号:
    21K19794
  • 财政年份:
    2021
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
音声を中心とした2話者混在メディア加工手法に関する実験的検討
以语音为核心的双人混合媒体处理方法实验研究
  • 批准号:
    19K12058
  • 财政年份:
    2019
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Research and development of a Japanese pronunciation training system using average voice morphing
基于平均语音变形的日语发音训练系统的研发
  • 批准号:
    16K13253
  • 财政年份:
    2016
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
Investigations on design methodology of functional voices
功能声音设计方法研究
  • 批准号:
    24650085
  • 财政年份:
    2012
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了