聴覚特性を考慮した音声信号の高品質補間に関する研究
考虑听觉特性的音频信号高质量插值研究
基本信息
- 批准号:16700183
- 负责人:
- 金额:$ 2.3万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Young Scientists (B)
- 财政年份:2004
- 资助国家:日本
- 起止时间:2004 至 2006
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
1.補間方法の評価・検証音声補間の応用の一つである音声モーフィングは、通常、異なる話者間の補間を行うが、話者間の音声特徴量の違いが大きいため、劣化も大きい上、劣化の原因も特定しづらい。そこで、本研究では、異なる話者間に比べて難易度の低い、同一話者・同一発声におけるモーフィングについて検討し、問題点を明らかにしてきた。特に、同じ発声内容でもスペクトルや基本周波数の変化に富む感情音声並びに、テンポや音程が保たれているため話声よりも扱いの容易な歌唱音声の補間・モーフィングについて検討している。今年度は、より広範なデータを用いての補間方法の検討・評価を行った。特徴点の設定方法を検討する中で、我々は声道断面積関数を利用したスペクトルの補間方法に関する手法を開発した。更なる高品質化のためには、より詳細な検討が必要であるが、極めて柔軟な補間が可能な手法となり得ることが確認されている。2.音声補間を利用したシステムの構築デモシステムの構築及び評価を行った。感情モーフィングを利用した中間的な感情を生成するシステム、入力歌唱音声のテンポを変更して合成するシステム、入力した音声のスペクトル及び基本周波数を実時間で変換して高品質な合成を行う実時間声質変換システムなどを構築した。特に、実時間声質変換システムについては、主観評価実験等による評価を行った結果を論文として投稿し、採録が決定している。このシステムに用いられている分析合成部分では、高品質音声分析合成方式であるSTRAIGHTをベースとしたものを用いているが、高速化や様々な工夫の導入により、実時間処理が難しいと言われていたSTRAIGHTの実時間処理を可能としている。この分析合成部分の評価を行った所、元のSTRAIGHTに比べれば劣化するものの、既存の分析合成であるケプストラムボコーダに比べて主観評価値のMOSにおいて1程度の品質向上が見られている。
1。插值方法的评估和验证语音变形,这是语音插值的应用之一,通常在不同的说话者之间进行插值,但是说话者之间的语音特征量的差异使得很难确定衰退的原因。因此,在这项研究中,我们研究了同一说话者和相同发声之间的变形,这比不同的说话者之间的困难不那么困难,并阐明了问题。特别是,我们正在考虑对情感言语的插值和变形,即使具有相同的声音内容以及唱歌的演讲,这种言语的频谱和基本频率都具有丰富的变化,这比说话更容易说话,因为说话的节奏和音调保持了。今年,我们使用更广泛的数据研究和评估了插值方法。在检查特征点的设置方法时,我们开发了一种使用声带横截面函数插值光谱的方法。尽管需要进一步改善质量,但需要更详细的检查,但已确认可以实现极其灵活的插值方法。 2。构建和评估了使用语音插值构建系统。我们已经构建了一个系统,该系统使用情绪变形产生中间情绪,该系统会改变输入唱歌声音的速度并综合它,以及一个实时的语音质量转换系统,该系统可以实时转换输入声音的频谱和基本频率,以实时执行高质量合成。特别是,对于实时语音质量转换系统,使用主观评估实验等评估的结果已作为论文提交,并决定接受本书。该系统中使用的分析和合成部分基于直质质量分析合成方法,但是引入了加速度和其他各种独创性,直接的实时处理,据说很难执行实时处理。当对该分析合成部分进行评估,尽管与原始笔直相比,它恶化了,但与现有的分析合成Cepstrum Vocoder相比,主观评估值的质量提高了约1。
项目成果
期刊论文数量(7)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
歌唱音声の音量変化に伴うスペクトル変形の分析について
歌声音量变化引起的频谱变形分析
- DOI:
- 发表时间:2005
- 期刊:
- 影响因子:0
- 作者:田原佳代子;森勢将雅;坂野秀樹;入野俊夫;河原英紀
- 通讯作者:河原英紀
感情音声データベースにおける母音特徴に注目したSTRAIGHTによる声質・感情変換について
关于使用 STRAIGHT 进行语音质量和情感转换,重点关注情感语音数据库中的元音特征
- DOI:
- 发表时间:2005
- 期刊:
- 影响因子:0
- 作者:藤井岳史;西雅史;高橋徹;坂野秀樹;入野俊夫;河原英紀
- 通讯作者:河原英紀
母音スペクトル形状における音高・音量依存成分の分析について
元音频谱形状中音高/音量相关分量的分析
- DOI:
- 发表时间:2005
- 期刊:
- 影响因子:0
- 作者:田原 佳代子;高橋 徹;坂野 秀樹;入野 俊夫;河原 英紀
- 通讯作者:河原 英紀
Procedure "Senza Vibrato" : A Key Component for Morphing Singing
“Senza Vibrato”程序:变形歌唱的关键组成部分
- DOI:
- 发表时间:2004
- 期刊:
- 影响因子:0
- 作者:H.Kawahara;Y.Hirachi;M.Morise;H.Banno
- 通讯作者:H.Banno
共 7 条
- 1
- 2
坂野 秀樹其他文献
アウトリーチではないバイオ(メディア)アートの勧め
非外展的生物(媒体)艺术推荐
- DOI:
- 发表时间:20212021
- 期刊:
- 影响因子:0
- 作者:河原 英紀;矢田部 浩平;榊原 健一;北村 達也;坂野 秀樹;森勢 将雅;斉藤了文;高田若葉・藤木淳;岩崎秀雄河原 英紀;矢田部 浩平;榊原 健一;北村 達也;坂野 秀樹;森勢 将雅;斉藤了文;高田若葉・藤木淳;岩崎秀雄
- 通讯作者:岩崎秀雄岩崎秀雄
『火星』の語史 -- 江戸・明治を中心に
“火星”一词的历史——以江户和明治时代为中心
- DOI:
- 发表时间:20212021
- 期刊:
- 影响因子:0
- 作者:河原 英紀;矢田部 浩平;榊原 健一;北村 達也;坂野 秀樹;森勢 将雅;米田達郎河原 英紀;矢田部 浩平;榊原 健一;北村 達也;坂野 秀樹;森勢 将雅;米田達郎
- 通讯作者:米田達郎米田達郎
サイドローブのない窓に基づく二種類の音源情報の表現について
基于无旁瓣窗的两类声源信息表示
- DOI:
- 发表时间:20212021
- 期刊:
- 影响因子:0
- 作者:河原 英紀;矢田部 浩平;榊原 健一;北村 達也;坂野 秀樹;森勢 将雅河原 英紀;矢田部 浩平;榊原 健一;北村 達也;坂野 秀樹;森勢 将雅
- 通讯作者:森勢 将雅森勢 将雅
対数周波数領域における高調波成分抑圧処理に基づく多重音の基本周波数推定手法の評価
基于对数频域谐波分量抑制处理的多音基频估计方法评价
- DOI:
- 发表时间:20152015
- 期刊:
- 影响因子:0
- 作者:高島田 良介;坂野 秀樹;旭 健作高島田 良介;坂野 秀樹;旭 健作
- 通讯作者:旭 健作旭 健作
スペクトル変動量を用いたスキャットの歌唱音声合成音の自然性向上手法に関する検討
利用频谱涨落提高散唱歌声合成自然度的方法研究
- DOI:
- 发表时间:20152015
- 期刊:
- 影响因子:0
- 作者:谷澤 啓介;坂野 秀樹;旭 健作谷澤 啓介;坂野 秀樹;旭 健作
- 通讯作者:旭 健作旭 健作
共 71 条
- 1
- 2
- 3
- 4
- 5
- 6
- 15
坂野 秀樹的其他基金
声道形状制御に基づく声質制御性および可視化性の高い音声分析合成手法の開発
基于声道形状控制的高音质可控可视化语音分析合成方法开发
- 批准号:24K1500024K15000
- 财政年份:2024
- 资助金额:$ 2.3万$ 2.3万
- 项目类别:Grant-in-Aid for Scientific Research (C)Grant-in-Aid for Scientific Research (C)
相似海外基金
A research on perceptual changes in paralanguage information with aging
副语言信息感知随年龄变化的研究
- 批准号:22K0319322K03193
- 财政年份:2022
- 资助金额:$ 2.3万$ 2.3万
- 项目类别:Grant-in-Aid for Scientific Research (C)Grant-in-Aid for Scientific Research (C)
Transfer characteristics of emotional speech information toward elderly persons with hearing loss and development of novel speech morphing methods
情感语音信息向听力损失老年人的传递特性及新型语音变形方法的开发
- 批准号:21K1979421K19794
- 财政年份:2021
- 资助金额:$ 2.3万$ 2.3万
- 项目类别:Grant-in-Aid for Challenging Research (Exploratory)Grant-in-Aid for Challenging Research (Exploratory)
音声を中心とした2話者混在メディア加工手法に関する実験的検討
以语音为核心的双人混合媒体处理方法实验研究
- 批准号:19K1205819K12058
- 财政年份:2019
- 资助金额:$ 2.3万$ 2.3万
- 项目类别:Grant-in-Aid for Scientific Research (C)Grant-in-Aid for Scientific Research (C)
Research and development of a Japanese pronunciation training system using average voice morphing
基于平均语音变形的日语发音训练系统的研发
- 批准号:16K1325316K13253
- 财政年份:2016
- 资助金额:$ 2.3万$ 2.3万
- 项目类别:Grant-in-Aid for Challenging Exploratory ResearchGrant-in-Aid for Challenging Exploratory Research
Investigations on design methodology of functional voices
功能声音设计方法研究
- 批准号:2465008524650085
- 财政年份:2012
- 资助金额:$ 2.3万$ 2.3万
- 项目类别:Grant-in-Aid for Challenging Exploratory ResearchGrant-in-Aid for Challenging Exploratory Research