Robust F0 estimation based on time-varying complex speech analysis and its application for IP telephony and musical signal
基于时变复杂语音分析的鲁棒F0估计及其在IP电话和音乐信号中的应用
基本信息
- 批准号:20500158
- 负责人:
- 金额:$ 2.41万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:2008
- 资助国家:日本
- 起止时间:2008 至 2010
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
F0 estimation of speech plays an important role on speech processing. One of the authors has proposed time-varying complex speech analysis for analytic speech signal and has proposed novel F0 estimation based on the time-varying complex speech analysis in which complex residual is estimated by the speech analysis and F0 is estimated by peak-picking the weighted auto-correlation with a reciprocal of the corresponding AMDF for the residual. It is called frame-based method. In this study, we propose more accurate and fast F0 estimation algorithm. In the method, pre-selections of F0 and F1 are realized by using F0 and F1 contour estimation method based on the time-varying complex analysis. It is called sample-based method. Final-selection of F0 is realized by the frame-based method with shorten range of F0 based on the estimated F0 and F1. The shorten range results in more accurate estimation with smaller computational amount in the two-stage F0 estimation. Furthermore, in order to investigate the efficacy of the time-varying analysis, the frame-based method is evaluated for each frame that is categorized into 4 modes with respect to the voiced strength. The experimental results confirm that the time-varying analysis can perform better for strong voiced frames.
F0语音估计在语音处理中起着重要作用。其中一位作者提出了针对分析语音信号的时变复杂语音分析,并基于随时间变化的复杂语音分析提出了新颖的F0估计,其中通过语音分析估算复杂的残差和F0估计,通过将相应的AMDF的相互序列添加到相应的AMDF中,可以通过峰值进行峰值。它称为基于帧的方法。在这项研究中,我们提出了更准确和快速的F0估计算法。在该方法中,通过基于时间变化的复合分析,使用F0和F1轮廓估计方法来实现F0和F1的前选择。它称为基于样本的方法。 F0的最终选择是通过基于框架的F0缩短范围的基于框架的方法实现的,该方法基于估计的F0和F1实现。缩短范围会导致更准确的估计,在两阶段F0估计中计算量较小。此外,为了研究时间变化分析的疗效,对基于框架的方法进行了基于框架的方法,该方法相对于声音强度归为4个模式。实验结果证实,随时间变化的分析可以更好地表现出强烈的声音帧。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
時変複素音声分析を用いた音声符号化方式について
关于使用时变复杂语音分析的语音编码方法
- DOI:
- 发表时间:2010
- 期刊:
- 影响因子:0
- 作者:吉川友也;藤和巳;元田浩;木村昌弘;大原剛三;戸次大介;舟木慶一
- 通讯作者:舟木慶一
時変複素音声分析を用いたFO軌跡推定方式の改善
利用时变复杂语音分析改进FO轨迹估计方法
- DOI:
- 发表时间:2008
- 期刊:
- 影响因子:0
- 作者:水田昌孝;山川一正;熊野雅仁;木村昌弘;舟木慶一
- 通讯作者:舟木慶一
Evaluation of Complex LPC Analysis on Lossless Compression of Finger Print Image Using MPEG-4 ALS
使用 MPEG-4 ALS 进行指纹图像无损压缩的复杂 LPC 分析评估
- DOI:
- 发表时间:2009
- 期刊:
- 影响因子:0
- 作者:伊藤政志;熊野雅仁;木村昌弘;斉藤和巳;元田浩;片岡喜代子;舟木慶一
- 通讯作者:舟木慶一
ロバスト複素AR音声分析に基づくITU-T G.711.1改良方式の検討
基于鲁棒复杂AR语音分析的改进ITU-T G.711.1方法研究
- DOI:
- 发表时间:2010
- 期刊:
- 影响因子:0
- 作者:小出明弘;斉藤和巳;元田浩;木村昌弘;大原剛三;舟木慶一
- 通讯作者:舟木慶一
複素線形予測分析を用いたMPEG-4 Audio Lossless Coding (ALS)の改良
使用复杂的线性预测分析改进 MPEG-4 音频无损编码 (ALS)
- DOI:
- 发表时间:2009
- 期刊:
- 影响因子:0
- 作者:木村昌弘;斉藤和巳;中野良平;元田浩;舟木慶一;片岡喜代子;舟木慶一
- 通讯作者:舟木慶一
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
FUNAKI Keiichi其他文献
FUNAKI Keiichi的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('FUNAKI Keiichi', 18)}}的其他基金
Robust HMM speech recognition using robust time-varying complex speech analysis
使用鲁棒时变复杂语音分析的鲁棒 HMM 语音识别
- 批准号:
14550363 - 财政年份:2002
- 资助金额:
$ 2.41万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
相似海外基金
高ダブルセレクティブ水中音響伝搬路において高速高信頼通信を実現する先進信号処理
先进的信号处理可在高度双选择性水声传播路径中实现高速可靠的通信
- 批准号:
23K22752 - 财政年份:2024
- 资助金额:
$ 2.41万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
正則化機能強化による超ロバスト推定法の開拓と一般化:信号処理・機械学習への応用
通过加强正则化功能开发和推广超鲁棒估计方法:在信号处理和机器学习中的应用
- 批准号:
23K22762 - 财政年份:2024
- 资助金额:
$ 2.41万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
EEGに基づいたMTR-BCIのための信号処理技術
基于EEG的MTR-BCI信号处理技术
- 批准号:
24K07529 - 财政年份:2024
- 资助金额:
$ 2.41万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
複素スペクトル領域での振幅位相関係に基づく新たな音響信号処理の創出
基于复谱域中的幅相关系创建新的声学信号处理
- 批准号:
24K20838 - 财政年份:2024
- 资助金额:
$ 2.41万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
水中音響高速移動体通信における時変動性マルチパス環境に対応する信号処理技術の研究
水声高速移动通信时变多径环境信号处理技术研究
- 批准号:
24K17462 - 财政年份:2024
- 资助金额:
$ 2.41万 - 项目类别:
Grant-in-Aid for Early-Career Scientists