音声データ圧縮・蓄積システムの高品質・低ビットレート化に関する研究

高质量低码率音频数据压缩与存储系统研究

基本信息

  • 批准号:
    06750373
  • 负责人:
  • 金额:
    $ 0.58万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
  • 财政年份:
    1994
  • 资助国家:
    日本
  • 起止时间:
    1994 至 无数据
  • 项目状态:
    已结题

项目摘要

1.従来の線形予測法にかえて,メルケプストラム分析法を利用したCELP音声符号化系を考案した.メルケプストラムを利用することにより,人間の聴覚特性を利用することが容易となった.2.メルケプストラム分析を用いた音声符号化系をワークステーション上で実現し,様々な標本化周波数,データレートに対応できるような拡張を行なった.3.実現したプログラムから総演算量を見積もり,演算量を削減する工夫をした.4.多くの音声データにより実際の符号化を行い,SN比などの客観評価により,実現された符号化システムの細部に渡る最適化を行なった.5.提案したメルケプストラム分析を用いた音声符号化系は,従来の線形予測法を用いた符号化系に比べ高いSN比をもつ.シミュレーションにより,従来法に比べ,約1dBの改善が達成されることを示した.6.この結果から,提案法は従来法に比べ高い音声品質をもつことが期待できるが,このような有効性を明らかにするためには,定量的な音声品質の評価を行わなければならない.本研究では,数十名程度の被験者による受聴試験に基づいて提案方式を従来方式と比較し,その優位性を示した.その結果,提案法は従来法に比較し,同じビットレートで,約1.8dBの改善を達成することができた.7.以上により,メルケプストラム分析のCELP音声符号化系における有効性が明かとなったが,今後はMBEなど他の音声符号化系におけるメルケプストラム分析の有効性についても検討していく予定である.
1.我们设计了一种采用梅尔倒谱分析方法的CELP语音编码系统,而不是传统的线性预测方法。利用梅尔倒谱可以很容易地利用人类的听觉特性。2.分析在工作站上实现,并扩展到支持各种采样频率和数据速率。 3. 根据实现的程序估算总计算量,并设计减少计算量的方法。 4. 使用大量音频数据进行实际编码,并通过信噪比等客观评估来评估所实现的编码。 5.所提出的使用梅尔倒谱分析的语音编码系统比使用传统线性预测方法的编码系统具有更高的信噪比。仿真表明,与传统方法相比,实现了约 1 dB 的改进。从这些结果可以看出,所提出的方法具有比传统方法更高的语音质量。在本研究中,我们通过对数十名受试者进行听力测试,将所提出的方法与传统方法进行了比较。结果,在相同比特率下,与传统方法相比,所提出的方法能够实现约1.8 dB的改进。7.虽然梅尔倒谱分析在语音编码系统中的有效性已经得到证明,但在未来我们计划。研究梅尔倒谱分析在其他语音编码系统(例如 MBE)中的有效性。

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
K.Koishida,K.Tokuda,T.kobayashi and S.Imai: "CELP coding based on mel-cepstral analysis" Proceedings of International Conference on Acoustics,Speech,and Signal Processing. (採録決定済). (1995)
K. Koishida、K. Tokuda、T. kobayashi 和 S. Imai:“基于梅尔倒谱分析的 CELP 编码”国际声学、语音和信号处理会议论文集(已接受)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

徳田 恵一其他文献

分離型2次元格子HMMに基づく顔画像認識
基于可分离二维网格HMM的人脸图像识别
  • DOI:
  • 发表时间:
    2005
  • 期刊:
  • 影响因子:
    0
  • 作者:
    布目 哲也;南角 吉彦;徳田 恵一;北村 正
  • 通讯作者:
    北村 正
英語音声合成における韻律推定モデルと音響モデルの同時学習
英语语音合成中韵律估计模型和声学模型的同时学习
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    大浦 圭一郎;戸田 智基;南角 吉彦;徳田 恵一;マイアハニエリ;坂井 信輔;中村 哲
  • 通讯作者:
    中村 哲
F0量子化と非パラレル学習に基づく声質変換の評価
基于F0量化和非并行学习的语音质量转换评估
Knowledge-based Discovery in Systems Biology using CF-Induction.
使用 CF-Induction 在系统生物学中进行基于知识的发现。
Blizzar Challenge 2007のための平均声に基づくHMM音声合成システムの評価
2007 年暴雪挑战赛基于平均语音的 HMM 语音合成系统评估
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    能勢 隆;山岸 順一;全 柄河;戸田 智基;徳田 恵一
  • 通讯作者:
    徳田 恵一

徳田 恵一的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('徳田 恵一', 18)}}的其他基金

深層学習に基づいた新世代音声・オーディオ信号生成に関する研究
基于深度学习的新一代语音音频信号生成研究
  • 批准号:
    23K24870
  • 财政年份:
    2024
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Next-generation audio and speech processing architectures based on deep learning
基于深度学习的下一代音频和语音处理架构
  • 批准号:
    22H03614
  • 财政年份:
    2022
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
t分布仮定に基づくロバストスペクトル推定
基于t分布假设的鲁棒谱估计
  • 批准号:
    97F00343
  • 财政年份:
    1998
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
マルチモーダル音声認識・合成によるインターフェースの構築
使用多模态语音识别和合成构建界面
  • 批准号:
    10780226
  • 财政年份:
    1998
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
隠れマルコフモデルを用いた認識ボコーダー極低ビットレート音声符号化-
使用隐马尔可夫模型进行极低比特率语音编码的识别声码器
  • 批准号:
    08780333
  • 财政年份:
    1996
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
隠れマルコフモデルを用いた音声の規則合成-喜怒哀楽の表現を目指して-
使用隐马尔可夫模型规则合成语音 - 旨在表达喜、怒、哀、乐 -
  • 批准号:
    07858043
  • 财政年份:
    1995
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
適応メルケプストラム分析法に基づく音声の高能率符号化法に関する研究
基于自适应梅尔倒谱分析方法的高效语音编码方法研究
  • 批准号:
    04750270
  • 财政年份:
    1992
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

Modelling Speech Spectra Based on Logarithmic Shallow Neural Networks
基于对数浅层神经网络的语音谱建模
  • 批准号:
    21K11957
  • 财政年份:
    2021
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Blind detection of audio data hiding
音频数据隐藏的盲检测
  • 批准号:
    18K11301
  • 财政年份:
    2018
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
人間の聴覚特性を考慮した残響・雑音環境下における音声信号処理の研究
考虑人耳听觉特性的混响噪声环境下音频信号处理研究
  • 批准号:
    18J20059
  • 财政年份:
    2018
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
Development of time series matching method by polynomials for object detection in videos and coding
开发用于视频中目标检测和编码的多项式时间序列匹配方法
  • 批准号:
    24300066
  • 财政年份:
    2012
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Robust and reversible audio watermarking technology
稳健且可逆的音频水印技术
  • 批准号:
    24500128
  • 财政年份:
    2012
  • 资助金额:
    $ 0.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了