変調伝達関数に基づいた骨導音声の明瞭度回復法の基礎検討

基于调制传递函数的骨导语音清晰度恢复方法基础研究

基本信息

项目摘要

本研究では,高騒音環境下での音声会話を実現するために骨導マイクを利用した補聴システムの構築を目指している.骨導マイクは雑音に頑健に音声を集音することができるが,その音声の音質や明瞭度は著しく低下しているため,そのままでは利用することができない.そこで,気導音声を入力,骨導音声を出力とした伝達系を想定し,この伝達特性を明らかにするとともに,伝達特性の逆特性を利用した骨導音声の明瞭度回復法の可能性を探る.本年度は,昨年度提案したプロトタイプモデルの改良を行うとともに,提案モデルについて二つの評価検討を行った.1)骨導音声回復法の改良線形予測(LP)法に基づいたプロトタイプモデルについて,骨導音声と気導音声間でLP残差がほぼ一定であること,LP係数を逆推定可能であること,ならびにより安定なLP表現上のLSF係数を逆推定可能であることを利用して,モデルを改良し,完全なたブラインド回復法を提案した.逆推定にはニューラルネットワーク等の学習法を利用した.2)客観評価による検討提案モデルを定量的に評価するために,昨年度構築した骨導・気導音声を評価データとして利用した.客観評価尺度としてスペクトル歪,LPC距離,MFCC距離を利用し,LP法ならびにLPベースのブラインド回復法が有効に骨導音声を気導音声並みに回復できることを示した.この成果は骨導音声に対する音声認識の前処理として利用可能であることを実証している.3)主観評価による検討同じく主観評価として,MOSテスト,改良Rhymeテスト,単語了解度試験を行った.改良Rhymeテストでは英語音声データに対してのみ,単語了解度試験では日本語音声データに対してのみ,MOSテストでは両データに対して行った.その結果,提案法が観測した骨導音声のみから,いずれも骨導音声の低下した音質や音声明瞭度を著しく改善できることを示した.
在这项研究中,我们的目标是构建一个使用骨传导麦克风的助听系统,以在高噪声环境下实现语音对话。骨传导麦克风可以抵抗噪声稳健地拾取声音,但声音的音质和清晰度明显下降,因此,我们假设采用气导语音作为输入,骨导语音作为输出的传输系统,并明确了传输特性,同时可以恢复骨导语音的清晰度。语音使用传输特性的逆特性。今年,我们改进了去年提出的原型模型,并对所提出的模型进行了两次评估:1)关于基于骨导语音恢复方法的改进线性预测(LP)方法的原型模型,我们利用了优势。由于骨传导语音和空气传导语音之间的 LP 残差几乎是恒定的,因此可以逆估计 LP 系数,并且可以逆估计更稳定的 LP 表示上的 LSF 系数。然后,我们进行改进。该模型并创建了完全盲目的恢复方法。我们提出了一种学习方法,例如神经网络进行逆估计。2)使用客观评估的考虑为了定量评估所提出的模型,我们使用去年建立的骨导和气导音频作为评估数据,使用频谱失真、LPC。距离和MFCC距离作为客观评价指标,我们表明LP方法和基于LP的盲恢复方法可以有效地将骨传导语音恢复到与空气传导语音相同的水平,用作语音识别的预处理。 3) 使用主观评价进行检查 我们进行了 MOS 测试、改进的韵律测试和单词清晰度测试作为主观评价。清晰度测试仅对日语语音数据进行,并且对两个数据都进行了 MOS 测试。结果发现,仅通过所提出的方法观察到的骨导语音显示,骨导语音的音质和语音清晰度均出现了劣化,并且已经表明劣化程度可以得到显着改善。

项目成果

期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
A study on restoration of bone-conducted speech with the LPC-based model
基于LPC模型的骨导语音恢复研究
A study on an LPC-based restoration model for improving the voice-quality of bone-conducted speech
基于LPC的骨导语音音质恢复模型研究
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    T.T.Vu;M.Unoki;M.Akagi
  • 通讯作者:
    M.Akagi
A method for restoring bone-conducted speech based on the LPC model
一种基于LPC模型的骨导语音恢复方法
An LP-based Blind Restoration Method for Improving Intelligibility of Bone-conducted Speech
基于LP的提高骨导语音清晰度的盲恢复方法
A Study on Restoration of Bone-conducted speech with MTF-based and LP-based Models
基于MTF和LP模型的骨导语音恢复研究
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

鵜木 祐史其他文献

自己聴取音の印象に関する個人性の調査
关于自听声音印象的个性调查
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    森田 翔太;鳥谷 輝樹;鵜木 祐史
  • 通讯作者:
    鵜木 祐史
Internal logic viewed from observation space: Theory and a case study
从观察空间看内部逻辑:理论与案例研究
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    羽二 生篤;鵜木 祐史;赤木 正人;M. Hatakeyama
  • 通讯作者:
    M. Hatakeyama
Controlling engine data : Nonperiodic fluctuations in a spark ignition engine of motorcycle and its stabilization
控制发动机数据:摩托车火花点火发动机的非周期性波动及其稳定性
脳の中のカオス
大脑混乱
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    羽二 生篤;鵜木 祐史;赤木 正人;M. Hatakeyama;Kazuhiro Matsumoto;I. Tsuda;Y. Fukushima;伊藤孝男;Y.Yamaguti;K.Matsumoto;S.Tadokoro;津田一郎
  • 通讯作者:
    津田一郎
Chaos Reality in the Brain
大脑中的混沌现实
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    羽二 生篤;鵜木 祐史;赤木 正人;M. Hatakeyama;Kazuhiro Matsumoto;I. Tsuda
  • 通讯作者:
    I. Tsuda

鵜木 祐史的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('鵜木 祐史', 18)}}的其他基金

振幅変調知覚に基づく聴覚エンリッチメント:人工内耳用音声信号処理の研究
基于调幅感知的听觉丰富:人工耳蜗音频信号处理研究
  • 批准号:
    23K21679
  • 财政年份:
    2024
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Voice information-hiding/anonymization technology for voice privacy protection
语音信息隐藏/匿名化技术,保护语音隐私
  • 批准号:
    23K18491
  • 财政年份:
    2023
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
Auditory Enrichment based on perception of amplitude modulation: Study on speech signal processing for Cochlear Implant
基于幅度调制感知的听觉丰富:人工耳蜗语音信号处理研究
  • 批准号:
    21H03463
  • 财政年份:
    2021
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
VOICE 2.0: towards augmentation of enriched speech communication
VOICE 2.0:增强丰富的语音通信
  • 批准号:
    20KK0233
  • 财政年份:
    2020
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Fund for the Promotion of Joint International Research (Fostering Joint International Research (B))
蝸牛遅延特性を利用した音信号への情報ハイディング
利用耳蜗延迟特性将信息隐藏到声音信号中
  • 批准号:
    21650035
  • 财政年份:
    2009
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
雑音・残響環境下における基本周波数推定法に関する研究
噪声/混响环境下基频估计方法研究
  • 批准号:
    14780267
  • 财政年份:
    2002
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
聴覚的音分離の計算理論に関する研究
听觉声音分离计算理论研究
  • 批准号:
    00J04717
  • 财政年份:
    2000
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
音の分離・抽出における聴覚の計算理論に関する基礎的研究
声音分离提取中的听觉计算理论基础研究
  • 批准号:
    98J08110
  • 财政年份:
    1998
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows

相似海外基金

雑音下における音声基本周波数抽出のための気導音、骨導音の利用に関する統合的研究
噪声下利用气导声和骨导声提取语音基频的综合研究
  • 批准号:
    22K12068
  • 财政年份:
    2022
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
ナノマテリアルを用いた大気下で最適駆動可能な演算ハードウェア素子の創製
使用纳米材料创建可以在大气中最佳运行的计算硬件元件
  • 批准号:
    21K14527
  • 财政年份:
    2021
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Test of effectiveness of guide information presentation on mobility support for persons with visual impairment by using bone-conduction 3-D sound.
使用骨传导 3-D 声音测试为视力障碍者提供移动支持的引导信息呈现的有效性。
  • 批准号:
    20K11300
  • 财政年份:
    2020
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Creation of brain-inspired material intelligence composed of nanomaterial network
创造由纳米材料网络组成的类脑物质智能
  • 批准号:
    20K22485
  • 财政年份:
    2020
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Research Activity Start-up
体内伝導音と音声信号の高次相関情報活用による騒音下でのベイズ推定に基づく信号抽出
利用人体传导声音和音频信号之间的高阶相关信息,在噪声条件下基于贝叶斯估计进行信号提取
  • 批准号:
    19K04428
  • 财政年份:
    2019
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了