変調伝達関数に基づいた骨導音声の明瞭度回復法の基礎検討

基于调制传递函数的骨导语音清晰度恢复方法基础研究

基本信息

批准号：
17650048
负责人：
鵜木祐史
金额：
$ 1.41万
依托单位：
Japan Advanced Institute of Science and Technology
依托单位国家：
日本
项目类别：
Grant-in-Aid for Exploratory Research
财政年份：
2005
资助国家：
日本
起止时间：
2005 至 2006
项目状态：
已结题

项目摘要

本研究では,高騒音環境下での音声会話を実現するために骨導マイクを利用した補聴システムの構築を目指している.骨導マイクは雑音に頑健に音声を集音することができるが,その音声の音質や明瞭度は著しく低下しているため,そのままでは利用することができない.そこで,気導音声を入力,骨導音声を出力とした伝達系を想定し,この伝達特性を明らかにするとともに,伝達特性の逆特性を利用した骨導音声の明瞭度回復法の可能性を探る.本年度は,昨年度提案したプロトタイプモデルの改良を行うとともに,提案モデルについて二つの評価検討を行った.1)骨導音声回復法の改良線形予測(LP)法に基づいたプロトタイプモデルについて,骨導音声と気導音声間でLP残差がほぼ一定であること,LP係数を逆推定可能であること,ならびにより安定なLP表現上のLSF係数を逆推定可能であることを利用して,モデルを改良し,完全なたブラインド回復法を提案した.逆推定にはニューラルネットワーク等の学習法を利用した.2)客観評価による検討提案モデルを定量的に評価するために,昨年度構築した骨導・気導音声を評価データとして利用した.客観評価尺度としてスペクトル歪,LPC距離,MFCC距離を利用し,LP法ならびにLPベースのブラインド回復法が有効に骨導音声を気導音声並みに回復できることを示した.この成果は骨導音声に対する音声認識の前処理として利用可能であることを実証している.3)主観評価による検討同じく主観評価として,MOSテスト,改良Rhymeテスト,単語了解度試験を行った.改良Rhymeテストでは英語音声データに対してのみ,単語了解度試験では日本語音声データに対してのみ,MOSテストでは両データに対して行った.その結果,提案法が観測した骨導音声のみから,いずれも骨導音声の低下した音質や音声明瞭度を著しく改善できることを示した.

在这项研究中，我们的目标是构建一个使用骨传导麦克风的助听系统，以在高噪声环境下实现语音对话。骨传导麦克风可以抵抗噪声稳健地拾取声音，但声音的音质和清晰度明显下降，因此，我们假设采用气导语音作为输入，骨导语音作为输出的传输系统，并明确了传输特性，同时可以恢复骨导语音的清晰度。语音使用传输特性的逆特性。今年，我们改进了去年提出的原型模型，并对所提出的模型进行了两次评估：1）关于基于骨导语音恢复方法的改进线性预测（LP）方法的原型模型，我们利用了优势。由于骨传导语音和空气传导语音之间的 LP 残差几乎是恒定的，因此可以逆估计 LP 系数，并且可以逆估计更稳定的 LP 表示上的 LSF 系数。然后，我们进行改进。该模型并创建了完全盲目的恢复方法。我们提出了一种学习方法，例如神经网络进行逆估计。2）使用客观评估的考虑为了定量评估所提出的模型，我们使用去年建立的骨导和气导音频作为评估数据，使用频谱失真、LPC。距离和MFCC距离作为客观评价指标，我们表明LP方法和基于LP的盲恢复方法可以有效地将骨传导语音恢复到与空气传导语音相同的水平，用作语音识别的预处理。 3) 使用主观评价进行检查我们进行了 MOS 测试、改进的韵律测试和单词清晰度测试作为主观评价。清晰度测试仅对日语语音数据进行，并且对两个数据都进行了 MOS 测试。结果发现，仅通过所提出的方法观察到的骨导语音显示，骨导语音的音质和语音清晰度均出现了劣化，并且已经表明劣化程度可以得到显着改善。

项目成果

期刊论文数量（3）

专著数量（0）

科研奖励数量（0）

会议论文数量（0）

专利数量（0）

A study on restoration of bone-conducted speech with the LPC-based model

基于LPC模型的骨导语音恢复研究

DOI：
发表时间：
2006
期刊：
日本音響学会聴覚研究会資料 36(1)
影响因子：
0
作者：
T.T.Vu;M.Unoki;M.Akagi
通讯作者：
M.Akagi

A study on an LPC-based restoration model for improving the voice-quality of bone-conducted speech

基于LPC的骨导语音音质恢复模型研究

DOI：
发表时间：
2006
期刊：
Proc.NCSP06
影响因子：
0
作者：
T.T.Vu;M.Unoki;M.Akagi
通讯作者：
M.Akagi

A method for restoring bone-conducted speech based on the LPC model

一种基于LPC模型的骨导语音恢复方法

DOI：
发表时间：
2006
期刊：
日本音響学会2006年度春季研究発表会講演資料 1-3-3
影响因子：
0
作者：
T.T.Vu;M.Unoki;M.Akagi
通讯作者：
M.Akagi

An LP-based Blind Restoration Method for Improving Intelligibility of Bone-conducted Speech

基于LP的提高骨导语音清晰度的盲恢复方法

DOI：
发表时间：
2007
期刊：
電子情報通信学会信学技報 SP2006-172
影响因子：
0
作者：
Vu;T.T.;Unoki;M.;Akagi;M.
通讯作者：
M.

A Study on Restoration of Bone-conducted speech with MTF-based and LP-based Models

基于MTF和LP模型的骨导语音恢复研究

DOI：
发表时间：
2006
期刊：
Journal of Signal Processing Vol. 10 No. 6
影响因子：
0
作者：
Vu;T.T.;Kimura;K.;Unoki;M.;Akagi;M
通讯作者：
M

DOI：
{{ item.doi }}
发表时间：
{{ item.publish_year }}
期刊：
{{ item.journal_name }}
影响因子：
{{ item.factor }}
作者：
{{ item.authors }}
通讯作者：
{{ item.author }}

数据更新时间：{{ journalArticles.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ monograph.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ sciAawards.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ conferencePapers.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ patent.updateTime }}

鵜木祐史其他文献

自己聴取音の印象に関する個人性の調査

关于自听声音印象的个性调查

DOI：
发表时间：
2021
期刊：
影响因子：
0
作者：
森田翔太;鳥谷輝樹;鵜木祐史
通讯作者：
鵜木祐史

Internal logic viewed from observation space: Theory and a case study

从观察空间看内部逻辑：理论与案例研究

DOI：
发表时间：
2007
期刊：
BioSystems 90
影响因子：
0
作者：
羽二生篤;鵜木祐史;赤木正人;M. Hatakeyama
通讯作者：
M. Hatakeyama

Controlling engine data : Nonperiodic fluctuations in a spark ignition engine of motorcycle and its stabilization

控制发动机数据：摩托车火花点火发动机的非周期性波动及其稳定性

DOI：
发表时间：
2006
期刊：
Abstracts : The 8th RIES-Hokudai International Symposium on [bi]
影响因子：
0
作者：
羽二生篤;鵜木祐史;赤木正人;M. Hatakeyama;Kazuhiro Matsumoto;I. Tsuda;Y. Fukushima;伊藤孝男;Y.Yamaguti;K.Matsumoto
通讯作者：
K.Matsumoto

脳の中のカオス

大脑混乱

DOI：
发表时间：
2006
期刊：
数学通信第11巻第1号
影响因子：
0
作者：
羽二生篤;鵜木祐史;赤木正人;M. Hatakeyama;Kazuhiro Matsumoto;I. Tsuda;Y. Fukushima;伊藤孝男;Y.Yamaguti;K.Matsumoto;S.Tadokoro;津田一郎
通讯作者：
津田一郎