位相差のモデルを活用したアドホックマイクロホンアレイ信号処理

使用相位差模型的特设麦克风阵列信号处理

基本信息

  • 批准号:
    22KJ2545
  • 负责人:
  • 金额:
    $ 1.98万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2023
  • 资助国家:
    日本
  • 起止时间:
    2023-03-08 至 2024-03-31
  • 项目状态:
    已结题

项目摘要

本研究課題では,分散配置されたスマートフォンやタブレットPCなどの録音機能をもつデバイスを連携させアレイ信号処理を行う,アドホックアレイ信号処理に取り組んでいる.アドホックアレイ信号処理では,各デバイスでのサンプリング周波数のずれにより,通常のアレイでは定常になるマイク間の位相差が非定常になり,これまでのアレイ信号処理がそのままでは適用できなくなるという課題がある.本年度は昨年度に引き続き,位相差の非定常性の原因であるサンプリング周波数のずれの推定・補償に取り組んだ.従来手法はあるマイクロホンのサンプリング周波数を基準とし,各非参照マイクロホンのサンプリング周波数の基準からのずれを個別に推定する.一方,提案手法では,アドホックアレイにおける多チャネル信号全体の確率モデルに基づきすべての非参照マイクロホンのサンプリング周波数を同時推定する.これにより,従来手法では考慮されていなかった非参照マイクロホン間の整合性を最適化の基準に取り入れることができ,推定精度が改善することを確認した.そして,サンプリング周波数の補償を行わないと音源分離の性能が低下する条件においても,提案手法によって音源分離性能を維持できることを確認した.また,アドホックアレイ信号処理の主要な応用先の一つである会議などの議事録作成を見据えて,音声強調・分離と音声認識の統合学習にも取り組んだ.特に,音声認識では近年注目されている自己教師あり学習表現 (SSLR) モデルを活用することで高い性能を実現した.多チャネル音声強調では様々なビームフォーマを比較検討し,WPDビームフォーマとSSLRモデルと組み合わせることで雑音・残響のある様々な環境において特に低い単語誤り率を実現した.
在本研究项目中,我们致力于自组织阵列信号处理,即通过将智能手机和平板电脑等具有记录功能的分布式设备链接起来进行阵列信号处理。 Ad-hoc阵列信号处理存在的问题是,在正常阵列中麦克风之间的相位差是恒定的,但由于每个设备中采样频率的差异而变得不稳定,从而无法应用传统的阵列信号处理:是。 ..今年,继去年之后,我们致力于估计和补偿采样频率偏移,这是不稳定相位差的原因。传统方法使用某个麦克风的采样频率作为参考,并单独估计每个非参考麦克风的采样频率与参考的偏差。另一方面,所提出的方法基于自组织阵列中整个多通道信号的概率模型同时估计所有非参考麦克风的采样频率。结果,我们证实,传统方法中未考虑的非参考麦克风之间的一致性可以纳入优化标准,从而提高估计精度。我们还证实,即使在不补偿采样频率的情况下声源分离性能会恶化的情况下,所提出的方法也可以保持声源分离性能。我们还致力于语音增强/分离和语音识别的集成学习,着眼于创建会议纪要,这是自组织阵列信号处理的主要应用之一。特别是,通过利用自监督学习表示(SSLR)模型在语音识别方面取得了高性能,近年来引起了人们的关注。对于多通道语音增强,我们比较和研究了各种波束形成器,通过结合WPD波束形成器和SSLR模型,我们在各种有噪声和混响的环境中实现了特别低的误码率。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Joint Optimization of Sampling Rate Offsets Based on Entire Signal Relationship Among Distributed Microphones
基于分布式麦克风间整体信号关系的采样率偏移联合优化
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Y. Masuyama; K. Yamaoka; N. Ono
  • 通讯作者:
    N. Ono
End-to-End Integration of Speech Recognition, Dereverberation, Beamforming, and Self-Supervised Learning Representation
语音识别、去混响、波束成形和自监督学习表示的端到端集成
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Y. Masuyama; X. Chang; S. Cornell; S. Watanabe;N. Ono
  • 通讯作者:
    N. Ono
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

升山 義紀其他文献

因果的MPDRビームフォーマの近接分離最適化による設計
基于邻近分离优化的因果 MPDR 波束形成器设计
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    升山 義紀; 山岡 洸瑛; 木下 裕磨; 小野 順貴
  • 通讯作者:
    小野 順貴
因果的MPDRビームフォーマの近接分離最適化による設計
基于邻近分离优化的因果 MPDR 波束形成器设计
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    升山 義紀; 山岡 洸瑛; 木下 裕磨; 小野 順貴
  • 通讯作者:
    小野 順貴
全方位画像と多チャネル音響信号を用いた自己教師あり深層音源定位
使用全向图像和多通道声信号进行自监督深度声源定位
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    升山 義紀; 坂東 宜昭; 大西 正輝; 矢田部 浩平; 及川 靖広
  • 通讯作者:
    及川 靖広
補助関数法による複数の非同期録音信号のブラインド同期
利用辅助函数法实现多个异步记录信号的盲同步
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    升山 義紀; 山岡 洸瑛; 小野 順貴
  • 通讯作者:
    小野 順貴
補助関数法による複数の非同期録音信号のブラインド同期
利用辅助函数法实现多个异步记录信号的盲同步
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    升山 義紀; 山岡 洸瑛; 小野 順貴
  • 通讯作者:
    小野 順貴

升山 義紀的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似海外基金

音響信号の振幅位相関係を考慮した複素スペクトル領域音声強調と応用
考虑声信号幅相关系的复谱域语音增强及其应用
  • 批准号:
    20K19827
  • 财政年份:
    2020
  • 资助金额:
    $ 1.98万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Development of ultrasonic feedback phased array tactile display
超声反馈相控阵触觉显示器的研制
  • 批准号:
    20K19819
  • 财政年份:
    2020
  • 资助金额:
    $ 1.98万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
分散ステレオマイクロフォンアレイに基づく音空間認識とその実世界応用
基于分布式立体声麦克风阵列的声音空间识别及其实际应用
  • 批准号:
    19J20420
  • 财政年份:
    2019
  • 资助金额:
    $ 1.98万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
Simultaneous Measurement of Multiple Sites of Multiple People for the Monitoring of Physiological Signals and Individual Identification Using Array Radar
利用阵列雷达同时测量多人多个部位的生理信号监测和个体识别
  • 批准号:
    19H02155
  • 财政年份:
    2019
  • 资助金额:
    $ 1.98万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Unification of Deep Learning and Generalized Mathematical Model for Independence-Based Audio Source Separation
深度学习与广义数学模型的统一用于基于独立的音频源分离
  • 批准号:
    19K20306
  • 财政年份:
    2019
  • 资助金额:
    $ 1.98万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了