マイクロホンアレーによる移動話者追尾システムの開発

利用麦克风阵列开发移动说话人跟踪系统

基本信息

  • 批准号:
    17760316
  • 负责人:
  • 金额:
    $ 1.41万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
  • 财政年份:
    2005
  • 资助国家:
    日本
  • 起止时间:
    2005 至 2006
  • 项目状态:
    已结题

项目摘要

平成18年度は,マイクロホンアレーを用いた移動話者追尾アルゴリズムの開発として,信号部分空間の逐次推定により話者方向を高精度に推定する手法を提案し,その性能について検証した。提案法では,音源方向椎定法としてMUSICを用いた。MUSICでは,マイクロホンアレーの受信音の作る信号空間を,音源信号に起因する信号部分空間と雑音信号に起因する雑音部分空間に分解し,互いの空間の直交性に基づいて推定を行う。直交性の判断にはMUSICスペクトラムと呼ばれる評価関数を用いて,そのピークから音源方向を推定する。MUSICは高精度な推定が可能であるが,信号部分空間の分解にアレーの受信音の相関行列の固有値分解が必要であるため,本研究で想定しているような話者が移動する状況においては,話者方向が変化するたびに固有値分解が必要であり,計算コストの増大をまねくという問題がある。そこで,提案法では信号部分空間の逐次推定法であるPASTを用いて信号部今空間を推定し,MUSICスペクトルにより移動音源方向を推定した。PASTを用いることにより,固有値分解をすることなく逐次的に信号部分空間の推定が可能であるとともに,計算コストの低減が可能となった。実環境実験により.提案法によって移動話者方向の逐次推定が可能であることを明らかにした。また,無音区間において騒音源方向を推定するという本手法固有の問題点を指摘するとともに,その解決法についても検討し,ヒルベルト変換器を用いて求めた複素信号の瞬時振幅のばらつきにより無音区間を判別し,無音区間における更新を停止することにより過渡状態における推定結果の不安定性の解決を行なった。
2006年,作为使用麦克风阵列的移动说话人跟踪算法开发的一部分,我们提出了一种通过顺序估计信号子空间来高精度估计说话人方向的方法,并验证了其性能。在所提出的方法中,使用MUSIC作为声源方向确定方法。在MUSIC中,麦克风阵列接收到的声音所产生的信号空间被分解为由声源信号引起的信号子空间和由噪声信号引起的噪声子空间,并基于两个空间的正交性进行估计。使用称为音乐频谱的评估函数来确定正交性,并根据声源的峰值来估计声源的方向。虽然MUSIC能够进行高精度估计,但它需要对阵列接收声音的相关矩阵进行特征值分解来分解信号子空间,因此它不适合说话者移动的情况,例如本研究中假设的情况存在每次说话人方向改变都需要进行特征值分解,导致计算成本增加的问题。因此,在所提出的方法中,使用PAST(信号子空间的顺序估计方法)来估计信号子空间,并使用MUSIC频谱来估计移动声源方向。通过使用PAST,可以在不进行特征值分解的情况下顺序估计信号子空间,并且还可以降低计算成本。通过现实世界的实验,我们证明了所提出的方法可以成功地估计移动扬声器的方向。此外,我们指出了这种在无声部分估计噪声源方向的方法固有的问题,并考虑了解决方案。通过确定差值和,解决了瞬态估计结果的不稳定性。在静默部分停止更新。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
信号空間の固有値に基づく線形フィルタによる目的音抽出
基于信号空间特征值使用线性滤波器提取目标声音
DESIGN METHODS OF FIR FILTERS WITH SIGNED POWER OF TWO COEFFICIENTS USING A NEW LINEAR PROGRAMMING RELAXATION WITH TRIANGLE INEQUALITIES
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    R. Ito;T. Fujie;K. Suyama;R. Hirabayashi
  • 通讯作者:
    R. Ito;T. Fujie;K. Suyama;R. Hirabayashi
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

陶山 健仁其他文献

非定常雑音環境下における音源分布に基づいた目的音強調法
非平稳噪声环境下基于声源分布的目标声增强方法
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    大宮 健太;陶山 健仁;大宮健太,陶山健仁;陶山健仁;大宮健太,平川真里,陶山健仁;篠原尚希,陶山健仁
  • 通讯作者:
    篠原尚希,陶山健仁
Multiple Omnidirectional Sound Source Tracking using Sequential Updating Histogram
使用顺序更新直方图的多个全向声源跟踪
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    大宮 健太;陶山 健仁;大宮健太,陶山健仁;陶山健仁;大宮健太,平川真里,陶山健仁;篠原尚希,陶山健仁;椎木悠介,陶山健仁;Yusuke Shiiki and Kenji Suyama;Yusuke Shiiki and Kenji Suyama
  • 通讯作者:
    Yusuke Shiiki and Kenji Suyama
Electromagnetic Plane Wave Scattering by a Rectangular Hole in a Thick Conducting Screen
厚导电屏中矩形孔的电磁平面波散射
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    大宮 健太;陶山 健仁;大宮健太,陶山健仁;陶山健仁;大宮健太,平川真里,陶山健仁;篠原尚希,陶山健仁;椎木悠介,陶山健仁;Yusuke Shiiki and Kenji Suyama;Yusuke Shiiki and Kenji Suyama;H. B. Chu and H. Shirai;清水 将行,白井 宏,佐藤 亮一;H. B. Chu and H. Shirai;H. N. Quang and H. Shirai;K. N. Nguyen and H. Shirai
  • 通讯作者:
    K. N. Nguyen and H. Shirai
瞬時位相差に基づく逐次更新ヒストグラムを用いた複数音源追尾
使用基于瞬时相位差的顺序更新直方图进行多声源跟踪
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    大宮 健太;陶山 健仁
  • 通讯作者:
    陶山 健仁
A Compact Metamaterial Quad-band Antenna Based on Asymmetric E-CRLH Unit Cell
基于非对称E-CRLH晶胞的紧凑型超材料四频天线
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    大宮 健太;陶山 健仁;大宮健太,陶山健仁;陶山健仁;大宮健太,平川真里,陶山健仁;篠原尚希,陶山健仁;椎木悠介,陶山健仁;Yusuke Shiiki and Kenji Suyama;Yusuke Shiiki and Kenji Suyama;H. B. Chu and H. Shirai
  • 通讯作者:
    H. B. Chu and H. Shirai

陶山 健仁的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('陶山 健仁', 18)}}的其他基金

Development of Digital Filter Design Method for Improving Designer's Efficiency
开发数字滤波器设计方法以提高设计人员的效率
  • 批准号:
    22K04110
  • 财政年份:
    2022
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
最適指向特性をもつ高SIN受音システムの開発
开发具有最佳指向性的高SIN声音接收系统
  • 批准号:
    15760277
  • 财政年份:
    2003
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)

相似海外基金

High quality sound collection by multiple microphone array
多个麦克风阵列采集高品质声音
  • 批准号:
    16K00256
  • 财政年份:
    2016
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
A study on stable multiple sound source tracking method in actual environment
实际环境下稳定的多声源跟踪方法研究
  • 批准号:
    21760299
  • 财政年份:
    2009
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
複素スペクトル円心法(CSCC法)によるマイクロホンアレー信号処理に関する研究
复谱圆心法(CSCC法)麦克风阵列信号处理研究
  • 批准号:
    17650045
  • 财政年份:
    2005
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
音声と顔画像の融合解析に基づく対話型人物認識システムに関する研究
基于语音与人脸图像融合分析的交互式人物识别系统研究
  • 批准号:
    07780379
  • 财政年份:
    1995
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
音声および顔情報の融合解析に基づく対話型人物認識システムに関する研究
基于语音与面部信息融合分析的交互式人物识别系统研究
  • 批准号:
    06780358
  • 财政年份:
    1994
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了