Innovation of speech / acoustic scene recognition based on distributed acoustic sensing and asynchronous sequence modeling
基于分布式声学传感和异步序列建模的语音/声学场景识别创新
基本信息
- 批准号:20H00613
- 负责人:
- 金额:$ 28.95万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (A)
- 财政年份:2020
- 资助国家:日本
- 起止时间:2020-04-01 至 2024-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
2021年度は以下の成果を得た。1) 音響シーン認識:分散マイクロホンによる観測の一部に欠損がある場合,欠損を模擬したモデル学習やAutoEncoderによる欠損の補完により,シーン分類性能低下を防ぐ手法を提案した。また,音響イベント検出と音響シーン認識を同時にモデル化し,音響イベントの弱ラベルを用いて相互に性能を高めあう学習法を提案した。ブリンキーを用いることを想定した end-to-end学習に基づく音響シーン認識についても検討を進めた。2) ブリンキーに基づく分散音響センシング:小規模DNNをブリンキー内で動作させることに成功した。また,光信号飽和時に伝達係数と信号を推定する手法を提案した。新たな展開として,音響信号から複数ブリンキーの光信号への変換を圧縮センシングと捉え,スパースなスペクトルを復元する手法を提案した。3) 非同期信号の同期技術:補助関数法を用いた複数時間差推定のオンライン化について検討した。また,この手法をサンプリング周波数ミスマッチの同時推定に拡張した。4) 微弱周期信号への動的同期加算:サンプリング周波数が微小に時間変動する環境下で微弱周期信号を強調する手法を,インパルス応答推定に応用した。さらに前年度収録したデータベースを用いて実環境での評価も行った。5) アレイ信号処理の発展:リアルタイム応用を想定し,因果性制約下近接分離最適化によりビームフォーマーを設計する手法を提案した。時間周波数線形結合ビームフォーマーについても最適なフィルタ数について検討を進めた。音場補間に基づく,マイクロホンアレイの回転に頑健なビームフォーミングを提案した。6) 実世界応用:自閉スペクトラム症診断のための対話音声の分散録音と分析について検討を進めた他,国立国語研究所が公開している日常会話コーパスに対して,ブラインド同期と音源分離による重畳音声の分離を試みた。
在2021财政年度,我们获得了以下结果:1)声学场景识别:如果分散麦克风的某些观察结果存在缺陷,我们提出了一种方法,通过学习模拟模拟缺陷并使用自动辅助模型来防止场景分类效果的方法来防止场景分类性能降低。我们还提出了一种学习方法,该方法同时建模了声学事件检测和声学场景识别,并使用弱标签来进行声学事件来提高性能。我们还讨论了基于端到端学习的声学场景识别,假设使用了眨眼。 2)基于眨眼的分布式声感应:眨眼内的小规模DNN的成功操作。我们还提出了一种估算光学信号饱和时传输系数和信号的方法。作为一种新的开发,我们提出了一种方法,通过将声学信号转换为多个闪电器光学信号作为压缩感应来重建稀疏频谱。 3)异步信号的同步技术:我们使用辅助函数方法研究了多个时间差估计的在线化。此外,该方法扩展到了采样频率不匹配的同时估计。 4)在弱周期性信号中的动态同步添加:在采样频率略有变化的环境中强调弱周期性信号的技术已应用于脉冲响应估计。此外,使用上一年记录的数据库在真实环境中进行了评估。 5)阵列信号处理的开发:我们提出了一种在实时应用的假设下,通过在因果约束下优化邻近分离来设计光束形式的方法。我们还研究了时间频线线性耦合光束器的最佳过滤器数量。我们提出了基于声场插值的麦克风阵列旋转的稳健光束形成。 6)现实世界的应用:除了研究自闭症谱系障碍诊断的分布式记录和对话言语的分析外,我们还试图通过盲目同步和声音源分离来分开由美国国家语言和研究学院发表的每日对话语料库的叠加语音。
项目成果
期刊论文数量(42)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
非同期分散マイクロフォンを活用する音響信号処理
利用异步分布式麦克风进行声学信号处理
- DOI:
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:Ryo Furukawa1 ;Shiro Oka2 ;Takahiro Kotachi2 ;Yuki Okamoto2 ;Shinji Tanaka2 ;Ryusuke Sagawa3 ;and Hiroshi Kawasaki4;小野順貴
- 通讯作者:小野順貴
音光変換デバイス「ブリンキー」の信号伝搬過程を考慮したEnd-to-End音響シーン分析
考虑声光转换装置“Blinky”信号传播过程的端到端声学场景分析
- DOI:
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:木下 裕磨;小野 順貴
- 通讯作者:小野 順貴
Sharpening Directivity of Beamforming Based on Neural Networks Using Virtual Observations
使用虚拟观测的基于神经网络的波束形成锐化方向性
- DOI:10.1109/gcce53005.2021.9621789
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:Yuki Kanekiyo;Mitsuhiro Mizumachi,?Ryoichi Miyazaki
- 通讯作者:Mitsuhiro Mizumachi,?Ryoichi Miyazaki
Phase representation based on HSV color model for acoustic classification with convolutional neural networks
基于 HSV 颜色模型的相位表示,用于卷积神经网络声学分类
- DOI:
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:Yuki Shiroma;Yuma KINOSHITA;Sayaka SHIOTA;Hitoshi KIYA,
- 通讯作者:Hitoshi KIYA,
共 41 条
- 1
- 2
- 3
- 4
- 5
- 6
- 9
小野 順貴其他文献
複数チャネル間の相互相関関数を用いたなりすまし検出法の雑音環境下における評価
噪声环境中使用多通道间互相关函数的欺骗检测方法的评估
- DOI:
- 发表时间:20192019
- 期刊:
- 影响因子:0
- 作者:矢口 凌也;塩田 さやか;小野 順貴;貴家 仁志矢口 凌也;塩田 さやか;小野 順貴;貴家 仁志
- 通讯作者:貴家 仁志貴家 仁志
伝達関数ゲイン基底NMFによる分散配置非同期録音における目的音強調の検討
使用基于传递函数增益的 NMF 检查分布式异步录音中的目标声音增强
- DOI:
- 发表时间:20142014
- 期刊:
- 影响因子:0
- 作者:千葉 大将;小野 順貴;宮部 滋樹;山田 武志;牧野 昭二;高橋 祐千葉 大将;小野 順貴;宮部 滋樹;山田 武志;牧野 昭二;高橋 祐
- 通讯作者:高橋 祐高橋 祐
複数チャネル間の相互相関関数を用いた話者照合のためのなりすまし検出
使用多个通道之间的互相关函数进行说话人匹配的冒充检测
- DOI:
- 发表时间:20182018
- 期刊:
- 影响因子:0
- 作者:矢口 凌也;塩田 さやか;小野 順貴;貴家 仁志矢口 凌也;塩田 さやか;小野 順貴;貴家 仁志
- 通讯作者:貴家 仁志貴家 仁志
Hologram Printing Technology (HOPTECH)とその応用
全息打印技术(HOPTECH)及其应用
- DOI:
- 发表时间:20172017
- 期刊:
- 影响因子:0
- 作者:最上 伸一;高宗 典玄;北村 大地;猿渡 洋;高橋 祐;近藤 多伸;中嶋 広明;小野 順貴;S. Kondo;山本健詞最上 伸一;高宗 典玄;北村 大地;猿渡 洋;高橋 祐;近藤 多伸;中嶋 広明;小野 順貴;S. Kondo;山本健詞
- 通讯作者:山本健詞山本健詞
正弦波重畳モデルのパラメータ最適化アルゴリズムの導出
正弦叠加模型参数优化算法推导
- DOI:
- 发表时间:20062006
- 期刊:
- 影响因子:0
- 作者:亀岡 弘和;小野 順貴;嵯峨山茂樹亀岡 弘和;小野 順貴;嵯峨山茂樹
- 通讯作者:嵯峨山茂樹嵯峨山茂樹
共 117 条
- 1
- 2
- 3
- 4
- 5
- 6
- 24
小野 順貴的其他基金
Multi-channel Audio Signal Processing Based on Sound-to-Light Conversion and Video Camera
基于声光转换和摄像机的多通道音频信号处理
- 批准号:17F1704917F17049
- 财政年份:2017
- 资助金额:$ 28.95万$ 28.95万
- 项目类别:Grant-in-Aid for JSPS FellowsGrant-in-Aid for JSPS Fellows
音声の時間周波数領域スパース性に基づくブラインド音源分離の研究
基于语音时频域稀疏性的盲源分离研究
- 批准号:1876030318760303
- 财政年份:2006
- 资助金额:$ 28.95万$ 28.95万
- 项目类别:Grant-in-Aid for Young Scientists (B)Grant-in-Aid for Young Scientists (B)
正則フィルタバンクを用いた時間周波数零点解析による信号の動的特徴抽出
使用常规滤波器组通过时频零点分析提取信号的动态特征
- 批准号:1676032516760325
- 财政年份:2004
- 资助金额:$ 28.95万$ 28.95万
- 项目类别:Grant-in-Aid for Young Scientists (B)Grant-in-Aid for Young Scientists (B)
ヤドリバエの聴覚器を模倣した超小型音源定位センサの研究
模仿槲寄生听觉器官的超小型声源定位传感器研究
- 批准号:1475034314750343
- 财政年份:2002
- 资助金额:$ 28.95万$ 28.95万
- 项目类别:Grant-in-Aid for Young Scientists (B)Grant-in-Aid for Young Scientists (B)
相似海外基金
地下構造モニタリングを目指した、地震波による新たな時空間イメージング手法の開発
开发利用地震波进行地下结构监测的新型时空成像方法
- 批准号:22KJ239722KJ2397
- 财政年份:2023
- 资助金额:$ 28.95万$ 28.95万
- 项目类别:Grant-in-Aid for JSPS FellowsGrant-in-Aid for JSPS Fellows
Tsunami detections using a fiber optic cable
使用光缆检测海啸
- 批准号:22H0175122H01751
- 财政年份:2022
- 资助金额:$ 28.95万$ 28.95万
- 项目类别:Grant-in-Aid for Scientific Research (B)Grant-in-Aid for Scientific Research (B)
Development of high spatial-density long-term earthquake observation system using seafloor cable with distributed acoustic sensing
利用海底电缆分布式声学传感开发高空间密度长期地震观测系统
- 批准号:22K0377322K03773
- 财政年份:2022
- 资助金额:$ 28.95万$ 28.95万
- 项目类别:Grant-in-Aid for Scientific Research (C)Grant-in-Aid for Scientific Research (C)
Study on centralized management by data clouding in health monitoring of structures
结构健康监测数据云化集中管理研究
- 批准号:2642047226420472
- 财政年份:2014
- 资助金额:$ 28.95万$ 28.95万
- 项目类别:Grant-in-Aid for Scientific Research (C)Grant-in-Aid for Scientific Research (C)