Data-driven sound field measurement for high-resolution spatial audio analysis and its applications

数据驱动的高分辨率空间音频分析声场测量及其应用

基本信息

项目摘要

本年度は,1) 音場補間のためのカーネル関数の適応的アルゴリズムの構築,2) 波動場の性質を組み入れた深層学習型音場計測法の検討,3) 少数観測点からの頭部伝達関数補間手法の構築,の3つについて実施した。1) 音場補間のためのカーネル関数の適応的アルゴリズムの構築では,音場のカーネル補間法において,推定解がヘルムホルツ方程式を満たす制約を保持しつつ,推定対象の環境に対してカーネル関数を適応的に学習可能なアルゴリズムを検討した。具体的には,カーネル関数を複数のサブカーネルの重み付き和として表現し,その重みパラメータを最適化する,マルチカーネル学習の枠組みに基づく。バッチ学習によるアルゴリズムを構築し,数値シミュレーションによって検証・評価を行った。2) 波動場の性質を組み入れた深層学習型音場計測法の検討では,事前の学習データを用いる音場推定の枠組みにおいて,推定結果がHelmholtz方程式を満たすことを損失関数に組み入れる手法を検討した。畳み込みニューラルネットワークに基づく補間において,出力値の補間に基づくヘルムホルツ方程式由来の損失関数を組み入れることに基づく。2次元空間での数値シミュレーションにより,対象領域内が自由空間の場合,散乱体を含む場合の二通りについて検証・評価を行った。3) 少数観測点からの頭部伝達関数補間手法の構築は,開始当初は実施を想定していなかったが,関連性の強い技術として検討に着手した。線形回帰に基づく従来法を再解釈し,オートエンコーダ構造を用いた深層学習に基づく補間手法を構築した。公開データセットを用いた検証・評価により,有効性を確認した。
今年,我们进行了三种类型:1)为声场插值构建一种用于内核函数的自适应算法,2)研究一种深度学习的声场测量方法,该方法结合了波场的性质,3)从少数观察点构建头部转移函数插值方法。 1)在构建用于声场插值内核函数的自适应算法时,我们研究了一种算法,该算法可以自适应地学习旨在估算的环境的内核功能,同时保留估计解决方案满足kernel interpolation of Sound Field方法中的Helmholtz方程。具体而言,它基于多内核学习框架,其中内核函数表示为多个子内存的加权总和并优化了其权重参数。使用数值模拟构建,验证和评估了使用批处理学习的算法。 2)在结合波场特性的深度学习声场测量方法的研究中,我们研究了一种使用先验学习数据将损失函数纳入声场估计框架中的方法,以结合估计结果满足Helmholtz方程。在基于卷积神经网络的插值中,它基于基于输出值插值的Helmholtz方程中的损失函数。验证了两种维度的数值模拟,并以两种方式进行评估:何时目标区域是自由空间以及何时包括散射器。 3)从少数观察点构建头部传递函数插值方法并不是要在一开始就实施的,但是我们开始将其视为一种高度相关的技术。我们根据线性回归重新解释了常规方法,并基于使用自动编码器结构进行深度学习构建了插值方法。通过使用公共数据集进行验证和评估证实了有效性。

项目成果

期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Physics-Informed Convolutional Neural Network with Bicubic Spline Interpolation for Sound Field Estimation
球波動関数展開を用いた深層学習による少数測定データからの頭部伝達関数補間
使用球面波函数展开进行深度学习,根据少量测量数据进行头部相关传递函数插值
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    伊藤 悠貴;中村 友彦;小山 翔一;猿渡 洋
  • 通讯作者:
    猿渡 洋
スプライン補間に基づく音場表現を用いたPhysics-Informed Neural Networksによる音場推定 -散乱体を含む領域に関する検証-
使用基于样条插值的声场表示的物理信息神经网络进行声场估计 - 验证包含散射体的区域 -
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    重見 和秀;小山 翔一;中村 友彦;猿渡 洋
  • 通讯作者:
    猿渡 洋
Head-Related Transfer Function Interpolation From Spatially Sparse Measurements Using Autoencoder With Source Position Conditioning
差分近似型Helmholtz方程式に基づく損失関数を用いた深層学習による少数観測点からの音場推定
使用基于微分近似型亥姆霍兹方程的损失函数进行深度学习,从少量观测点进行声场估计
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    重見 和秀;小山 翔一;中村 友彦;猿渡 洋
  • 通讯作者:
    猿渡 洋
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

小山 翔一其他文献

微分可能な凸損失関数を用いたオーバーサンプリングされたクリップ信号の復元
使用可微凸损失函数恢复过采样限幅信号
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    植野 夏樹;小山 翔一;猿渡 洋
  • 通讯作者:
    猿渡 洋
ロシア革命・内戦期ウクライナにおける民族属人自治
俄罗斯革命和内战期间乌克兰的民族自治
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    伊東 勇登;小山 翔一;植野 夏樹;猿渡 洋;Natsuki Ueno;Natsuki Ueno;植野夏樹;Yuki Murata;村田優樹;Yuki Murata;村田優樹;村田優樹;村田優樹;村田優樹;村田優樹
  • 通讯作者:
    村田優樹
Annihilatingフィルタを用いた球面調和関数領域reciprocity gap functional: 複数周波数を用いたグリッドレス音場分解
使用湮灭滤波器的球谐域互易间隙函数:使用多个频率的无网格声场分解
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    瀧田 雄太;小山 翔一;植野 夏樹;猿渡 洋
  • 通讯作者:
    猿渡 洋
音場のカーネル補間に基づくフィードバック型三次元空間能動騒音制御
基于声场核插值的反馈式三维空间主动噪声控制
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    伊東 勇登;小山 翔一;植野 夏樹;猿渡 洋
  • 通讯作者:
    猿渡 洋
Multiple Paths to Autonomy: The Moderate Ukrainians in Revolutionary Petersburg
自治的多条道路:革命彼得堡的温和乌克兰人
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0.3
  • 作者:
    伊東 勇登;小山 翔一;植野 夏樹;猿渡 洋;Natsuki Ueno;Natsuki Ueno;植野夏樹;Yuki Murata;村田優樹;Yuki Murata
  • 通讯作者:
    Yuki Murata

小山 翔一的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('小山 翔一', 18)}}的其他基金

高解像度音空間解析のためのデータ駆動型計測技術とその応用
数据驱动测量技术及其在高分辨率声空间分析中的应用
  • 批准号:
    23K24864
  • 财政年份:
    2024
  • 资助金额:
    $ 11.07万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
音場のスパース表現による超解像型音場収音・再現の研究
基于稀疏声场表示的超分辨声场采集与再现研究
  • 批准号:
    26880003
  • 财政年份:
    2014
  • 资助金额:
    $ 11.07万
  • 项目类别:
    Grant-in-Aid for Research Activity Start-up

相似海外基金

Research on acoustic scene analysis by integrating time-domain deep leraning and multiresolution analysis
时域深度学习与多分辨率分析相结合的声场景分析研究
  • 批准号:
    20K19818
  • 财政年份:
    2020
  • 资助金额:
    $ 11.07万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
音響的分析と聞き手の心理評価に基づく表情豊かな英語スピーチ力の育成
基于声学分析和听众心理评估培养英语表达能力
  • 批准号:
    20K00842
  • 财政年份:
    2020
  • 资助金额:
    $ 11.07万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Research of calibration free model for asynchronous distributed microphone array
异步分布式麦克风阵列免标定模型研究
  • 批准号:
    19K12017
  • 财政年份:
    2019
  • 资助金额:
    $ 11.07万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Acoustic Augmented Reality and Auditory Communication Ability Expansion Based on Small-Data Machine Learning Theory
基于小数据机器学习理论的声学增强现实与听觉交流能力扩展
  • 批准号:
    19H01116
  • 财政年份:
    2019
  • 资助金额:
    $ 11.07万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
Development of speech enhancement methods for conveying emotions equivalent to face-to-face communication
开发用于传达相当于面对面交流的情感的语音增强方法
  • 批准号:
    19K20618
  • 财政年份:
    2019
  • 资助金额:
    $ 11.07万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了