選択的音楽聴取を実現するリアルタイム音源分離とその応用

实时声源分离及其在选择性音乐收听中的应用

基本信息

  • 批准号:
    22KJ2548
  • 负责人:
  • 金额:
    $ 1.41万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2023
  • 资助国家:
    日本
  • 起止时间:
    2023-03-08 至 2024-03-31
  • 项目状态:
    已结题

项目摘要

本研究課題では音楽信号の選択的な聴取の実現を目指して,高精度かつ低演算量なブラインド音源分離手法の開発に取り組んでいる.ブラインド音源分離はスマートフォンにおける音声認識機能や補聴器の性能向上などに応用されている.さらに,音楽信号の選択的な聴取が可能になれば,音楽のリミックスや自動採譜などさらなる応用が期待される.本年度はまず,前年度からの継続として,独立低ランク行列分析を用いた音源分離の性能向上に関する研究について査読対応を進め,ジャーナル論文としての採択に至った.次に実環境でのユーザ自身の移動に頑健な音源分離に取り組み,音場補間とオンライン音源分離を組み合わせることにより,頭部装着した円状マイクが回転しても連続的にオンライン音源分離を行う手法を提案し,日本音響学会研究発表会にて発表した.また,前年度に提案したiterative source steering(以下,ISS)を用いたオンライン音源分離に引き続き取り組み,国際会議APSIPA ASCに採択され,発表した.さらにオンライン音源分離の特殊な場合として,1個の音源だけが移動する状況でオンライン音源分離を行う問題を音源追跡と呼び,この問題について効率的な手法を検討した.ISSを適用する際のパラメータ更新方法を工夫することによって online source steering(OSS)という新たな手法を導出し,演算量のオーダーを理論限界まで削減することに成功した.この内容は,信号処理分野のトップ国際会議であるICASSPに採択された.なお本成果は指導教員の小野順貴教授が研究代表者を務めるJSPS科研費の助成も部分的に受け,NTTコミュニケーション科学基礎研究所との共同研究の一環として取り組んだものであり,特許出願中である.
在本研究项目中,我们正在开发一种高精度、低计算复杂度的盲声源分离方法,旨在实现音乐信号的选择性收听。盲声源分离已被应用于提高智能手机的语音识别功能和助听器的性能。此外,如果可以选择性地收听音乐信号,则预计会有进一步的应用,例如音乐混音和自动乐谱。今年,作为去年的延续,我们开始对我们关于使用独立低秩矩阵分析提高声源分离性能的研究进行同行评审,这导致其被接受为期刊文章。接下来,我们将致力于对真实环境中用户的移动具有鲁棒性的声源分离,通过声场插值和在线声源分离相结合,即使圆形麦克风佩戴在身上,我们也将持续进行在线声源分离。我们提出了一种方法并在日本声学学会研究会议上提出。此外,我们继续去年提出的使用迭代源引导(ISS)进行在线声源分离的工作,我们的工作被采纳并在国际会议 APSIPA ASC 上展示。此外,作为在线声源分离的一种特殊情况,在只有一个声源移动的情况下进行在线声源分离的问题称为声源跟踪,我们研究了解决该问题的有效方法。通过设计应用ISS时的参数更新方法,我们衍生出一种称为在线源引导(OSS)的新方法,并成功地将计算量减少到理论极限的量级。该内容被信号处理领域国际顶级会议ICASSP采纳。该成果得到了 JSPS KAKENHI 的部分支持,我的导师 Junki Ono 教授是该研究的首席研究员,是与 NTT 通信科学实验室联合研究的一部分,目前正在申请专利。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
独立ベクトル分析によるオンライン音源分離・追跡のための高速最適化
使用独立矢量分析快速优化在线声源分离和跟踪
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中嶋 大志;池下 林太郎;小野 順貴;荒木 章子;中谷 智広
  • 通讯作者:
    中谷 智広
補助関数法を用いた複数時間差のオンライン推定
利用辅助函数法在线估计多重时间差
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    山岡 洸瑛;中嶋 大志;若林 佑幸;小野 順貴
  • 通讯作者:
    小野 順貴
ブラインド音源分離に基づく複数音源方向推定を用いた分離音源選択の検討
基于盲声源分离的多声源方向估计分离声源选择研究
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    茂木 倖大;中嶋 大志;若林 佑幸;小野 順貴
  • 通讯作者:
    小野 順貴
Inverse-free Online Independent Vector Analysis with Flexible Iterative Source Steering
音源追跡方法及び装置
声源追踪方法及装置
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

中嶋 大志其他文献

導電性高分子のフェルミレベル制御と熱電変換特性
导电聚合物的费米能级控制和热电转换性能
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    金橋 魁利;竹腰 直哉;中嶋 大志;Yong-Young Noh;太田 裕道;田中 久暁;竹延 大志
  • 通讯作者:
    竹延 大志
A report on ongoing research into the modeling of multimedia franchise hierarchies, the ‘Superwork’ entity, and the description of various pop culture resources using metadata aggregation
关于正在进行的多媒体特许经营层次结构建模、“超级工作”实体以及使用元数据聚合描述各种流行文化资源的报告
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中嶋 大志;シャイブラー ロビン;若林 佑幸;小野 順貴;Senan Kiryakos
  • 通讯作者:
    Senan Kiryakos
側鎖変調されたポリチオフェンドープ膜の構造と伝導特性
侧链调制聚噻吩掺杂薄膜的结构和导电性能
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    伊藤 駿一郎;中嶋 大志;金橋 魁利;田中 久暁;太田 裕道;竹延 大志
  • 通讯作者:
    竹延 大志
分離ベクトル同時更新による独立低ランク行列分析の収束性と性能向上の検討
分离向量同步更新独立低秩矩阵分析的收敛性和性能改进研究
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中嶋 大志;シャイブラー ロビン;若林 佑幸;小野 順貴
  • 通讯作者:
    小野 順貴
音場補間に基づく円状マイクロフォンアレイの自己回転角度推定
基于声场插值的圆形麦克风阵列自转角度估计
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    連 冠三;中嶋 大志;若林 佑幸;小野 順貴
  • 通讯作者:
    小野 順貴

中嶋 大志的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似海外基金

振幅変調知覚に基づく聴覚エンリッチメント:人工内耳用音声信号処理の研究
基于调幅感知的听觉丰富:人工耳蜗音频信号处理研究
  • 批准号:
    23K21679
  • 财政年份:
    2024
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
深層エネルギーベースモデルによる創造的声質変換の研究
使用深度能量模型进行创造性语音质量转换的研究
  • 批准号:
    23K11161
  • 财政年份:
    2023
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
マルチタスク深層学習における補助損失の動的制御と音声コミュニケーションへの応用
多任务深度学习中辅助损失的动态控制及其在语音通信中的应用
  • 批准号:
    22K12105
  • 财政年份:
    2022
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Transfer characteristics of emotional speech information toward elderly persons with hearing loss and development of novel speech morphing methods
情感语音信息向听力损失老年人的传递特性及新型语音变形方法的开发
  • 批准号:
    21K19794
  • 财政年份:
    2021
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
Development of a Listening Evaluation and Support System for "Children with Listening Difficulties" using Acoustic Signal Processing.
利用声学信号处理为“听力困难儿童”开发听力评估和支持系统。
  • 批准号:
    21K12037
  • 财政年份:
    2021
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了