選択的音楽聴取を実現するリアルタイム音源分離とその応用
实时声源分离及其在选择性音乐收听中的应用
基本信息
- 批准号:22KJ2548
- 负责人:
- 金额:$ 1.41万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for JSPS Fellows
- 财政年份:2023
- 资助国家:日本
- 起止时间:2023-03-08 至 2024-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究課題では音楽信号の選択的な聴取の実現を目指して,高精度かつ低演算量なブラインド音源分離手法の開発に取り組んでいる.ブラインド音源分離はスマートフォンにおける音声認識機能や補聴器の性能向上などに応用されている.さらに,音楽信号の選択的な聴取が可能になれば,音楽のリミックスや自動採譜などさらなる応用が期待される.本年度はまず,前年度からの継続として,独立低ランク行列分析を用いた音源分離の性能向上に関する研究について査読対応を進め,ジャーナル論文としての採択に至った.次に実環境でのユーザ自身の移動に頑健な音源分離に取り組み,音場補間とオンライン音源分離を組み合わせることにより,頭部装着した円状マイクが回転しても連続的にオンライン音源分離を行う手法を提案し,日本音響学会研究発表会にて発表した.また,前年度に提案したiterative source steering(以下,ISS)を用いたオンライン音源分離に引き続き取り組み,国際会議APSIPA ASCに採択され,発表した.さらにオンライン音源分離の特殊な場合として,1個の音源だけが移動する状況でオンライン音源分離を行う問題を音源追跡と呼び,この問題について効率的な手法を検討した.ISSを適用する際のパラメータ更新方法を工夫することによって online source steering(OSS)という新たな手法を導出し,演算量のオーダーを理論限界まで削減することに成功した.この内容は,信号処理分野のトップ国際会議であるICASSPに採択された.なお本成果は指導教員の小野順貴教授が研究代表者を務めるJSPS科研費の助成も部分的に受け,NTTコミュニケーション科学基礎研究所との共同研究の一環として取り組んだものであり,特許出願中である.
该研究主题正在努力开发一种盲目的分离方法,该方法是高度准确且计算密集的盲源分离方法,目的是实现选择性聆听音乐信号的目的。盲声源分离已应用于提高智能手机和助听器中语音识别功能的性能。此外,如果有选择性收听音乐信号的可能性,则预计会有更多的应用程序(例如混合音乐和自动转录)。今年,作为上一年的延续,我们开始回答有关使用独立低级矩阵分析改善声音源分离性能的研究的同行评论,并被选为期刊文章。接下来,我们在真实环境中对用户自己的动作进行了强大的声音源分离,并提出了一种方法,即使当圆形麦克风连接到头部的圆形麦克风通过结合声场插值和在线声音源分离而旋转,并在日本声学社会研究介绍中呈现。此外,该公司继续努力使用上一年提出的迭代源转向(以下称为ISS)分开在线声音来源,并由国际会议APSIPA ASC选择并介绍了它。此外,在在线声源分离的特殊情况下,在仅一个声音源移动的情况下,在线声源分离的问题称为声源跟踪,并检查了此问题的有效方法。通过设计应用ISS时更新参数的方法,我们得出了一种称为在线源转向(OSS)的新方法,并成功地将计算量的顺序降低到了理论上的限制。此内容是由信号处理领域的国际顶级会议ICASSP通过的。该结果得到了JSPS研究基金的部分支持,该基金是主管,Ono Junki教授的主要研究员,并与NTT通信科学研究所共同研究,目前正在申请专利。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
独立ベクトル分析によるオンライン音源分離・追跡のための高速最適化
使用独立矢量分析快速优化在线声源分离和跟踪
- DOI:
- 发表时间:2023
- 期刊:
- 影响因子:0
- 作者:中嶋 大志;池下 林太郎;小野 順貴;荒木 章子;中谷 智広
- 通讯作者:中谷 智広
ブラインド音源分離に基づく複数音源方向推定を用いた分離音源選択の検討
基于盲声源分离的多声源方向估计分离声源选择研究
- DOI:
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:茂木 倖大;中嶋 大志;若林 佑幸;小野 順貴
- 通讯作者:小野 順貴
Inverse-free Online Independent Vector Analysis with Flexible Iterative Source Steering
- DOI:10.23919/apsipaasc55919.2022.9979837
- 发表时间:2022-09
- 期刊:
- 影响因子:0
- 作者:Taishi Nakashima;Nobutaka Ono
- 通讯作者:Taishi Nakashima;Nobutaka Ono
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
中嶋 大志其他文献
導電性高分子のフェルミレベル制御と熱電変換特性
导电聚合物的费米能级控制和热电转换性能
- DOI:
- 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
金橋 魁利;竹腰 直哉;中嶋 大志;Yong-Young Noh;太田 裕道;田中 久暁;竹延 大志 - 通讯作者:
竹延 大志
側鎖変調されたポリチオフェンドープ膜の構造と伝導特性
侧链调制聚噻吩掺杂薄膜的结构和导电性能
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
伊藤 駿一郎;中嶋 大志;金橋 魁利;田中 久暁;太田 裕道;竹延 大志 - 通讯作者:
竹延 大志
A report on ongoing research into the modeling of multimedia franchise hierarchies, the ‘Superwork’ entity, and the description of various pop culture resources using metadata aggregation
关于正在进行的多媒体特许经营层次结构建模、“超级工作”实体以及使用元数据聚合描述各种流行文化资源的报告
- DOI:
- 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
中嶋 大志;シャイブラー ロビン;若林 佑幸;小野 順貴;Senan Kiryakos - 通讯作者:
Senan Kiryakos
分離ベクトル同時更新による独立低ランク行列分析の収束性と性能向上の検討
分离向量同步更新独立低秩矩阵分析的收敛性和性能改进研究
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
中嶋 大志;シャイブラー ロビン;若林 佑幸;小野 順貴 - 通讯作者:
小野 順貴
音場補間に基づく円状マイクロフォンアレイの自己回転角度推定
基于声场插值的圆形麦克风阵列自转角度估计
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
連 冠三;中嶋 大志;若林 佑幸;小野 順貴 - 通讯作者:
小野 順貴
中嶋 大志的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似海外基金
振幅変調知覚に基づく聴覚エンリッチメント:人工内耳用音声信号処理の研究
基于调幅感知的听觉丰富:人工耳蜗音频信号处理研究
- 批准号:
23K21679 - 财政年份:2024
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
深層エネルギーベースモデルによる創造的声質変換の研究
使用深度能量模型进行创造性语音质量转换的研究
- 批准号:
23K11161 - 财政年份:2023
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
マルチタスク深層学習における補助損失の動的制御と音声コミュニケーションへの応用
多任务深度学习中辅助损失的动态控制及其在语音通信中的应用
- 批准号:
22K12105 - 财政年份:2022
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Transfer characteristics of emotional speech information toward elderly persons with hearing loss and development of novel speech morphing methods
情感语音信息向听力损失老年人的传递特性及新型语音变形方法的开发
- 批准号:
21K19794 - 财政年份:2021
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Challenging Research (Exploratory)
Development of a Listening Evaluation and Support System for "Children with Listening Difficulties" using Acoustic Signal Processing.
利用声学信号处理为“听力困难儿童”开发听力评估和支持系统。
- 批准号:
21K12037 - 财政年份:2021
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Scientific Research (C)