人間の聴覚システムの模倣に基づく自律的音響信号処理の研究
基于模仿人类听觉系统的自主声信号处理研究
基本信息
- 批准号:15J09992
- 负责人:
- 金额:$ 1.22万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for JSPS Fellows
- 财政年份:2015
- 资助国家:日本
- 起止时间:2015-04-24 至 2017-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
音響信号から重畳された音源信号を分離・同定する多重音解析は,音楽・音声コンテンツの検索など様々なシステムを構築するための基礎技術となりうる.これまで多重音解析に対して聴覚・音響信号処理・機械学習の研究コミュニティで強力なアプローチが提案されてきた.しかし,これらのアプローチで用いられた手がかりは互いに矛盾しないにも関わらず,問題設定や着目する性質の違いによってそれぞれのコミュニティで独立に研究が進められているのが実情である.本研究では,これらの手がかりをまとめ上げ数理的に組み込んだ1つの最適化問題として定式化することで,聴覚・音響信号処理・機械学習にまたがる多重音解析技術の開発に取り組んだ.本年度は,楽音や音声の生成過程をよく説明できるソースフィルタモデルをいかに連続ウェーブレット変換(CWT)領域で表現するかについて主に検討した.CWTは人間の聴覚フィルタバンクと類似した周波数解像度をもつ時間周波数表現を与えるが,基底波形同士が直交しないためソースフィルタモデルなどの時間領域で定義される信号モデルとの対応関係を導出することが容易ではない.これに対し,解析的な時間信号モデルを元にCWT領域でのソースフィルタモデルを記述することで私が以前提案した手法(Nakamura+2014)を拡張し,ソースフィルタモデル導入の有効性を確認した.この手法は国内研究会で発表賞を受賞した.また,適切な仮定を置くことで基底波形が直交した場合と同様にソースフィルタモデルをCWT領域で表現できることを示した.この手法については査読付き国際会議で発表した.さらに,振幅スペクトログラムからの位相推定や音声の声道スペクトル推定に関しても新手法を提案し,どちらも国内学会で発表した.これらの成果は博士論文の一部としてまとめ,東京大学大学院情報理工学系研究科研究科長賞を受賞した.
多声音分析从声音信号中分离并识别叠加的声源信号,可以成为构建音乐和音频内容搜索等各种系统的基本技术。到目前为止,听觉、声学信号处理和机器学习研究社区已经提出了多种声音分析的强大方法。然而,尽管这些方法中使用的线索并不相互矛盾,但现实情况是,由于问题设置和焦点特征的差异,每个社区的研究都是独立进行的。在这项研究中,我们致力于开发多种声音分析技术,涵盖听觉感知、声学信号处理和机器学习,将这些线索结合起来,并将它们表述为一个以数学方式将它们结合起来的单一优化问题。今年,我们主要研究如何在连续小波变换(CWT)域中表达源滤波器模型,该模型可以很好地解释乐音和声音的生成过程。 CWT 提供了频率分辨率类似于人类听觉滤波器组的时频表示,但由于基本波形彼此不正交,因此很难导出与时域中定义的信号模型的对应关系,例如作为源过滤模型并不容易。为此,我们扩展了我之前提出的方法(Nakamura+2014),基于分析时间信号模型在 CWT 域中描述源滤波器模型,并证实了引入源滤波器模型的有效性.该方法在国内课题组获得了演讲奖。我们还表明,通过做出适当的假设,源滤波器模型可以在 CWT 域中以与基本波形正交时相同的方式表示。我们在一次同行评审的国际会议上提出了这种方法。此外,我们还提出了振幅谱图相位估计和声道谱估计的新方法,并在国内学术会议上发表了论文。这些结果被总结为博士论文的一部分,该论文获得了东京大学研究生院信息科学与技术研究生院院长奖。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
高速近似連続ウェーブレット変換による振幅スペクトログラムに対する実時間位相推定法
基于快速近似连续小波变换的幅度谱图实时相位估计方法
- DOI:
- 发表时间:2016
- 期刊:
- 影响因子:0
- 作者:Tomohiko Nakamura;Eita Nakamura;Shigeki Sagayama;中村友彦,亀岡弘和;中村友彦,亀岡弘和;Tomohiko Nakamura and Hirokazu Kameoka;中村友彦,亀岡弘和
- 通讯作者:中村友彦,亀岡弘和
Real-Time Audio-to-Score Alignment of Music Performances Containing Errors and Arbitrary Repeats and Skips
- DOI:10.1109/taslp.2015.2507862
- 发表时间:2015-12
- 期刊:
- 影响因子:0
- 作者:Tomohiko Nakamura;Eita Nakamura;S. Sagayama
- 通讯作者:Tomohiko Nakamura;Eita Nakamura;S. Sagayama
非負値行列因子分解に基づく欠損データ補間による声道スペクトル推定法の検討
基于非负矩阵分解的缺失数据插值声道频谱估计方法研究
- DOI:
- 发表时间:2016
- 期刊:
- 影响因子:0
- 作者:Tomohiko Nakamura;Eita Nakamura;Shigeki Sagayama;中村友彦,亀岡弘和;中村友彦,亀岡弘和;Tomohiko Nakamura and Hirokazu Kameoka;中村友彦,亀岡弘和;中村友彦,亀岡弘和
- 通讯作者:中村友彦,亀岡弘和
全極スペクトルモデルと擬似周期信号モデルのウェーブレット変換表現を用いた多重音スペクトログラムの調波時間因子分解
使用全极点频谱模型和准周期信号模型的小波变换表示进行多音频谱图的谐波时间分解
- DOI:
- 发表时间:2015
- 期刊:
- 影响因子:0
- 作者:Tomohiko Nakamura;Eita Nakamura;Shigeki Sagayama;中村友彦,亀岡弘和;中村友彦,亀岡弘和;Tomohiko Nakamura and Hirokazu Kameoka;中村友彦,亀岡弘和;中村友彦,亀岡弘和;中村友彦,亀岡弘和
- 通讯作者:中村友彦,亀岡弘和
Shifted and Convolutive Non-Negative Matrix Factorization for Monaural Audio Source Separation
用于单声道音频源分离的移位和卷积非负矩阵分解
- DOI:
- 发表时间:2016
- 期刊:
- 影响因子:0
- 作者:Tomohiko Nakamura;Eita Nakamura;Shigeki Sagayama;中村友彦,亀岡弘和;中村友彦,亀岡弘和;Tomohiko Nakamura and Hirokazu Kameoka
- 通讯作者:Tomohiko Nakamura and Hirokazu Kameoka
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
中村 友彦其他文献
家族性アミロイドポリニューロパチーにおける心血管系自律神経障害の検討
家族性淀粉样多发性神经病心血管自主神经病变的检查
- DOI:
- 发表时间:
2016 - 期刊:
- 影响因子:0
- 作者:
小池 春樹;中村 友彦;池田 昇平;川頭 祐一;飯島 正博;勝野 雅央;祖父江 元 - 通讯作者:
祖父江 元
Late preterm児と正期産児の低酸素性虚血脳症の比較 母体・周産期因子について
晚期早产儿和足月儿缺氧缺血性脑病的比较:母体和围产期因素
- DOI:
- 发表时间:
2015 - 期刊:
- 影响因子:0
- 作者:
早川 昌弘;伊藤 裕司;長 和俊;村越 毅;中村 友彦;光田 信明;齋藤 滋;周産期学シンポジウム運営委員会 - 通讯作者:
周産期学シンポジウム運営委員会
深層学習に基づく間引きインジケータ付き周波数帯域補間手法による音源分離処理の高速化
基于深度学习的细化指标频带插值法加速声源分离处理
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
渡辺 瑠伊;北村 大地;中村 友彦;猿渡 洋;高橋 祐;近藤 多伸 - 通讯作者:
近藤 多伸
Soft inductive tactile sensor using liquid metal and coils
使用液态金属和线圈的软电感式触觉传感器
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
成澤 直輝;池下 林太郎;高宗 典玄;北村 大地;中村 友彦;猿渡 洋;中谷 智広;松田大作,飯野哲平,廣田恭平,玉井佑,滝沢研二,Tayhun E. Tezduyar;Takumi Kawasetsu - 通讯作者:
Takumi Kawasetsu
誤り・任意の弾き直し・弾き飛ばしを含む演奏音響信号への高速な楽譜追跡
对演奏声学信号进行高速乐谱跟踪,包括错误、任意重放和跳过的播放
- DOI:
- 发表时间:
2013 - 期刊:
- 影响因子:0
- 作者:
中村 友彦;中村 栄太;嵯峨山 茂樹 - 通讯作者:
嵯峨山 茂樹
中村 友彦的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('中村 友彦', 18)}}的其他基金
人間の介入可能性を考慮した音響情景分析のための深層分析合成基盤の開拓とその深化
开发和深化考虑人为干预可能性的声学场景分析的深度分析和合成平台
- 批准号:
23K28108 - 财政年份:2024
- 资助金额:
$ 1.22万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
新生児集中治療室におけるファミリーセンタードケアの医療社会学的有用性の評価
新生儿重症监护病房以家庭为中心的护理的医学社会学效用评估
- 批准号:
24K13307 - 财政年份:2024
- 资助金额:
$ 1.22万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
人間の介入可能性を考慮した音響情景分析のための深層分析合成基盤の開拓とその深化
开发和深化考虑人为干预可能性的声学场景分析的深度分析和合成平台
- 批准号:
23H03418 - 财政年份:2023
- 资助金额:
$ 1.22万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
画像認識技術を用いたシェル状天体検出手法の開発
利用图像识别技术开发贝壳类物体检测方法
- 批准号:
26610044 - 财政年份:2014
- 资助金额:
$ 1.22万 - 项目类别:
Grant-in-Aid for Challenging Exploratory Research
30ミクロン帯撮像観測による大質量星終末期におけるダスト形成量の測定
使用 30 微米波段成像观测测量大质量恒星末期形成的尘埃量
- 批准号:
10J08881 - 财政年份:2010
- 资助金额:
$ 1.22万 - 项目类别:
Grant-in-Aid for JSPS Fellows
相似海外基金
機械学習による音源分離に立脚したAUVの物体検知の高精度化の研究
利用机器学习提高基于声源分离的AUV目标检测精度研究
- 批准号:
24K07923 - 财政年份:2024
- 资助金额:
$ 1.22万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
統計的音源分離を用いた音響センシングでの非侵襲胎児心音計測の研究
基于统计声源分离的声学传感无创胎心音测量研究
- 批准号:
23K28111 - 财政年份:2024
- 资助金额:
$ 1.22万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
独立性と振幅位相モデルに基づく音源分離の数理的深化及びマルチモーダル補聴器開発
基于独立性和幅相模型的声源分离数学深化及多模态助听器开发
- 批准号:
23K24908 - 财政年份:2024
- 资助金额:
$ 1.22万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
オンデマンドな音環境理解のための教師なしモノラル音源分離に関する研究
用于按需声环境理解的无监督单声道声源分离研究
- 批准号:
24KJ2096 - 财政年份:2024
- 资助金额:
$ 1.22万 - 项目类别:
Grant-in-Aid for JSPS Fellows
人間の介入可能性を考慮した音響情景分析のための深層分析合成基盤の開拓とその深化
开发和深化考虑人为干预可能性的声学场景分析的深度分析和合成平台
- 批准号:
23H03418 - 财政年份:2023
- 资助金额:
$ 1.22万 - 项目类别:
Grant-in-Aid for Scientific Research (B)