音楽音響信号の音源分離における統合的理論の構築とその応用

音乐声信号源分离综合理论构建及其应用

基本信息

  • 批准号:
    08J02757
  • 负责人:
  • 金额:
    $ 1.15万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2008
  • 资助国家:
    日本
  • 起止时间:
    2008 至 2010
  • 项目状态:
    已结题

项目摘要

本年度は,音源分離と楽器名同定の同時処理,および音源分離の応用としての類似楽曲検索システムに関する研究に取り組み,論文を発表した.1.複数楽器混合モデルのパラメータ推定と楽器名同定への応用 複雑な音楽音響信号中の楽器音を認識し,信号からその構成要素である楽器音や歌声を分離することは,近年の音楽情報処理における重要な要素技術である.混合音の音楽音響信号および楽曲中の各単音の音高と発音区間を入力として,各単音の分離音響信号と楽器名同定結果を出力する問題に取り組んだ.2~3楽器音の混合音に対して楽器音を分離しそれぞれの楽器名を同定する実験を行ったところ,2音の混合に対する平均音源同定正解率は72.1%,3音に対しては54.8%であった.音源分離性能は2音,3音のそれぞれに対して平均対数スペクトル距離が3.12,3.65であった.さらに,楽器名同定の正解によって音源分離性能が向上することを確認した.2.楽器音イコライザによる音色の類似度に基づく楽曲検索システム 類似楽曲検索とは,ユーザが指定した楽曲をクエリとして与え,楽曲を類似性に基づいてランキングする検索手法である.楽器音量バランスを操作したクエリ楽曲を用いて類似楽曲検索を行い,検索結果のジャンルからクエリ楽曲のジャンルシフトを調査した.楽器音量バランスとジャンルシフトとの間には合理的な関係があり,音楽ジャンルの典型的なイメージと整合していることが確認できた.ボーカルパートとドラムスパートでは,分離音と原音で同じ傾向のジャンルシフトが確認されたが,ギターパートでは異なっていた.
今年,我们进行了声源分离和乐器名称识别的同时处理以及类似的音乐检索系统作为声源分离的应用的研究,并发表了论文1.多乐器混合模型的参数估计及其应用。仪器名称识别识别复杂的音乐声信号中的乐器声音并将其组成的乐器声音和歌声从信号中分离出来是当前音乐信息处理中的一项重要的基本技术。我们研究了输入单个音符的音高和发音音程的问题。歌曲并输出每个单个音符的分离声学信号以及乐器名称识别的结果。我们从每种乐器的两到三个乐器名称的混合中分离出乐器声音。我们进行识别实验时,两种声音混合的平均声源识别准确率为72.1%,三种声音混合的平均声源识别准确率为54.8%。声源分离性能为两种声音和三种声音各自的平均对数谱距离分别为3.12和3.65,并且证实了通过正确的乐器名称识别可以提高声源分离性能。 2.使用乐器声音均衡器的基于音色相似性的音乐检索系统。相似歌曲搜索是一种以用户指定的歌曲作为查询,并根据相似度对歌曲进行排名的搜索方法。使用查询歌曲并操纵乐器音量平衡进行相似歌曲搜索,搜索结果我们根据流派调查了查询歌曲中的流派转变。乐器证实了音量平衡与流派转换之间存在合理的关系,并且与音乐流派的典型形象一致。在人声部分和鼓部分,分离的声音和原始声音也观察到相同的趋势音乐风格的转变得到了证实,但吉他部分有所不同。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Parameter Estimation for Harmonic and Inharmonic Models by Using Timbre Feature Distributions
使用音色特征分布对谐波和非谐波模型进行参数估计
  • DOI:
  • 发表时间:
    2009
  • 期刊:
  • 影响因子:
    0
  • 作者:
    糸山克寿; 後藤真孝; 駒谷和範; 尾形哲也; 奥乃博
  • 通讯作者:
    奥乃博
楽器音イコライザ:楽器パートの音量を操作可能なオーディオプレーヤ
乐器声音均衡器:允许您控制乐器部分音量的音频播放器
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    糸山克寿
  • 通讯作者:
    糸山克寿
Query-by-Example Music Information Retrieval by Score-Informed Source Separation and Remixing Technologies
通过乐谱信息源分离和混音技术进行示例查询音乐信息检索
  • DOI:
  • 发表时间:
    2010
  • 期刊:
  • 影响因子:
    1.9
  • 作者:
    Katsutoshi Itoyama; Masataka Goto; Kazunori Komatani; Tetsuya Ogata; Hiroshi G.Okuno
  • 通讯作者:
    Hiroshi G.Okuno
Simultaneous Processing of Sound Source Separation and Musical Instrument Identification Using Rayesian Spectral Modeling
使用瑞叶斯谱模型同时处理声源分离和乐器识别
  • DOI:
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Katsutoshi Itoyama; Masataka Goto; Kazunori Komatani; Tetsuya Ogata; Hiroshi G.Okuno
  • 通讯作者:
    Hiroshi G.Okuno
楽器別音楽イコライザー
按乐器的音乐均衡器
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    糸山克寿
  • 通讯作者:
    糸山克寿
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

糸山 克寿其他文献

A Music Retrieval Approach from Alternative Genres of Query by Adjusting Instrument Volume
一种通过调节乐器音量从另类查询中检索音乐的方法
  • DOI:
  • 发表时间:
    2009-03-10
  • 期刊:
  • 影响因子:
    0
  • 作者:
    王 凱平;糸山 克寿;後藤 真孝;駒谷 和範;尾形 哲也;奥乃 博
  • 通讯作者:
    奥乃 博
複数楽器個体による事前分布を用いた調波・非調波統合モデルのパラメータ推定
利用多种乐器先验分布的谐波/非谐波综合模型参数估计
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    糸山 克寿; 後藤 真孝; 駒谷 和範; 尾形 哲也; 奥乃 博
  • 通讯作者:
    奥乃 博
楽器音に対する仮想音源のパラメータ推定
乐器声音虚拟声源的参数估计
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    糸山 克寿; 奥乃 博
  • 通讯作者:
    奥乃 博
複数楽器個体による事前分布を用いた調波・非調波統合モデルのパラメータ推定
利用多种乐器先验分布的谐波/非谐波综合模型参数估计
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    糸山 克寿; 後藤 真孝; 駒谷 和範; 尾形 哲也; 奥乃 博
  • 通讯作者:
    奥乃 博
伸縮スペクトルのランク最小化の緩和に基づくチャネル間同期?A
基于拉伸频谱秩最小松弛的通道间同步?A
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    糸山 克寿; 中臺 一博
  • 通讯作者:
    中臺 一博

糸山 克寿的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似海外基金

Changes in apical cochlear mechanics after cochlear implantation
人工耳蜗植入后耳蜗顶端力学的变化
  • 批准号:
    10730981
  • 财政年份:
    2023
  • 资助金额:
    $ 1.15万
  • 项目类别:
Conference on Implantable Auditory Prostheses
植入式听觉假体会议
  • 批准号:
    10606813
  • 财政年份:
    2023
  • 资助金额:
    $ 1.15万
  • 项目类别:
Non-sensory Circuits for Auditory Perceptual Learning
用于听觉感知学习的非感觉回路
  • 批准号:
    10563542
  • 财政年份:
    2023
  • 资助金额:
    $ 1.15万
  • 项目类别:
CRCNS: Online optimization for probing high-level auditory representations
CRCNS:用于探测高级听觉表征的在线优化
  • 批准号:
    10831120
  • 财政年份:
    2023
  • 资助金额:
    $ 1.15万
  • 项目类别:
Longitudinal Investigation of Factors Impacting the Development and Rehabilitation of Phonotrauma
影响声音外伤发生和康复的因素的纵向调查
  • 批准号:
    10738690
  • 财政年份:
    2023
  • 资助金额:
    $ 1.15万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了