音乐旋律提取关键技术研究及其在音乐借用识别中的应用

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61671156
  • 项目类别:
    面上项目
  • 资助金额:
    58.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0111.信号理论与信号处理
  • 结题年份:
    2020
  • 批准年份:
    2016
  • 项目状态:
    已结题
  • 起止时间:
    2017-01-01 至2020-12-31

项目摘要

Melody is one of the most important elements of music, with many direct and indirect applications in music content analysis, music creation, music education, and protection of music intellectual properties. In this proposal, the research is focused on automatic melody extraction technique and its application in music borrowing identification. The main content is divided into five aspects: (1). Design a pitch salience-based melody extraction algorithm, combining perceptual time-frequency transform, melodic pitch contour characterization, post-processing using high-level musical knowledge, and melody locating; (2). Design an audio separation based melody extraction algorithm. The problem of partial overlap and melodic contour breaking can be solved, to some extent, by combing fuzzy classification and musical knowledge; (3). From the data-driven perspective, we design a classification-based melody extraction algorithm. With comprehensive well trained note templates of common instruments, deep neural network (DNN) and convertional GMM classifier are fused together to obtain more reliable melody note sequence; (4). Among the three algorithms above, the best melody extraction method is incorporated into the task of music borrowing identification. Because both the position and length of similar fragments located in two different songs are unknown, conventional similarity matrix and recursive plot have to be accordingly modified to solve this problem; (5). Develop two demonstration systems of automatic melody extraction and music borrowing identification, respectively. To facilitate the algorithm testing and performance comparison, a new large-scale open dataset needs to be established.
旋律是最重要的音乐要素之一,在音乐内容分析、音乐创作、音乐教育、抄袭检测等方面具有很多应用。本课题研究音乐旋律提取技术及其在音乐引用识别中的应用。研究内容分为五个方面:(1). 结合感知时频变换、音高包络线、利用音乐知识的后处理、以及旋律定位等技术,在音高显著性计算框架下进行旋律提取算法研究;(2). 进行基于音频分离技术的旋律提取算法研究,运用模糊分类及音乐知识在一定程度上解决泛音重叠及旋律包络线断续的问题;(3). 从数据驱动的角度出发研究自动旋律提取。在充分训练的基础上,对音乐信号的时频表示基于常规分类器和深度学习分别加以分类,然后进行分类器融合以得到更可靠的旋律音符序列;(4). 基于以上最佳的旋律提取结果进行音乐借用识别算法研究。针对相似片段位置及长度不定的问题对递归图及相似片段挑选策略进行改进;(5). 开发自动旋律提取及音乐借用识别演示系统,建立公开的较大规模测试数据库。

结项摘要

旋律是音乐最基本的要素之一。从音乐信号中自动提取主旋律是音乐人工智能的核心技术之一。具有诸多应用场景,如哼唱检索、翻唱识别、歌唱评价、歌手识别等。. 在音乐信号主旋律提取方面,主要有如下工作:流行音乐主旋律提取技术综述;基于DNN音高估计和基于重要性的音高改进的歌声主旋律提取;用于主旋律提取的多任务学习;基于歌声分离和编码器-解码器音高估计的歌唱旋律提取;基于两阶段训练的HRNet-BLSTM模型的歌声旋律提取;基于音调和八度感知的旋律提取;基于时空注意力网络的旋律提取。. 在其它音乐人工智能及一般音频计算机听觉领域进行了大量扩展研究,主要有如下工作:基于相似性函数融合的翻唱检索;多维度自动高级歌唱评价;基于残差注意力网络的自动发声方式分类;基于GRU递归神经网络/卷积神经网络多维特征深度融合的歌声检测;消除伴奏对歌声检测的影响;基于KNN-Net深度神经网络模型的深度音色特征学习/时域波形堆叠扩张卷积神经网络的歌手识别;基于MIDI训练的DRN和CNN深度特征及BLSTM-CRF序列解码/随机森林/结构化和弦表示的大词汇量和弦识别;基于多尺度分组注意力网络的音乐速度估计;基于客观特征的民族乐器音色分析;基于迁移学习/带通道注意机制CNN的音乐情感识别;基于高分辨率网络/条纹信息的音源分离;基于音乐结构分析的副歌提取算法;基于卷积神经网络和数据增强的中医闻诊;基于分区预训练卷积神经网络的水声目标识别。. 以上研究成果基本都达到甚至超过了国际先进水平,发表20余篇研究论文,包括TASLP、ICASSP、ISMIR、ICME、CSMT等音频和多媒体领域国内外权威期刊和重要学术会议。另投稿8篇,申请6项国家发明专利(已授权1项),2项软件著作权。在MIREX 2017-2018和弦识别竞赛取得多项第一名。联合举办ISMIR 2017权威国际会议,CSMT 2017-2020权威国内会议。培养毕业13名硕士、博士研究生。撰写基于Music和Audio的两篇大型中文综述,主编该领域第一本中文教材,定义百度百科学科词条,主持拍摄在线MOOC,奠定音乐人工智能与计算机听觉这一新兴交叉学科的基础。

项目成果

期刊论文数量(14)
专著数量(2)
科研奖励数量(0)
会议论文数量(2)
专利数量(6)
A practical singing voice detection system based on GRU-RNN
一种基于GRU-RNN的实用歌声检测系统
  • DOI:
    --
  • 发表时间:
    2019
  • 期刊:
    Springer LNEE 568 (Lecture Notes in Electrical Engineering)
  • 影响因子:
    --
  • 作者:
    Z. Chen;X. Zhang;J. Deng;J. Li;Y. Jiang;W. Li
  • 通讯作者:
    W. Li
Data augmentation based convolutional neural network for auscultation
基于数据增强的卷积神经网络用于听诊
  • DOI:
    --
  • 发表时间:
    2019
  • 期刊:
    复旦学报(自然科学版)
  • 影响因子:
    --
  • 作者:
    江益靓;张旭龙;邓晋;张文强;李伟
  • 通讯作者:
    李伟
CCMusic:用于MIR研究的中国音乐数据库建设
  • DOI:
    10.15943/j.cnki.fdxb-jns.2019.03.007
  • 发表时间:
    2019
  • 期刊:
    复旦学报(自然科学版)
  • 影响因子:
    --
  • 作者:
    李子晋;于帅;肖畅;耿瑜曼;钱文琪;高永伟;李伟
  • 通讯作者:
    李伟
理解数字音乐——音乐信息检索技术综述
  • DOI:
    10.15943/j.cnki.fdxb-jns.2018.03.001
  • 发表时间:
    2018
  • 期刊:
    复旦学报(自然科学版)
  • 影响因子:
    --
  • 作者:
    李伟;李子晋;高永伟
  • 通讯作者:
    高永伟
A Method for Detecting Short Similar Segments in Music Segments in Music Borrowing
一种音乐借用中音乐片段中短相似片段的检测方法
  • DOI:
    10.15943/j.cnki.fdxb-jns.2019.03.003
  • 发表时间:
    2019
  • 期刊:
    复旦学报(自然科学版)
  • 影响因子:
    --
  • 作者:
    高永伟;沈迤淳;吴益明;张旭龙;于帅;李伟
  • 通讯作者:
    李伟

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

基于特征族群语义扩散核的半监督农业文本分类
  • DOI:
    10.13698/j.cnki.cn36-1346/c.2018.03.016
  • 发表时间:
    2018
  • 期刊:
    赣南师范大学学报
  • 影响因子:
    --
  • 作者:
    李伟;汪廷华;郑惠宁
  • 通讯作者:
    郑惠宁
利用GRACE反演陕甘晋高原地下水储量变化
  • DOI:
    10.13474/j.cnki.11-2246.2018.0026
  • 发表时间:
    2018
  • 期刊:
    测绘通报
  • 影响因子:
    --
  • 作者:
    谢小伟;许才军;龚正;李伟
  • 通讯作者:
    李伟
缩放型喷嘴空化射流空泡云演化规律的试验研究
  • DOI:
    10.3969/j.issn.1674-8530.19.0002
  • 发表时间:
    2020
  • 期刊:
    排灌机械工程学报
  • 影响因子:
    --
  • 作者:
    李伟;张文全;施卫东;杨勇飞;曹卫东
  • 通讯作者:
    曹卫东
Wire electrochemical machining with axial electrolyte flushing for titanium alloy
钛合金轴向电解液冲洗线材电化学加工
  • DOI:
    10.1016/j.cja.2012.12.026
  • 发表时间:
    2013-02
  • 期刊:
    Chinese Journal of Aeronautics
  • 影响因子:
    5.7
  • 作者:
    曲宁松;房晓龙;李伟;曾永彬;朱荻
  • 通讯作者:
    朱荻
Sourcing strategy of original equipment manufacturer with quality competition
质量竞争的原始设备制造商采购策略
  • DOI:
    10.1111/deci.12413
  • 发表时间:
    2019-08
  • 期刊:
    Decision Sciences
  • 影响因子:
    5.5
  • 作者:
    李伟;陈静;陈滨桐
  • 通讯作者:
    陈滨桐

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

李伟的其他基金

基于深度学习的音乐节拍及强拍跟踪技术研究
  • 批准号:
    62171138
  • 批准年份:
    2021
  • 资助金额:
    57 万元
  • 项目类别:
    面上项目
介孔碳基非贵金属氢燃料电池催化材料的设计合成和性能研究
  • 批准号:
    U21A20329
  • 批准年份:
    2021
  • 资助金额:
    260.00 万元
  • 项目类别:
介孔碳基非贵金属氢燃料电池催化材料的设计合成和性能研究
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    260 万元
  • 项目类别:
DNA甲基化边界漂移重塑增强子活性在肺癌脑转移中的作用研究
  • 批准号:
    32000505
  • 批准年份:
    2020
  • 资助金额:
    24 万元
  • 项目类别:
    青年科学基金项目
Necrosulfonamide通过抑制细胞焦亡防治老年性聋的实验研究
  • 批准号:
    81900942
  • 批准年份:
    2019
  • 资助金额:
    18.0 万元
  • 项目类别:
    青年科学基金项目
非贵金属助催化剂修饰介孔黑二氧化钛体系的构建及光催化产氢性能研究
  • 批准号:
    21603036
  • 批准年份:
    2016
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
基于人声检测及分离的多版本流行音乐检索关键技术研究
  • 批准号:
    61171128
  • 批准年份:
    2011
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
音频指纹在音乐检索中的关键技术研究
  • 批准号:
    60873255
  • 批准年份:
    2008
  • 资助金额:
    26.0 万元
  • 项目类别:
    面上项目
数字音频水印算法研究
  • 批准号:
    60402008
  • 批准年份:
    2004
  • 资助金额:
    22.0 万元
  • 项目类别:
    青年科学基金项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码