音乐旋律提取关键技术研究及其在音乐借用识别中的应用
项目介绍
AI项目解读
基本信息
- 批准号:61671156
- 项目类别:面上项目
- 资助金额:58.0万
- 负责人:
- 依托单位:
- 学科分类:F0111.信号理论与信号处理
- 结题年份:2020
- 批准年份:2016
- 项目状态:已结题
- 起止时间:2017-01-01 至2020-12-31
- 项目参与者:陈宁; 张文强; 张旭龙; 范殊文; 冯相宜; 吴益明; 高月洁; 邓永莉; 陈志高;
- 关键词:
项目摘要
Melody is one of the most important elements of music, with many direct and indirect applications in music content analysis, music creation, music education, and protection of music intellectual properties. In this proposal, the research is focused on automatic melody extraction technique and its application in music borrowing identification. The main content is divided into five aspects: (1). Design a pitch salience-based melody extraction algorithm, combining perceptual time-frequency transform, melodic pitch contour characterization, post-processing using high-level musical knowledge, and melody locating; (2). Design an audio separation based melody extraction algorithm. The problem of partial overlap and melodic contour breaking can be solved, to some extent, by combing fuzzy classification and musical knowledge; (3). From the data-driven perspective, we design a classification-based melody extraction algorithm. With comprehensive well trained note templates of common instruments, deep neural network (DNN) and convertional GMM classifier are fused together to obtain more reliable melody note sequence; (4). Among the three algorithms above, the best melody extraction method is incorporated into the task of music borrowing identification. Because both the position and length of similar fragments located in two different songs are unknown, conventional similarity matrix and recursive plot have to be accordingly modified to solve this problem; (5). Develop two demonstration systems of automatic melody extraction and music borrowing identification, respectively. To facilitate the algorithm testing and performance comparison, a new large-scale open dataset needs to be established.
旋律是最重要的音乐要素之一,在音乐内容分析、音乐创作、音乐教育、抄袭检测等方面具有很多应用。本课题研究音乐旋律提取技术及其在音乐引用识别中的应用。研究内容分为五个方面:(1). 结合感知时频变换、音高包络线、利用音乐知识的后处理、以及旋律定位等技术,在音高显著性计算框架下进行旋律提取算法研究;(2). 进行基于音频分离技术的旋律提取算法研究,运用模糊分类及音乐知识在一定程度上解决泛音重叠及旋律包络线断续的问题;(3). 从数据驱动的角度出发研究自动旋律提取。在充分训练的基础上,对音乐信号的时频表示基于常规分类器和深度学习分别加以分类,然后进行分类器融合以得到更可靠的旋律音符序列;(4). 基于以上最佳的旋律提取结果进行音乐借用识别算法研究。针对相似片段位置及长度不定的问题对递归图及相似片段挑选策略进行改进;(5). 开发自动旋律提取及音乐借用识别演示系统,建立公开的较大规模测试数据库。
结项摘要
旋律是音乐最基本的要素之一。从音乐信号中自动提取主旋律是音乐人工智能的核心技术之一。具有诸多应用场景,如哼唱检索、翻唱识别、歌唱评价、歌手识别等。. 在音乐信号主旋律提取方面,主要有如下工作:流行音乐主旋律提取技术综述;基于DNN音高估计和基于重要性的音高改进的歌声主旋律提取;用于主旋律提取的多任务学习;基于歌声分离和编码器-解码器音高估计的歌唱旋律提取;基于两阶段训练的HRNet-BLSTM模型的歌声旋律提取;基于音调和八度感知的旋律提取;基于时空注意力网络的旋律提取。. 在其它音乐人工智能及一般音频计算机听觉领域进行了大量扩展研究,主要有如下工作:基于相似性函数融合的翻唱检索;多维度自动高级歌唱评价;基于残差注意力网络的自动发声方式分类;基于GRU递归神经网络/卷积神经网络多维特征深度融合的歌声检测;消除伴奏对歌声检测的影响;基于KNN-Net深度神经网络模型的深度音色特征学习/时域波形堆叠扩张卷积神经网络的歌手识别;基于MIDI训练的DRN和CNN深度特征及BLSTM-CRF序列解码/随机森林/结构化和弦表示的大词汇量和弦识别;基于多尺度分组注意力网络的音乐速度估计;基于客观特征的民族乐器音色分析;基于迁移学习/带通道注意机制CNN的音乐情感识别;基于高分辨率网络/条纹信息的音源分离;基于音乐结构分析的副歌提取算法;基于卷积神经网络和数据增强的中医闻诊;基于分区预训练卷积神经网络的水声目标识别。. 以上研究成果基本都达到甚至超过了国际先进水平,发表20余篇研究论文,包括TASLP、ICASSP、ISMIR、ICME、CSMT等音频和多媒体领域国内外权威期刊和重要学术会议。另投稿8篇,申请6项国家发明专利(已授权1项),2项软件著作权。在MIREX 2017-2018和弦识别竞赛取得多项第一名。联合举办ISMIR 2017权威国际会议,CSMT 2017-2020权威国内会议。培养毕业13名硕士、博士研究生。撰写基于Music和Audio的两篇大型中文综述,主编该领域第一本中文教材,定义百度百科学科词条,主持拍摄在线MOOC,奠定音乐人工智能与计算机听觉这一新兴交叉学科的基础。
项目成果
期刊论文数量(14)
专著数量(2)
科研奖励数量(0)
会议论文数量(2)
专利数量(6)
A practical singing voice detection system based on GRU-RNN
一种基于GRU-RNN的实用歌声检测系统
- DOI:--
- 发表时间:2019
- 期刊:Springer LNEE 568 (Lecture Notes in Electrical Engineering)
- 影响因子:--
- 作者:Z. Chen;X. Zhang;J. Deng;J. Li;Y. Jiang;W. Li
- 通讯作者:W. Li
Data augmentation based convolutional neural network for auscultation
基于数据增强的卷积神经网络用于听诊
- DOI:--
- 发表时间:2019
- 期刊:复旦学报(自然科学版)
- 影响因子:--
- 作者:江益靓;张旭龙;邓晋;张文强;李伟
- 通讯作者:李伟
CCMusic:用于MIR研究的中国音乐数据库建设
- DOI:10.15943/j.cnki.fdxb-jns.2019.03.007
- 发表时间:2019
- 期刊:复旦学报(自然科学版)
- 影响因子:--
- 作者:李子晋;于帅;肖畅;耿瑜曼;钱文琪;高永伟;李伟
- 通讯作者:李伟
理解数字音乐——音乐信息检索技术综述
- DOI:10.15943/j.cnki.fdxb-jns.2018.03.001
- 发表时间:2018
- 期刊:复旦学报(自然科学版)
- 影响因子:--
- 作者:李伟;李子晋;高永伟
- 通讯作者:高永伟
A Method for Detecting Short Similar Segments in Music Segments in Music Borrowing
一种音乐借用中音乐片段中短相似片段的检测方法
- DOI:10.15943/j.cnki.fdxb-jns.2019.03.003
- 发表时间:2019
- 期刊:复旦学报(自然科学版)
- 影响因子:--
- 作者:高永伟;沈迤淳;吴益明;张旭龙;于帅;李伟
- 通讯作者:李伟
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
基于特征族群语义扩散核的半监督农业文本分类
- DOI:10.13698/j.cnki.cn36-1346/c.2018.03.016
- 发表时间:2018
- 期刊:赣南师范大学学报
- 影响因子:--
- 作者:李伟;汪廷华;郑惠宁
- 通讯作者:郑惠宁
利用GRACE反演陕甘晋高原地下水储量变化
- DOI:10.13474/j.cnki.11-2246.2018.0026
- 发表时间:2018
- 期刊:测绘通报
- 影响因子:--
- 作者:谢小伟;许才军;龚正;李伟
- 通讯作者:李伟
缩放型喷嘴空化射流空泡云演化规律的试验研究
- DOI:10.3969/j.issn.1674-8530.19.0002
- 发表时间:2020
- 期刊:排灌机械工程学报
- 影响因子:--
- 作者:李伟;张文全;施卫东;杨勇飞;曹卫东
- 通讯作者:曹卫东
Wire electrochemical machining with axial electrolyte flushing for titanium alloy
钛合金轴向电解液冲洗线材电化学加工
- DOI:10.1016/j.cja.2012.12.026
- 发表时间:2013-02
- 期刊:Chinese Journal of Aeronautics
- 影响因子:5.7
- 作者:曲宁松;房晓龙;李伟;曾永彬;朱荻
- 通讯作者:朱荻
Sourcing strategy of original equipment manufacturer with quality competition
质量竞争的原始设备制造商采购策略
- DOI:10.1111/deci.12413
- 发表时间:2019-08
- 期刊:Decision Sciences
- 影响因子:5.5
- 作者:李伟;陈静;陈滨桐
- 通讯作者:陈滨桐
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}

内容获取失败,请点击重试

查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图

请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
李伟的其他基金
基于深度学习的音乐节拍及强拍跟踪技术研究
- 批准号:62171138
- 批准年份:2021
- 资助金额:57 万元
- 项目类别:面上项目
介孔碳基非贵金属氢燃料电池催化材料的设计合成和性能研究
- 批准号:U21A20329
- 批准年份:2021
- 资助金额:260.00 万元
- 项目类别:
介孔碳基非贵金属氢燃料电池催化材料的设计合成和性能研究
- 批准号:
- 批准年份:2021
- 资助金额:260 万元
- 项目类别:
DNA甲基化边界漂移重塑增强子活性在肺癌脑转移中的作用研究
- 批准号:32000505
- 批准年份:2020
- 资助金额:24 万元
- 项目类别:青年科学基金项目
Necrosulfonamide通过抑制细胞焦亡防治老年性聋的实验研究
- 批准号:81900942
- 批准年份:2019
- 资助金额:18.0 万元
- 项目类别:青年科学基金项目
非贵金属助催化剂修饰介孔黑二氧化钛体系的构建及光催化产氢性能研究
- 批准号:21603036
- 批准年份:2016
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
基于人声检测及分离的多版本流行音乐检索关键技术研究
- 批准号:61171128
- 批准年份:2011
- 资助金额:60.0 万元
- 项目类别:面上项目
音频指纹在音乐检索中的关键技术研究
- 批准号:60873255
- 批准年份:2008
- 资助金额:26.0 万元
- 项目类别:面上项目
数字音频水印算法研究
- 批准号:60402008
- 批准年份:2004
- 资助金额:22.0 万元
- 项目类别:青年科学基金项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}