基于类别噪声过滤学习的核分类器优化
项目介绍
AI项目解读
基本信息
- 批准号:61806030
- 项目类别:青年科学基金项目
- 资助金额:26.0万
- 负责人:
- 依托单位:
- 学科分类:F0603.机器学习
- 结题年份:2021
- 批准年份:2018
- 项目状态:已结题
- 起止时间:2019-01-01 至2021-12-31
- 项目参与者:舒禹程; 刘立; 陈百云; 刘运胜; 丁鑫; 李曹枭;
- 关键词:
项目摘要
The choice of kernel parameters is critical to the performance of the kernel classifiers. The existing kernel parameters selections are mainly dependent on regularization and cross validation, which are inefficient and not enough optimized. The methods based on the separability measure of the mapping space can improve the efficiency to a certain extent. But on the one hand, the time complexity of the algorithms is still in the quadratic form. On the other hand, the influence of the excessive noise mapping is not taken into account. This is an important reason for the restrictions of wide application of SVM, kernel logistic regression, kernel Fisher and other kernel classifiers in the large-scale data sets..The main reason that the existing class noise research cannot be used in the optimization of kernel parameters is that the class noise detection in the complex data environment is difficult, and the existing methods are difficult to achieve good results, which is needed to be solved urgently. To this end, this project combined with random forest, deep convolution neural network and transform learning and other methods to achieve the effective detection of class noise in complex data environment. On the basis of this, this project will solve the problem of efficient optimization of kernel parameters in two ways: on the one hand, we solve the problem of excessive mapping of kernel parameters by detecting and filtering the class noise in the data, and accelerate the methods based on validation training; On the other hand, we use the reference point instead of the center of gravity of the mapping space to reduce the algorithm time complexity. We further extend the proposed kernel parameters optimization methods into different kernel classifiers, significantly improving their application capacities in large-scale data sets.
核参数选择对核分类器的性能至关重要,现有的核参数选择主要依赖正则化和交叉验证,效率低,不够优化。基于映射空间可分性度量的方法可以提高效率,但是一方面算法时间复杂度基本在二次方;另一方面,没有考虑到类别噪声过度映射的影响。这制约了SVM、核逻辑回归、核Fisher等核分类器在大规模数据中的广泛应用。.现有的类别噪声研究无法用于核参数寻优的主要原因在于,复杂数据环境中的类别噪声检测比较困难,现有方法难以取得较好效果。为此,本项目结合随机森林、深度卷积神经网络和迁移学习等方法实现复杂数据环境下类别噪声的有效检测。在此基础上,通过两方面解决核参数的高效精确寻优问题:第一,通过检测和过滤类别噪声解决核参数的过度映射问题,并加速基于验证训练的寻优方法;第二,使用参考点代替映射空间的重心来降低算法时间复杂度。并将新的核参数优化方法结合到不同核分类器中,显著提高其在大规模数据中的应用能力。
结项摘要
为了克服现有的标签噪声检测方法难以有效用于复杂数据环境的缺点,基于多粒度认知计算,解决核参数无法高效精确寻优的问题,继而使得标签噪声过滤学习方法能有效地改善核分类器的学习性能,本项目的研究目标作如下规划:(1)研究出健壮高效的标签噪声检测方法;(2)研究出基于标签噪声过滤学习的核分类器高效优化方法。相应的主要研究内容有(1)适用于复杂数据环境下的标签噪声快速检测方法;(2)基于标签噪声过滤学习的核参数高效优化方法;(3)基于标签噪声过滤学习的核分类器优化研究。技术方案的选择上,我们提出了粒球计算方法,通过粒球计算来平滑过滤标签噪声。.基于以上研究目标和研究内容,申请人通过粒空间生成的方式,对该科学问题开展了持续研究,具体取得了如下关键创新和突破:.(1)提出了粒球计算方法,构造了基于非像素点输入的分类器数学模型,实现了高效鲁棒的分类学习过程;另外,我们基于粒球的几何结构,通过采样粒球附近的样本点,将粒球计算应用到采样算法中,解决了大规模的、非线性、不平衡分类问题下样本采样压缩问题。.(2)提出了基于粒球计算的精确聚类算法,实现了大规模k-means高效聚类;提出了基于粒球计算的粗糙集算法,实现了高效自适应的连续数据属性约简。该方法中,由于使用超球体来量化空间簇,获得了更加精确的近邻关系,单个样本点的计算次数远小于现有的同类顶尖算法;另外,该近邻关系不需要额外参数,消除了现有大多数优秀加速算法中单个样本上下界,因此算法具有良好的自适应性。.(3)提出了一种对类别噪声鲁棒的邻域粗糙集算法-GBNRS,实现了针对不平衡问题的高效鲁棒的过采样。相对于经典邻域粗糙集,基于粒球计算理论提出了粒球邻域粗糙集。GBNRS能够自动识别类别噪声,因此,相比传统方法,在很多数据集中能够获得更好的精度。.研究成果可以广泛应用于含有标签噪声的数据挖掘和模式识别等人工神经网络领域,提高学习的鲁棒性。.
项目成果
期刊论文数量(7)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Weighted oversampling algorithms for imbalanced problems and application in prediction of streamflow
不平衡问题的加权过采样算法及其在水流预测中的应用
- DOI:10.1016/j.knosys.2021.107306
- 发表时间:2021
- 期刊:Knowledge-Based Systems
- 影响因子:8.8
- 作者:Zhou Hao;Dong Xianyong;Xia Shuyin;Wang Guoyin
- 通讯作者:Wang Guoyin
GBNRS: A Novel Rough Set Algorithm for Fast Adaptive Attribute Reduction in Classification
GBNRS:一种用于分类中快速自适应属性约简的新型粗糙集算法
- DOI:10.1109/tkde.2020.2997039
- 发表时间:2020-05
- 期刊:IEEE Transactions on Knowledge and Data Engineering
- 影响因子:8.9
- 作者:Shuyin Xia;Zhao Zhang;Wenhua Li;Guoyin Wang;Elisabeth Giem;Zizhong Chen
- 通讯作者:Zizhong Chen
Granular ball computing classifiers for efficient, scalable and robust learning
用于高效、可扩展和稳健学习的粒度球计算分类器
- DOI:10.1016/j.ins.2019.01.010
- 发表时间:2019-05
- 期刊:Information Sciences
- 影响因子:8.1
- 作者:Shuyin Xia;Yunsheng Liu;Xin Ding;Guoyin Wang;Hong Yu;Yuoguo Luo
- 通讯作者:Yuoguo Luo
Random Space Division Sampling for Label-Noisy Classification or Imbalanced Classification
用于标签噪声分类或不平衡分类的随机空分采样
- DOI:10.1109/tcyb.2021.3070005
- 发表时间:2021-04-27
- 期刊:IEEE TRANSACTIONS ON CYBERNETICS
- 影响因子:11.8
- 作者:Xia, Shuyin;Zheng, Yong;Chen, Zizhong
- 通讯作者:Chen, Zizhong
RSMOTE: A self-adaptive robust SMOTE for imbalanced problems with label noise
RSMOTE:一种自适应鲁棒 SMOTE,用于解决标签噪声不平衡问题
- DOI:10.1016/j.ins.2020.10.013
- 发表时间:2021-01-14
- 期刊:INFORMATION SCIENCES
- 影响因子:8.1
- 作者:Chen, Baiyun;Xia, Shuyin;Wang, Guoyin
- 通讯作者:Wang, Guoyin
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
夏书银的其他基金
基于粒空间的粗糙集高维数据分析方法
- 批准号:
- 批准年份:2021
- 资助金额:59 万元
- 项目类别:面上项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}