大规模数据挖掘中嵌入式数据归约的稀疏模型与算法研究
项目介绍
AI项目解读
基本信息
- 批准号:61866010
- 项目类别:地区科学基金项目
- 资助金额:40.0万
- 负责人:
- 依托单位:
- 学科分类:F0603.机器学习
- 结题年份:2022
- 批准年份:2018
- 项目状态:已结题
- 起止时间:2019-01-01 至2022-12-31
- 项目参与者:卢媛; 吴爽; 张婷婷; 黄凌伟; 张军; 陈文辉;
- 关键词:
项目摘要
How to effectively perform data reduction is a key issue for large-scale data mining. Embedded data reduction refers to data reduction while learning data mining tasks. It is a research hotspot for current data reduction. Support vector machine (SVM) is a typical representative of embedded data reduction. However, traditional support vector machines can only perform sample reduction, and cannot perform feature reduction. Furthermore, it is particularly important data to improve the performance of the data reduction for the large-scale. This project intends to further improve support vector machines and related embedded data reduction methods for large-scale embedded data reduction. The specific contents include: Study loss functions and regular terms with more sparse nature of both samples and features, and then propose the large-scale support vector machines that can perform sample reduction and feature reduction simultaneously; For least squares SVM and linear discriminant analysis, study the sparse models and algorithms for feature selection and feature extraction; study the sparse models that can simultaneously perform sample and feature reduction, focusing on the interpretability of sparse regularization and sparse loss functions, and fast algorithms of large-scale problems Finally, the above research is applied to the large-scale image information retrieval problem. The study of this project is of innovative significance to the theory and practice of embedded data reduction in large-scale data mining.
如何有效进行数据归约是大规模数据挖掘的一个关键问题。嵌入式数据归约是指在学习数据挖掘任务的同时进行数据归约,是当前数据归约的研究热点。支持向量机是嵌入式数据归约的典型代表,然而传统的支持向量机只能进行样本归约,不能进行特征归约,并且对大规模数据的归约性能也亟待提高。本项目拟进一步改进支持向量机及有关嵌入式数据归约方法,施行大规模嵌入式数据归约。具体内容包括:研究对样本和特征具有更加稀疏性质的损失项和正则项,进而提出即可进行样本规约、又可进行特征归约的大规模支持向量机;对最小二乘支持向量机和判别分析,构造稀疏的特征选择和特征提取模型与算法;研究可以同时进行样本和特征归约的稀疏模型,重点关注其稀疏正则化和稀疏损失函数的可解释性和大规模问题的快速求解算法;最后,将以上研究应用于大规模图像信息检索问题。本项目的研究对大规模数据挖掘中嵌入式数据归约的理论和实践都具有创新意义。
结项摘要
如何有效进行数据归约是大规模数据挖掘的一个关键问题。嵌入式数据归约是指在学习数据挖掘任务的同时进行数据归约,是当前数据归约的研究热点。本项目以支持向量机的同时样本归约和特征归约为研究切入点,研究对样本和特征具有更加稀疏性质的损失项和正则项,进而提出了即可进行样本规约、又可进行特征归约的大规模支持向量机;对最小二乘支持向量机和判别分析,构造稀疏的特征选择和特征提取模型与算法;研究了可以同时进行样本和特征归约的稀疏模型,特别是其稀疏正则化和稀疏损失函数的可解释性和大规模问题的快速求解算法;对设计的算法在实际问题进行了数值实验,选取优秀的算法并开发了性能优异的求解器。最后,将以上研究应用于大规模图像信息检索问题。.经过4年的研究,共发表了20篇与项目相关的研究论文,参加或参与组织国际国内学术会议10次,并做报告宣传项目研究成果。培养相关毕业研究生6名。其中,作为本项目的重要结果,给出了最小二乘支持向量机同时进行样本归约和特征归约的条件以及相应的模型与算法。给出了线性判别分析同时进行样本归约和特征归约的条件以及相应的模型与算法。建立了最具有稀疏性的L0/1损失支持向量机稀疏理论基础及大规模归约算法。这些稀疏算法与工作集算法和截断算法结合,从而使其适用于大规模数据挖掘中嵌入式数据归约。.总之,本项目的完成不仅为大规模数据挖掘中嵌入式数据归约提供新的稀疏模型和新算法,而且为学科交叉与融合提供了实践经验,对于人才培养以及嵌入式稀疏归约相关领域的深度合作与交流起到了积极推动作用。
项目成果
期刊论文数量(20)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Multiple Flat Projections for Cross-Manifold Clustering
用于跨流形聚类的多个平面投影
- DOI:10.1109/tcyb.2021.3050487
- 发表时间:2020-02
- 期刊:IEEE Transactions on Cybernetics
- 影响因子:11.8
- 作者:Lan Bai;Yuan-Hai Shao;Zhen Wang;Wei-Jie Chen;Nai-Yang Deng
- 通讯作者:Nai-Yang Deng
Joint sample and feature selection via sparse primal and dual LSSVM
通过稀疏原始和对偶 LSSVM 进行联合样本和特征选择
- DOI:10.1016/j.knosys.2019.104915
- 发表时间:2019
- 期刊:Knowledge-Based Systems
- 影响因子:8.8
- 作者:Shao Yuan Hai;Li Chun Na;Huang Ling Wei;Wang Zhen;Deng Nai Yang;Xu Yan
- 通讯作者:Xu Yan
Reverse nearest neighbors Bhattacharyya bound linear discriminant analysis for multimodal classification
用于多模态分类的反向最近邻 Bhattacharyya 边界线性判别分析
- DOI:10.1016/j.engappai.2020.104033
- 发表时间:2021-01-01
- 期刊:ENGINEERING APPLICATIONS OF ARTIFICIAL INTELLIGENCE
- 影响因子:8
- 作者:Guo, Yan-Ru;Bai, Yan-Qin;Jiang, Cheng-zi
- 通讯作者:Jiang, Cheng-zi
Generalized two-dimensional linear discriminant analysis with regularization
正则化广义二维线性判别分析
- DOI:10.1016/j.neunet.2021.04.030
- 发表时间:2021-05-10
- 期刊:NEURAL NETWORKS
- 影响因子:7.8
- 作者:Li, Chun-Na;Shao, Yuan-Hai;Deng, Nai-Yang
- 通讯作者:Deng, Nai-Yang
Sparse L1-norm two dimensional linear discriminant analysis via the generalized elastic net regularization
基于广义弹性网正则化的稀疏 L1 范数二维线性判别分析
- DOI:10.1016/j.neucom.2019.01.049
- 发表时间:2019-04-14
- 期刊:NEUROCOMPUTING
- 影响因子:6
- 作者:Li, Chun-Na;Shang, Meng-Qi;Wang, Zhen
- 通讯作者:Wang, Zhen
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
金融空间联系及K-means聚类中心等级识别研究——以长三角为例
- DOI:10.13249/j.cnki.sgs.2015.01.144
- 发表时间:2015-02
- 期刊:地理科学
- 影响因子:--
- 作者:杨志民;化祥雨;叶娅芬;邵元海
- 通讯作者:邵元海
外商直接投资空间联系研究——以浙江省为例
- DOI:--
- 发表时间:2013
- 期刊:经济地理
- 影响因子:--
- 作者:杨志民;化祥雨;邵元海;叶娅芬
- 通讯作者:叶娅芬
未确知支持向量机
- DOI:--
- 发表时间:2013
- 期刊:自动化学报
- 影响因子:--
- 作者:杨志民;邵元海;梁静
- 通讯作者:梁静
基于支持向量机的集团信用风险预警研究
- DOI:--
- 发表时间:--
- 期刊:中国农业大学学报
- 影响因子:--
- 作者:邵元海;冯一宁;陈静;王来生;邓乃扬
- 通讯作者:邓乃扬
鲁棒的稀疏Lp-模主成分分析
- DOI:10.16383/j.aas.2017.c150512
- 发表时间:2017
- 期刊:自动化学报
- 影响因子:--
- 作者:李春娜;陈伟杰;邵元海
- 通讯作者:邵元海
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
邵元海的其他基金
完全统计学习的小数据支持向量机
- 批准号:12271131
- 批准年份:2022
- 资助金额:46 万元
- 项目类别:面上项目
SVM不定核学习的低秩优化算法
- 批准号:11926349
- 批准年份:2019
- 资助金额:10.0 万元
- 项目类别:数学天元基金项目
噪声数据的非凸损失函数支持向量机最优化模型与算法研究
- 批准号:11871183
- 批准年份:2018
- 资助金额:52.0 万元
- 项目类别:面上项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}