基于约束的高维数据聚类
项目介绍
AI项目解读
基本信息
- 批准号:61272374
- 项目类别:面上项目
- 资助金额:80.0万
- 负责人:
- 依托单位:
- 学科分类:F0607.知识表示与处理
- 结题年份:2016
- 批准年份:2012
- 项目状态:已结题
- 起止时间:2013-01-01 至2016-12-31
- 项目参与者:王智慧; 丁锋; 许真珍; 刘馨月; 于红; 韩敏; 秦静; 尤全增; 吴尧;
- 关键词:
项目摘要
Clustering, which helps to find natural structure of data, is an essential content of data minning and plays an important role in many fields. In recent years, massive high-dimensional data has been produced, which poses hugh challenge,called the curse of dimensionality, to traditional clustering algorithms. The challenge is mainly because that in high dimensional data, different clusters are embeded in different subpaces, and the tasks of finding subspaces and detecting clusters are circular dependent. To break the circular dependency, existing algorithms usually make some assumptions on the data set. However, these assumptions do not make sense in most situations. Through numerous studies, we have learned that constraint information could be used to break this kind of circular dependency. Nevertheless, research on constraint based high dimensional data clustering is just the beginning. The only few algorithms are all local improvements on existing unsupervised algorithms. They do not escape from making assumptions on the data set, thus could not really break the circular dependency. In this project, based on our previous results, we introduce the concept of correlation between constraints and subspaces to solve the circular dependency problem of high-dimensional data clustering. We also apply constraints to all procedures of clustering to gain high quality constaint based high-dimensional data clustering algorithms. We aim to solve the curse of dimensionality of high-dimensional data clustering, thus pave the way to establishing basic algorithmic and theoretical framework of constraint based high-dimensional data clustering.
聚类是数据挖掘的基本内容,它帮助发现数据的自然结构,在很多领域起重要作用。近年来产生的大量高维数据给传统聚类算法带来被称为维度灾难的巨大挑战,主要表现为:在高维数据中不同的簇对应于不同的子空间,发现子空间和发现簇这两个任务是循环依赖的。为了打破这种循环依赖关系,现有算法通常对数据集做某种假设,而这些假设在多数情况下是不成立的。通过前期大量研究,我们认识到约束信息可以用来打破这种循环依赖关系。但基于约束的高维数据聚类研究刚刚起步,仅有的几个算法都是对现有无监督算法的局部改进,没有摆脱对数据集的假设,即没有在真正意义上解决循环依赖这个根本问题。本项目在我们前期研究取得进展的基础上,通过引进约束与子空间相关度的概念来解决高维数据聚类的循环依赖问题,并将约束用于聚类的各个环节,获得基于约束的高维数据聚类高质量算法,解决高维数据聚类的维度灾难,为初步建立基于约束的高维数据聚类算法和理论体系奠定基础。
结项摘要
聚类是数据挖掘的基本内容,它帮助发现数据的自然结构,在很多领域起重要作用。近年来产生的大量高维数据给传统聚类算法带来被称为维度灾难的巨大挑战,主要现为:在高维数据中不同的簇对应于不同的子空间,发现子空间和发现簇这两个任务是循环依赖的。为了打破这种循环依赖关系,现有算法通常对数据集做某种假设,而这些假设在多数情况下是不成立的。通过前期大量研究,我们认识到约束信息可以用来打破这种循环依赖关系。但基于约束的高维数据聚类研究刚刚起步,仅有的几个算法都是对现有无监督算法的局部改进,没有摆脱对数据集的假设,即没有在真正意义上解决循环依赖这个根本问题。本项目目标在我们前期工作基础上,探索在不对数据集进行任何假设的条件下,用约束解决高维数据聚类中发现子空间和发现簇的循环依赖这个根本问题,并将约束用于高维数据聚类的各个环节,首先获得基于约束的类似CLIQUE 和PROCLUS 的基础性算法,再进一步发展若干基于约束的高质量高维数据聚类算法。最终本项目高维数据聚类、不确定数据聚类、多视角聚类和多任务聚类等方面取得了大量创新成果。主要创新成果包括: 1)提出基于约束的集成高维数据聚类算法;2)基于约束的高维不确定数据子空间聚类算法;3)提出新的基于密度的不确定数据聚类算法;4)提出基于非负矩阵分解的约束聚类;5)提出谱聚类Nystrom扩展抽样的增量方法和新的分析方法;6)提出聪明的多任务Bregman聚类和多任务核聚类算法;7)提出自适应多任务聚类问题和算法;8)提出多视角数据的局部线性重构算法;9)提出基于多流行正则化非负矩阵分解的多视角聚类算法;10)提出基于约束的不对应数据多视角聚类;11)提出多任务多视角聚类问题和算法。在TKDE、TKDD等国际期刊和IJCAI、AAAI等国际会议上发表论文28篇,由科学出版社出版专著《数据聚类》1部,获教育部自然科学二等奖。
项目成果
期刊论文数量(11)
专著数量(0)
科研奖励数量(0)
会议论文数量(17)
专利数量(0)
Sampling for Nystrom Extension based Spectral Clustering: Incremental Perspective and Novel Analysis
基于 Nystrom 扩展的谱聚类采样:增量视角和新颖分析
- DOI:--
- 发表时间:2016
- 期刊:ACM Transactions on Knowledge Discovery from Data
- 影响因子:3.6
- 作者:张宪超;宗林林;尤全增;勇幸
- 通讯作者:勇幸
Constrained Clustering With Nonnegative Matrix Factorization
具有非负矩阵分解的约束聚类
- DOI:10.1109/tnnls.2015.2448653
- 发表时间:2016-07
- 期刊:IEEE Transactions on Neural Networks and Learning Systems
- 影响因子:10.4
- 作者:张宪超;宗林林;刘馨月;罗杰波
- 通讯作者:罗杰波
Automatic seed set expansion for trust propagation based anti-spam algorithms
基于信任传播的反垃圾邮件算法的自动种子集扩展
- DOI:10.1016/j.ins.2012.12.035
- 发表时间:2013-05
- 期刊:INFORMATION SCIENCES
- 影响因子:8.1
- 作者:张宪超;梁文新;朱少萍;韩博
- 通讯作者:韩博
Discovering social spammers from multiple views
从多个角度发现社交垃圾邮件发送者
- DOI:10.1016/j.neucom.2016.11.013
- 发表时间:2017-02
- 期刊:Neurocomputing
- 影响因子:6
- 作者:张宪超;宗林林;刘馨月;梁文新
- 通讯作者:梁文新
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
二次分配问题的骨架分析与算法设计
- DOI:--
- 发表时间:--
- 期刊:中国科学(E辑:信息科学)
- 影响因子:--
- 作者:陈国良;李明楚;江贺;张宪超
- 通讯作者:张宪超
高维分类属性的子空间聚类算法
- DOI:--
- 发表时间:--
- 期刊:小型微型计算机系统
- 影响因子:--
- 作者:王新艳;单世民;张宪超
- 通讯作者:张宪超
一种适用于大型站点的层次链接分析算法
- DOI:--
- 发表时间:--
- 期刊:小型微型计算机系统
- 影响因子:--
- 作者:刘瑜;张宪超;刘馨月
- 通讯作者:刘馨月
肺腺癌肿瘤相关巨噬细胞的免疫组织化学双标染色方法优化
- DOI:10.16016/j.1000-5404.201701070
- 发表时间:2017
- 期刊:第三军医大学学报
- 影响因子:--
- 作者:张宪超;张翔;曹棉富;陈露;党微旗;宋康;崔有宏;张厦;卞修武
- 通讯作者:卞修武
An improved spectral clustering algorithm based on random walk
一种基于随机游走的改进谱聚类算法
- DOI:10.1007/s11704-011-0023-0
- 发表时间:2011-09
- 期刊:Frontier of Computer Science in China
- 影响因子:--
- 作者:张宪超;尤全增
- 通讯作者:尤全增
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
张宪超的其他基金
基于可能世界的不确定数据聚类
- 批准号:61876028
- 批准年份:2018
- 资助金额:62.0 万元
- 项目类别:面上项目
平面图及近似平面图上的最大流和最小割
- 批准号:61070016
- 批准年份:2010
- 资助金额:11.0 万元
- 项目类别:面上项目
Web社区高质量识别算法研究
- 批准号:60873180
- 批准年份:2008
- 资助金额:30.0 万元
- 项目类别:面上项目
面向若干挑战性应用的网络最大流算法研究
- 批准号:60673066
- 批准年份:2006
- 资助金额:8.0 万元
- 项目类别:面上项目
Web图流算法及Web社区发现
- 批准号:60503003
- 批准年份:2005
- 资助金额:6.0 万元
- 项目类别:青年科学基金项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}