海量高维天体光谱数据挖掘及其并行化研究
项目介绍
AI项目解读
基本信息
- 批准号:61272263
- 项目类别:面上项目
- 资助金额:80.0万
- 负责人:
- 依托单位:
- 学科分类:F0607.知识表示与处理
- 结题年份:2016
- 批准年份:2012
- 项目状态:已结题
- 起止时间:2013-01-01 至2016-12-31
- 项目参与者:杨海峰; 胡立华; 刘爱琴; 荀亚玲; 娄圣金; 石岩; 钟利华;
- 关键词:
项目摘要
Aiming at three major science tasks of the great national science engineering project LAMOST,this project makes research on massive and high dimensional data mining of celestial spectra data and its parallel technology around the key scientific issue which is "Looking for the special celestial body with tracing properties and the universe awareness of unknown laws". The main research work is as follow: Local outlier mining algorithm of massive and high dimensional data set and its parallelization based on subspace and attribute correlation analysis; Frequent pattern mining algorithm and its parallelization based on address table and FIUT tree structure; Celestial body spectrum-oriented reduction and representation of association rule; Performance optimization of data mining algorithms and load balancing under the cluster environments; Parallel oulier mining technology of massive and high dimensional celestial spectra ; The parallelization technology of correlation analysis of massive and high dimensional celestial spectra data based on association rule; Celestial spectra data mining system under Hadoop environments. The research on the project not only affords effective ways and means for massive and high dimensional data mining, but also further provides core support technologies for improving the scientific output of LAMOST, discovering unknown special celestial bodies and the astronomical law, and the cross-certification of unknown celestial bodies.
本项目针对国家重大科学工程LAMOST项目的三大科学任务,围绕拟解决的关键科学问题"寻找具有示踪性质的特殊天体以及宇宙未知规律的认识",对海量高维天体光谱数据挖掘及其并行化技术进行研究,主要研究内容包括:基于子空间和属性相关性的海量高维局部离群数据挖掘算法及其并行化;基于地址表和FIUT树结构的频繁模式挖掘算法及其并行化;面向天体光谱数据的关联规则约简与表示;集群环境下的数据挖掘算法性能优化与负载均衡;海量高维天体光谱离群数据并行挖掘技术;基于关联规则的海量高维天体光谱数据相关性分析并行化技术;Hadoop环境下的天体光谱数据挖掘系统。该课题的研究不仅为海量高维数据挖掘,拟提出一种有效的方法和途径,而且也可望为进一步提高LAMOST的科学产出,实现未知特殊天体光谱数据和天文规律的知识发现,以及未知特殊天体的交叉认证,提供核心支撑技术。
结项摘要
本项目以国家重大科学工程LAMOST为应用背景,对海量高维天体光谱数据挖掘及其并行化技术进行了深入、系统的研究与探索,已圆满完成了研究内容,取得良好的研究成果,达到了预期研究目标和效果。所取得的重要成果包括:提出了一种基于基于FIUT树和MapReduce编程模型的并行频繁项集挖掘方法-FiDoop,以及一种在集群中平衡节点负载的数据分区方法,并进一步优化了FiDoop,使其更适合处理高维数据;针对并行频繁模式FIM算法,提出了一种的集群环境下有效数据划分方法FiDoop-dp,FiDoop-dp考虑了项目以及事物之间的相关性,并对项目分组和事物划分,减少了网络传输量也降低了各节点的计算负载,同时结合Voronoi 图和LSH技术,实现了该数据划分策略;提出了一种约束频繁模式并行化挖掘算法,采用了基于频繁项支持度的数据分组策略,实现了数据记录迁移,并有效地解决了频繁模式生成过程中的负载均衡问题,同时也给出了一种重定向任务调度算法,缩短了作业完成时间和降低系统资源消耗,提高了作业并行化程度;采用MapReduce编程模型和LSH分布式策略,提出了一种MapReduce编程模型下的局部离群数据并行挖掘算法;提出了一种基于wk-距离的离群数据挖掘算法Miner*,开发了恒星光谱离群数据挖掘原型系统等。其研究成果不仅为海量高维数据挖掘,提供了一种有效的方法和途径,而且也为进一步提高LAMOST的科学产出,实现未知特殊天体光谱数据和天文规律的知识发现,提供了核心支撑技术。该项目所取得的成果已在《IEEE TPDS》、《IEEE TSMCS》和《软件学报》等国内外学术刊物和学术会议上,发表与录用学术论文14篇,其中:CCF A类期刊2篇、B类期刊1篇、C类期刊2篇;SCI刊物9篇、EI刊物3篇。
项目成果
期刊论文数量(14)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
MapReduce集群环境下的数据放置策略
- DOI:--
- 发表时间:2015
- 期刊:软件学报
- 影响因子:--
- 作者:荀亚玲;张继福;秦啸
- 通讯作者:秦啸
A parallel algorithm for mining constrained frequent patterns using MapReduce
使用 MapReduce 挖掘约束频繁模式的并行算法
- DOI:10.1007/s00500-015-1930-z
- 发表时间:--
- 期刊:Soft Computing,2016,In Press
- 影响因子:--
- 作者:Yan; Xiaowu;Zhang; Jifu;Xun; Yaling;Qin; Xiao
- 通讯作者:Xiao
基于MapReduce与相关子空间的局部离群数据挖掘算法
- DOI:--
- 发表时间:2015
- 期刊:软件学报
- 影响因子:--
- 作者:张继福;李永红;秦啸;荀亚玲
- 通讯作者:荀亚玲
A parallel frequent itemsets mining algorithm based on compressed linked list
一种基于压缩链表的并行频繁项集挖掘算法
- DOI:--
- 发表时间:2015
- 期刊:ICIC Express Letters
- 影响因子:--
- 作者:Xun; Yaling;Zhang; Jifu
- 通讯作者:Jifu
FiDoop-DP: Data Partitioning in Frequent Itemset Mining on Hadoop Clusters
FiDoop-DP:Hadoop 集群上频繁项集挖掘的数据分区
- DOI:10.1109/tpds.2016.2560176
- 发表时间:2017
- 期刊:IEEE Transactions on Parallel and Distributed Systems
- 影响因子:5.3
- 作者:Xun; Yaling;Zhang; Jifu;Qin; Xiao;Zhao; Xujun
- 通讯作者:Xujun
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
LAMOST离群光谱J140242.45+092049.8特征分析
- DOI:--
- 发表时间:--
- 期刊:光谱学与光谱分析
- 影响因子:--
- 作者:杨海峰;蔡江辉;张继福;罗阿理;赵旭俊
- 通讯作者:赵旭俊
大型物体视觉测量模拟和精度分析
- DOI:--
- 发表时间:2015
- 期刊:计算机辅助设计与图形学学报
- 影响因子:--
- 作者:胡立华;张继福;张素兰
- 通讯作者:张素兰
一种面向枢纽现象的离群数据检测算法
- DOI:--
- 发表时间:2020
- 期刊:小型微型计算机系统
- 影响因子:--
- 作者:马文强;赵旭俊;张继福;饶元淇
- 通讯作者:饶元淇
基于形式概念分析的图像场景语义标注模型
- DOI:--
- 发表时间:2015
- 期刊:计算机应用
- 影响因子:--
- 作者:张素兰;张继福;胡立华;褚萌
- 通讯作者:褚萌
A CL-BASED HIERARCHICAL SCENE CLASSIFICATION MODEL
基于CL的层次场景分类模型
- DOI:--
- 发表时间:2015
- 期刊:ICIC Express Letters
- 影响因子:--
- 作者:张素兰;张继福;胡立华
- 通讯作者:胡立华
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
张继福的其他基金
面向天体光谱大数据分析的属性分组加权离群检测研究
- 批准号:62172293
- 批准年份:2021
- 资助金额:60 万元
- 项目类别:面上项目
高维海量恒星光谱数据的并行子空间聚类分析
- 批准号:61876122
- 批准年份:2018
- 资助金额:64.0 万元
- 项目类别:面上项目
集群环境下的天体光谱离群数据挖掘与性能优化
- 批准号:61572343
- 批准年份:2015
- 资助金额:64.0 万元
- 项目类别:面上项目
面向LAMOST天文光谱特征线的数据挖掘方法研究
- 批准号:61073145
- 批准年份:2010
- 资助金额:32.0 万元
- 项目类别:面上项目
基于加权和约束概念格的数据挖掘方法与天体光谱数据挖掘技术
- 批准号:60773014
- 批准年份:2007
- 资助金额:26.0 万元
- 项目类别:面上项目
基于背景知识的数据挖掘方法及其在LAMOST中的应用
- 批准号:60573075
- 批准年份:2005
- 资助金额:23.0 万元
- 项目类别:面上项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}