海量高维天体光谱数据挖掘及其并行化研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61272263
  • 项目类别:
    面上项目
  • 资助金额:
    80.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0607.知识表示与处理
  • 结题年份:
    2016
  • 批准年份:
    2012
  • 项目状态:
    已结题
  • 起止时间:
    2013-01-01 至2016-12-31

项目摘要

Aiming at three major science tasks of the great national science engineering project LAMOST,this project makes research on massive and high dimensional data mining of celestial spectra data and its parallel technology around the key scientific issue which is "Looking for the special celestial body with tracing properties and the universe awareness of unknown laws". The main research work is as follow: Local outlier mining algorithm of massive and high dimensional data set and its parallelization based on subspace and attribute correlation analysis; Frequent pattern mining algorithm and its parallelization based on address table and FIUT tree structure; Celestial body spectrum-oriented reduction and representation of association rule; Performance optimization of data mining algorithms and load balancing under the cluster environments; Parallel oulier mining technology of massive and high dimensional celestial spectra ; The parallelization technology of correlation analysis of massive and high dimensional celestial spectra data based on association rule; Celestial spectra data mining system under Hadoop environments. The research on the project not only affords effective ways and means for massive and high dimensional data mining, but also further provides core support technologies for improving the scientific output of LAMOST, discovering unknown special celestial bodies and the astronomical law, and the cross-certification of unknown celestial bodies.
本项目针对国家重大科学工程LAMOST项目的三大科学任务,围绕拟解决的关键科学问题"寻找具有示踪性质的特殊天体以及宇宙未知规律的认识",对海量高维天体光谱数据挖掘及其并行化技术进行研究,主要研究内容包括:基于子空间和属性相关性的海量高维局部离群数据挖掘算法及其并行化;基于地址表和FIUT树结构的频繁模式挖掘算法及其并行化;面向天体光谱数据的关联规则约简与表示;集群环境下的数据挖掘算法性能优化与负载均衡;海量高维天体光谱离群数据并行挖掘技术;基于关联规则的海量高维天体光谱数据相关性分析并行化技术;Hadoop环境下的天体光谱数据挖掘系统。该课题的研究不仅为海量高维数据挖掘,拟提出一种有效的方法和途径,而且也可望为进一步提高LAMOST的科学产出,实现未知特殊天体光谱数据和天文规律的知识发现,以及未知特殊天体的交叉认证,提供核心支撑技术。

结项摘要

本项目以国家重大科学工程LAMOST为应用背景,对海量高维天体光谱数据挖掘及其并行化技术进行了深入、系统的研究与探索,已圆满完成了研究内容,取得良好的研究成果,达到了预期研究目标和效果。所取得的重要成果包括:提出了一种基于基于FIUT树和MapReduce编程模型的并行频繁项集挖掘方法-FiDoop,以及一种在集群中平衡节点负载的数据分区方法,并进一步优化了FiDoop,使其更适合处理高维数据;针对并行频繁模式FIM算法,提出了一种的集群环境下有效数据划分方法FiDoop-dp,FiDoop-dp考虑了项目以及事物之间的相关性,并对项目分组和事物划分,减少了网络传输量也降低了各节点的计算负载,同时结合Voronoi 图和LSH技术,实现了该数据划分策略;提出了一种约束频繁模式并行化挖掘算法,采用了基于频繁项支持度的数据分组策略,实现了数据记录迁移,并有效地解决了频繁模式生成过程中的负载均衡问题,同时也给出了一种重定向任务调度算法,缩短了作业完成时间和降低系统资源消耗,提高了作业并行化程度;采用MapReduce编程模型和LSH分布式策略,提出了一种MapReduce编程模型下的局部离群数据并行挖掘算法;提出了一种基于wk-距离的离群数据挖掘算法Miner*,开发了恒星光谱离群数据挖掘原型系统等。其研究成果不仅为海量高维数据挖掘,提供了一种有效的方法和途径,而且也为进一步提高LAMOST的科学产出,实现未知特殊天体光谱数据和天文规律的知识发现,提供了核心支撑技术。该项目所取得的成果已在《IEEE TPDS》、《IEEE TSMCS》和《软件学报》等国内外学术刊物和学术会议上,发表与录用学术论文14篇,其中:CCF A类期刊2篇、B类期刊1篇、C类期刊2篇;SCI刊物9篇、EI刊物3篇。

项目成果

期刊论文数量(14)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
MapReduce集群环境下的数据放置策略
  • DOI:
    --
  • 发表时间:
    2015
  • 期刊:
    软件学报
  • 影响因子:
    --
  • 作者:
    荀亚玲;张继福;秦啸
  • 通讯作者:
    秦啸
A parallel algorithm for mining constrained frequent patterns using MapReduce
使用 MapReduce 挖掘约束频繁模式的并行算法
  • DOI:
    10.1007/s00500-015-1930-z
  • 发表时间:
    --
  • 期刊:
    Soft Computing,2016,In Press
  • 影响因子:
    --
  • 作者:
    Yan; Xiaowu;Zhang; Jifu;Xun; Yaling;Qin; Xiao
  • 通讯作者:
    Xiao
基于MapReduce与相关子空间的局部离群数据挖掘算法
  • DOI:
    --
  • 发表时间:
    2015
  • 期刊:
    软件学报
  • 影响因子:
    --
  • 作者:
    张继福;李永红;秦啸;荀亚玲
  • 通讯作者:
    荀亚玲
A parallel frequent itemsets mining algorithm based on compressed linked list
一种基于压缩链表的并行频繁项集挖掘算法
  • DOI:
    --
  • 发表时间:
    2015
  • 期刊:
    ICIC Express Letters
  • 影响因子:
    --
  • 作者:
    Xun; Yaling;Zhang; Jifu
  • 通讯作者:
    Jifu
FiDoop-DP: Data Partitioning in Frequent Itemset Mining on Hadoop Clusters
FiDoop-DP:Hadoop 集群上频繁项集挖掘的数据分区
  • DOI:
    10.1109/tpds.2016.2560176
  • 发表时间:
    2017
  • 期刊:
    IEEE Transactions on Parallel and Distributed Systems
  • 影响因子:
    5.3
  • 作者:
    Xun; Yaling;Zhang; Jifu;Qin; Xiao;Zhao; Xujun
  • 通讯作者:
    Xujun

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

LAMOST离群光谱J140242.45+092049.8特征分析
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    光谱学与光谱分析
  • 影响因子:
    --
  • 作者:
    杨海峰;蔡江辉;张继福;罗阿理;赵旭俊
  • 通讯作者:
    赵旭俊
大型物体视觉测量模拟和精度分析
  • DOI:
    --
  • 发表时间:
    2015
  • 期刊:
    计算机辅助设计与图形学学报
  • 影响因子:
    --
  • 作者:
    胡立华;张继福;张素兰
  • 通讯作者:
    张素兰
一种面向枢纽现象的离群数据检测算法
  • DOI:
    --
  • 发表时间:
    2020
  • 期刊:
    小型微型计算机系统
  • 影响因子:
    --
  • 作者:
    马文强;赵旭俊;张继福;饶元淇
  • 通讯作者:
    饶元淇
基于形式概念分析的图像场景语义标注模型
  • DOI:
    --
  • 发表时间:
    2015
  • 期刊:
    计算机应用
  • 影响因子:
    --
  • 作者:
    张素兰;张继福;胡立华;褚萌
  • 通讯作者:
    褚萌
A CL-BASED HIERARCHICAL SCENE CLASSIFICATION MODEL
基于CL的层次场景分类模型
  • DOI:
    --
  • 发表时间:
    2015
  • 期刊:
    ICIC Express Letters
  • 影响因子:
    --
  • 作者:
    张素兰;张继福;胡立华
  • 通讯作者:
    胡立华

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

张继福的其他基金

面向天体光谱大数据分析的属性分组加权离群检测研究
  • 批准号:
    62172293
  • 批准年份:
    2021
  • 资助金额:
    60 万元
  • 项目类别:
    面上项目
高维海量恒星光谱数据的并行子空间聚类分析
  • 批准号:
    61876122
  • 批准年份:
    2018
  • 资助金额:
    64.0 万元
  • 项目类别:
    面上项目
集群环境下的天体光谱离群数据挖掘与性能优化
  • 批准号:
    61572343
  • 批准年份:
    2015
  • 资助金额:
    64.0 万元
  • 项目类别:
    面上项目
面向LAMOST天文光谱特征线的数据挖掘方法研究
  • 批准号:
    61073145
  • 批准年份:
    2010
  • 资助金额:
    32.0 万元
  • 项目类别:
    面上项目
基于加权和约束概念格的数据挖掘方法与天体光谱数据挖掘技术
  • 批准号:
    60773014
  • 批准年份:
    2007
  • 资助金额:
    26.0 万元
  • 项目类别:
    面上项目
基于背景知识的数据挖掘方法及其在LAMOST中的应用
  • 批准号:
    60573075
  • 批准年份:
    2005
  • 资助金额:
    23.0 万元
  • 项目类别:
    面上项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码