天文大数据中时序图像子集高效检索方法与系统研究
项目介绍
AI项目解读
基本信息
- 批准号:U1531111
- 项目类别:联合基金项目
- 资助金额:47.0万
- 负责人:
- 依托单位:
- 学科分类:A1503.恒星晚期演化及爆发、致密天体及其相关高能过程
- 结题年份:2018
- 批准年份:2015
- 项目状态:已结题
- 起止时间:2016-01-01 至2018-12-31
- 项目参与者:黄妍妍; 肖健; 赵来平; 吴虎统; 汤善江; 傅浩; 王洁; 洪智; 尹树成;
- 关键词:
项目摘要
Astronomical research is already in big data era as the astronomical science data is so rich and keep increasing dramatically. High efficiency subset retrieving is the prerequisite of the specific research. This project focuses on the time domain astronomy topics based on image data to research on the high efficiency subset retrieving methods and scalable system architecture for astronomical image data. The research work is based on high performance storage and indexing technologies and uses actual observed data and science topics as samples. The main contents and innovations include the following. A high performance metadata and indexing system constructed without any modification on the archived raw image data to locate the files needed, a high efficiency subset reading methods designed for FITS image file to retrieve the specific area of the large image with least effort, a high performance cache designed to store the queried time series image data. The optimization focuses on the data layout and data lifecycle management. The system architecture for different scale of data set will support both single node and distributed storage environment. The expected output of this project can directly support the astronomical research on time series image data and the management of massive astronomical image data, and will be a sample for the management and high performance retrieving of other types of astronomical science data.
大数据时代的天文学研究,天文科学数据量空前丰富且增长迅速,高效获取所需要数据子集成是开展具体研究的前提。本项目以基于图像数据的时域天文学为主要需求,以高性能存储、索引等技术为基础,以实际观测数据和科学问题为范例,研究在大数据环境中高效提取时序天文图像子集的方法和可扩展系统构架。研究工作的主要内容和创新在于:在不对已经归档的图像数据进行任何改变的前提下,构建高性能元数据结构和索引系统,用于定位所需数据所在的文件;研究高效FITS图像文件局部数据读取方法,以最少代价读取局部图像数据;研究设计高性能缓存系统,通过数据布局优化和数据生命周期优化管理提高检索得到的时序图像数据的访问性能和使用效率;研究设计针对不同规模数据集的系统构架,支持单存储节点环境与分布式存储环境。研发成果可以直接服务于需要时序图像集合的天文学研究以及大规模天文图像数据管理,也可以为其他类型天文科学数据管理和高性能检索提供参考。
结项摘要
大数据时代的天文学研究,天文观测数据的增长与积累对数据存储与科学分析提出了性能与效率方面的新挑战。同时,天文学研究者不需要也不能够使用全部观测数据进行研究,因此,需要一个存储系统能够高效地为用户提供所需要的数据子集。本项目以高性能存储、索引等技术为基础,研究了在大数据环境中高效提取时序天文图像子集的方法和可扩展系统。.本项目提出了一套基于天区划分索引的天文图像数据高效检索方法(AQUAdex)。该方法采用了“原地不动”的数据处理模式,经过专门设计的索引结构仅保留了检索中需要的关键信息,从而维持了较小的索引数据体积并使其可以被完全载入内存之中。此方法的查询效率比非基于天区划分的索引查询效率提高了9倍之多。改进版的AQUAdexIM采用纯内存计算的方式,其对天文图像数据的检索效率相比于应用广泛的内存数据库Redis也提升了10倍之余。同时,本项目提出了一种基于缓存磁盘管理的FITS文件子图的高效生成服务,设计并实现了对用户请求模式敏感的PA缓存替换策略。采用的坐标映射方法、子图合并策略以及缓存替换的优先级算法用较少的缓存空间消耗换取了更多的缓存命中机会。相比于LRU,LFU和LRFU策略,在缓存磁盘容量与被查询文件大小总量比约为23%时仍能保持72%的缓存命中率,拥有最低的平均响应时间。提出了一个对请求队列作预处理的PA-G缓存替换策略。PA-G比原PA策略在重载下能将平均响应时间降低81.8%。针对大规模的观测数据,本项目提出了分布式环境中子集检索系统(GAIDR)。该系统设计了多层级主从存储架构并建立相关天文原始图像数据索引与副本数据索引来实现高效检索,提出了一种适用于时域天文学天文数据访问的副本策略,通过副本数据布局、合并以及替换,GAIDR的平均响应时间相对于性能最好的对比实验降低了14.07%。.此外,本项目围绕这些核心技术问题进行了天体光变时间序列数据生成方法、多波段天文数据融合、天文观测数据存储管理优化等多个方面的天文科学数据处理的研究工作。
项目成果
期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(11)
专利数量(0)
天文科技领域云:大数据时代的天文教育和科研信息化平台
- DOI:10.16791/j.cnki.sjg.2017.10.033
- 发表时间:2017
- 期刊:实验技术与管理
- 影响因子:--
- 作者:肖健;于策;崔辰州;李长华;何勃亮
- 通讯作者:何勃亮
Cost-efficient scheduling of FAST observations
经济高效地安排 FAST 观测
- DOI:10.1007/s10686-018-9577-2
- 发表时间:2018
- 期刊:Experimental Astronomy
- 影响因子:3
- 作者:Luo Qi;Yu Ce;Sun Jizhou;Zhao Laiping;Xiao Jian;Zhu Ming;Zhong Yi;Zhao LP
- 通讯作者:Zhao LP
AQUAdexIM: highly efficient in-memory indexing and querying of astronomy time series images
AQUAdexIM:天文时间序列图像的高效内存索引和查询
- DOI:10.1007/s10686-016-9515-0
- 发表时间:2016-11
- 期刊:Experimental Astronomy
- 影响因子:3
- 作者:Hong Zhi;Yu Ce;Wang Jie;Xiao Jian;Cui Chenzhou;Sun Jizhou
- 通讯作者:Sun Jizhou
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
基于MapReduce模型的分布式天文交叉证认
- DOI:--
- 发表时间:--
- 期刊:计算机应用研究
- 影响因子:--
- 作者:赵青;孙济洲;肖健;于策;崔辰州;刘旭;袁鳌
- 通讯作者:袁鳌
FITS数据文件的检索和访问
- DOI:--
- 发表时间:--
- 期刊:天文研究与技术
- 影响因子:--
- 作者:赵永恒;徐祯;于策;崔辰州;李文;于建军
- 通讯作者:于建军
多租户系统的轻量级实现及其在大型仪器设备共享平台中的应用
- DOI:10.16791/j.cnki.sjg.2018.05.038
- 发表时间:2018
- 期刊:实验技术与管理
- 影响因子:--
- 作者:肖健;于策;崔辰州;樊东卫;王传军;张戈
- 通讯作者:张戈
GAISP:一种GPU加速的天文图像相减测光算法
- DOI:--
- 发表时间:2011
- 期刊:计算机应用研究
- 影响因子:--
- 作者:杨沐津;于策;孙济洲;曹玮;陈锦言;商朝晖;刘强
- 通讯作者:刘强
P2P多线程动态容错模型的研究与应用
- DOI:--
- 发表时间:2013
- 期刊:计算机工程
- 影响因子:--
- 作者:汪建军;于策;孙济洲;孙超;金舟;成钢
- 通讯作者:成钢
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
于策的其他基金
面向分布式光学时域巡天的光变曲线数据构造与存储方法研究
- 批准号:
- 批准年份:2022
- 资助金额:55 万元
- 项目类别:面上项目
面向窄带非稳定网络环境中远程天文观测的高可靠数据通信系统
- 批准号:U1931130
- 批准年份:2019
- 资助金额:53.0 万元
- 项目类别:联合基金项目
面向动态规划计算的并行编程模型和运行时系统研究
- 批准号:61303021
- 批准年份:2013
- 资助金额:25.0 万元
- 项目类别:青年科学基金项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}