大数据存储评测优化与救援关键技术研究
项目介绍
AI项目解读
基本信息
- 批准号:61872043
- 项目类别:面上项目
- 资助金额:63.0万
- 负责人:
- 依托单位:
- 学科分类:F0204.计算机系统结构与硬件技术
- 结题年份:2022
- 批准年份:2018
- 项目状态:已结题
- 起止时间:2019-01-01 至2022-12-31
- 项目参与者:崔慧敏; 赵家程; 宋育庚; 高猛; 李登辉; 于汝意; 张悦; 陈雨婷;
- 关键词:
项目摘要
With the explosive growth of data, the era of big data is coming.Currently, big data computing platform faces the problems of lower performance, lower efficiency and lower reliability of big data storage, which reflect in the lower locality of data access, the higher redundancy of data storage and the poorer efficiency of large data rescue. In this project, we will research on the following four contents. As to the problem of lower storage performance, we will research on the evaluation and analysis methods of big data storage as well as the memory-centered task scheduling method. As to the problem of lower storage efficiency, we will research on the unified data layout methods. As to the problem of lower storage reliability, we will research on the big data quick rescue method based on the data fingerprint technology. Based on the above four research contents, we will complete the big data computing system FlyHadoop, thereby enhancing the performance, efficiency and reliability big data storage. During this research, we will publish more than six papers in the ACM/IEEE Transactions or international proceedings, and we will provide a set of performance, efficient and reliability methods of data storage for big data computing platform to push the development of big data computing platform.
随着数据爆炸式增长,大数据时代已来临。目前,大数据平台在数据存储方面面临存储性能低、存储效率不高和存储可靠性不高的问题,这体现在数据访问局部性较低、数据存储冗余度过高以及大数据救援效率不高三个方面。本项目拟着重研究如下四个方面的内容:针对存储性能低的问题,拟研究大数据存储的评测分析方法、以内存为中心的大数据任务调度优化方法;针对存储效率不高的问题,拟研究大数据计算平台数据的统一布局方法;针对存储可靠性不高的问题,拟研究基于数据指纹的大数据快速救援方法。形成大数据计算平台优化系统FlyHadoop,从而提升大数据计算平台存储性能、效率和可靠性。通过该项目的研究,将在ACM或IEEE重要期刊或国际会议上发表学术论文6篇以上,为大数据计算平台提供高性能、高效、可靠的存储方法,促进大数据计算平台的发展。
结项摘要
随着数据爆炸式增长,一个完善的大数据平台在数据存储方面面临存储性能低、存储效率不高和存储可靠性不高的问题。针对上述问题,本项目研究了大数据存储的评测分析方法、以内存为中心的大数据任务优化、大数据计算平台数据的统一布局和大数据快速救援方法,从而提升大数据计算平台存储性能、效率和可靠性。.本项目在大数据存储评测分析的基础上,提出基于文件访问特性的分布式自适应存储方法FACHS,将改进后的多副本、纠删码等不同存储方法进行自适应选择,从而给出大数据计算平台数据的统一布局。实验结果显示,与现有方法相比,FACHS在读/写性能上分别最多提高13.7%和6.4%;在恢复效率上最多可提升29.1%;在1000节点规模下最多节省9000GB的存储空间。.在以内存为中心的数据缓存技术和以内存为中心的大数据任务优化方面,本项目提出了Panthera,通过轻量级静态程序分析和动态数据使用监控来推断粗粒度的数据使用行为,利用垃圾收集在DRAM和NVM之间迁移数据。实验结果表明Panthera有效地利用了混合内存,将内存能量减少了22%–34%,将Spark的平均执行时间开销减少了 32%–53%。本项目提出了一种新的磁盘辅助方法及工具DiskDroid。该方法通过重新计算和高效的磁盘交换优化内存使用。DiskDroid的性能比FlowDroid提高了 8.6%。.本项目提出了一系列数据救援方法,在不同场景下解决数据高效恢复的问题,具体包括:一种基于交叉校验的低开销数据恢复方法HV-SNSP,基于纠删码的批量并行恢复方法BPR,基于纠删码存储的主动数据恢复方法LEC-PR等。与现有方法相比,HV-SNSP可以减少25%的跨机架带宽,缩短36.58%的恢复时间;BPR可减少10%的跨机架网络传输时间,并提高8%的恢复吞吐量;LEC-PR可缩短恢复时间68%,减少跨节点流量35%。.上述研究对于大数据计算平台的发展将起到重大的推动作用,且更有利于大数据计算平台在诸多领域/行业如医疗、食品安全大数据、金融大数据、交通大数据等的应用,从而对于推进整个社会的发展起到促进作用。
项目成果
期刊论文数量(17)
专著数量(0)
科研奖励数量(0)
会议论文数量(16)
专利数量(5)
Scaling Poisson Solvers on Many Cores via MMEwald
通过 MMEwald 在多核上扩展泊松解算器
- DOI:10.1109/tpds.2021.3127138
- 发表时间:2021
- 期刊:IEEE Transactions on Parallel and Distributed Systems
- 影响因子:5.3
- 作者:Mingchuan Wu;Yangjun Wu;Honghui Shang;Ying Liu;Huimin Cui;Fang Li;Xiaohui Duan;Yunquan Zhang;Xiaobing Feng
- 通讯作者:Xiaobing Feng
DNNTune: Automatic Benchmarking DNN Models for Mobile-cloud Computing
DNNTune:移动云计算 DNN 模型的自动基准测试
- DOI:10.1145/3368305
- 发表时间:2019
- 期刊:ACM Transactions on Architecture and Code Optimization
- 影响因子:1.6
- 作者:Chunwei Xia;Jiacheng Zhao;Huimin Cui;Xiaobing Feng;Jingling Xue
- 通讯作者:Jingling Xue
Improving task scheduling with parallelism awareness in heterogeneous computational environments
在异构计算环境中通过并行意识改进任务调度
- DOI:10.1016/j.future.2018.11.012
- 发表时间:2019-05
- 期刊:Future Generation Computer Systems
- 影响因子:--
- 作者:Bo Wang;Ying Song;Jie Cao;Xiao Cui;Ling Zhang
- 通讯作者:Ling Zhang
CloudRaid: Detecting Distributed Concurrency Bugs via Log Mining and Enhancement
CloudRaid:通过日志挖掘和增强检测分布式并发错误
- DOI:10.1109/tse.2020.2999364
- 发表时间:2022-02
- 期刊:IEEE Transactions on Software Engineering
- 影响因子:7.4
- 作者:Jie Lu;Feng Li;Chen Liu;Lian Li;Xiaobing Feng;Jingling Xue
- 通讯作者:Jingling Xue
Optimizing deep neural networks on intelligent edge accelerators via flexible-rate filter pruning
通过灵活速率滤波器修剪优化智能边缘加速器上的深度神经网络
- DOI:10.1016/j.sysarc.2022.102431
- 发表时间:2022-02-16
- 期刊:JOURNAL OF SYSTEMS ARCHITECTURE
- 影响因子:4.5
- 作者:Li, Guangli;Ma, Xiu;Xue, Jingling
- 通讯作者:Xue, Jingling
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
光电测量设备图像高频频谱对主观评价的影响
- DOI:--
- 发表时间:2016
- 期刊:光学学报
- 影响因子:--
- 作者:张宁;沈湘衡;叶露;宋莹
- 通讯作者:宋莹
基于幂函数型双稳随机共振的故障信号检测方法
- DOI:--
- 发表时间:2016
- 期刊:仪器仪表学报
- 影响因子:--
- 作者:贺利芳;崔莹莹;张天骐;张刚;宋莹
- 通讯作者:宋莹
卫生系统反应性量表的信效度分析
- DOI:--
- 发表时间:2013
- 期刊:中国全科医学
- 影响因子:--
- 作者:宋莹;赵科颖;孟琼;李晓梅
- 通讯作者:李晓梅
体重指数对冠心病行经皮冠状动脉介入治疗术后患者血小板高反应性及长期预后的影响
- DOI:--
- 发表时间:2019
- 期刊:中国循环杂志
- 影响因子:--
- 作者:王欢欢;姚懿;唐晓芳;宋莹;许晶晶;蒋萍;姜琳;赵雪燕;高展;张茵;宋雷;高立建;陈珏;乔树宾;杨跃进;高润霖;徐波;袁晋青
- 通讯作者:袁晋青
Levy噪声下一阶线性系统的弱信号复原分析
- DOI:--
- 发表时间:2016
- 期刊:仪器仪表学报
- 影响因子:--
- 作者:张刚;宋莹;张天骐;胡韬;崔莹莹
- 通讯作者:崔莹莹
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}