大数据存储评测优化与救援关键技术研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61872043
  • 项目类别:
    面上项目
  • 资助金额:
    63.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0204.计算机系统结构与硬件技术
  • 结题年份:
    2022
  • 批准年份:
    2018
  • 项目状态:
    已结题
  • 起止时间:
    2019-01-01 至2022-12-31

项目摘要

With the explosive growth of data, the era of big data is coming.Currently, big data computing platform faces the problems of lower performance, lower efficiency and lower reliability of big data storage, which reflect in the lower locality of data access, the higher redundancy of data storage and the poorer efficiency of large data rescue. In this project, we will research on the following four contents. As to the problem of lower storage performance, we will research on the evaluation and analysis methods of big data storage as well as the memory-centered task scheduling method. As to the problem of lower storage efficiency, we will research on the unified data layout methods. As to the problem of lower storage reliability, we will research on the big data quick rescue method based on the data fingerprint technology. Based on the above four research contents, we will complete the big data computing system FlyHadoop, thereby enhancing the performance, efficiency and reliability big data storage. During this research, we will publish more than six papers in the ACM/IEEE Transactions or international proceedings, and we will provide a set of performance, efficient and reliability methods of data storage for big data computing platform to push the development of big data computing platform.
随着数据爆炸式增长,大数据时代已来临。目前,大数据平台在数据存储方面面临存储性能低、存储效率不高和存储可靠性不高的问题,这体现在数据访问局部性较低、数据存储冗余度过高以及大数据救援效率不高三个方面。本项目拟着重研究如下四个方面的内容:针对存储性能低的问题,拟研究大数据存储的评测分析方法、以内存为中心的大数据任务调度优化方法;针对存储效率不高的问题,拟研究大数据计算平台数据的统一布局方法;针对存储可靠性不高的问题,拟研究基于数据指纹的大数据快速救援方法。形成大数据计算平台优化系统FlyHadoop,从而提升大数据计算平台存储性能、效率和可靠性。通过该项目的研究,将在ACM或IEEE重要期刊或国际会议上发表学术论文6篇以上,为大数据计算平台提供高性能、高效、可靠的存储方法,促进大数据计算平台的发展。

结项摘要

随着数据爆炸式增长,一个完善的大数据平台在数据存储方面面临存储性能低、存储效率不高和存储可靠性不高的问题。针对上述问题,本项目研究了大数据存储的评测分析方法、以内存为中心的大数据任务优化、大数据计算平台数据的统一布局和大数据快速救援方法,从而提升大数据计算平台存储性能、效率和可靠性。.本项目在大数据存储评测分析的基础上,提出基于文件访问特性的分布式自适应存储方法FACHS,将改进后的多副本、纠删码等不同存储方法进行自适应选择,从而给出大数据计算平台数据的统一布局。实验结果显示,与现有方法相比,FACHS在读/写性能上分别最多提高13.7%和6.4%;在恢复效率上最多可提升29.1%;在1000节点规模下最多节省9000GB的存储空间。.在以内存为中心的数据缓存技术和以内存为中心的大数据任务优化方面,本项目提出了Panthera,通过轻量级静态程序分析和动态数据使用监控来推断粗粒度的数据使用行为,利用垃圾收集在DRAM和NVM之间迁移数据。实验结果表明Panthera有效地利用了混合内存,将内存能量减少了22%–34%,将Spark的平均执行时间开销减少了 32%–53%。本项目提出了一种新的磁盘辅助方法及工具DiskDroid。该方法通过重新计算和高效的磁盘交换优化内存使用。DiskDroid的性能比FlowDroid提高了 8.6%。.本项目提出了一系列数据救援方法,在不同场景下解决数据高效恢复的问题,具体包括:一种基于交叉校验的低开销数据恢复方法HV-SNSP,基于纠删码的批量并行恢复方法BPR,基于纠删码存储的主动数据恢复方法LEC-PR等。与现有方法相比,HV-SNSP可以减少25%的跨机架带宽,缩短36.58%的恢复时间;BPR可减少10%的跨机架网络传输时间,并提高8%的恢复吞吐量;LEC-PR可缩短恢复时间68%,减少跨节点流量35%。.上述研究对于大数据计算平台的发展将起到重大的推动作用,且更有利于大数据计算平台在诸多领域/行业如医疗、食品安全大数据、金融大数据、交通大数据等的应用,从而对于推进整个社会的发展起到促进作用。

项目成果

期刊论文数量(17)
专著数量(0)
科研奖励数量(0)
会议论文数量(16)
专利数量(5)
Scaling Poisson Solvers on Many Cores via MMEwald
通过 MMEwald 在多核上扩展泊松解算器
  • DOI:
    10.1109/tpds.2021.3127138
  • 发表时间:
    2021
  • 期刊:
    IEEE Transactions on Parallel and Distributed Systems
  • 影响因子:
    5.3
  • 作者:
    Mingchuan Wu;Yangjun Wu;Honghui Shang;Ying Liu;Huimin Cui;Fang Li;Xiaohui Duan;Yunquan Zhang;Xiaobing Feng
  • 通讯作者:
    Xiaobing Feng
DNNTune: Automatic Benchmarking DNN Models for Mobile-cloud Computing
DNNTune:移动云计算 DNN 模型的自动基准测试
  • DOI:
    10.1145/3368305
  • 发表时间:
    2019
  • 期刊:
    ACM Transactions on Architecture and Code Optimization
  • 影响因子:
    1.6
  • 作者:
    Chunwei Xia;Jiacheng Zhao;Huimin Cui;Xiaobing Feng;Jingling Xue
  • 通讯作者:
    Jingling Xue
Improving task scheduling with parallelism awareness in heterogeneous computational environments
在异构计算环境中通过并行意识改进任务调度
  • DOI:
    10.1016/j.future.2018.11.012
  • 发表时间:
    2019-05
  • 期刊:
    Future Generation Computer Systems
  • 影响因子:
    --
  • 作者:
    Bo Wang;Ying Song;Jie Cao;Xiao Cui;Ling Zhang
  • 通讯作者:
    Ling Zhang
CloudRaid: Detecting Distributed Concurrency Bugs via Log Mining and Enhancement
CloudRaid:通过日志挖掘和增强检测分布式并发错误
  • DOI:
    10.1109/tse.2020.2999364
  • 发表时间:
    2022-02
  • 期刊:
    IEEE Transactions on Software Engineering
  • 影响因子:
    7.4
  • 作者:
    Jie Lu;Feng Li;Chen Liu;Lian Li;Xiaobing Feng;Jingling Xue
  • 通讯作者:
    Jingling Xue
Optimizing deep neural networks on intelligent edge accelerators via flexible-rate filter pruning
通过灵活速率滤波器修剪优化智能边缘加速器上的深度神经网络
  • DOI:
    10.1016/j.sysarc.2022.102431
  • 发表时间:
    2022-02-16
  • 期刊:
    JOURNAL OF SYSTEMS ARCHITECTURE
  • 影响因子:
    4.5
  • 作者:
    Li, Guangli;Ma, Xiu;Xue, Jingling
  • 通讯作者:
    Xue, Jingling

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

光电测量设备图像高频频谱对主观评价的影响
  • DOI:
    --
  • 发表时间:
    2016
  • 期刊:
    光学学报
  • 影响因子:
    --
  • 作者:
    张宁;沈湘衡;叶露;宋莹
  • 通讯作者:
    宋莹
基于幂函数型双稳随机共振的故障信号检测方法
  • DOI:
    --
  • 发表时间:
    2016
  • 期刊:
    仪器仪表学报
  • 影响因子:
    --
  • 作者:
    贺利芳;崔莹莹;张天骐;张刚;宋莹
  • 通讯作者:
    宋莹
卫生系统反应性量表的信效度分析
  • DOI:
    --
  • 发表时间:
    2013
  • 期刊:
    中国全科医学
  • 影响因子:
    --
  • 作者:
    宋莹;赵科颖;孟琼;李晓梅
  • 通讯作者:
    李晓梅
体重指数对冠心病行经皮冠状动脉介入治疗术后患者血小板高反应性及长期预后的影响
  • DOI:
    --
  • 发表时间:
    2019
  • 期刊:
    中国循环杂志
  • 影响因子:
    --
  • 作者:
    王欢欢;姚懿;唐晓芳;宋莹;许晶晶;蒋萍;姜琳;赵雪燕;高展;张茵;宋雷;高立建;陈珏;乔树宾;杨跃进;高润霖;徐波;袁晋青
  • 通讯作者:
    袁晋青
Levy噪声下一阶线性系统的弱信号复原分析
  • DOI:
    --
  • 发表时间:
    2016
  • 期刊:
    仪器仪表学报
  • 影响因子:
    --
  • 作者:
    张刚;宋莹;张天骐;胡韬;崔莹莹
  • 通讯作者:
    崔莹莹

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码