面向数据中心混合负载的数据存储结构及其转换技术研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61379042
  • 项目类别:
    面上项目
  • 资助金额:
    76.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0202.系统软件、数据库与工业软件
  • 结题年份:
    2017
  • 批准年份:
    2013
  • 项目状态:
    已结题
  • 起止时间:
    2014-01-01 至2017-12-31

项目摘要

There are multiple types of applications run in a data center, including online services, big data analysis jobs, stream data processing jobs. Existing solutions use different data storage systems for different types of applications, which results in deployment of multiple data storage systems in a enterprise. However, enterprise's decision-making requires to preocess the data in different systems. To link different systems, the data has to be transformed, transmitted and assembled between different systems, which results in high total cost, long delay for data processing, operational complextiy and difficult to use. To address these issues, this proposal conducts research on the key technologies for a storage system which can simultaneously serve multiple types of applications. Our main research issues including: 1) optimization of the data storage structure for each type of workload by using hybrid memories consisting of NVM、DRAM and hard disks, and according to the charactoristics of each type of memory;2) automatic transformation from one data storage structure to another with minimum interference to normal workloads by reducing the resource usage duing the transformation; 3) automactic stage partioning of the data life cycle by using the charactoristics of the workloads in order to determine which data storage structure to use and when to perform the stage transformation. After we complete the research work of this proposal,we will provide feasible solutions to the storage system which can support multiple types of the data center applications.
当前数据中心所面临的一个棘手问题是:各种负载所产生的大数据集分别存储在不同存储系统之中,数据需要在这些系统之间进行变换、传输和重组,造成了高昂的系统维护成本,也给数据进行及时就地分析带来极大的困难。为解决这些问题,本课题研究高效支持多种负载的存储系统的关键技术,它支持多种数据存储结构,不同的数据存储结构服务于不同的负载,并且自动转换数据存储结构,以适应负载的变化。主要研究内容包括:(1)研究如何利用NVM器件的优势、并根据不同负载的特点和性能需求来优化几种数据存储结构,提高数据存取的性价比;(2)研究不同数据存储结构之间的自动转换方法,以控制转换消耗的系统资源、减少转换对正常负载的影响、提高转换的效率;(3)研究根据负载的特征来自动划分数据生命周期阶段的方法,从而确定数据的存储结构及其转换时机。通过本项目研究,为高效支持数据中心多种负载的存储系统提供切实可行的解决方案。

结项摘要

SSD和新型NVM为缓解数据中心的存取瓶颈带来了前所未有的机遇和挑战:1)对于混合内存系统(DRAM+NVM),如何设计高效的数据存储结构,以充分发挥两类内存介质各自的优势,并避免其劣势;2)对于基于MapReduce的大数据处理负载,如何利用SSD和NVM的速度快来加快数据处理,减少作业执行时间;3)对于面向在线服务负载的数据存储结构LSM-tree,如何充分利用SSD的速度优势。.本课题针对上述问题展开研究,并取得了以下成果:.1) 我们揭示了数据中心的典型大数据负载的内存访问特征:持续高带宽、时间局布性较差等;以及磁盘访问特征:磁盘带宽利用率低、请求的平均等待时间较长、数据存取时间比较集中。.2) 针对SSD上的LSM-tree结构,我们提出一种并行流水线化的合并方法PCP,将合并的带宽提高了77%,系统的吞吐率提高了62%。.3) 针对SSD上的LSM-tree结构,我们提出一种延迟合并技术,将写放大减少了50%左右,而且系统的吞吐率提高了89%左右。.4) 针对由DRAM与NVM构成的混合内存系统,我们提出一种感知异构内存的CPU cache划分方法HAP,使应用性能提高46.7%,同时能耗降低21.9%。.5) 针对混合内存系统(DRAM+NVM),我们提出一种软硬件相结合的数据放置策略2PP,使应用性能提高了12.1%,能效提高了18.4%。.6) 我们设计并实现了一个同时处理离线分析和实时分析的统一数据处理平台的软件原型Matiff-2。.7) 针对混合存储系统(SSD+HDD),我们提出了一种感知异构存储的任务调度算法H-Scheduler,使得作业执行时间最多可减少73.6%。.8) 针对大数据处理中的Shuffle,我们提出了一种利用NVM来存储Shuffle数据的方法NV-Shuffle,使应用执行时间节省了10% ~ 40%。.9) 针对混合内存系统(DRAM+NVM),我们实现了基于混合索引的键值存储系统HiKV,使延迟可降低86.5%,吞吐率可提高6.9 倍。..本课题在高水平国际会议和国内外核心期刊上发表了15篇学术论文,其中,SCI期刊论文4篇,CCF B类学术期刊论文3篇;CCF A类、B类和C类学术会议论文分别为1篇、5篇和1篇。产出了11份发明专利申请,培养了4名博士生和1名硕士生完成学位论文,并实现了两个软件系统原型。

项目成果

期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(8)
专利数量(11)
dCompaction: Speeding up Compaction of the LSM-Tree via Delayed Compaction
dCompaction:通过延迟压缩加速 LSM 树的压缩
  • DOI:
    10.1007/s11390-017-1704-4
  • 发表时间:
    2017-01
  • 期刊:
    Journal of Computer Science and Technology
  • 影响因子:
    0.7
  • 作者:
    Pan Feng-Feng;Yue Yin-Liang;Xiong Jin
  • 通讯作者:
    Xiong Jin
NV-Shuffle: 基于非易失内存的Shuffle机制
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    计算机研究与发展
  • 影响因子:
    --
  • 作者:
    潘锋烽;熊劲
  • 通讯作者:
    熊劲
A Survey of Phase Change Memory Systems
相变存储系统综述
  • DOI:
    10.1007/s11390-015-1509-2
  • 发表时间:
    2015-01
  • 期刊:
    Journal of Computer Science and Technology
  • 影响因子:
    0.7
  • 作者:
    Fei Xia;Dejun Jiang;Jin Xiong;Ninghui Sun
  • 通讯作者:
    Ninghui Sun
影响非易失性内存系统性能的因素分析
  • DOI:
    --
  • 发表时间:
    2014
  • 期刊:
    计算机研究与发展
  • 影响因子:
    --
  • 作者:
    夏飞;蒋德钧;熊劲
  • 通讯作者:
    熊劲

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

面向机群文件系统的高可靠消息传输机制
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    Huazhong Keji Daxue Xuebao (ziran Kexue Ban)/journal of Huazhong University of Science and Technology (natural Science Edition)
  • 影响因子:
    --
  • 作者:
    周江;熊劲;马灿
  • 通讯作者:
    马灿
一种支持EB级存储的可扩展存储空间管理方法
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    计算机研究与发展
  • 影响因子:
    --
  • 作者:
    邢晶;熊劲;孙凝晖;马捷
  • 通讯作者:
    马捷
异构存储感知的Ceph存储系统数据放置方法
  • DOI:
    --
  • 发表时间:
    2017
  • 期刊:
    计算机科学
  • 影响因子:
    --
  • 作者:
    刘飞;蒋德钧;张欢;陈静;王筠;熊劲
  • 通讯作者:
    熊劲
云南香格里拉特有易危植物中甸刺玫的表型多样性
  • DOI:
    --
  • 发表时间:
    2013
  • 期刊:
    园艺学报
  • 影响因子:
    --
  • 作者:
    李淑斌;熊劲;李进昆;唐开学
  • 通讯作者:
    唐开学
P2P网贷担保认证服务对借款的影响——以人人贷为例
  • DOI:
    --
  • 发表时间:
    2015
  • 期刊:
    管理现代化
  • 影响因子:
    --
  • 作者:
    熊劲;马超群;姚铮
  • 通讯作者:
    姚铮

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

熊劲的其他基金

基于SSD的大规模元数据处理技术研究
  • 批准号:
    60970025
  • 批准年份:
    2009
  • 资助金额:
    30.0 万元
  • 项目类别:
    面上项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码