CSR---PDOS: A Benchmarking Framework for High-Availability Distributed Storage Systems

CSR---PDOS:高可用分布式存储系统的基准框架

基本信息

  • 批准号:
    1102629
  • 负责人:
  • 金额:
    $ 0.8万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2010
  • 资助国家:
    美国
  • 起止时间:
    2010-09-09 至 2011-08-31
  • 项目状态:
    已结题

项目摘要

The availability and robustness of the I/O system is crucial to large-scale applications that generate and analyze terabytes of data. Storage systems are vulnerable to numerous hardware failures (I/O and metadata server crashes) and contribute to as much as 25% of all system failures. Actually, highly available data storage for high end computing is becoming increasingly more critical as high-end computing systems scale up in size. To achieve high availability storage systems, a challenging issue is to characterize the availability metric in addition to performance of these systems.This research investigates high-availability data and I/O services and benchmarking. The investigators take an organized approach to developing a benchmarking framework to measure the storage performance in consideration of availability under various faulty conditions. The research involves four tasks: 1) develop faults/errors model and design fault injection schemes for storage systems; 2) develop an innovative benchmarking framework for high availability distributed storage systems under different faulty conditions; 3) implement an Availability and Performance Evaluation Toolset (APET) to integrate the fault injection and stress testing libraries and capture raw performance of storage systems at block level under various faults; 4) validate the benchmarking framework using APET for block-level storage systems. This research has direct contributions to understanding highly available data and I/O services for HEC systems, establishing a general benchmarking framework for characterizing storage systems under faulty conditions, and thus benefiting the society by guiding develop high-availability oriented distributed storage systems which are crucial to many applications.
I/O系统的可用性和鲁棒性对于生成和分析数据的大规模应用至关重要。存储系统容易遭受众多硬件故障(I/O和元数据服务器崩溃),并占所有系统故障的25%。实际上,随着高端计算系统规模的扩大,高端计算的高端数据存储变得越来越关键。为了实现高可用性存储系统,一个具有挑战性的问题是除了这些系统的性能外,还要表征可用性指标。这项研究研究了高可用性数据,I/O服务和基准测试。研究人员采用有组织的方法来开发基准测量框架,以考虑到各种错误条件下的可用性,以衡量存储性能。该研究涉及四个任务:1)为存储系统开发故障/错误模型和设计故障注入方案; 2)在不同的故障条件下为高可用性分布式存储系统开发创新的基准测试框架; 3)实施可用性和性能评估工具集(APET),以整合故障注入和应力测试库,并在各种故障下捕获块级别存储系统的原始性能; 4)使用APET用于块级存储系统验证基准测试框架。这项研究对了解HEC系统的高度可用数据和I/O服务有直接的贡献,建立了在有缺陷条件下表征存储系统的一般基准测试框架,从而通过指导社会受益于开发高可用性的面向高可用性的分布式存储系统,这对许多应用至关重要。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Xubin He其他文献

Reducing Fragmentation for In-line Deduplication Backup Storage via Exploiting Backup History and Cache Knowledge
通过利用备份历史记录和缓存知识减少内联重复数据删除备份存储的碎片
An Extensible I/O Performance Analysis Framework for Distributed Environments
分布式环境的可扩展 I/O 性能分析框架
Active/active replication for highly available HPC system services
高可用性 HPC 系统服务的主动/主动复制
An efficient design for fast memory registration in RDMA
RDMA 中快速内存注册的高效设计
StoreRush: An Application-Level Approach to Harvesting Idle Storage in a Best Effort Environment
StoreRush:一种在尽力环境中收集空闲存储的应用程序级方法

Xubin He的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Xubin He', 18)}}的其他基金

Collaborative Research: Elements: ProDM: Developing A Unified Progressive Data Management Library for Exascale Computational Science
协作研究:要素:ProDM:为百亿亿次计算科学开发统一的渐进式数据管理库
  • 批准号:
    2311758
  • 财政年份:
    2023
  • 资助金额:
    $ 0.8万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Rethinking Performance Variation for Emerging Applications - An Application-centric and Cross-layer Approach
协作研究:SHF:小型:重新思考新兴应用程序的性能变化 - 以应用程序为中心的跨层方法
  • 批准号:
    2134203
  • 财政年份:
    2022
  • 资助金额:
    $ 0.8万
  • 项目类别:
    Standard Grant
SHF:Small: Collaborative Research: Understanding, Modeling, and System Support for HPC Data Reduction
SHF:Small:协作研究:HPC 数据缩减的理解、建模和系统支持
  • 批准号:
    1813081
  • 财政年份:
    2018
  • 资助金额:
    $ 0.8万
  • 项目类别:
    Standard Grant
SHF:Small: Collaborative Research: Tailoring Memory Systems for Data-Intensive HPC Applications
SHF:Small:协作研究:为数据密集型 HPC 应用定制内存系统
  • 批准号:
    1717660
  • 财政年份:
    2017
  • 资助金额:
    $ 0.8万
  • 项目类别:
    Standard Grant
CSR: Small: Cost Effective, High Performance Solutions Using Erasure Codes for Big Data Management in Large Data Centers
CSR:小型:在大型数据中心使用纠删码进行大数据管理的经济高效、高性能解决方案
  • 批准号:
    1700719
  • 财政年份:
    2016
  • 资助金额:
    $ 0.8万
  • 项目类别:
    Standard Grant
SHF: Small: ASF: An Adaptive Scaling Framework for High Scalability of XOR-Based RAID Systems
SHF:小型:ASF:基于 XOR 的 RAID 系统的高可扩展性的自适应扩展框架
  • 批准号:
    1702474
  • 财政年份:
    2016
  • 资助金额:
    $ 0.8万
  • 项目类别:
    Standard Grant
SHF: Small: ASF: An Adaptive Scaling Framework for High Scalability of XOR-Based RAID Systems
SHF:小型:ASF:基于 XOR 的 RAID 系统的高可扩展性的自适应扩展框架
  • 批准号:
    1320349
  • 财政年份:
    2014
  • 资助金额:
    $ 0.8万
  • 项目类别:
    Standard Grant
CSR: Small: Cost Effective, High Performance Solutions Using Erasure Codes for Big Data Management in Large Data Centers
CSR:小型:在大型数据中心使用纠删码进行大数据管理的经济高效、高性能解决方案
  • 批准号:
    1218960
  • 财政年份:
    2012
  • 资助金额:
    $ 0.8万
  • 项目类别:
    Standard Grant
Collaborative Research: Cross-Layer Exploration of Non-Volatile Solid-State Memories to Achieve Effective I/O Stack for High-Performance Computing Systems
协作研究:非易失性固态存储器的跨层探索,为高性能计算系统实现有效的 I/O 堆栈
  • 批准号:
    1102605
  • 财政年份:
    2010
  • 资助金额:
    $ 0.8万
  • 项目类别:
    Standard Grant
RUI: Automatic Identification of I/O Bottleneck and Run-time Optimization for Cluster Virtualization
RUI:集群虚拟化I/O瓶颈自动识别与运行时优化
  • 批准号:
    1102624
  • 财政年份:
    2010
  • 资助金额:
    $ 0.8万
  • 项目类别:
    Standard Grant

相似国自然基金

基于pDOS策略的海洋甲壳源5-羟甲基糠醛衍生物的多样性合成及杀线活性评价
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    58 万元
  • 项目类别:
    面上项目

相似海外基金

A micro-dissection platform for generating uniform-sized patient-derived tumor organoids (PDOs) for personalized cancer therapy
一个显微解剖平台,用于生成大小一致的患者来源的肿瘤类器官(PDO),用于个性化癌症治疗
  • 批准号:
    10697348
  • 财政年份:
    2022
  • 资助金额:
    $ 0.8万
  • 项目类别:
cellular heterogeneity of colorectal cancer
结直肠癌的细胞异质性
  • 批准号:
    19K22570
  • 财政年份:
    2019
  • 资助金额:
    $ 0.8万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
Prediction of drug efficacy by patients derived tumor organoids (PDOs) and early response markers (ERMs)
通过患者来源的肿瘤类器官(PDO)和早期反应标志物(ERM)预测药物疗效
  • 批准号:
    18H02631
  • 财政年份:
    2018
  • 资助金额:
    $ 0.8万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
CSR---PDOS: Online Production-Run Software Failure Diagnosis at the User Site
CSR---PDOS:用户现场生产运行软件故障在线诊断
  • 批准号:
    1022830
  • 财政年份:
    2009
  • 资助金额:
    $ 0.8万
  • 项目类别:
    Continuing Grant
CSR-PDOS: Hardening Distributed Data Stores for Disaster Recovery
CSR-PDOS:强化分布式数据存储以实现灾难恢复
  • 批准号:
    0720578
  • 财政年份:
    2007
  • 资助金额:
    $ 0.8万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了