DC: Small: Collaborative Research: DARE: Declarative and Scalable Recovery

DC:小型:协作研究:DARE:声明式和可扩展的恢复

基本信息

  • 批准号:
    1016924
  • 负责人:
  • 金额:
    --
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2010
  • 资助国家:
    美国
  • 起止时间:
    2010-09-15 至 2013-05-31
  • 项目状态:
    已结题

项目摘要

One dominant characteristic of today's large-scale computing systemsis the prevalence of large storage clusters. Storage clusters at thescale of hundreds or thousands of commodity machines areincreasingly being deployed. At companies like Amazon, Google, Yahoo,and others, thousands of nodes are managed as a single system.As large clusters have brought many benefits, they also bring a newchallenge: a growing number and frequency of failures that must bemanaged. Bits, sectors, disks, machines, racks, and many othercomponents fail. With millions of servers and hundreds of datacenters, there are millions of opportunities for these components tofail. Failing to deal with failures will directly impact thereliability and availability of data and jobs.Unfortunately, we still hear data-loss stories even recently. Forexample, in March 2009, Facebook lost millions of photos due tosimultaneous disk failures that "should" rarely happen at the sametime (but it happened); in July 2009, a large bank was fined a recordtotal of 3 millions pounds after losing data on thousands of itscustomers; more recently, in October 2009, T-Mobile Sidekick, whichuses Microsoft's cloud service, also lost its customer data. Theseincidents have shown that existing large-scale storage systems arestill fragile to failures.To address the challenges of large-scale recovery, the goal of thisproject is to: (1) seek the fundamental problems of recovery intoday's scalable world of computing, (2) improve the reliability,performance, and scalability of existing large-scale recovery, and (3)explore formally grounded languages to empower rigorous specificationof recovery properties and behaviors. Our vision is to build systemsthat "DARE to fail": systems that deliberately fail themselves,exercise recovery routinely, and enable easy and correct deployment ofnew recovery policies.For more information, please visit this website:http://boom.cs.berkeley.edu/dare/
当今大规模计算系统的一个主要特征是大型存储集群的盛行。 数百或数千台商用机器规模的存储集群正在越来越多地得到部署。在亚马逊、谷歌、雅虎等公司,数千个节点作为单个系统进行管理。大型集群带来了许多好处,但也带来了新的挑战:必须管理越来越多的故障和频率。位、扇区、磁盘、机器、机架和许多其他组件发生故障。 拥有数百万台服务器和数百个数据中心,这些组件有数以百万计的机会发生故障。未能处理故障将直接影响数据和作业的可靠性和可用性。不幸的是,即使在最近,我们仍然听到数据丢失的故事。例如,2009 年 3 月,Facebook 由于同时发生磁盘故障而丢失了数百万张照片,而这种情况“应该”很少同时发生(但它确实发生了); 2009 年 7 月,一家大型银行因丢失数千名客户数据而被处以创纪录的 300 万英镑罚款;最近,2009 年 10 月,使用微软云服务的 T-Mobile Sidekick 也丢失了其客户数据。 这些事件表明,现有的大规模存储系统仍然容易出现故障。为了应对大规模恢复的挑战,该项目的目标是:(1)寻求当今可扩展计算世界恢复的根本问题,(2)提高现有大规模恢复的可靠性、性能和可扩展性,以及(3)探索形式化基础语言以支持恢复属性和行为的严格规范。 我们的愿景是构建“敢于失败”的系统:故意让自己失败的系统,定期进行恢复,并能够轻松正确地部署新的恢复策略。有关更多信息,请访问此网站:http://boom.cs.berkeley .edu/敢/

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Haryadi Gunawi其他文献

Haryadi Gunawi的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Haryadi Gunawi', 18)}}的其他基金

Collaborative Research: PPoSS: LARGE: ScaleStuds: Foundations for Correctness Checkability and Performance Predictability of Systems at Scale
合作研究:PPoSS:大型:ScaleStuds:大规模系统正确性可检查性和性能可预测性的基础
  • 批准号:
    2119184
  • 财政年份:
    2021
  • 资助金额:
    --
  • 项目类别:
    Continuing Grant
PPoSS: Planning: CP2: Towards Systems Correctness Checkability and Performance Predictability at Scale
PPoSS:规划:CP2:实现大规模系统正确性可检查性和性能可预测性
  • 批准号:
    2028427
  • 财政年份:
    2020
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
USENIX FAST 2017 NSF Student Travel Support
USENIX FAST 2017 NSF 学生旅行支持
  • 批准号:
    1727380
  • 财政年份:
    2017
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
CSR: Medium:Combating Distributed Concurrency Bugs in Cloud Systems
CSR:中:对抗云系统中的分布式并发错误
  • 批准号:
    1563956
  • 财政年份:
    2016
  • 资助金额:
    --
  • 项目类别:
    Continuing Grant
CSR: Small: BreezeFS: File System Transformation for Cloud and Multistore Era
CSR:小型:BreezeFS:云和多存储时代的文件系统转型
  • 批准号:
    1526304
  • 财政年份:
    2015
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
CAREER: DrCloud: Drill-Ready Cloud Computing
职业:DrCloud:可练习的云计算
  • 批准号:
    1350499
  • 财政年份:
    2014
  • 资助金额:
    --
  • 项目类别:
    Continuing Grant
XPS:CLCCA:LigHTS: Lagging-Hardware Tolerant Systems" in the system.
系统中的“XPS:CLCCA:LigHTS:滞后硬件容忍系统”。
  • 批准号:
    1336580
  • 财政年份:
    2013
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
DC: Small: Collaborative Research: DARE: Declarative and Scalable Recovery
DC:小型:协作研究:DARE:声明式和可扩展的恢复
  • 批准号:
    1321958
  • 财政年份:
    2012
  • 资助金额:
    --
  • 项目类别:
    Standard Grant

相似国自然基金

诊疗一体化PS-Hc@MB协同训练介导脑小血管病康复的作用及机制研究
  • 批准号:
    82372561
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
非小细胞肺癌MECOM/HBB通路介导血红素代谢异常并抑制肿瘤起始细胞铁死亡的机制研究
  • 批准号:
    82373082
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
基于胆碱能皮层投射纤维探讨脑小血管病在帕金森病步态障碍中的作用及机制研究
  • 批准号:
    82301663
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
关于丢番图方程小素数解上界估计的研究
  • 批准号:
    12301005
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
嗅球小胶质细胞P2X7受体在变应性鼻炎发生帕金森病样改变中的作用与机制研究
  • 批准号:
    82371119
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目

相似海外基金

DC: Small: Collaborative Research: DARE: Declarative and Scalable Recovery
DC:小型:协作研究:DARE:声明式和可扩展的恢复
  • 批准号:
    1321958
  • 财政年份:
    2012
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
DC:Small:Collaborative Research:Data Intensive Computing for General Relational Data Learning
DC:Small:协作研究:用于一般关系数据学习的数据密集型计算
  • 批准号:
    1018114
  • 财政年份:
    2010
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
DC: Small: Collaborative Research: DARE: Declarative and Scalable Recovery
DC:小型:协作研究:DARE:声明式和可扩展的恢复
  • 批准号:
    1017073
  • 财政年份:
    2010
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
DC:Small: Collaborative Research: Data Intensive Computing for General Relational Data Learning
DC:Small:协作研究:用于一般关系数据学习的数据密集型计算
  • 批准号:
    1017828
  • 财政年份:
    2010
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
DC: Small: Collaborative Research: Exploring Energy-Reliability Trade-offs in Data Storage Systems
DC:小型:协作研究:探索数据存储系统中的能源可靠性权衡
  • 批准号:
    1016198
  • 财政年份:
    2010
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了