CSR: Rethinking System Software for Overprovisioned, High-Performance Computing Systems

CSR:重新思考用于过度配置的高性能计算系统的系统软件

基本信息

  • 批准号:
    1526015
  • 负责人:
  • 金额:
    $ 49万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2015
  • 资助国家:
    美国
  • 起止时间:
    2015-10-01 至 2020-09-30
  • 项目状态:
    已结题

项目摘要

Currently, the high-performance computing (HPC) community is focused on achieving exaflop performance, which is about a 30-fold improvement from the performance of the best supercomputer in the world today. Because of practical, financial, and environmental concerns, the Department of Energy is setting a power limit for achieving an exaflop at 20 megawatts. As today's top machines generally consume between five and 20 megawatts---and yet are an order of magnitude or more away from the exaflop performance target, significant hardware and software advances in HPC systems are necessary. One way to improve hardware is to use overprovisioned systems, which contain more machines than can be fully powered simultaneously. While overprovisioned systems have the potential to significantly improve power and performance, software will need to be redesigned to support such systems.The focus of this proposal is to design and implement software infrastructure that will support overprovisioned systems. The key advance in the infrastructure is support of system-wide optimizations, i.e., optimizations that span multiple applications. This is in stark contrast to the current focus in HPC systems of optimizing on a per-application basis. The developed software will consist of a job profiler, a scheduler that performs analysis on multiple jobs at a time, and a cluster-wide run-time system that jointly optimizes multiple applications based on the output of the scheduler analysis.Achieving exascale computing is an important national priority and will impact many critical application domains, such as climate/weather, renewable energy, nuclear energy, materials science, and national security. The work described here will improve whole-system performance on power-constrained HPC systems, which is one important step towards the exascale goal. The project plans to transfer technology resulting from this research in the form of the proposed software stack via longstanding collaborations with several national laboratories.
目前,高性能计算 (HPC) 社区致力于实现 exaflop 性能,这比当今世界上最好的超级计算机的性能提高了约 30 倍。出于实际、财务和环境方面的考虑,能源部将实现百亿亿次运算的功率限制设定为 20 兆瓦。 由于当今顶级机器的功耗通常在 5 到 20 兆瓦之间,但距离百亿亿次浮点运算性能目标还差一个数量级或更多,因此 HPC 系统的硬件和软件方面需要取得重大进展。 改进硬件的一种方法是使用过度配置的系统,其中包含的机器数量多于能够同时完全供电的机器数量。 虽然过度配置的系统有可能显着提高功率和性能,但需要重新设计软件以支持此类系统。该提案的重点是设计和实施支持过度配置系统的软件基础设施。 基础设施的关键进步是支持系统范围的优化,即跨多个应用程序的优化。这与 HPC 系统当前关注的基于每个应用程序的优化形成鲜明对比。 开发的软件将包括一个作业分析器、一个一次对多个作业进行分析的调度程序,以及一个集群范围的运行时系统,该系统根据调度程序分析的输出联合优化多个应用程序。重要的国家优先事项,并将影响许多关键应用领域,例如气候/天气、可再生能源、核能、材料科学和国家安全。 这里描述的工作将提高功率受限的 HPC 系统的整个系统性能,这是实现百亿亿次目标的重要一步。 该项目计划通过与几个国家实验室的长期合作,以拟议的软件堆栈的形式转让这项研究产生的技术。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

David Lowenthal其他文献

Cardiac Response to Exercise in Health and Disease
健康和疾病中心脏对运动的反应
  • DOI:
    10.1055/s-2007-1006312
  • 发表时间:
    1993-03-01
  • 期刊:
  • 影响因子:
    0
  • 作者:
    David Lowenthal;Michael Pollock
  • 通讯作者:
    Michael Pollock
COMO CONHECEMOS O PASSADO
科莫·科赫西莫斯·奥帕萨多
  • DOI:
  • 发表时间:
    1998
  • 期刊:
  • 影响因子:
    0
  • 作者:
    David Lowenthal;Tradução Lúcia Haddad;Revisão técnica Mariana Maluf
  • 通讯作者:
    Revisão técnica Mariana Maluf
The Interpretation of Ordinary Landscapes: Geographical Essays
普通风景的解读:地理散文
  • DOI:
    10.2307/633442
  • 发表时间:
    1979-06-07
  • 期刊:
  • 影响因子:
    0
  • 作者:
    D. W. Meinig;J. B. Jackson;Peirce F. Lewis;David Lowenthal;Marwyn S. Samuels;D. E. Sopher;Y. Tuan
  • 通讯作者:
    Y. Tuan
Social Origins of Dictatorship and Democracy: Lord and Peasant in the Making of the Modern World
独裁与民主的​​社会根源:现代世界形成中的地主与农民
  • DOI:
    10.2307/2575331
  • 发表时间:
    1967-09-01
  • 期刊:
  • 影响因子:
    0
  • 作者:
    David Lowenthal;Barrington. Moore
  • 通讯作者:
    Barrington. Moore
The Heritage Crusade and the Spoils of History
遗产远征和历史战利品
  • DOI:
  • 发表时间:
    1996
  • 期刊:
  • 影响因子:
    0
  • 作者:
    David Lowenthal
  • 通讯作者:
    David Lowenthal

David Lowenthal的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('David Lowenthal', 18)}}的其他基金

Collaborative Research: SHF: Medium: Co-Optimizing Computation and Data Transformations for Sparse Tensors
协作研究:SHF:中:稀疏张量的协同优化计算和数据转换
  • 批准号:
    2106621
  • 财政年份:
    2022
  • 资助金额:
    $ 49万
  • 项目类别:
    Continuing Grant
Collaborative Research: OAC Core: Improving Utilization of High-Performance Computing Systems via Intelligent Co-scheduling
合作研究:OAC Core:通过智能协同调度提高高性能计算系统的利用率
  • 批准号:
    2103511
  • 财政年份:
    2021
  • 资助金额:
    $ 49万
  • 项目类别:
    Standard Grant
Collaborative Research: OAC Core: Improving Utilization of High-Performance Computing Systems via Intelligent Co-scheduling
合作研究:OAC Core:通过智能协同调度提高高性能计算系统的利用率
  • 批准号:
    2103511
  • 财政年份:
    2021
  • 资助金额:
    $ 49万
  • 项目类别:
    Standard Grant
CSR: Small:Conductor: A Run-Time System for Exascale Computing
CSR:Small:Conductor:用于百亿亿次计算的运行时系统
  • 批准号:
    1216829
  • 财政年份:
    2012
  • 资助金额:
    $ 49万
  • 项目类别:
    Standard Grant
CSR-PSCE, SM: MPI-PPA: Improving Efficiency of Large-Scale Clusters Through Statistical Performance Prediction
CSR-PSCE、SM:MPI-PPA:通过统计性能预测提高大规模集群的效率
  • 批准号:
    0936251
  • 财政年份:
    2009
  • 资助金额:
    $ 49万
  • 项目类别:
    Continuing Grant
CSR-PSCE, SM: MPI-PPA: Improving Efficiency of Large-Scale Clusters Through Statistical Performance Prediction
CSR-PSCE、SM:MPI-PPA:通过统计性能预测提高大规模集群的效率
  • 批准号:
    0834356
  • 财政年份:
    2008
  • 资助金额:
    $ 49万
  • 项目类别:
    Continuing Grant
Collaborative Research: Efficient Detection and Alleviation of Scalability Problems
协作研究:有效检测和缓解可扩展性问题
  • 批准号:
    0429285
  • 财政年份:
    2004
  • 资助金额:
    $ 49万
  • 项目类别:
    Standard Grant
SOFTWARE: Heterogeneous Cluster MPI: A System for Out-Of-Core, Heterogeneous Data Distribution
软件:异构集群 MPI:核外异构数据分发系统
  • 批准号:
    0234285
  • 财政年份:
    2003
  • 资助金额:
    $ 49万
  • 项目类别:
    Continuing Grant
Instrumentation Grant for Research in Parallel and Distributed Computing
用于并行和分布式计算研究的仪器补助金
  • 批准号:
    9986032
  • 财政年份:
    2000
  • 资助金额:
    $ 49万
  • 项目类别:
    Standard Grant
Career: An Integrated Compiler/Run-Time System for Global Data Distribution
职业生涯:用于全球数据分发的集成编译器/运行时系统
  • 批准号:
    9733063
  • 财政年份:
    1998
  • 资助金额:
    $ 49万
  • 项目类别:
    Continuing Grant

相似国自然基金

基于“批注-反思-研讨”协同阅读教学的过程解构与适应性智能教学策略重构的在线系统研究
  • 批准号:
    62377017
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
课堂“空间教学”行为的多模态分析与教师实践反思支持研究
  • 批准号:
    62307024
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
双边需求视角下的职场自我反思:构念、触发机制与价值激活效应研究
  • 批准号:
    72271231
  • 批准年份:
    2022
  • 资助金额:
    44 万元
  • 项目类别:
    面上项目
新时期的小额信贷与相对贫困治理:理论反思、机制分析及路径优化
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目

相似海外基金

CAREER: Rethinking System Stack for the Load-Store I/O Era
职业:重新思考加载-存储 I/O 时代的系统堆栈
  • 批准号:
    2339901
  • 财政年份:
    2024
  • 资助金额:
    $ 49万
  • 项目类别:
    Continuing Grant
CAREER: Rethinking Spiking Neural Networks from a Dynamical System Perspective
职业:从动态系统的角度重新思考尖峰神经网络
  • 批准号:
    2337646
  • 财政年份:
    2024
  • 资助金额:
    $ 49万
  • 项目类别:
    Continuing Grant
Rethinking Legionella pneumophila type IV pili and their roles in intracellular infection
重新思考嗜肺军团菌 IV 型菌毛及其在细胞内感染中的作用
  • 批准号:
    10738431
  • 财政年份:
    2023
  • 资助金额:
    $ 49万
  • 项目类别:
Rethinking the neuroanatomical organization of cognition: Recognition memory in visual cortex
重新思考认知的神经解剖学组织:视觉皮层的识别记忆
  • 批准号:
    10469534
  • 财政年份:
    2021
  • 资助金额:
    $ 49万
  • 项目类别:
Rethinking the neuroanatomical organization of cognition: Recognition memory in visual cortex
重新思考认知的神经解剖学组织:视觉皮层的识别记忆
  • 批准号:
    10303534
  • 财政年份:
    2021
  • 资助金额:
    $ 49万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了