SHF: Small: Scalable Trace-Based Tools for In-Situ Data Analysis of HPC Applications (ScalaJack)

SHF:小型:用于 HPC 应用程序现场数据分析的可扩展的基于跟踪的工具 (ScalaJack)

基本信息

  • 批准号:
    1217748
  • 负责人:
  • 金额:
    $ 45.74万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2012
  • 资助国家:
    美国
  • 起止时间:
    2012-06-01 至 2017-05-31
  • 项目状态:
    已结题

项目摘要

Production codes on supercomputers are struggling to remain scalableeach time the processor core count increases by a factor of 10, eventhough they run efficiently at smaller scale.But root cause diagnosis fails at petascale since (1) symptoms ofperformance problems can be subtle, (2) only fewmetrics can be efficiently collected and (3) tools can only feasibly recorda small subset of even these metrics.This work addresses these problems by creating a framework that allowsapplication developers to focus on data analysis that drives customizeddata extraction combined with on-the-fly analysis specifically gearedto their individual problems. This is accomplished by combining traceanalysis and in-situ data analysis techniques at runtime, therebylifting data reduction to a new level where it IS analysis. With thisapproach, modular measurement and analysis components are combined toselectively extract representative data from production codes in aproblem-specific manner, which enables root cause analysis.The work demonstrates the feasibility of customized dataextraction and analysis at scale for root cause analysis on currentand forthcoming multi-petascale supercomputers. It thus contributesto sustain scalable scientific computing into the future up to the largestscales. Results of this work will be contributed as open-source codeto the research community and beyond as done, allowing other groups tonot only build tools on top of our framework but also contribute theirown components.
每当处理器核心数量增加 10 倍时,超级计算机上的生产代码就很难保持可扩展性,尽管它们在较小的规模上运行效率很高。但根本原因诊断在千万亿级规模上失败,因为 (1) 性能问题的症状可能很微妙,(2)只能有效地收集很少的指标,并且 (3) 工具甚至只能记录这些指标的一小部分。这项工作通过创建一个框架来解决这些问题,该框架允许应用程序开发人员专注于数据分析,驱动定制的数据提取与即时相结合专门针对他们个人问题的分析。 这是通过在运行时结合跟踪分析和现场数据分析技术来实现的,从而将数据简化提升到分析的新水平。通过这种方法,模块化测量和分析组件相结合,以特定问题的方式有选择地从生产代码中提取代表性数据,从而实现根本原因分析。这项工作证明了大规模定制数据提取和分析用于当前和即将到来的多问题根本原因分析的可行性。千万亿级超级计算机。 因此,它有助于维持未来最大规模的可扩展科学计算。 这项工作的结果将作为开源代码贡献给研究社区及其他社区,使其他团体不仅可以在我们的框架之上构建工具,还可以贡献自己的组件。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Frank Mueller其他文献

nMobility Restrictions and the Substitution between On-site and Remote Work: Empirical Evidence from a European Online Labour Market
流动性限制以及现场工作和远程工作之间的替代:来自欧洲在线劳动力市场的经验证据
Does Data Disclosure Increase Citations? Empirical Evidence from a Natural Experiment in Leading Economics Journals
数据披露会增加引用吗?
Trade, Competition and Welfare in Global Online Labour Markets: A 'Gig Economy' Case Study
全球在线劳动力市场的贸易、竞争和福利:“零工经济”案例研究
  • DOI:
    10.2139/ssrn.3090929
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Estrella Gomez;B. Martens;Frank Mueller
  • 通讯作者:
    Frank Mueller
Parallel Trade and its Ambiguous Effects on Global Welfare
平行贸易及其对全球福利的模糊影响
  • DOI:
    10.1111/j.1467-9396.2011.01016.x
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Frank Mueller
  • 通讯作者:
    Frank Mueller
C OPYRIGHTS AND C REATIVITY E VIDENCE FROM I TALIAN O PERA IN THE N APOLEONIC A GE *
拿破仑时代意大利歌剧院的版权和创造力证据*
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    B. Depoorter;Stephan Heblich;Sarah Kaplan;Frank Mueller;D. O’Reagan;F. Velde;Joel Waldfogel
  • 通讯作者:
    Joel Waldfogel

Frank Mueller的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Frank Mueller', 18)}}的其他基金

Collaborative Research: PPoSS: Planning: Cross-layer Coordination and Optimization for Scalable and Sparse Tensor Networks (CROSS)
合作研究:PPoSS:规划:可扩展和稀疏张量网络的跨层协调和优化(CROSS)
  • 批准号:
    2217020
  • 财政年份:
    2022
  • 资助金额:
    $ 45.74万
  • 项目类别:
    Standard Grant
EAGER: Curricula Development of a Quantum Programming Class with Hardware Access
EAGER:具有硬件访问功能的量子编程课程的课程开发
  • 批准号:
    1917383
  • 财政年份:
    2019
  • 资助金额:
    $ 45.74万
  • 项目类别:
    Standard Grant
SaTC: CORE: Small: Enhanced Security and Reliability for Embedded Control Systems
SaTC:CORE:小型:增强嵌入式控制系统的安全性和可靠性
  • 批准号:
    1813004
  • 财政年份:
    2018
  • 资助金额:
    $ 45.74万
  • 项目类别:
    Standard Grant
Student Travel Grant for RTSS'17 Ph.D. Student Poster Forum on Real-Time Aspects of Internet of Things and Cyber-Physical Systems
RTSS17 博士学生旅费补助金
  • 批准号:
    1744221
  • 财政年份:
    2017
  • 资助金额:
    $ 45.74万
  • 项目类别:
    Standard Grant
CPS: Breakthrough: Collaborative Research: Bringing the Multicore Revolution to Safety-Critical Cyber-Physical Systems
CPS:突破:协作研究:为安全关键的网络物理系统带来多核革命
  • 批准号:
    1239246
  • 财政年份:
    2013
  • 资助金额:
    $ 45.74万
  • 项目类别:
    Standard Grant
SHF: Small: RESYST: Resilience via Synergistic Redundancy and Fault Tolerance for High-End Computing
SHF:小型:RESYST:通过协同冗余和容错实现高端计算的弹性
  • 批准号:
    1058779
  • 财政年份:
    2010
  • 资助金额:
    $ 45.74万
  • 项目类别:
    Standard Grant
II-NEW: ARC: A Root Cluster for Research into Scalable Computer Systems
II-新:ARC:用于研究可扩展计算机系统的根集群
  • 批准号:
    0958311
  • 财政年份:
    2010
  • 资助金额:
    $ 45.74万
  • 项目类别:
    Standard Grant
CSR: Medium: Collaborative Research: Providing Predictable Timing for Task Migration in Embedded Multi-Core Environments (TiME-ME)
CSR:中:协作研究:为嵌入式多核环境中的任务迁移提供可预测的时序 (TiME-ME)
  • 批准号:
    0905181
  • 财政年份:
    2009
  • 资助金额:
    $ 45.74万
  • 项目类别:
    Continuing Grant
CSR--EHS: Collaborative Research: Hybrid Timing Analysis via Multi-Mode Execution
CSR--EHS:协作研究:通过多模式执行进行混合时序分析
  • 批准号:
    0720496
  • 财政年份:
    2007
  • 资助金额:
    $ 45.74万
  • 项目类别:
    Standard Grant
Collaborative Research: Effective Detection and Alleviation of Scalability Problems
协作研究:有效检测和缓解可扩展性问题
  • 批准号:
    0429653
  • 财政年份:
    2004
  • 资助金额:
    $ 45.74万
  • 项目类别:
    Standard Grant

相似国自然基金

单细胞分辨率下的石杉碱甲介导小胶质细胞极化表型抗缺血性脑卒中的机制研究
  • 批准号:
    82304883
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
小分子无半胱氨酸蛋白调控生防真菌杀虫活性的作用与机理
  • 批准号:
    32372613
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
诊疗一体化PS-Hc@MB协同训练介导脑小血管病康复的作用及机制研究
  • 批准号:
    82372561
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
非小细胞肺癌MECOM/HBB通路介导血红素代谢异常并抑制肿瘤起始细胞铁死亡的机制研究
  • 批准号:
    82373082
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
FATP2/HILPDA/SLC7A11轴介导肿瘤相关中性粒细胞脂代谢重编程影响非小细胞肺癌放疗免疫的作用和机制研究
  • 批准号:
    82373304
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目

相似海外基金

Collaborative Research: SHF: Small: Efficient and Scalable Privacy-Preserving Neural Network Inference based on Ciphertext-Ciphertext Fully Homomorphic Encryption
合作研究:SHF:小型:基于密文-密文全同态加密的高效、可扩展的隐私保护神经网络推理
  • 批准号:
    2412357
  • 财政年份:
    2024
  • 资助金额:
    $ 45.74万
  • 项目类别:
    Standard Grant
SHF: Small: QED - A New Approach to Scalable Verification of Hardware Memory Consistency
SHF:小型:QED - 硬件内存一致性可扩展验证的新方法
  • 批准号:
    2332891
  • 财政年份:
    2024
  • 资助金额:
    $ 45.74万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Efficient and Scalable Privacy-Preserving Neural Network Inference based on Ciphertext-Ciphertext Fully Homomorphic Encryption
合作研究:SHF:小型:基于密文-密文全同态加密的高效、可扩展的隐私保护神经网络推理
  • 批准号:
    2243053
  • 财政年份:
    2023
  • 资助金额:
    $ 45.74万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Efficient and Scalable Privacy-Preserving Neural Network Inference based on Ciphertext-Ciphertext Fully Homomorphic Encryption
合作研究:SHF:小型:基于密文-密文全同态加密的高效、可扩展的隐私保护神经网络推理
  • 批准号:
    2243052
  • 财政年份:
    2023
  • 资助金额:
    $ 45.74万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Scalable and Extensible I/O Runtime and Tools for Next Generation Adaptive Data Layouts
协作研究:SHF:小型:可扩展和可扩展的 I/O 运行时以及下一代自适应数据布局的工具
  • 批准号:
    2401274
  • 财政年份:
    2023
  • 资助金额:
    $ 45.74万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了