Collaborative Research: SHF: Small: Rethinking Performance Variation for Emerging Applications - An Application-centric and Cross-layer Approach

协作研究:SHF:小型:重新思考新兴应用程序的性能变化 - 以应用程序为中心的跨层方法

基本信息

  • 批准号:
    2134202
  • 负责人:
  • 金额:
    $ 19万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2022
  • 资助国家:
    美国
  • 起止时间:
    2022-01-01 至 2024-12-31
  • 项目状态:
    已结题

项目摘要

High-performance computing (HPC) is moving rapidly to the unparalleled level of exaflops in 2021, when the first exascale systems will be ready for science production. Despite the peak performance obtained by simplistic benchmarks during the maintenance window when no other users are allowed to access the system, applications routinely suffer from performance variations as a result of intra- or inter-application interference over storage and network. The consequence is the low system utilization and prolonged time to insights for applications. To address this challenge, this project aims to develop new methods in memory and input/output (I/O) that can significantly reduce the performance variation for large scientific applications. This project provides integrated research and education activities to nurture next-generation computer researchers and engineers in the area of HPC, particularly for those from under-represented groups, to strengthen the U.S. competitiveness in computational science and engineering. This project aims to address the performance variation issue on HPC systems using a novel application-centric approach across the system stack. To address increasing resource contention, a selective hint-sharing scheme is designed to reduce the overall performance variation, and a cluster-partition technique is developed to regulate the scale of hint sharing. In addition, a feedback mechanism is incorporated to adjust the hint traffic according to the degree of performance-variation reduction. Based upon memory-access similarity, memory pages or work nodes sharing high similarity are grouped together to optimize the memory-system performance. Furthermore, a rule-based I/O re-routing scheme, where I/O traffic is re-routed based upon not only the interference profile, but also the requirements of downstream data analytics. In particular, an error-bounded coarsening technique that reacts to performance variation by adjusting the fidelity of an HPC application is explored. The integrated research activities in this project will significantly improve the understanding and methods in managing performance variations for large computational science and engineering applications.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
高性能计算(HPC)在2021年迅速移动到无与伦比的Exaflops水平,届时第一个Exascale系统将准备好科学生产。尽管在维护窗口中,当不允许其他用户访问系统时,通过简单的基准获得了峰值性能,但由于对存储和网络的内置或施法间干扰,应用程序通常会遭受性能变化。结果是系统利用率较低,并延长了用于应用程序的见解。为了应对这一挑战,该项目旨在在内存和输入/输出(I/O)中开发新的方法,以显着降低大型科学应用的性能变化。该项目提供了综合的研究和教育活动,以培养HPC领域的下一代计算机研究人员和工程师,特别是对于代表不足的群体的计算机研究人员,以增强美国在计算科学和工程方面的竞争力。该项目旨在通过整个系统堆栈中以新颖的以应用程序为中心的方法来解决HPC系统上的性能变化问题。为了解决不断增加的资源争夺,选择性提示共享方案旨在减少整体性能变化,并开发了一种群集分区技术来调节提示共享的规模。此外,还合并了一种反馈机制,以根据降低性能变化的程度来调整提示流量。基于内存访问相似性,将共享高相似性的内存页面或工作节点分组在一起以优化内存系统性能。此外,基于规则的I/O重新布置方案,其中I/O流量不仅基于干扰配置文件,而且还基于下游数据分析的要求。特别是,通过调整HPC应用程序的保真度来对性能变化做出反应的误差的粗化技术。该项目中的集成研究活动将显着提高大型计算科学和工程应用程序绩效变化方面的理解和方法。该奖项反映了NSF的法定任务,并被认为是通过基金会的知识分子优点和更广泛的影响来审查标准的评估值得支持的。

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Locality-based transfer learning on compression autoencoder for efficient scientific data lossy compression
  • DOI:
    10.1016/j.jnca.2022.103452
  • 发表时间:
    2022-06
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Nan Wang;Tong Liu;Jinzhen Wang;Qing Liu;Shakeel Alibhai;Xubin He
  • 通讯作者:
    Nan Wang;Tong Liu;Jinzhen Wang;Qing Liu;Shakeel Alibhai;Xubin He
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Qing Liu其他文献

Formyl peptide receptor 2 as a potential therapeutic target for inflammatory bowel disease
甲酰基肽受体2作为炎症性肠病的潜在治疗靶点
  • DOI:
    10.1038/s41401-022-00944-0
  • 发表时间:
    2022-07
  • 期刊:
  • 影响因子:
    8.2
  • 作者:
    Wen-sheng Yang;Jing-lin Wang;Wei Wu;Guang-fei Wang;Jun Yan;Qing Liu;Xiao-yan Wu;Qing-tong Zhou;De-hua Yang;Ming-Wei Wang;Zhi-Ping Li
  • 通讯作者:
    Zhi-Ping Li
Fourier-transform-based two-stage camera calibration method with simple periodical pattern
基于傅里叶变换的简单周期模式两级相机标定方法
  • DOI:
    10.1016/j.optlaseng.2020.106121
  • 发表时间:
    2020-10
  • 期刊:
  • 影响因子:
    4.6
  • 作者:
    Xiangcheng Chen;Ruimei Fan;Jun Wu;Xiaokai Song;Qing Liu;Yuwei Wang;Yajun Wang;Bo Tao
  • 通讯作者:
    Bo Tao
Closure properties of the second-order regular variation under convolutions
卷积下二阶正则变分的闭包性质
Synthesis and characterization of a highly stable poly (3,4-ethylenedioxythiophene)-gold nanoparticles composite film and its application to electrochemical dopamine sensors
高稳定性聚(3,4-乙撑二氧噻吩)-金纳米粒子复合膜的合成、表征及其在电化学多巴胺传感器中的应用
  • DOI:
    10.1039/c3ra45859h
  • 发表时间:
    2014-01
  • 期刊:
  • 影响因子:
    3.9
  • 作者:
    Keke Liu;Haiyan Pang;Jianrong Zhang;Haiping Huang;Qing Liu;Yanhong Chu
  • 通讯作者:
    Yanhong Chu
Research of spatial direction relation’s consistency based on genetic algorithm
基于遗传算法的空间方向关系一致性研究

Qing Liu的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Qing Liu', 18)}}的其他基金

Collaborative Research: Elements: ProDM: Developing A Unified Progressive Data Management Library for Exascale Computational Science
协作研究:要素:ProDM:为百亿亿次计算科学开发统一的渐进式数据管理库
  • 批准号:
    2311757
  • 财政年份:
    2023
  • 资助金额:
    $ 19万
  • 项目类别:
    Standard Grant
CAREER: Enabling Progressive Data Analytics for High Performance Computing: Algorithms and System Support
职业:实现高性能计算的渐进式数据分析:算法和系统支持
  • 批准号:
    2144403
  • 财政年份:
    2022
  • 资助金额:
    $ 19万
  • 项目类别:
    Continuing Grant
SHF:Small: Collaborative Research: Understanding, Modeling, and System Support for HPC Data Reduction
SHF:Small:协作研究:HPC 数据缩减的理解、建模和系统支持
  • 批准号:
    1812861
  • 财政年份:
    2018
  • 资助金额:
    $ 19万
  • 项目类别:
    Standard Grant
SHF:Small: Collaborative Research: Tailoring Memory Systems for Data-Intensive HPC Applications
SHF:Small:协作研究:为数据密集型 HPC 应用定制内存系统
  • 批准号:
    1718297
  • 财政年份:
    2017
  • 资助金额:
    $ 19万
  • 项目类别:
    Standard Grant
STTR Phase I: A novel biomimetic nanofiber coating on dental implants for gingival regeneration
STTR 第一阶段:用于牙龈再生的牙种植体上的新型仿生纳米纤维涂层
  • 批准号:
    1346430
  • 财政年份:
    2014
  • 资助金额:
    $ 19万
  • 项目类别:
    Standard Grant

相似国自然基金

支持二维毫米波波束扫描的微波/毫米波高集成度天线研究
  • 批准号:
    62371263
  • 批准年份:
    2023
  • 资助金额:
    52 万元
  • 项目类别:
    面上项目
腙的Heck/脱氮气重排串联反应研究
  • 批准号:
    22301211
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
水系锌离子电池协同性能调控及枝晶抑制机理研究
  • 批准号:
    52364038
  • 批准年份:
    2023
  • 资助金额:
    33 万元
  • 项目类别:
    地区科学基金项目
基于人类血清素神经元报告系统研究TSPYL1突变对婴儿猝死综合征的致病作用及机制
  • 批准号:
    82371176
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
FOXO3 m6A甲基化修饰诱导滋养细胞衰老效应在补肾法治疗自然流产中的机制研究
  • 批准号:
    82305286
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Collaborative Research: SHF: Medium: Differentiable Hardware Synthesis
合作研究:SHF:媒介:可微分硬件合成
  • 批准号:
    2403134
  • 财政年份:
    2024
  • 资助金额:
    $ 19万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: LEGAS: Learning Evolving Graphs At Scale
协作研究:SHF:小型:LEGAS:大规模学习演化图
  • 批准号:
    2331302
  • 财政年份:
    2024
  • 资助金额:
    $ 19万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: LEGAS: Learning Evolving Graphs At Scale
协作研究:SHF:小型:LEGAS:大规模学习演化图
  • 批准号:
    2331301
  • 财政年份:
    2024
  • 资助金额:
    $ 19万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Efficient and Scalable Privacy-Preserving Neural Network Inference based on Ciphertext-Ciphertext Fully Homomorphic Encryption
合作研究:SHF:小型:基于密文-密文全同态加密的高效、可扩展的隐私保护神经网络推理
  • 批准号:
    2412357
  • 财政年份:
    2024
  • 资助金额:
    $ 19万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Medium: Enabling Graphics Processing Unit Performance Simulation for Large-Scale Workloads with Lightweight Simulation Methods
合作研究:SHF:中:通过轻量级仿真方法实现大规模工作负载的图形处理单元性能仿真
  • 批准号:
    2402804
  • 财政年份:
    2024
  • 资助金额:
    $ 19万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了