Collaborative Research: SI2-SSI: A Comprehensive Performance Tuning Framework for the MPI Stack

合作研究:SI2-SSI:MPI 堆栈的综合性能调优框架

基本信息

  • 批准号:
    1147926
  • 负责人:
  • 金额:
    $ 45.08万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2012
  • 资助国家:
    美国
  • 起止时间:
    2012-06-01 至 2016-05-31
  • 项目状态:
    已结题

项目摘要

The Message Passing Interface (MPI) is a very widely used parallel programming model on modern High-End Computing (HEC) systems. Many performance aspects of MPI libraries, such as latency, bandwidth, scalability, memory footprint, cache pollution, overlap of computation and communication etc. are highly dependent on system configuration and application requirements. Additionally, modern clusters are changing rapidly with the growth of multi-core processors and commodity networking technologies such as InfiniBand and 10GigE/iWARP. They are becoming diverse and heterogeneous with varying number of processor cores, processor speed, memory speed, multi-generation network adapters/switches, I/O interface technologies, and accelerators (GPGPUs), etc. Typically, any MPI library deals with the above kind of diversity in platforms and sensitivity of applications by employing various runtime parameters. These parameters are tuned during its release, or bysystem administrators, or by end-users. These default parameters may or may not be optimal for all system configurations and applications.The MPI library of a typical proprietary system goes through heavy performance tuning for a range of applications. Since commodity clusters provide greater flexibility in their configurations (processor, memory and network), it is very hard to achieve optimal tuning using released version of any MPI library, with its default settings. This leads to the following broad challenge: "Can a comprehensive performance tuning framework be designed for MPI library so that the next generation InfiniBand, 10GigE/iWARP and RoCE clusters and applications will be able to extract `bare-metal' performance and maximum scalability?" The investigators, involving computerscientists from The Ohio State University (OSU) and Ohio Supercomputer Center (OSC) as well as computational scientists from the Texas Advanced Computing Center (TACC) and San Diego Supercomputer Center (SDSC), University of California San Diego (UCSD), will be addressing the above challenge with innovative solutions.The investigators will specifically address the following challenges: 1) Can a set of static tools be designed to optimize performance of an MPI library during installation time? 2) Can a set of dynamic tools with low overhead be designed to optimize performance on a per-user and per-application basis during production runs? 3) How to incorporate the proposed performance tuning framework with the upcoming MPIT interface? 4) How to configure MPI libraries on a given system to deliver different optimizations to a set of driving applications? and 5) What kind of benefits (in terms of performance, scalability, memory efficiency and reduction in cache pollution) can be achieved by the proposed tuning framework? The research will be driven by a set of applications from established NSF computational science researchers running large scale simulations on the TACC Ranger and other systems at OSC, SDSC and OSU. The proposed designs will be integrated into the open-source MVAPICH2 library.
消息传递接口 (MPI) 是现代高端计算 (HEC) 系统上广泛使用的并行编程模型。 MPI 库的许多性能方面,例如延迟、带宽、可扩展性、内存占用、缓存污染、计算和通信重叠等,都高度依赖于系统配置和应用程序需求。此外,随着多核处理器和商用网络技术(例如 InfiniBand 和 10GigE/iWARP)的发展,现代集群正在迅速发生变化。它们变得多样化和异构,具有不同数量的处理器核心、处理器速度、内存速度、多代网络适配器/交换机、I/O 接口技术和加速器 (GPGPU) 等。通常,任何 MPI 库都会处理上述内容通过使用各种运行时参数来实现平台的多样性和应用程序的敏感性。这些参数在发布期间或由系统管理员或最终用户进行调整。 这些默认参数对于所有系统配置和应用程序可能是最佳的,也可能不是最佳的。典型专有系统的 MPI 库针对一系列应用程序进行了大量的性能调整。 由于商品集群在其配置(处理器、内存和网络)方面提供了更大的灵活性,因此使用任何 MPI 库的发布版本及其默认设置很难实现最佳调整。这带来了以下广泛的挑战:“能否为 MPI 库设计一个全面的性能调整框架,以便下一代 InfiniBand、10GigE/iWARP 和 RoCE 集群和应用程序能够提取‘裸机’性能和最大可扩展性? ” 研究人员包括来自俄亥俄州立大学 (OSU) 和俄亥俄超级计算机中心 (OSC) 的计算机科学家,以及来自德克萨斯高级计算中心 (TACC) 和圣地亚哥超级计算机中心 (SDSC)、加州大学圣地亚哥分校 (UCSD) 的计算科学家),将通过创新的解决方案解决上述挑战。研究人员将具体解决以下挑战:1)是否可以设计一组静态工具来优化安装期间 MPI 库的性能? 2) 是否可以设计一组低开销的动态工具来优化生产运行期间每个用户和每个应用程序的性能? 3) 如何将建议的性能调优框架与即将推出的 MPIT 接口结合起来? 4) 如何在给定系统上配置 MPI 库,以便为一组驱动应用程序提供不同的优化? 5)所提出的调优框架可以实现哪些好处(在性能、可扩展性、内存效率和减少缓存污染方面)? 该研究将由美国国家科学基金会 (NSF) 计算科学研究人员的一系列应用程序推动,这些研究人员在 TACC Ranger 以及 OSC、SDSC 和 OSU 的其他系统上运行大规模模拟。 拟议的设计将集成到开源 MAPICH2 库中。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Amitava Majumdar其他文献

Avoiding burnt probe tips: Practical solutions for testing internally regulated power supplies
避免探针尖端烧毁:测试内部稳压电源的实用解决方案
Cyberinfrastructure Usage Modalities on the TeraGrid
TeraGrid 上的网络基础设施使用方式
A parallel Monte Carlo code for planar and SPECT imaging: implementation, verification and applications in /sup 131/I SPECT
用于平面和 SPECT 成像的并行蒙特卡罗代码:/sup 131/I SPECT 中的实现、验证和应用
Ground bounce considerations in DC parametric test generation using boundary scan
使用边界扫描生成直流参数测试时的地弹注意事项
GPU-based ultra-fast dose calculation using a finite size pencil beam model
使用有限尺寸笔形射束模型进行基于 GPU 的超快速剂量计算
  • DOI:
  • 发表时间:
    2009
  • 期刊:
  • 影响因子:
    3.5
  • 作者:
    Xuejun Gu;Dongju Choi;C. Men;Hubert Pan;Amitava Majumdar;Steve B Jiang
  • 通讯作者:
    Steve B Jiang

Amitava Majumdar的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Amitava Majumdar', 18)}}的其他基金

Collaborative Research: Frameworks: hpcGPT: Enhancing Computing Center User Support with HPC-enriched Generative AI
协作研究:框架:hpcGPT:通过 HPC 丰富的生成式 AI 增强计算中心用户支持
  • 批准号:
    2411297
  • 财政年份:
    2024
  • 资助金额:
    $ 45.08万
  • 项目类别:
    Standard Grant
Category II: Exploring Neural Network Processors for AI in Science and Engineering
第二类:探索科学与工程中人工智能的神经网络处理器
  • 批准号:
    2005369
  • 财政年份:
    2020
  • 资助金额:
    $ 45.08万
  • 项目类别:
    Cooperative Agreement
Collaborative Research: CIBR: Building Capacity for Data-driven Neuroscience Research
合作研究:CIBR:数据驱动神经科学研究能力建设
  • 批准号:
    1935749
  • 财政年份:
    2020
  • 资助金额:
    $ 45.08万
  • 项目类别:
    Standard Grant
Collaborative Research: Frameworks: Designing Next-Generation MPI Libraries for Emerging Dense GPU Systems
协作研究:框架:为新兴密集 GPU 系统设计下一代 MPI 库
  • 批准号:
    1931450
  • 财政年份:
    2019
  • 资助金额:
    $ 45.08万
  • 项目类别:
    Standard Grant
Promoting International Collaboration on Developing Scalable, Portable & Efficient HPC Software for Modern HPC Platforms
促进开发可扩展、便携的国际合作
  • 批准号:
    1849519
  • 财政年份:
    2018
  • 资助金额:
    $ 45.08万
  • 项目类别:
    Standard Grant
SHF: Large: Collaborative Research: Next Generation Communication Mechanisms exploiting Heterogeneity, Hierarchy and Concurrency for Emerging HPC Systems
SHF:大型:协作研究:利用新兴 HPC 系统的异构性、层次结构和并发性的下一代通信机制
  • 批准号:
    1565336
  • 财政年份:
    2016
  • 资助金额:
    $ 45.08万
  • 项目类别:
    Standard Grant
Bilateral BBSRC-NSF/BIO: Collaborative Research: ABI Development: Seamless Integration of Neuroscience Models and Tools with HPC - Easy Path to Supercomputing for Neuroscience
双边 BBSRC-NSF/BIO:合作研究:ABI 开发:神经科学模型和工具与 HPC 的无缝集成 - 神经科学超级计算的简单途径
  • 批准号:
    1458840
  • 财政年份:
    2015
  • 资助金额:
    $ 45.08万
  • 项目类别:
    Standard Grant
BIGDATA: F: DKM: Collaborative Research: Scalable Middleware for Managing and Processing Big Data on Next Generation HPC Systems
BIGDATA:F:DKM:协作研究:用于在下一代 HPC 系统上管理和处理大数据的可扩展中间件
  • 批准号:
    1447861
  • 财政年份:
    2014
  • 资助金额:
    $ 45.08万
  • 项目类别:
    Standard Grant
Collaborative Research SI2-SSE:Sustained Innovation in Acceleration of Molecular Dynamics on Future Computational Environments: Power to the People in the Cloud and on Accelerators
合作研究 SI2-SSE:未来计算环境中分子动力学加速的持续创新:为云端和加速器中的人们提供力量
  • 批准号:
    1148276
  • 财政年份:
    2012
  • 资助金额:
    $ 45.08万
  • 项目类别:
    Standard Grant
SHF: Large: Collaborative Research: Unified Runtime for Supporting Hybrid Programming Models on Heterogeneous Architecture.
SHF:大型:协作研究:支持异构架构上的混合编程模型的统一运行时。
  • 批准号:
    1213056
  • 财政年份:
    2012
  • 资助金额:
    $ 45.08万
  • 项目类别:
    Standard Grant

相似国自然基金

IGF-1R调控HIF-1α促进Th17细胞分化在甲状腺眼病发病中的机制研究
  • 批准号:
    82301258
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
CTCFL调控IL-10抑制CD4+CTL旁观者激活促口腔鳞状细胞癌新辅助免疫治疗抵抗机制研究
  • 批准号:
    82373325
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
RNA剪接因子PRPF31突变导致人视网膜色素变性的机制研究
  • 批准号:
    82301216
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
血管内皮细胞通过E2F1/NF-kB/IL-6轴调控巨噬细胞活化在眼眶静脉畸形中的作用及机制研究
  • 批准号:
    82301257
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于多元原子间相互作用的铝合金基体团簇调控与强化机制研究
  • 批准号:
    52371115
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目

相似海外基金

SI2-SSI: Collaborative Research: Einstein Toolkit Community Integration and Data Exploration
SI2-SSI:协作研究:Einstein Toolkit 社区集成和数据探索
  • 批准号:
    2114580
  • 财政年份:
    2020
  • 资助金额:
    $ 45.08万
  • 项目类别:
    Continuing Grant
Collaborative Research: SI2-SSI: Expanding Volunteer Computing
合作研究:SI2-SSI:扩展志愿者计算
  • 批准号:
    2039142
  • 财政年份:
    2020
  • 资助金额:
    $ 45.08万
  • 项目类别:
    Standard Grant
Collaborative Research: SI2-SSI: Expanding Volunteer Computing
合作研究:SI2-SSI:扩展志愿者计算
  • 批准号:
    2001752
  • 财政年份:
    2019
  • 资助金额:
    $ 45.08万
  • 项目类别:
    Standard Grant
Collaborative Research: NISC SI2-S2I2 Conceptualization of CFDSI: Model, Data, and Analysis Integration for End-to-End Support of Fluid Dynamics Discovery and Innovation
合作研究:NISC SI2-S2I2 CFDSI 概念化:模型、数据和分析集成,用于流体动力学发现和创新的端到端支持
  • 批准号:
    1743180
  • 财政年份:
    2018
  • 资助金额:
    $ 45.08万
  • 项目类别:
    Continuing Grant
Collaborative Research: NISC SI2-S2I2 Conceptualization of CFDSI: Model, Data, and Analysis Integration for End-to-End Support of Fluid Dynamics Discovery and Innovation
合作研究:NISC SI2-S2I2 CFDSI 概念化:模型、数据和分析集成,用于流体动力学发现和创新的端到端支持
  • 批准号:
    1743191
  • 财政年份:
    2018
  • 资助金额:
    $ 45.08万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了