SHF: Small: Collaborative Research: Experimental-based Research on Effective Models of Parallel Application Execution Time, Power, and Resilience
SHF:小型:协作研究:基于实验的并行应用程序执行时间、功耗和弹性有效模型的研究
基本信息
- 批准号:1618776
- 负责人:
- 金额:$ 20万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2016
- 资助国家:美国
- 起止时间:2016-09-01 至 2021-08-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
The increasing scale and complexity of parallel systems present enormous challenges to parallel applications. One such challenge is the integration and balancing of execution time, power, and resilience for parallel applications. The MuMMI_R project seeks to advance the scientific understanding of the interdependence among power, execution time, and resilience for various application-system configurations. The broader impacts include training of undergraduate and graduate students and the participation in programs such as REUs, CREU, and DREU to increase the participation of students from underrepresented groups in the project.The MuMMI_R research aims to develop effective techniques for quantifying the complicated tradeoffs among execution time, power, and resilience, and to provide a tuning mechanism for user-defined metrics. Toward this goal, the research focuses on three interrelated research thrusts: (1) experimental research to conduct extensive experiments of a suite of representative application under different resilience strategies on various parallel architectures, (2) application-level co-modeling to develop analytical models and colored Petri net based simulation for quantifying the correlations and tradeoffs between execution time, power, and resilience, and (3) model-based analysis to examine the tradeoffs among resilience, execution time, and power for different application-system configurations, and to tune application implementations for a user-defined target metric on current and future systems. The resulting framework, MuMMI_R, will provide valuable insights into application-system interactions and aid in the design of efficient parallel applications (with respect to execution time, power requirements, and resilience), runtime systems, and computer architectures.
并行系统规模和复杂性的不断增加给并行应用带来了巨大的挑战。其中一项挑战是并行应用程序的执行时间、功率和弹性的集成和平衡。 MuMMI_R 项目旨在促进对各种应用系统配置的功率、执行时间和弹性之间相互依赖关系的科学理解。更广泛的影响包括培训本科生和研究生以及参与 REU、CREU 和 DREU 等项目,以增加来自代表性不足群体的学生对项目的参与。 MuMMI_R 研究旨在开发有效的技术来量化执行时间、功率和弹性,并为用户定义的指标提供调整机制。为了实现这一目标,该研究重点关注三个相互关联的研究重点:(1)实验研究,在各种并行架构上的不同弹性策略下对一组代表性应用程序进行广泛的实验,(2)应用程序级联合建模以开发分析模型以及基于彩色 Petri 网的模拟,用于量化执行时间、功率和弹性之间的相关性和权衡,以及 (3) 基于模型的分析,用于检查不同应用程序系统配置的弹性、执行时间和功率之间的权衡,并调整应用程序实现用于当前和未来系统的用户定义的目标指标。由此产生的框架 MuMMI_R 将为应用程序系统交互提供有价值的见解,并帮助设计高效的并行应用程序(在执行时间、功耗要求和弹性方面)、运行时系统和计算机体系结构。
项目成果
期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Union: An Automatic Workload Manager for Accelerating Network Simulation
Union:用于加速网络仿真的自动工作负载管理器
- DOI:10.1109/ipdps47924.2020.00089
- 发表时间:2020-05
- 期刊:
- 影响因子:0
- 作者:Wang, Xin;Mubarak, Misbah;Kang, Yao;Ross, Robert B.;Lan, Zhiling
- 通讯作者:Lan, Zhiling
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Zhiling Lan其他文献
Interpretable Modeling of Deep Reinforcement Learning Driven Scheduling
深度强化学习驱动调度的可解释建模
- DOI:
10.1109/mascots59514.2023.10387651 - 发表时间:
2023-10-16 - 期刊:
- 影响因子:0
- 作者:
Boyang Li;Zhiling Lan;M. Papka - 通讯作者:
M. Papka
Surrogate Modeling for HPC Application Iteration Times Forecasting with Network Features
具有网络特征的 HPC 应用程序迭代时间预测的代理建模
- DOI:
- 发表时间:
2024 - 期刊:
- 影响因子:0
- 作者:
Xiongxiao Xu;Kevin A. Brown;Tanwi Mallick;Xin Wang;Elkin Cruz;Robert B. Ross;Christopher D. Carothers;Zhiling Lan;Kai Shu - 通讯作者:
Kai Shu
Integrating Mamba and Transformer for Long-Short Range Time Series Forecasting
集成 Mamba 和 Transformer 进行长短期时间序列预测
- DOI:
10.48550/arxiv.2404.14757 - 发表时间:
2024-04-23 - 期刊:
- 影响因子:0
- 作者:
Xiongxiao Xu;Yueqing Liang;Baixiang Huang;Zhiling Lan;Kai Shu - 通讯作者:
Kai Shu
Evaluation of oral Lanzhou lamb rotavirus vaccine via passive transfusion with CD4(+)/CD8(+) T lymphocytes.
CD4( )/CD8( ) T淋巴细胞被动输注兰州羔羊轮状病毒口服疫苗的评价
- DOI:
- 发表时间:
2016 - 期刊:
- 影响因子:5
- 作者:
Jialiang Du;Zhiling Lan;Yueshuai Liu;Yan Liu;Qingchuan Yu;Yanchao Li;T. Guo - 通讯作者:
T. Guo
Inhalation Study of Mycobacteriophage D29 Aerosol for Mice by Endotracheal Route and Nose-Only Exposure.
通过气管内途径和仅鼻子暴露对小鼠分枝杆菌噬菌体 D29 气雾剂的吸入研究。
- DOI:
10.1089/jamp.2015.1233 - 发表时间:
2016-10-01 - 期刊:
- 影响因子:0
- 作者:
Ke;Wenhui Yang;Xiao;L. Cong;Na Li;Yun Li;Zhan;Zhe Yin;Zhiling Lan - 通讯作者:
Zhiling Lan
Zhiling Lan的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Zhiling Lan', 18)}}的其他基金
SHF:Small:Intelligent Management of Hybrid Workloads for Extreme Scale Computing
SHF:Small:超大规模计算混合工作负载的智能管理
- 批准号:
2413597 - 财政年份:2023
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
Collaborative Research: PPoSS: Planning: SEEr: A Scalable, Energy Efficient HPC Environment for AI-Enabled Science
合作研究:PPoSS:规划:SEEr:面向人工智能科学的可扩展、节能的 HPC 环境
- 批准号:
2119294 - 财政年份:2021
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
SHF:Small:Intelligent Management of Hybrid Workloads for Extreme Scale Computing
SHF:Small:超大规模计算混合工作负载的智能管理
- 批准号:
2109316 - 财政年份:2021
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
CSR: Small: IRON: Reducing Workload Interference on Massively Parallel Platforms
CSR:小:IRON:减少大规模并行平台上的工作负载干扰
- 批准号:
1717763 - 财政年份:2017
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
SHF: CSR: Small: Toward Smart HPC through Active Learning and Intelligent Scheduling
SHF:CSR:小型:通过主动学习和智能调度迈向智能 HPC
- 批准号:
1422009 - 财政年份:2014
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
SHF: CSR: Small: A Cooperative Framework for Topology Awareness on Large-Scale Systems
SHF:CSR:小型:大型系统拓扑意识的合作框架
- 批准号:
1320125 - 财政年份:2013
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
Collaborative Research: Towards Petascale Cosmological Simulations
合作研究:迈向千万亿次宇宙学模拟
- 批准号:
0904670 - 财政年份:2009
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
CSR-PSCE,SM: Recovery Aware Parallel Computing
CSR-PSCE,SM:恢复感知并行计算
- 批准号:
0834514 - 财政年份:2008
- 资助金额:
$ 20万 - 项目类别:
Continuing Grant
CSR/AES: Enhancing Application Robustness via Adaptive and Cooperative Methods
CSR/AES:通过自适应和协作方法增强应用程序的稳健性
- 批准号:
0720549 - 财政年份:2007
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
相似国自然基金
小分子代谢物Catechin与TRPV1相互作用激活外周感觉神经元介导尿毒症瘙痒的机制研究
- 批准号:82371229
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
DHEA抑制小胶质细胞Fis1乳酸化修饰减轻POCD的机制
- 批准号:82301369
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
异常激活的小胶质细胞通过上调CTSS抑制微血管特异性因子MFSD2A表达促进1型糖尿病视网膜病变的免疫学机制研究
- 批准号:82370827
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
SETDB1调控小胶质细胞功能及参与阿尔茨海默病发病机制的研究
- 批准号:82371419
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
PTBP1驱动H4K12la/BRD4/HIF1α复合物-PKM2正反馈环路促进非小细胞肺癌糖代谢重编程的机制研究及治疗方案探索
- 批准号:82303616
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
相似海外基金
Collaborative Research: SHF: Small: LEGAS: Learning Evolving Graphs At Scale
协作研究:SHF:小型:LEGAS:大规模学习演化图
- 批准号:
2331301 - 财政年份:2024
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
Collaborative Research: SHF: Small: Efficient and Scalable Privacy-Preserving Neural Network Inference based on Ciphertext-Ciphertext Fully Homomorphic Encryption
合作研究:SHF:小型:基于密文-密文全同态加密的高效、可扩展的隐私保护神经网络推理
- 批准号:
2412357 - 财政年份:2024
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
Collaborative Research: SHF: Small: LEGAS: Learning Evolving Graphs At Scale
协作研究:SHF:小型:LEGAS:大规模学习演化图
- 批准号:
2331302 - 财政年份:2024
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
Collaborative Research: SHF: Small: Technical Debt Management in Dynamic and Distributed Systems
合作研究:SHF:小型:动态和分布式系统中的技术债务管理
- 批准号:
2232720 - 财政年份:2023
- 资助金额:
$ 20万 - 项目类别:
Standard Grant
Collaborative Research: SHF: Small: Quasi Weightless Neural Networks for Energy-Efficient Machine Learning on the Edge
合作研究:SHF:小型:用于边缘节能机器学习的准失重神经网络
- 批准号:
2326895 - 财政年份:2023
- 资助金额:
$ 20万 - 项目类别:
Standard Grant