CSR: Medium: Pythia: An Application Analysis and Online Modeling Based Prediction Framework for Scalable Resource Management

CSR:中:Pythia:基于应用分析和在线建模的可扩展资源管理预测框架

基本信息

项目摘要

Computer applications that process large amounts of information are becoming common in a variety of science domains, such as High-Speed Physics, Economics, Genomics, Astronomy, and Meteorology. The overall goal of this project is to design software tools and technologies to support such applications efficiently on advanced computing systems. Moreover, the hardware that is used to implement such advanced systems often boasts of different types of resources, e.g., a conventional computer processor running alongside specialized graphic processing units, and this heterogeneity presents a major challenge when running the applications at the needed large scale. Having a better understanding of the applications behavior on the emerging hardware is key to sustaining these systems. To this end, the project designs and develops Pythia, software that models and predicts how applications would behave on given hardware. This information is then used to better utilize the resources, and achieve scalable and high performance computing systems.The intellectual value of this research involves three intermediate research goals. 1) Design an accurate application classifier using compile-time program analysis that captures workflow behavior and application characteristics, and provides detailed insights into expected runtime application interactions. 2) Design and develop an accurate simulation model that incorporates workflow and application characteristics into a heuristics engine to predict how the application will perform under given conditions and resources. 3) Design a distributed, flexible, efficient, and easy-to-use online oracle framework that captures the infrastructure heterogeneity and integrates with live systems to predict application behavior, which in turn can help guide application-attuned resource scheduling and management. Completion of the project will create tools and technologies for realization of more efficient and scalable computing systems. This work impacts a broad range of disciplines that regularly employ high-performance large-scale computing systems, especially for data-driven discovery. Consequently, use of Pythia will reduce the time-to-solution for modern and emerging applications, and therefore directly affect our way of life. The educational activities, which include recruiting and mentoring women and minority students, will help produce graduates with highly marketable skill sets. The integration of the research discoveries and software tools, which will be open source and made public, into the educational curriculum will help capture the interest of the next generation of computer scientists.
处理大量信息的计算机应用程序在高速物理、经济学、基因组学、天文学和气象学等各种科学领域中变得越来越普遍。该项目的总体目标是设计软件工具和技术,以在先进计算系统上有效地支持此类应用程序。此外,用于实现此类先进系统的硬件通常拥有不同类型的资源,例如与专用图形处理单元一起运行的传统计算机处理器,而这种异构性在以所需的大规模运行应用程序时提出了重大挑战。更好地了解新兴硬件上的应用程序行为是维持这些系统的关键。为此,该项目设计并开发了 Pythia,该软件可以建模并预测应用程序在给定硬件上的行为方式。然后利用这些信息更好地利用资源,实现可扩展的高性能计算系统。这项研究的智力价值涉及三个中间研究目标。 1) 使用编译时程序分析设计准确的应用程序分类器,捕获工作流行为和应用程序特征,并提供对预期运行时应用程序交互的详细见解。 2) 设计和开发精确的模拟模型,将工作流程和应用程序特征合并到启发式引擎中,以预测应用程序在给定条件和资源下的执行情况。 3)设计一个分布式、灵活、高效、易于使用的在线预言机框架,捕获基础设施异构性并与实时系统集成以预测应用程序行为,从而有助于指导应用程序调整的资源调度和管理。该项目的完成将创建用于实现更高效和可扩展的计算系统的工具和技术。这项工作影响了经常使用高性能大规模计算系统的广泛学科,特别是数据驱动的发现。因此,使用 Pythia 将缩短现代和新兴应用程序的解决时间,从而直接影响我们的生活方式。这些教育活动包括招募和指导女性和少数民族学生,将有助于培养具有高度市场化技能的毕业生。将开源和公开的研究发现和软件工具整合到教育课程中将有助于吸引下一代计算机科学家的兴趣。

项目成果

期刊论文数量(30)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Slimmer: Weight Loss Secrets for Docker Registries
Simmer:Docker 注册表的减肥秘密
BESPOKV: Application Tailored Scale-Out Key-Value Stores.
BESPOKV:应用程序定制的横向扩展键值存储。
  • DOI:
  • 发表时间:
    2018-11
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Anwar, Ali;Cheng, Yue;Huang, Hai;Lee, Dongyoon;Han, Jingoo;Sim, Hyogi;Douglis, Fred;Butt, Ali R.
  • 通讯作者:
    Butt, Ali R.
Finding and counting tree-like subgraphs using MapReduce
使用 MapReduce 查找和计算树状子图
  • DOI:
    10.1109/tmscs.2017.2768426
  • 发表时间:
    2017-10
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Zhao, Zhao;Chen, Langshi;Avram, Mihai;Li, Meng;Wang, Guanying;Butt, Ali;Khan, Maleq;Marathe, Madhav;Qiu, Judy;Vullikanti, Anil
  • 通讯作者:
    Vullikanti, Anil
Large-Scale Analysis of the Docker Hub Dataset
Docker Hub 数据集的大规模分析
Toward Scalable Monitoring on Large-Scale Storage for Software Defined Cyberinfrastructure
面向软件定义网络基础设施的大规模存储的可扩展监控
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Ali Butt其他文献

Vaccines against chicken coccidiosis with particular reference to previous decade: progress, challenges, and opportunities
鸡球虫病疫苗,特别是过去十年:进展、挑战和机遇
  • DOI:
    10.1007/s00436-022-07612-6
  • 发表时间:
    2022-10
  • 期刊:
  • 影响因子:
    2
  • 作者:
    Tean Zaheer;R. Z. Abbas;Muhammad Imran;A. Abbas;Ali Butt;Sarfraz Aslam;Jameel Ahmad
  • 通讯作者:
    Jameel Ahmad

Ali Butt的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Ali Butt', 18)}}的其他基金

Collaborative Research: CNS Core: Medium:HardLambda: A new FaaS Abstraction for Cross-Stack Resource Management in Disaggregated Datacenters
协作研究:CNS 核心:Medium:HardLambda:分解数据中心跨堆栈资源管理的新 FaaS 抽象
  • 批准号:
    2106634
  • 财政年份:
    2021
  • 资助金额:
    $ 75万
  • 项目类别:
    Standard Grant
SPX: Collaborative Research: Cross-stack Memory Optimizations for Boosting I/O Performance of Deep Learning HPC Applications
SPX:协作研究:用于提升深度学习 HPC 应用程序 I/O 性能的跨堆栈内存优化
  • 批准号:
    1919113
  • 财政年份:
    2019
  • 资助金额:
    $ 75万
  • 项目类别:
    Standard Grant
Workshop on Data Storage Research Vision
数据存储研究愿景研讨会
  • 批准号:
    1829096
  • 财政年份:
    2018
  • 资助金额:
    $ 75万
  • 项目类别:
    Standard Grant
CSR: Small: Collaborative Research: Scalable Fine-Grained Cloud Monitoring for Empowering IoT
CSR:小型:协作研究:支持物联网的可扩展细粒度云监控
  • 批准号:
    1615411
  • 财政年份:
    2016
  • 资助金额:
    $ 75万
  • 项目类别:
    Standard Grant
CSR: Small: Collaborative Research: Scalable Fine-Grained Cloud Monitoring for Empowering IoT
CSR:小型:协作研究:支持物联网的可扩展细粒度云监控
  • 批准号:
    1615411
  • 财政年份:
    2016
  • 资助金额:
    $ 75万
  • 项目类别:
    Standard Grant
Student Travel Support for IEEE 23rd International Symposium on Modelling, Analysis and Simulation of Computer and Telecommunication Systems (MASCOTS 2015)
IEEE 第 23 届计算机和电信系统建模、分析和仿真国际研讨会 (MASCOTS 2015) 学生旅行支持
  • 批准号:
    1541504
  • 财政年份:
    2015
  • 资助金额:
    $ 75万
  • 项目类别:
    Standard Grant
DC: Small: Collaborative Research: Exploring Energy-Reliability Trade-offs in Data Storage Systems
DC:小型:协作研究:探索数据存储系统中的能源可靠性权衡
  • 批准号:
    1016408
  • 财政年份:
    2010
  • 资助金额:
    $ 75万
  • 项目类别:
    Standard Grant
Increasing Student Participation in Cluster Computing through IEEE Cluster 2010 Attendance
通过出席 IEEE Cluster 2010 提高学生对集群计算的参与
  • 批准号:
    1049858
  • 财政年份:
    2010
  • 资助金额:
    $ 75万
  • 项目类别:
    Standard Grant
CSR: Small: Towards Realizing Cloud HPC: An Adaptive Programming Model for Accelerator-based Clusters
CSR:小:迈向实现云 HPC:基于加速器的集群的自适应编程模型
  • 批准号:
    1016793
  • 财政年份:
    2010
  • 资助金额:
    $ 75万
  • 项目类别:
    Standard Grant
U.S. - Pakistan International Planning Visit: Economical Computing Substrate for Developing Regions
美国-巴基斯坦国际规划访问:发展中地区的经济计算基板
  • 批准号:
    0940048
  • 财政年份:
    2009
  • 资助金额:
    $ 75万
  • 项目类别:
    Standard Grant

相似国自然基金

基于机器学习和经典电动力学研究中等尺寸金属纳米粒子的量子表面等离激元
  • 批准号:
    22373002
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
基于挥发性分布和氧化校正的大气半/中等挥发性有机物来源解析方法构建
  • 批准号:
    42377095
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
中等质量黑洞附近的暗物质分布及其IMRI系统引力波回波探测
  • 批准号:
    12365008
  • 批准年份:
    2023
  • 资助金额:
    32 万元
  • 项目类别:
    地区科学基金项目
复合低维拓扑材料中等离激元增强光学响应的研究
  • 批准号:
    12374288
  • 批准年份:
    2023
  • 资助金额:
    52 万元
  • 项目类别:
    面上项目
中等垂直风切变下非对称型热带气旋快速增强的物理机制研究
  • 批准号:
    42305004
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Collaborative Research: AF: Medium: Fast Combinatorial Algorithms for (Dynamic) Matchings and Shortest Paths
合作研究:AF:中:(动态)匹配和最短路径的快速组合算法
  • 批准号:
    2402284
  • 财政年份:
    2024
  • 资助金额:
    $ 75万
  • 项目类别:
    Continuing Grant
Collaborative Research: AF: Medium: The Communication Cost of Distributed Computation
合作研究:AF:媒介:分布式计算的通信成本
  • 批准号:
    2402835
  • 财政年份:
    2024
  • 资助金额:
    $ 75万
  • 项目类别:
    Continuing Grant
Collaborative Research: SHF: Medium: Enabling Graphics Processing Unit Performance Simulation for Large-Scale Workloads with Lightweight Simulation Methods
合作研究:SHF:中:通过轻量级仿真方法实现大规模工作负载的图形处理单元性能仿真
  • 批准号:
    2402804
  • 财政年份:
    2024
  • 资助金额:
    $ 75万
  • 项目类别:
    Standard Grant
Collaborative Research: AF: Medium: The Communication Cost of Distributed Computation
合作研究:AF:媒介:分布式计算的通信成本
  • 批准号:
    2402836
  • 财政年份:
    2024
  • 资助金额:
    $ 75万
  • 项目类别:
    Continuing Grant
Collaborative Research: CIF: Medium: Snapshot Computational Imaging with Metaoptics
合作研究:CIF:Medium:Metaoptics 快照计算成像
  • 批准号:
    2403123
  • 财政年份:
    2024
  • 资助金额:
    $ 75万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了