OAC Core: Cost-Adaptive Monitoring and Real-Time Tuning at Function-Level
OAC核心:功能级成本自适应监控和实时调优
基本信息
- 批准号:2402542
- 负责人:
- 金额:$ 42.65万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2024
- 资助国家:美国
- 起止时间:2024-08-01 至 2026-07-31
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
This project aims to address the challenge of performance monitoring on supercomputers by developing a tool that provides function-level insights with minimal overhead, enabling real-time tuning of applications. The initiative addresses the gap in understanding computational practices within diverse scientific domains, thus aiding in informed decision-making for system design and numerical library optimization. This advancement promises to enhance the efficiency of existing supercomputing infrastructures and contributes to the NSF's mission by supporting scientific progress and educational diversity, ultimately catalyzing a broader spectrum of scientific breakthroughs.This project is designed to improve performance monitoring within high-performance computing. It aims to address the increasing complexity and diversity of applications spanning scientific research, engineering, big data, and artificial intelligence. The approach involves implementing function-level monitoring through dynamic binary instrumentation and managing the monitoring overhead with a heartbeat mechanism. Additionally, it integrates real-time tuning capabilities for optimizing numerical libraries at runtime. This endeavor seeks to enhance traditional job-level resource utilization monitoring tools significantly. The research will identify standard function calls, evaluate the instrumentation overhead, and develop and validate policies for controlling overhead and accuracy. It will also involve creating a performance benchmark for assessing real-time tuning. The intellectual merit of this project stems from its potential to provide a novel tool that offers a more precise resolution of application behaviors and enables real-time performance tuning. By introducing adaptive monitoring and real-time tuning at the function level for large computational platforms, this project aims to accelerate scientific progress. Furthermore, it promotes diversity and inclusivity by actively involving underrepresented minority groups, contributing to a more diverse and skilled workforce in high-performance computing.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
该项目旨在通过开发一种工具来解决超级计算机性能监控的挑战,该工具能够以最小的开销提供功能级见解,从而实现应用程序的实时调整。该倡议解决了理解不同科学领域内计算实践的差距,从而有助于系统设计和数值库优化的明智决策。这一进步有望提高现有超级计算基础设施的效率,并通过支持科学进步和教育多样性,最终促进更广泛的科学突破,为 NSF 的使命做出贡献。该项目旨在改善高性能计算中的性能监控。它旨在解决科学研究、工程、大数据和人工智能领域日益复杂和多样化的应用。该方法涉及通过动态二进制检测实现功能级监控,并通过心跳机制管理监控开销。此外,它还集成了实时调整功能,可在运行时优化数值库。这项工作旨在显着增强传统的工作级资源利用率监控工具。该研究将确定标准函数调用,评估仪器开销,并开发和验证控制开销和准确性的策略。它还将涉及创建用于评估实时调整的性能基准。该项目的智力优势源于其提供一种新颖工具的潜力,该工具可以更精确地解决应用程序行为并实现实时性能调整。通过在大型计算平台的功能层面引入自适应监控和实时调整,该项目旨在加速科学进步。此外,它还通过积极让代表性不足的少数群体参与来促进多样性和包容性,为高性能计算领域培养更加多元化和熟练的劳动力队伍做出贡献。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力优势和更广泛的评估进行评估,被认为值得支持。影响审查标准。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Yinzhi Wang其他文献
Performance Comparison of Julia Distributed Implementations of Dirichlet Process Mixture Models
Dirichlet 过程混合模型的 Julia 分布式实现的性能比较
- DOI:
10.1109/bigdata47090.2019.9005453 - 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
Ruizhu Huang;Weijia Xu;Yinzhi Wang;S. Liverani;A. Stapleton - 通讯作者:
A. Stapleton
(U-Th)/He thermochronology of metallic ore deposits in the Liaodong Peninsula: Implications for orefield evolution in northeast China
辽东半岛金属矿床(U-Th)/He热年代学:对中国东北地区矿田演化的启示
- DOI:
10.1016/j.oregeorev.2017.11.025 - 发表时间:
2018 - 期刊:
- 影响因子:3.3
- 作者:
Yinzhi Wang;Fei Wang;Lin Wu;Wenbei Shi;Liekun Yang - 通讯作者:
Liekun Yang
Automatic BLAS Offloading on Unified Memory Architecture: A Study on NVIDIA Grace-Hopper
统一内存架构上的自动 BLAS 卸载:NVIDIA Grace-Hopper 的研究
- DOI:
10.1145/3626203.3670561 - 发表时间:
2024 - 期刊:
- 影响因子:0
- 作者:
Junjie Li;Yinzhi Wang;Xiao Liang;Hang Liu - 通讯作者:
Hang Liu
Perspectives and Experiences Supporting Containers for Research Computing at the Texas Advanced Computing Center
德克萨斯高级计算中心支持研究计算容器的观点和经验
- DOI:
- 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
Erik Ferlanti;William J. Allen;Ernesto A. B. F. Lima;Yinzhi Wang;John Fonner - 通讯作者:
John Fonner
Optimizing GPU-Enhanced HPC System and Cloud Procurements for Scientific Workloads
优化 GPU 增强型 HPC 系统和科学工作负载的云采购
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
R. T. Evans;M. Cawood;Stephen Lien Harrell;Lei Huang;Si Liu;Chun;Amit Ruhela;Yinzhi Wang;Zhao Zhang - 通讯作者:
Zhao Zhang
Yinzhi Wang的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Yinzhi Wang', 18)}}的其他基金
Collaborative Research: Frameworks: Seismic COmputational Platform for Empowering Discovery (SCOPED)
合作研究:框架:增强发现能力的地震计算平台(SCOPED)
- 批准号:
2103494 - 财政年份:2021
- 资助金额:
$ 42.65万 - 项目类别:
Standard Grant
Elements: PASSPP: Provenance-Aware Scalable Seismic Data Processing with Portability
要素: PASSPP:具有可移植性的来源感知可扩展地震数据处理
- 批准号:
1931352 - 财政年份:2019
- 资助金额:
$ 42.65万 - 项目类别:
Standard Grant
相似国自然基金
高能核碰撞中重味产生研究
- 批准号:12375135
- 批准年份:2023
- 资助金额:52 万元
- 项目类别:面上项目
FOXC2调控FOXO3核内滞留的机制研究
- 批准号:32370760
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
细胞核内N-WASP调控RNA Pol II相分离影响转录过程的机制研究
- 批准号:32300571
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
玉米花粉二核三核期卵磷脂代谢基因挖掘与新型高频单倍体诱导系创制
- 批准号:32301914
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
吻内侧被盖核GABA能神经元调控持续稳定麻醉状态的作用及机制
- 批准号:32371033
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
相似海外基金
原位置宇宙線生成核種年代測定法による日本列島の第四紀地殻変動速度と時間変動の解明
利用原位宇宙线产生核素测年法阐明日本列岛第四纪地壳变形率和时间变化
- 批准号:
23K25420 - 财政年份:2024
- 资助金额:
$ 42.65万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
3本鎖DNA形成を基軸とした人工核酸の開発と遺伝子発現コントロール技術への新展開
基于三链DNA形成的人工核酸开发及基因表达调控技术新进展
- 批准号:
23K27301 - 财政年份:2024
- 资助金额:
$ 42.65万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
3本鎖DNA形成を基軸とした人工核酸の開発と遺伝子発現コントロール技術への新展開
基于三链DNA形成的人工核酸开发及基因表达调控技术新进展
- 批准号:
23H02610 - 财政年份:2023
- 资助金额:
$ 42.65万 - 项目类别:
Grant-in-Aid for Scientific Research (B)