SHF:Small: Collaborative Research: Understanding, Modeling, and System Support for HPC Data Reduction
SHF:Small:协作研究:HPC 数据缩减的理解、建模和系统支持
基本信息
- 批准号:1813081
- 负责人:
- 金额:$ 19.99万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2018
- 资助国家:美国
- 起止时间:2018-07-01 至 2022-06-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
High-performance computing (HPC) enables high fidelity science missions that capture microscopic phenomena that were impossible to study in the past. In order to allow science missions to be accomplished in a timely manner, it is critical to manage the massive datasets that HPC generates in efficient way so that the time to knowledge can be shortened. This project aims to understand the role and usage of data reduction in large computational applications. Research and educational opportunities are provided to train a new generation of computer scientists and engineers, particularly those under-represented groups, to ensure the U.S. competitiveness in high-performance computing. The goal of this project is to address a number of critical gaps in using data reduction for HPC-based science missions. In particular, 1) the impact of reduction error on scientific discovery is mathematically and experimentally studied; 2) analytical models are formulated to estimate the reduction performance, without forcing users to compress the full data. For data-intensive applications, having this capability is important so that domain scientists do not have to go through the cumbersome trial-and-error process to figure out what reduction can offer; 3) the project provides potentially more efficient data analysis and reduction capabilities for exascale computing. The integrated research activities in this NSF project will significantly improve the understanding and usage of data reduction on future systems.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
高性能计算 (HPC) 能够实现高保真科学任务,捕捉过去无法研究的微观现象。为了及时完成科学任务,有效管理 HPC 生成的海量数据集以缩短获得知识的时间至关重要。该项目旨在了解数据缩减在大型计算应用中的作用和用法。提供研究和教育机会来培训新一代计算机科学家和工程师,特别是那些代表性不足的群体,以确保美国在高性能计算领域的竞争力。 该项目的目标是解决在基于 HPC 的科学任务中使用数据缩减的一些关键差距。特别是,1)通过数学和实验研究了减少误差对科学发现的影响; 2)制定分析模型来估计缩减性能,而不强迫用户压缩完整数据。对于数据密集型应用程序来说,拥有这种能力非常重要,这样领域科学家就不必经历繁琐的试错过程来找出减少可以提供什么; 3) 该项目为百亿亿次计算提供了潜在的更高效的数据分析和缩减能力。该 NSF 项目中的综合研究活动将显着提高对未来系统数据缩减的理解和使用。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力价值和更广泛的影响审查标准进行评估,被认为值得支持。
项目成果
期刊论文数量(9)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Exploring Transfer Learning to Reduce Training Overhead of HPC Data in Machine Learning
- DOI:10.1109/nas.2019.8834723
- 发表时间:2019-08
- 期刊:
- 影响因子:0
- 作者:Tong Liu;Shakeel Alibhai;Jinzhen Wang;Qing Liu;Xubin He;Chentao Wu
- 通讯作者:Tong Liu;Shakeel Alibhai;Jinzhen Wang;Qing Liu;Xubin He;Chentao Wu
Zperf: A Statistical Gray-Box Approach to Performance Modeling and Extrapolation for Scientific Lossy Compression
Zperf:科学有损压缩性能建模和外推的统计灰盒方法
- DOI:10.1109/tc.2023.3257517
- 发表时间:2023
- 期刊:
- 影响因子:3.7
- 作者:Wang, Jinzhen;Chen, Qi;Liu, Tong;Liu, Qing;He, Xubin
- 通讯作者:He, Xubin
EC-Fusion: An Efficient Hybrid Erasure Coding Framework to Improve Both Application and Recovery Performance in Cloud Storage Systems
- DOI:10.1109/ipdps47924.2020.00029
- 发表时间:2020-05
- 期刊:
- 影响因子:0
- 作者:Han Qiu;Chentao Wu;Jie Li;M. Guo;Tong Liu;Xubin He;Yuanyuan Dong;Yafei Zhao
- 通讯作者:Han Qiu;Chentao Wu;Jie Li;M. Guo;Tong Liu;Xubin He;Yuanyuan Dong;Yafei Zhao
Locality-based transfer learning on compression autoencoder for efficient scientific data lossy compression
- DOI:10.1016/j.jnca.2022.103452
- 发表时间:2022-06
- 期刊:
- 影响因子:0
- 作者:Nan Wang;Tong Liu;Jinzhen Wang;Qing Liu;Shakeel Alibhai;Xubin He
- 通讯作者:Nan Wang;Tong Liu;Jinzhen Wang;Qing Liu;Shakeel Alibhai;Xubin He
High-Ratio Lossy Compression: Exploring the Autoencoder to Compress Scientific Data
- DOI:10.1109/tbdata.2021.3066151
- 发表时间:2023-02
- 期刊:
- 影响因子:7.2
- 作者:Tong Liu;Jinzhen Wang;Qing Liu;Shakeel Alibhai;Tao Lu;Xubin He
- 通讯作者:Tong Liu;Jinzhen Wang;Qing Liu;Shakeel Alibhai;Tao Lu;Xubin He
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Xubin He其他文献
An Extensible I/O Performance Analysis Framework for Distributed Environments
分布式环境的可扩展 I/O 性能分析框架
- DOI:
10.1007/978-3-642-03869-3_9 - 发表时间:
2009 - 期刊:
- 影响因子:0
- 作者:
Benjamin Eckart;Xubin He;H. Ong;S. Scott - 通讯作者:
S. Scott
Reducing Fragmentation for In-line Deduplication Backup Storage via Exploiting Backup History and Cache Knowledge
通过利用备份历史记录和缓存知识减少内联重复数据删除备份存储的碎片
- DOI:
10.1109/tpds.2015.2410781 - 发表时间:
2016-03 - 期刊:
- 影响因子:0
- 作者:
Min Fu;Dan Feng;Yu Hua;Xubin He;Zuoning Chen;Jingning Liu;Wen Xia;Fangting Huang;Qing Liu - 通讯作者:
Qing Liu
Active/active replication for highly available HPC system services
高可用性 HPC 系统服务的主动/主动复制
- DOI:
10.1109/ares.2006.23 - 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
C. Engelmann;S. Scott;C. Leangsuksun;Xubin He - 通讯作者:
Xubin He
An efficient design for fast memory registration in RDMA
RDMA 中快速内存注册的高效设计
- DOI:
10.1016/j.jnca.2008.07.008 - 发表时间:
2009 - 期刊:
- 影响因子:8.7
- 作者:
Li Ou;Xubin He;Jizhong Han - 通讯作者:
Jizhong Han
StoreRush: An Application-Level Approach to Harvesting Idle Storage in a Best Effort Environment
StoreRush:一种在尽力环境中收集空闲存储的应用程序级方法
- DOI:
10.1016/j.procs.2017.05.005 - 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
Qing Liu;N. Podhorszki;J. Choi;Jeremy S. Logan;M. Wolf;S. Klasky;T. Kurç;Xubin He - 通讯作者:
Xubin He
Xubin He的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Xubin He', 18)}}的其他基金
Collaborative Research: Elements: ProDM: Developing A Unified Progressive Data Management Library for Exascale Computational Science
协作研究:要素:ProDM:为百亿亿次计算科学开发统一的渐进式数据管理库
- 批准号:
2311758 - 财政年份:2023
- 资助金额:
$ 19.99万 - 项目类别:
Standard Grant
Collaborative Research: SHF: Small: Rethinking Performance Variation for Emerging Applications - An Application-centric and Cross-layer Approach
协作研究:SHF:小型:重新思考新兴应用程序的性能变化 - 以应用程序为中心的跨层方法
- 批准号:
2134203 - 财政年份:2022
- 资助金额:
$ 19.99万 - 项目类别:
Standard Grant
SHF:Small: Collaborative Research: Tailoring Memory Systems for Data-Intensive HPC Applications
SHF:Small:协作研究:为数据密集型 HPC 应用定制内存系统
- 批准号:
1717660 - 财政年份:2017
- 资助金额:
$ 19.99万 - 项目类别:
Standard Grant
CSR: Small: Cost Effective, High Performance Solutions Using Erasure Codes for Big Data Management in Large Data Centers
CSR:小型:在大型数据中心使用纠删码进行大数据管理的经济高效、高性能解决方案
- 批准号:
1700719 - 财政年份:2016
- 资助金额:
$ 19.99万 - 项目类别:
Standard Grant
SHF: Small: ASF: An Adaptive Scaling Framework for High Scalability of XOR-Based RAID Systems
SHF:小型:ASF:基于 XOR 的 RAID 系统的高可扩展性的自适应扩展框架
- 批准号:
1702474 - 财政年份:2016
- 资助金额:
$ 19.99万 - 项目类别:
Standard Grant
SHF: Small: ASF: An Adaptive Scaling Framework for High Scalability of XOR-Based RAID Systems
SHF:小型:ASF:基于 XOR 的 RAID 系统的高可扩展性的自适应扩展框架
- 批准号:
1320349 - 财政年份:2014
- 资助金额:
$ 19.99万 - 项目类别:
Standard Grant
CSR: Small: Cost Effective, High Performance Solutions Using Erasure Codes for Big Data Management in Large Data Centers
CSR:小型:在大型数据中心使用纠删码进行大数据管理的经济高效、高性能解决方案
- 批准号:
1218960 - 财政年份:2012
- 资助金额:
$ 19.99万 - 项目类别:
Standard Grant
Collaborative Research: Cross-Layer Exploration of Non-Volatile Solid-State Memories to Achieve Effective I/O Stack for High-Performance Computing Systems
协作研究:非易失性固态存储器的跨层探索,为高性能计算系统实现有效的 I/O 堆栈
- 批准号:
1102605 - 财政年份:2010
- 资助金额:
$ 19.99万 - 项目类别:
Standard Grant
CSR---PDOS: A Benchmarking Framework for High-Availability Distributed Storage Systems
CSR---PDOS:高可用分布式存储系统的基准框架
- 批准号:
1102629 - 财政年份:2010
- 资助金额:
$ 19.99万 - 项目类别:
Continuing Grant
RUI: Automatic Identification of I/O Bottleneck and Run-time Optimization for Cluster Virtualization
RUI:集群虚拟化I/O瓶颈自动识别与运行时优化
- 批准号:
1102624 - 财政年份:2010
- 资助金额:
$ 19.99万 - 项目类别:
Standard Grant
相似国自然基金
诊疗一体化PS-Hc@MB协同训练介导脑小血管病康复的作用及机制研究
- 批准号:82372561
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
非小细胞肺癌MECOM/HBB通路介导血红素代谢异常并抑制肿瘤起始细胞铁死亡的机制研究
- 批准号:82373082
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
基于胆碱能皮层投射纤维探讨脑小血管病在帕金森病步态障碍中的作用及机制研究
- 批准号:82301663
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
关于丢番图方程小素数解上界估计的研究
- 批准号:12301005
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
嗅球小胶质细胞P2X7受体在变应性鼻炎发生帕金森病样改变中的作用与机制研究
- 批准号:82371119
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
相似海外基金
Collaborative Research: SHF: Small: LEGAS: Learning Evolving Graphs At Scale
协作研究:SHF:小型:LEGAS:大规模学习演化图
- 批准号:
2331302 - 财政年份:2024
- 资助金额:
$ 19.99万 - 项目类别:
Standard Grant
Collaborative Research: SHF: Small: LEGAS: Learning Evolving Graphs At Scale
协作研究:SHF:小型:LEGAS:大规模学习演化图
- 批准号:
2331301 - 财政年份:2024
- 资助金额:
$ 19.99万 - 项目类别:
Standard Grant
Collaborative Research: SHF: Small: Efficient and Scalable Privacy-Preserving Neural Network Inference based on Ciphertext-Ciphertext Fully Homomorphic Encryption
合作研究:SHF:小型:基于密文-密文全同态加密的高效、可扩展的隐私保护神经网络推理
- 批准号:
2412357 - 财政年份:2024
- 资助金额:
$ 19.99万 - 项目类别:
Standard Grant
Collaborative Research: SHF: Small: Technical Debt Management in Dynamic and Distributed Systems
合作研究:SHF:小型:动态和分布式系统中的技术债务管理
- 批准号:
2232720 - 财政年份:2023
- 资助金额:
$ 19.99万 - 项目类别:
Standard Grant
Collaborative Research: SHF: Small: Quasi Weightless Neural Networks for Energy-Efficient Machine Learning on the Edge
合作研究:SHF:小型:用于边缘节能机器学习的准失重神经网络
- 批准号:
2326895 - 财政年份:2023
- 资助金额:
$ 19.99万 - 项目类别:
Standard Grant