OAC Core: LABIOS: Storage Acceleration via Data Labeling and Asynchronous I/O

OAC 核心:LABIOS:通过数据标签和异步 I/O 进行存储加速

基本信息

  • 批准号:
    2313154
  • 负责人:
  • 金额:
    $ 60万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2023
  • 资助国家:
    美国
  • 起止时间:
    2023-08-01 至 2026-07-31
  • 项目状态:
    未结题

项目摘要

Data is everywhere, and it is growing exponentially. Data-intensive computing is a field that deals with processing and analyzing massive amounts of data for various purposes, such as scientific discovery, business intelligence, social media, and health care. However, storing and accessing data efficiently and effectively is a major challenge for data-intensive computing. Current storage systems are not designed to handle the diverse and complex data needs of different applications. They are slow, rigid, and wasteful. This project introduces a new way of managing data that overcomes these limitations. It develops a new data representation and a companion storage system that are faster, more flexible, and more scalable than existing solutions. This project also shows how this new approach improves the performance and functionality of various applications in different application domains, such as scientific computing, deep learning, and microservices. It advances the state-of-the-art in data-intensive computing and serves the national interest by enhancing scientific productivity and output, increasing the scalability and reliability of scientific applications that handle massive and complex data sets, and facilitating the collaboration and communication among scientists from different disciplines by improving the compatibility of scientific applications that use different data formats, platforms, and protocols. This project can foster interdisciplinary research and innovation. It also supports education and diversity in computing and data science by creating a well-trained workforce and enhancing the existing curricula and research programs.The goal of this project is to develop and evaluate a new input/output (I/O) paradigm for data-intensive computing based on the concept of a Label and a system called LABIOS. A Label is a data unit that encapsulates an operation and a pointer to its input data. LABIOS is a distributed storage system that executes Labels asynchronously and independently on servers that support tiered storage (e.g., non-volatile memory express (NVMe), solid state drive (SSD), hard disk drive (HDD), etc.). This project investigates how to design and implement LABIOS to provide active storage semantics, software defined storage semantics, and in-situ and in-transit analytics. It explores how to use LABIOS to support elastic and dynamic resource provisioning, integrated storage access, and programmable storage application programming interfaces (APIs). The performance and functionality of LABIOS are evaluated using various applications and workloads from scientific and Big Data domains, such as scientific computing, deep learning, and microservices; and how LABIOS improves the I/O efficiency and effectiveness of these applications and workloads are demonstrated. This project also analyzes the implications of the new I/O paradigm for the existing high-performance computing (HPC) ecosystem. It contributes to the advancement of data-intensive computing by providing a novel data representation and a scalable storage system that can address the diverse and complex data requirements of large-scale applications.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
数据无处不在,而且呈指数级增长。数据密集型计算是一个处理和分析大量数据以用于各种目的的领域,例如科学发现、商业智能、社交媒体和医疗保健。然而,高效且有效地存储和访问数据是数据密集型计算的主要挑战。当前的存储系统并不能满足不同应用程序多样化且复杂的数据需求。它们缓慢、僵化且浪费。该项目引入了一种克服这些限制的新数据管理方法。它开发了一种新的数据表示形式和配套存储系统,比现有解决方案更快、更灵活且更具可扩展性。该项目还展示了这种新方法如何提高不同应用领域(例如科学计算、深度学习和微服务)中各种应用程序的性能和功能。它通过提高科学生产力和产出、提高处理海量复杂数据集的科学应用程序的可扩展性和可靠性、促进科学应用程序之间的协作和沟通,推进数据密集型计算的最先进水平,并服务于国家利益。通过提高使用不同数据格式、平台和协议的科学应用程序的兼容性,吸引来自不同学科的科学家。该项目可以促进跨学科研究和创新。它还通过培养训练有素的劳动力队伍和增强现有课程和研究项目来支持计算和数据科学方面的教育和多样性。该项目的目标是开发和评估新的数据输入/输出(I/O)范例-基于标签概念和称为 LABIOS 的系统的密集计算。标签是一个数据单元,封装了操作和指向其输入数据的指针。 LABIOS 是一个分布式存储系统,它在支持分层存储(例如非易失性存储器(NVMe)、固态驱动器(SSD)、硬盘驱动器(HDD)等)的服务器上异步且独立地执行标签。该项目研究如何设计和实现 LABIOS 以提供主动存储语义、软件定义存储语义以及现场和传输中分析。它探讨了如何使用 LABIOS 支持弹性和动态资源配置、集成存储访问和可编程存储应用程序编程接口 (API)。 LABIOS 的性能和功能是使用科学计算、深度学习和微服务等科学和大数据领域的各种应用程序和工作负载进行评估的;并演示了 LABIOS 如何提高这些应用程序和工作负载的 I/O 效率和有效性。该项目还分析了新 I/O 范式对现有高性能计算 (HPC) 生态系统的影响。它通过提供新颖的数据表示形式和可扩展的存储系统来满足大规模应用程序多样化和复杂的数据需求,为数据密集型计算的进步做出贡献。该奖项反映了 NSF 的法定使命,并被认为值得通过以下方式获得支持:使用基金会的智力价值和更广泛的影响审查标准进行评估。

项目成果

期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
An Evaluation of DAOS for Simulation and Deep Learning HPC Workloads
针对模拟和深度学习 HPC 工作负载的 DAOS 评估
LuxIO: Intelligent Resource Provisioning and Auto-Configuration for Storage Services
LuxIO:存储服务的智能资源供应和自动配置
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Xian-He Sun其他文献

HARL: Optimizing Parallel File Systems with Heterogeneity-Aware Region-Level Data Layout
HARL:使用异构感知区域级数据布局优化并行文件系统
Optimizing Parallel I/O Accesses through Pattern-Directed and Layout-Aware Replication
通过模式导向和布局感知复制优化并行 I/O 访问
HCDA: From Computational Thinking to a Generalized Thinking Paradigm
HCDA:从计算思维到广义思维范式
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yuhang Liu;Xian-He Sun;Yang Wang;Yungang Bao
  • 通讯作者:
    Yungang Bao
Enhancing Hybrid Parallel File System through Performance and Space-Aware Data layout
通过性能和空间感知数据布局增强混合并行文件系统
On Cost-Driven Collaborative Data Caching: A New Model Approach
成本驱动的协作数据缓存:一种新的模型方法

Xian-He Sun的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Xian-He Sun', 18)}}的其他基金

Collaborative Research: CSR: Medium: Towards A Unified Memory-centric Computing System with Cross-layer Support
协作研究:CSR:中:迈向具有跨层支持的统一的以内存为中心的计算系统
  • 批准号:
    2310422
  • 财政年份:
    2023
  • 资助金额:
    $ 60万
  • 项目类别:
    Continuing Grant
CNS Core: Small: Practical Memory Access Pattern Obfuscation with Algorithm, Application and Architecture Co-designs
CNS 核心:小型:通过算法、应用程序和架构协同设计进行实用内存访问模式混淆
  • 批准号:
    2152497
  • 财政年份:
    2022
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
Frameworks: Collaborative Research: ChronoLog: A High-Performance Storage Infrastructure for Activity and Log Workloads
框架:协作研究:ChronoLog:用于活动和日志工作负载的高性能存储基础架构
  • 批准号:
    2104013
  • 财政年份:
    2021
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
Frameworks: Collaborative Research: ChronoLog: A High-Performance Storage Infrastructure for Activity and Log Workloads
框架:协作研究:ChronoLog:用于活动和日志工作负载的高性能存储基础架构
  • 批准号:
    2104013
  • 财政年份:
    2021
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Optimization of Memory Architectures: A Foundation Approach
合作研究:SHF:小型:内存架构优化:基础方法
  • 批准号:
    2008907
  • 财政年份:
    2020
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
CSR: Small: IRIS: A unified data access framework for the merging of compute-centric and data-centric storage
CSR:小型:IRIS:用于合并以计算为中心和以数据为中心的存储的统一数据访问框架
  • 批准号:
    1814872
  • 财政年份:
    2019
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
Framework: Software: NSCI: Collaborative Research: Hermes: Extending the HDF Library to Support Intelligent I/O Buffering for Deep Memory and Storage Hierarchy Systems
框架: 软件:NSCI:协作研究:Hermes:扩展 HDF 库以支持深度内存和存储层次系统的智能 I/O 缓冲
  • 批准号:
    1835764
  • 财政年份:
    2018
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
Eager: Collaborative Research: DiRecMR: Reconciling the Dichotomy of MapReduce for Efficient Speculation and Resilience
Eager:协作研究:DiRecMR:调和 MapReduce 的二分法以实现高效推测和弹性
  • 批准号:
    1744317
  • 财政年份:
    2017
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
CRI: II-NEW: A Big Data Professing Infrastructure for Smart Energy Systems
CRI:II-NEW:智能能源系统的大数据专业基础设施
  • 批准号:
    1730488
  • 财政年份:
    2017
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
Eager: Collaborative Research: DiRecMR: Reconciling the Dichotomy of MapReduce for Efficient Speculation and Resilience
Eager:协作研究:DiRecMR:调和 MapReduce 的二分法以实现高效推测和弹性
  • 批准号:
    1744317
  • 财政年份:
    2017
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant

相似国自然基金

谷氨酸触发Grina介导的细胞核内钙内流抑制侧支形成机制研究
  • 批准号:
    82370409
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
伏隔核-腹侧被盖区-基底外侧杏仁核神经环路在小鼠氯胺酮成瘾中的机制研究
  • 批准号:
    82371900
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
核壳型咯菌腈控释体系防治小麦全生育期茎基腐病的释放行为及调控机制
  • 批准号:
    32372599
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
基于NRF2调控KPNB1促进PD-L1核转位介导非小细胞肺癌免疫治疗耐药的机制研究
  • 批准号:
    82303969
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
CES3可变启动子选择性利用产物CES3-e的SUMO化促进核浆分布改变在子宫内膜癌孕激素抵抗中的分子机制
  • 批准号:
    82373339
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目

相似海外基金

The Alan Turing Institute Core Grant
艾伦图灵研究所核心资助
  • 批准号:
    EP/Z532861/1
  • 财政年份:
    2024
  • 资助金额:
    $ 60万
  • 项目类别:
    Research Grant
Collaborative Research: OAC Core: Distributed Graph Learning Cyberinfrastructure for Large-scale Spatiotemporal Prediction
合作研究:OAC Core:用于大规模时空预测的分布式图学习网络基础设施
  • 批准号:
    2403313
  • 财政年份:
    2024
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
Collaborative Research: OAC Core: Large-Scale Spatial Machine Learning for 3D Surface Topology in Hydrological Applications
合作研究:OAC 核心:水文应用中 3D 表面拓扑的大规模空间机器学习
  • 批准号:
    2414185
  • 财政年份:
    2024
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
OAC Core: Cost-Adaptive Monitoring and Real-Time Tuning at Function-Level
OAC核心:功能级成本自适应监控和实时调优
  • 批准号:
    2402542
  • 财政年份:
    2024
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
Collaborative Research: OAC Core: CropDL - Scheduling and Checkpoint/Restart Support for Deep Learning Applications on HPC Clusters
合作研究:OAC 核心:CropDL - HPC 集群上深度学习应用的调度和检查点/重启支持
  • 批准号:
    2403088
  • 财政年份:
    2024
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了