CSR: Small: IRIS: A unified data access framework for the merging of compute-centric and data-centric storage

CSR:小型:IRIS:用于合并以计算为中心和以数据为中心的存储的统一数据访问框架

基本信息

  • 批准号:
    1814872
  • 负责人:
  • 金额:
    $ 50万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2019
  • 资助国家:
    美国
  • 起止时间:
    2019-01-01 至 2023-12-31
  • 项目状态:
    已结题

项目摘要

As the boundary between High Performance Computing (HPC) and High-Performance Data Analytics (HPDA) continue to blur, the conventional compute-centric HPC and the newly emerged data-driven Big Data application are converging. HPC becomes more data-intensive. In the meantime, HPDA requires more computing power. MapReduce and Spark software environments are developed and are popular for HPDA. However, these software frameworks are not designed for HPC and not compatible with HPC storage subsystems. In this research, the design and development of a unified data access framework, named IRIS, is proposed for the integration of compute-centric and data-centric storage solutions. The intellectual merit of this research is three-fold. 1) Mapping of incompatible structures: Mapping a file to key-value pairs and vice versa efficiently is a challenging task. 2) Maintaining metadata information: Since IRIS is a unified storage layer, it needs to maintain compatibility with legacy codes. IRIS will address this challenge with tunable consistency, which need to be carefully studied for implementation and design choices. 3) Minimizing overhead and memory footprint of IRIS solutions: Mapping of incompatible structures can cause excessive memory usage; this will be addressed in this research.This project is expected to have significant impact, including bridging data generation and data analysis processes; promoting collaboration between the model simulation and data analysis communities; and building a foundation element for next generation integrated storage systems. This research will create advanced solutions and technologies that will have direct impact on improving the efficiency of data access and management at scale. Since Big Data is a national strategic infrastructure for science, engineering, and industry, this research will advance a broad range of fields. It aims to make significant progress toward a unified storage access system. All data generated from this project will be stored in an electronic format and will be preserved on the server machines at the Illinois Institute of Technology (IIT): http://cs.iit.edu/~scs/. The server machines have hot-copy backup disks for backing up the primary copy of all data. A secondary copy of all data will be kept on the server machines in the computer science department at IIT per semester basis. The data will be transferred to new storage devices every 2 years. All data will be retained within 3 years of the project completion date.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
随着高性能计算(HPC)和高性能数据分析(HPDA)之间的界限不断模糊,传统的以计算为中心的HPC和新出现的数据驱动的大数据应用正在融合。 HPC 变得更加数据密集。同时,HPDA需要更多的计算能力。 MapReduce 和 Spark 软件环境是为 HPDA 开发并流行的。然而,这些软件框架并不是为HPC设计的,并且与HPC存储子系统不兼容。在本研究中,提出了一个名为 IRIS 的统一数据访问框架的设计和开发,用于集成以计算为中心和以数据为中心的存储解决方案。 这项研究的智力价值有三个方面。 1)不兼容结构的映射:有效地将文件映射到键值对,反之亦然是一项具有挑战性的任务。 2)维护元数据信息:由于IRIS是统一的存储层,因此需要保持与遗留代码的兼容性。 IRIS 将通过可调一致性来应对这一挑战,需要仔细研究实施和设计选择。 3)最小化IRIS解决方案的开销和内存占用:不兼容结构的映射可能会导致内存使用过多;本研究将解决这个问题。该项目预计将产生重大影响,包括桥接数据生成和数据分析过程;促进模型模拟和数据分析社区之间的合作;并为下一代集成存储系统构建基础元素。这项研究将创建先进的解决方案和技术,对大规模提高数据访问和管理的效率产生直接影响。由于大数据是科学、工程和工业的国家战略基础设施,这项研究将推动广泛的领域的发展。它的目标是在统一存储访问系统方面取得重大进展。该项目生成的所有数据都将以电子格式存储在伊利诺伊理工学院 (IIT) 的服务器上:http://cs.iit.edu/~scs/。服务器计算机具有热复制备份磁盘,用于备份所有数据的主副本。所有数据的辅助副本将每学期保存在 IIT 计算机科学系的服务器计算机上。数据每两年就会转移到新的存储设备。所有数据将在项目完成之日起 3 年内保留。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(7)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
LabStor: A Modular and Extensible Platform for Developing High-Performance, Customized I/O Stacks in Userspace
LabStor:用于在用户空间中开发高性能、定制 I/O 堆栈的模块化和可扩展平台
DLIO: A Data-Centric Benchmark for Scientific Deep Learning Applications
DLIO:科学深度学习应用程序的以数据为中心的基准
  • DOI:
    10.1109/ccgrid51090.2021.00018
  • 发表时间:
    2021-05
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Devarajan, Hariharan;Zheng, Huihuo;Kougkas, Anthony;Sun, Xian;Vishwanath, Venkatram
  • 通讯作者:
    Vishwanath, Venkatram
HFlow: A Dynamic and Elastic Multi-Layered I/O Forwarder
HFlow:动态、弹性的多层 I/O 转发器
Apollo:: An ML-assisted Real-Time Storage Resource Observer
Apollo:: 机器学习辅助的实时存储资源观察器
NIOBE: An Intelligent I/O Bridging Engine for Complex and Distributed Workflows
NIOBE:适用于复杂分布式工作流程的智能 I/O 桥接引擎
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Xian-He Sun其他文献

HARL: Optimizing Parallel File Systems with Heterogeneity-Aware Region-Level Data Layout
HARL:使用异构感知区域级数据布局优化并行文件系统
Optimizing Parallel I/O Accesses through Pattern-Directed and Layout-Aware Replication
通过模式导向和布局感知复制优化并行 I/O 访问
HCDA: From Computational Thinking to a Generalized Thinking Paradigm
HCDA:从计算思维到广义思维范式
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yuhang Liu;Xian-He Sun;Yang Wang;Yungang Bao
  • 通讯作者:
    Yungang Bao
Enhancing Hybrid Parallel File System through Performance and Space-Aware Data layout
通过性能和空间感知数据布局增强混合并行文件系统
On Cost-Driven Collaborative Data Caching: A New Model Approach
成本驱动的协作数据缓存:一种新的模型方法

Xian-He Sun的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Xian-He Sun', 18)}}的其他基金

Collaborative Research: CSR: Medium: Towards A Unified Memory-centric Computing System with Cross-layer Support
协作研究:CSR:中:迈向具有跨层支持的统一的以内存为中心的计算系统
  • 批准号:
    2310422
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
OAC Core: LABIOS: Storage Acceleration via Data Labeling and Asynchronous I/O
OAC 核心:LABIOS:通过数据标签和异步 I/O 进行存储加速
  • 批准号:
    2313154
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CNS Core: Small: Practical Memory Access Pattern Obfuscation with Algorithm, Application and Architecture Co-designs
CNS 核心:小型:通过算法、应用程序和架构协同设计进行实用内存访问模式混淆
  • 批准号:
    2152497
  • 财政年份:
    2022
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Frameworks: Collaborative Research: ChronoLog: A High-Performance Storage Infrastructure for Activity and Log Workloads
框架:协作研究:ChronoLog:用于活动和日志工作负载的高性能存储基础架构
  • 批准号:
    2104013
  • 财政年份:
    2021
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Frameworks: Collaborative Research: ChronoLog: A High-Performance Storage Infrastructure for Activity and Log Workloads
框架:协作研究:ChronoLog:用于活动和日志工作负载的高性能存储基础架构
  • 批准号:
    2104013
  • 财政年份:
    2021
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Optimization of Memory Architectures: A Foundation Approach
合作研究:SHF:小型:内存架构优化:基础方法
  • 批准号:
    2008907
  • 财政年份:
    2020
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Framework: Software: NSCI: Collaborative Research: Hermes: Extending the HDF Library to Support Intelligent I/O Buffering for Deep Memory and Storage Hierarchy Systems
框架: 软件:NSCI:协作研究:Hermes:扩展 HDF 库以支持深度内存和存储层次系统的智能 I/O 缓冲
  • 批准号:
    1835764
  • 财政年份:
    2018
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Eager: Collaborative Research: DiRecMR: Reconciling the Dichotomy of MapReduce for Efficient Speculation and Resilience
Eager:协作研究:DiRecMR:调和 MapReduce 的二分法以实现高效推测和弹性
  • 批准号:
    1744317
  • 财政年份:
    2017
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Eager: Collaborative Research: DiRecMR: Reconciling the Dichotomy of MapReduce for Efficient Speculation and Resilience
Eager:协作研究:DiRecMR:调和 MapReduce 的二分法以实现高效推测和弹性
  • 批准号:
    1744317
  • 财政年份:
    2017
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CRI: II-NEW: A Big Data Professing Infrastructure for Smart Energy Systems
CRI:II-NEW:智能能源系统的大数据专业基础设施
  • 批准号:
    1730488
  • 财政年份:
    2017
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant

相似国自然基金

小分子代谢物Catechin与TRPV1相互作用激活外周感觉神经元介导尿毒症瘙痒的机制研究
  • 批准号:
    82371229
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
DHEA抑制小胶质细胞Fis1乳酸化修饰减轻POCD的机制
  • 批准号:
    82301369
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
SETDB1调控小胶质细胞功能及参与阿尔茨海默病发病机制的研究
  • 批准号:
    82371419
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
PTBP1驱动H4K12la/BRD4/HIF1α复合物-PKM2正反馈环路促进非小细胞肺癌糖代谢重编程的机制研究及治疗方案探索
  • 批准号:
    82303616
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Development of a tele-mentoring system integrated into an ultra-portable surgical microscope to treat cataract in underserved populations
开发集成到超便携式手术显微镜中的远程指导系统,以治疗服务不足人群的白内障
  • 批准号:
    10602749
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
Accessible Eye Tracking Solution for Assessment of Cognitive Deficits in Alzheimer's Disease
用于评估阿尔茨海默病认知缺陷的眼动追踪解决方案
  • 批准号:
    10383292
  • 财政年份:
    2022
  • 资助金额:
    $ 50万
  • 项目类别:
A Widefield, Handheld OCT system for Patients who are Unable to Cooperate
适用于无法合作的患者的宽视野手持式 OCT 系统
  • 批准号:
    10482623
  • 财政年份:
    2022
  • 资助金额:
    $ 50万
  • 项目类别:
Transcriptional signatures of glaucomatous retinal and optic nerve head cells
青光眼视网膜和视神经乳头细胞的转录特征
  • 批准号:
    10524883
  • 财政年份:
    2022
  • 资助金额:
    $ 50万
  • 项目类别:
Development of the First-ever Safe and Effective Anterior Chamber Paracentesis Instrument to Treat and Diagnose Ocular Diseases
开发首个安全有效的前房穿刺器械来治疗和诊断眼部疾病
  • 批准号:
    10325880
  • 财政年份:
    2021
  • 资助金额:
    $ 50万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了