CSR: Small: Empower Data-Intensive Computing: the integrated data management approach

CSR:小:赋能数据密集型计算:集成数据管理方法

基本信息

  • 批准号:
    1526887
  • 负责人:
  • 金额:
    $ 40万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2015
  • 资助国家:
    美国
  • 起止时间:
    2015-09-01 至 2019-08-31
  • 项目状态:
    已结题

项目摘要

From the computer system point of view there are two types of digital data: observational data, the data collected by electrical devices such as sensor, monitor, camera, text, etc.; and simulation data, data generated by computing. The former represents newly emerged internet data-driven applications, such as social media and data analytic; and the latter represents the conventional computing-driven applications, such as climate modeling and computational fluid dynamics. In general, the latter requires strong consistency for correctness and the former does not. The difference in consistency leads to two kinds of file systems: data-intensive distributed file system, represented by the MapReduce-based Hadoop distributed file systems (HDFS); and computing-intensive file systems, represented by the high performance parallel file systems (PFS), such as the IBM general parallel file system (GPFS). These two kinds of file systems are designed with different philosophies, for different applications, and do not talk to each other. Understanding huge amounts of collected data depends on powerful computation, whereas large-scale computation requires the management of large data. Therefore, big data applications demand an integrated solution. The integrated data access system (IDAS) developed under this research is designed to bridge the data management gap.In agreement with the CAP theory in the distributed system design, the IDAS approach is not designed as a new standalone system but as a software layer which provides an integrated interface to conduct cross-platform data access, from HDFS to PFS, or from PFS to HDFS, read or write, effectively and interchangeably without changing the users' applications. The development plan for IDAS has three components: 1) establish the communication channels so that data can be accessed between HDFS and PFS; 2) design an extended semantic interface so that different file systems can be accessed under different computing systems; 3) develop optimization techniques to optimize I/O operation under HDFS, PFS, and under IDAS. Big data requires a joint effort of the data-driven internet computing community and the compute-driven scientific computing community. IDAS provides a sustainable, cost-effective infrastructure for cross-platform, cross-community services of data storage, access, and sharing. This research will create advanced solutions and technologies that will have direct impact on improving the efficiency of data access and management at scale. Since big data is a national strategic infrastructure for science, engineering, and industry, the proposed investigations will advance a broad range of fields. The success of this research will strive to make significant progress of a timely, important, highly challenging, and high-impact problem, namely integrated data access system.
从计算机系统的角度来看,有两种类型的数字数据:观察数据,传感器,显示器,相机,文本等电气设备收集的数据;和仿真数据,通过计算生成的数据。前者代表了新出现的Internet数据驱动的应用程序,例如社交媒体和数据分析;后者代表了传统的计算驱动的应用,例如气候建模和计算流体动力学。通常,后者需要强大的正确性,而前者则不需要。一致性的差异导致两种文件系统:基于MapReduce的Hadoop分布式文件系统(HDFS)表示数据密集的分布式文件系统;以及以高性能并行文件系统(PFS)为代表的计算密集型文件系统,例如IBM常规并行文件系统(GPFS)。这两种文件系统的设计具有不同的哲学,用于不同的应用程序,并且不相互交流。了解大量收集的数据取决于强大的计算,而大规模计算需要大量数据的管理。因此,大数据应用程序需要集成解决方案。根据本研究开发的集成数据访问系统(IDA)旨在与分布式系统设计中的CAP理论一致弥合数据管理差距,IDAS方法不是作为新的独立系统设计设计的,而是作为一个软件层,该软件层提供了一个集成的界面,以进行跨平台数据访问,从HDF到PFS到PFS,或者从PFS到HDFS,不用hdfs sepriptions offersive offly offers,又有效率地,并且有效地将其互动,并有效地互动,并互动,并互动。 IDA的开发计划具有三个组成部分:1)建立通信渠道,以便可以在HDFS和PFS之间访问数据; 2)设计扩展的语义界面,以便可以在不同的计算系统下访问不同的文件系统; 3)开发优化技术,以优化HDF,PFS和IDA下的I/O操作。大数据需要数据驱动的互联网计算社区和计算驱动的科学计算社区的共同努力。 IDA为数据存储,访问和共享的跨平台,跨社区服务提供了可持续的,具有成本效益的基础架构。这项研究将创建高级解决方案和技术,这些解决方案和技术将直接影响提高数据访问和管理的效率。由于大数据是科学,工程和行业的国家战略基础设施,因此拟议的调查将推进广泛的领域。这项研究的成功将努力在及时,重要,高度挑战和高影响力问题(即集成数据访问系统)方面取得重大进展。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Xian-He Sun其他文献

LPM: A Systematic Methodology for Concurrent Data Access Pattern Optimization from a Matching Perspective
LPM:从匹配角度优化并发数据访问模式的系统方法
Enhancing hybrid parallel file system through performance and space-aware data layout
通过性能和空间感知数据布局增强混合并行文件系统
Applications and Accuracy of the Parallel Diagonal Dominant
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Xian-He Sun
  • 通讯作者:
    Xian-He Sun
Application and Accuracy of the Parallel Diagonal Dominant Algorithm
  • DOI:
    10.1016/0167-8191(95)00018-j
  • 发表时间:
    1995-08
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Xian-He Sun
  • 通讯作者:
    Xian-He Sun
HARL: Optimizing Parallel File Systems with Heterogeneity-Aware Region-Level Data Layout
HARL:使用异构感知区域级数据布局优化并行文件系统

Xian-He Sun的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Xian-He Sun', 18)}}的其他基金

OAC Core: LABIOS: Storage Acceleration via Data Labeling and Asynchronous I/O
OAC 核心:LABIOS:通过数据标签和异步 I/O 进行存储加速
  • 批准号:
    2313154
  • 财政年份:
    2023
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
Collaborative Research: CSR: Medium: Towards A Unified Memory-centric Computing System with Cross-layer Support
协作研究:CSR:中:迈向具有跨层支持的统一的以内存为中心的计算系统
  • 批准号:
    2310422
  • 财政年份:
    2023
  • 资助金额:
    $ 40万
  • 项目类别:
    Continuing Grant
CNS Core: Small: Practical Memory Access Pattern Obfuscation with Algorithm, Application and Architecture Co-designs
CNS 核心:小型:通过算法、应用程序和架构协同设计进行实用内存访问模式混淆
  • 批准号:
    2152497
  • 财政年份:
    2022
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
Frameworks: Collaborative Research: ChronoLog: A High-Performance Storage Infrastructure for Activity and Log Workloads
框架:协作研究:ChronoLog:用于活动和日志工作负载的高性能存储基础架构
  • 批准号:
    2104013
  • 财政年份:
    2021
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Optimization of Memory Architectures: A Foundation Approach
合作研究:SHF:小型:内存架构优化:基础方法
  • 批准号:
    2008907
  • 财政年份:
    2020
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
CSR: Small: IRIS: A unified data access framework for the merging of compute-centric and data-centric storage
CSR:小型:IRIS:用于合并以计算为中心和以数据为中心的存储的统一数据访问框架
  • 批准号:
    1814872
  • 财政年份:
    2019
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
Framework: Software: NSCI: Collaborative Research: Hermes: Extending the HDF Library to Support Intelligent I/O Buffering for Deep Memory and Storage Hierarchy Systems
框架: 软件:NSCI:协作研究:Hermes:扩展 HDF 库以支持深度内存和存储层次系统的智能 I/O 缓冲
  • 批准号:
    1835764
  • 财政年份:
    2018
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
CRI: II-NEW: A Big Data Professing Infrastructure for Smart Energy Systems
CRI:II-NEW:智能能源系统的大数据专业基础设施
  • 批准号:
    1730488
  • 财政年份:
    2017
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
Eager: Collaborative Research: DiRecMR: Reconciling the Dichotomy of MapReduce for Efficient Speculation and Resilience
Eager:协作研究:DiRecMR:调和 MapReduce 的二分法以实现高效推测和弹性
  • 批准号:
    1744317
  • 财政年份:
    2017
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
Utilizing Memory Parallelism for High Performance Data Processing
利用内存并行性进行高性能数据处理
  • 批准号:
    1536079
  • 财政年份:
    2015
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant

相似国自然基金

靶向Treg-FOXP3小分子抑制剂的筛选及其在肺癌免疫治疗中的作用和机制研究
  • 批准号:
    32370966
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
化学小分子激活YAP诱导染色质可塑性促进心脏祖细胞重编程的表观遗传机制研究
  • 批准号:
    82304478
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
靶向小胶质细胞的仿生甘草酸纳米颗粒构建及作用机制研究:脓毒症相关性脑病的治疗新策略
  • 批准号:
    82302422
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
HMGB1/TLR4/Cathepsin B途径介导的小胶质细胞焦亡在新生大鼠缺氧缺血脑病中的作用与机制
  • 批准号:
    82371712
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
小分子无半胱氨酸蛋白调控生防真菌杀虫活性的作用与机理
  • 批准号:
    32372613
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目

相似海外基金

Advanced machine learning to empower ultra-sensitive liquid biopsy in melanoma and non-small cell lung cancer
先进的机器学习使黑色素瘤和非小细胞肺癌的超灵敏液体活检成为可能
  • 批准号:
    10591304
  • 财政年份:
    2023
  • 资助金额:
    $ 40万
  • 项目类别:
Access-H20: Sensor driven smart faucet to enable and empower independent drinking and grooming for individuals impacted by spinal cord injury
Access-H20:传感器驱动的智能水龙头,使受脊髓损伤的个人能够独立饮酒和梳洗
  • 批准号:
    10817375
  • 财政年份:
    2023
  • 资助金额:
    $ 40万
  • 项目类别:
Mission Empower
使命赋能
  • 批准号:
    10693461
  • 财政年份:
    2023
  • 资助金额:
    $ 40万
  • 项目类别:
Access-H20: Sensor-driven smart faucet to enable and empower independent drinking and grooming for individuals impacted by spinal cord injury
Access-H20:传感器驱动的智能水龙头,使受脊髓损伤的个人能够独立饮酒和梳洗
  • 批准号:
    10733031
  • 财政年份:
    2023
  • 资助金额:
    $ 40万
  • 项目类别:
Access-H20: Sensor driven smart faucet to enable and empower independent drinking and grooming for individuals impacted by spinal cord injury
Access-H20:传感器驱动的智能水龙头,使受脊髓损伤的个人能够独立饮酒和梳洗
  • 批准号:
    10482451
  • 财政年份:
    2022
  • 资助金额:
    $ 40万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了