BIGDATA: Small: DCM: Collaborative Research: An efficient, versatile, scalable, and portable storage system for scientific data containers
大数据:小型:DCM:协作研究:用于科学数据容器的高效、多功能、可扩展和便携式存储系统
基本信息
- 批准号:1251037
- 负责人:
- 金额:$ 15.2万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2013
- 资助国家:美国
- 起止时间:2013-07-01 至 2017-06-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Scientific Bigdata sets are becoming too large and complex to fit in RAM, forcing scientific applications to perform a lot of slow disk and network I/O. This growth also makes scientific data more vulnerable to corruptions due to crashes and human errors. This project will use recent results from algorithms, database, and storage research to improve the performance and reliability of standard scientific data formats. This will make scientific research cheaper, faster, more reliable, and more reproducible.The Hierarchical Data Format (HDF5) standard is a container format for scientific data. It allows scientists to define and store complex data structures inside HDF5 files. Unfortunately, the current standard forces users to store all data objects and their meta-data properties inside one large physical file; this mix hinders meta-data-specific optimizations. The current storage also uses data-structures that scale poorly for large data. Lastly, the current model lacks snapshot support, important for recovery from errors.A new HDF5 release allows users to create more versatile storage plugins to control storage policies on each object and attribute. This project is developing support for snapshots in HDF5, designing new data structures and algorithms to scale HDF5 data access on modern storage devices to Bigdata. The project is designing several new HDF5 drivers: mapping objects to a Linux file system; storing objects in a database; and accessing data objects on remote Web servers. These improvements are evaluated using large-scale visualization applications with Bigdata, stemming from real-world scientific computations.
科学大数据集变得太大、太复杂,无法容纳在 RAM 中,迫使科学应用程序执行大量缓慢的磁盘和网络 I/O。 这种增长还使得科学数据更容易因崩溃和人为错误而受到损坏。 该项目将利用算法、数据库和存储研究的最新成果来提高标准科学数据格式的性能和可靠性。 这将使科学研究变得更便宜、更快、更可靠、更可重复。分层数据格式 (HDF5) 标准是科学数据的容器格式。 它允许科学家在 HDF5 文件中定义和存储复杂的数据结构。 不幸的是,当前的标准迫使用户将所有数据对象及其元数据属性存储在一个大型物理文件中;这种混合阻碍了特定于元数据的优化。 当前的存储还使用对于大数据而言扩展性较差的数据结构。最后,当前模型缺乏快照支持,这对于从错误中恢复非常重要。新的 HDF5 版本允许用户创建更通用的存储插件来控制每个对象和属性的存储策略。 该项目正在开发对 HDF5 快照的支持,设计新的数据结构和算法,以将现代存储设备上的 HDF5 数据访问扩展到大数据。该项目正在设计几个新的 HDF5 驱动程序:将对象映射到 Linux 文件系统;将对象存储在数据库中;以及访问远程 Web 服务器上的数据对象。 这些改进是使用源自现实世界科学计算的大规模可视化应用程序和大数据进行评估的。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Liuba Shrira其他文献
Liuba Shrira的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Liuba Shrira', 18)}}的其他基金
CSR: Medium: Collaborative Research: Fast and Simple Concurrency Through Data-Abstraction Transactions
CSR:媒介:协作研究:通过数据抽象事务实现快速而简单的并发
- 批准号:
1513471 - 财政年份:2015
- 资助金额:
$ 15.2万 - 项目类别:
Standard Grant
CSR: Small: Efficient Techniques for Modular Past State Systems
CSR:小型:模块化过去状态系统的高效技术
- 批准号:
1318798 - 财政年份:2013
- 资助金额:
$ 15.2万 - 项目类别:
Standard Grant
ITR: Collaborative Research: (ASE+NHS) - (int): BFT-LS: Byzantine Fault Tolerance for Large-Scale, High-Performance Distributed Storage Systems
ITR:协作研究:(ASE NHS) - (int):BFT-LS:大规模、高性能分布式存储系统的拜占庭容错
- 批准号:
0427408 - 财政年份:2004
- 资助金额:
$ 15.2万 - 项目类别:
Continuing Grant
Support for Scalable Transactional Applications on the Global Internet
支持全球互联网上的可扩展交易应用程序
- 批准号:
9901699 - 财政年份:1999
- 资助金额:
$ 15.2万 - 项目类别:
Standard Grant
相似国自然基金
单细胞分辨率下的石杉碱甲介导小胶质细胞极化表型抗缺血性脑卒中的机制研究
- 批准号:82304883
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
小分子无半胱氨酸蛋白调控生防真菌杀虫活性的作用与机理
- 批准号:32372613
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
诊疗一体化PS-Hc@MB协同训练介导脑小血管病康复的作用及机制研究
- 批准号:82372561
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
非小细胞肺癌MECOM/HBB通路介导血红素代谢异常并抑制肿瘤起始细胞铁死亡的机制研究
- 批准号:82373082
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
FATP2/HILPDA/SLC7A11轴介导肿瘤相关中性粒细胞脂代谢重编程影响非小细胞肺癌放疗免疫的作用和机制研究
- 批准号:82373304
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
相似海外基金
BIGDATA: Small: DCM: Collaborative Research: An efficient, versatile, scalable, and portable storage system for scientific data containers
大数据:小型:DCM:协作研究:用于科学数据容器的高效、多功能、可扩展和便携式存储系统
- 批准号:
1723292 - 财政年份:2017
- 资助金额:
$ 15.2万 - 项目类别:
Standard Grant
BIGDATA: Small: DCM: Data Management for Analytics Applications on Modern Architecture
BIGDATA:小型:DCM:现代架构上分析应用程序的数据管理
- 批准号:
1250886 - 财政年份:2013
- 资助金额:
$ 15.2万 - 项目类别:
Standard Grant
BIGDATA: Small: DA: DCM: Measurement and Learning in Large-Scale Social Networks
BIGDATA:小型:DA:DCM:大规模社交网络中的测量和学习
- 批准号:
1251267 - 财政年份:2013
- 资助金额:
$ 15.2万 - 项目类别:
Standard Grant
BIGDATA: Small: DCM: JetStream: A Flexible Distributed System for Online and In-Place Data Analysis
BIGDATA:小型:DCM:JetStream:用于在线和就地数据分析的灵活分布式系统
- 批准号:
1250990 - 财政年份:2013
- 资助金额:
$ 15.2万 - 项目类别:
Standard Grant
BIGDATA: Small: DCM: DA: Building a Mergeable and Interactive Distributed Data Layer for Big Data Summarization Systems
BIGDATA:小型:DCM:DA:为大数据汇总系统构建可合并和交互式的分布式数据层
- 批准号:
1251019 - 财政年份:2013
- 资助金额:
$ 15.2万 - 项目类别:
Standard Grant