CRII: III: Declarative array processing for large-scale scientific analyses

CRII:III:用于大规模科学分析的声明性数组处理

基本信息

  • 批准号:
    1464381
  • 负责人:
  • 金额:
    $ 17.5万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2015
  • 资助国家:
    美国
  • 起止时间:
    2015-04-15 至 2018-03-31
  • 项目状态:
    已结题

项目摘要

Scientists understand complex natural phenomena through data-intensive analyses that run on hundreds of thousands of processing cores. Quickly exploring very large datasets in parallel for insights, however, is challenging. Analyzing larger-than-memory datasets exposes the intricacies of the storage hierarchy and necessitates different implementations based on the anticipated data volume and the system architecture. Domain scientists using large-scale computing facilities are therefore faced with a dilemma: they need to either perpetually maintain and tune their data processing codes to the evolving system infrastructure, or limit their investigation to analyses that can be completed in a reasonable time as datasets continue to grow in size. Declarative data processing techniques can alleviate scientists from the burden of managing how scientific data are accessed or stored. Although many declarative data management systems are actively used by scientists, these systems require time-consuming data transformations, such as loading, chunking and repartitioning, before answering any scientific query. In addition, many data management systems assume complete control of the underlying hardware, and are oblivious to optimizations and scaling opportunities that are offered through the batch execution paradigm of large-scale computing facilities. To address this gap in research, we will investigate techniques in the intersection of data management and scientific computing on how to allocate resources, and how to proactively manage parallel I/O and distributed memory. To impact scientific practice, we will develop a prototype runtime system that will augment an established scientific file format library with declarative querying capabilities for data analysis in leadership computing facilities.For further information see the project web site at: http://go.osu.edu/insitu_analysis
科学家通过在数十万个处理核心上运行的数据密集型分析来了解复杂的自然现象。然而,快速并行地探索非常大的数据集以获得见解是具有挑战性的。分析大于内存的数据集暴露了存储层次结构的复杂性,并且需要根据预期的数据量和系统架构进行不同的实现。因此,使用大规模计算设施的领域科学家面临着两难境地:他们需要永久维护和调整数据处理代码以适应不断发展的系统基础设施,或者将他们的调查限制为随着数据集的不断发展而在合理时间内完成的分析。扩大规模。声明性数据处理技术可以减轻科学家管理科学数据访问或存储方式的负担。尽管科学家们积极使用许多声明性数据管理系统,但这些系统在回答任何科学查询之前需要进行耗时的数据转换,例如加载、分块和重新分区。此外,许多数据管理系统假定对底层硬件的完全控制,并且忽视了通过大规模计算设施的批处理执行范例提供的优化和扩展机会。为了弥补这一研究空白,我们将研究数据管理和科学计算的交叉技术,了解如何分配资源,以及如何主动管理并行 I/O 和分布式内存。为了影响科学实践,我们将开发一个原型运行时系统,该系统将通过声明性查询功能来增强已建立的科学文件格式库,以在领先的计算设施中进行数据分析。有关更多信息,请访问该项目网站:http://go.osu .edu/insitu_analysis

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Spyros Blanas其他文献

In-Memory Transactions
Query Processing on Gaming Consoles
游戏机上的查询处理
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Wei Cui;Qianxi Zhang;Spyros Blanas;Jesús Camacho;Brandon Haynes;Yinan Li;Ravishankar Ramamurthy;Peng Cheng;Rathijit Sen;Matteo Interlandi
  • 通讯作者:
    Matteo Interlandi
Engineering Security and Performance with Cipherbase
使用 Cipherbase 进行工程安全和性能
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    A. Arasu;Spyros Blanas;Ken Eguro;Manas R. Joglekar;R. Kaushik;Donald Kossmann;Ravishankar Ramamurthy;P. Upadhyaya;R. Venkatesan
  • 通讯作者:
    R. Venkatesan
GRaSP: generalized range search in peer-to-peer networks
GRaSP:对等网络中的广义范围搜索
ApproxJoin
近似连接

Spyros Blanas的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Spyros Blanas', 18)}}的其他基金

SHF: Small: Hyperscaling Data Analytics for High-Performance Computers
SHF:小型:高性能计算机的超大规模数据分析
  • 批准号:
    1816577
  • 财政年份:
    2018
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
SHF: EAGER: HI-HDFS - Holistic I/O optimizations for the Hadoop distributed filesystem
SHF:EAGER:HI-HDFS - Hadoop 分布式文件系统的整体 I/O 优化
  • 批准号:
    1747447
  • 财政年份:
    2017
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant

相似国自然基金

摇摆桥梁三维动力学行为及地震响应规律研究
  • 批准号:
    52308494
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于瞬态成像响应的非同步相移轮廓术三维测量方法研究
  • 批准号:
    62375078
  • 批准年份:
    2023
  • 资助金额:
    48 万元
  • 项目类别:
    面上项目
高精度OFDR分布式螺旋多芯光纤三维形状传感技术
  • 批准号:
    62375178
  • 批准年份:
    2023
  • 资助金额:
    54 万元
  • 项目类别:
    面上项目
构件复杂背景下的实景三维古建筑物细节多层次语义提取方法研究
  • 批准号:
    62306107
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

III: Small: Declarative Recursive Computation on a Database System
III:小型:数据库系统上的声明式递归计算
  • 批准号:
    1910803
  • 财政年份:
    2019
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
A study on the concepts of the four tones classes in Japan in the Muromachi period onwards.
日本室町时代以后四声的概念研究。
  • 批准号:
    18K00625
  • 财政年份:
    2018
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
III: Medium: Collaborative Research: A Unified and Declarative Approach to Causal Analysis for Big Data
III:媒介:协作研究:大数据因果分析的统一声明式方法
  • 批准号:
    1703331
  • 财政年份:
    2017
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
III: Medium: Collaborative Research: A Unified and Declarative Approach to Causal Analysis for Big Data
III:媒介:协作研究:大数据因果分析的统一声明式方法
  • 批准号:
    1703431
  • 财政年份:
    2017
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
III: Medium: Collaborative Research: A Unified and Declarative Approach to Causal Analysis for Big Data
III:媒介:协作研究:大数据因果分析的统一声明式方法
  • 批准号:
    1703281
  • 财政年份:
    2017
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了