CRII: III: Declarative array processing for large-scale scientific analyses

CRII:III:用于大规模科学分析的声明性数组处理

基本信息

  • 批准号:
    1464381
  • 负责人:
  • 金额:
    $ 17.5万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2015
  • 资助国家:
    美国
  • 起止时间:
    2015-04-15 至 2018-03-31
  • 项目状态:
    已结题

项目摘要

Scientists understand complex natural phenomena through data-intensive analyses that run on hundreds of thousands of processing cores. Quickly exploring very large datasets in parallel for insights, however, is challenging. Analyzing larger-than-memory datasets exposes the intricacies of the storage hierarchy and necessitates different implementations based on the anticipated data volume and the system architecture. Domain scientists using large-scale computing facilities are therefore faced with a dilemma: they need to either perpetually maintain and tune their data processing codes to the evolving system infrastructure, or limit their investigation to analyses that can be completed in a reasonable time as datasets continue to grow in size. Declarative data processing techniques can alleviate scientists from the burden of managing how scientific data are accessed or stored. Although many declarative data management systems are actively used by scientists, these systems require time-consuming data transformations, such as loading, chunking and repartitioning, before answering any scientific query. In addition, many data management systems assume complete control of the underlying hardware, and are oblivious to optimizations and scaling opportunities that are offered through the batch execution paradigm of large-scale computing facilities. To address this gap in research, we will investigate techniques in the intersection of data management and scientific computing on how to allocate resources, and how to proactively manage parallel I/O and distributed memory. To impact scientific practice, we will develop a prototype runtime system that will augment an established scientific file format library with declarative querying capabilities for data analysis in leadership computing facilities.For further information see the project web site at: http://go.osu.edu/insitu_analysis
科学家通过对数十万个加工核心进行的数据密集分析来了解复杂的自然现象。但是,快速探索非常大的数据集以寻求见解是具有挑战性的。分析大型内存数据集揭示了存储层次结构的复杂性,因此需要基于预期的数据量和系统体系结构来实现不同的实现。因此,使用大规模计算设施的领域科学家面临困境:他们需要永久维护并调整其数据处理代码到不断发展的系统基础架构,或将其调查限制为可以在合理时间完成的分析,因为数据集的大小不断增长。声明性的数据处理技术可以减轻科学家管理科学数据的访问或存储方式的负担。尽管科学家积极使用许多声明性的数据管理系统,但这些系统需要耗时的数据转换,例如加载,分解和重新分配,然后再回答任何科学查询。此外,许多数据管理系统都可以完全控制基础硬件,并且忽略了通过大规模计算设施的批处理执行范式提供的优化和扩展机会。为了解决研究中的这一差距,我们将研究有关如何分配资源以及如何主动管理并行I/O和分布式内存的数据管理和科学计算交集的技术。为了影响科学实践,我们将开发一个原型运行时系统,该系统将增强既定的科学文件格式库,并具有声明性的查询功能,以便在领导力计算设施中进行数据分析。有关更多信息,请参见项目网站:http://go.osu.edu/insitu/insitu_analyasis

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Spyros Blanas其他文献

In-Memory Transactions
Query Processing on Gaming Consoles
游戏机上的查询处理
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Wei Cui;Qianxi Zhang;Spyros Blanas;Jesús Camacho;Brandon Haynes;Yinan Li;Ravishankar Ramamurthy;Peng Cheng;Rathijit Sen;Matteo Interlandi
  • 通讯作者:
    Matteo Interlandi
Engineering Security and Performance with Cipherbase
使用 Cipherbase 进行工程安全和性能
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    A. Arasu;Spyros Blanas;Ken Eguro;Manas R. Joglekar;R. Kaushik;Donald Kossmann;Ravishankar Ramamurthy;P. Upadhyaya;R. Venkatesan
  • 通讯作者:
    R. Venkatesan
GRaSP: generalized range search in peer-to-peer networks
GRaSP:对等网络中的广义范围搜索
ApproxJoin
近似连接

Spyros Blanas的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Spyros Blanas', 18)}}的其他基金

SHF: Small: Hyperscaling Data Analytics for High-Performance Computers
SHF:小型:高性能计算机的超大规模数据分析
  • 批准号:
    1816577
  • 财政年份:
    2018
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
SHF: EAGER: HI-HDFS - Holistic I/O optimizations for the Hadoop distributed filesystem
SHF:EAGER:HI-HDFS - Hadoop 分布式文件系统的整体 I/O 优化
  • 批准号:
    1747447
  • 财政年份:
    2017
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant

相似国自然基金

基于III-V族半导体纳米结构阵列的短波红外偏振探测理论与方法研究
  • 批准号:
    62305023
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
生物炭表面结构属性对Fe(II)氧化诱导As(III)氧化截污的影响机制
  • 批准号:
    42307492
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
乙肝肝纤维化进程咪唑丙酸通过mTORC1通路调控III型固有淋巴细胞糖脂代谢重编程及机制研究
  • 批准号:
    82370622
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
铁载体与Fe(III)相互作用过程的铁同位素分馏及机理的模拟实验研究
  • 批准号:
    42377264
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
人工湿地铁循环驱动As(III)氧化的过程调控及其强化除砷机制
  • 批准号:
    52370204
  • 批准年份:
    2023
  • 资助金额:
    51 万元
  • 项目类别:
    面上项目

相似海外基金

III: Small: Declarative Recursive Computation on a Database System
III:小型:数据库系统上的声明式递归计算
  • 批准号:
    1910803
  • 财政年份:
    2019
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
III: Medium: Collaborative Research: A Unified and Declarative Approach to Causal Analysis for Big Data
III:媒介:协作研究:大数据因果分析的统一声明式方法
  • 批准号:
    1703331
  • 财政年份:
    2017
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
III: Medium: Collaborative Research: A Unified and Declarative Approach to Causal Analysis for Big Data
III:媒介:协作研究:大数据因果分析的统一声明式方法
  • 批准号:
    1703431
  • 财政年份:
    2017
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
III: Medium: Collaborative Research: A Unified and Declarative Approach to Causal Analysis for Big Data
III:媒介:协作研究:大数据因果分析的统一声明式方法
  • 批准号:
    1703281
  • 财政年份:
    2017
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
III: Small: Enabling Declarative Querying and Analytics over Large Dynamic Information Networks
III:小型:在大型动态信息网络上实现声明式查询和分析
  • 批准号:
    1319432
  • 财政年份:
    2013
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了