AitF: FULL: Query Processing with Optimal Communication Cost

AitF:FULL:具有最佳通信成本的查询处理

基本信息

  • 批准号:
    1535565
  • 负责人:
  • 金额:
    $ 72万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2015
  • 资助国家:
    美国
  • 起止时间:
    2015-08-15 至 2020-07-31
  • 项目状态:
    已结题

项目摘要

Big Data analytics is changing traditional query processing in two ways. The first is a shift from single server or small-scale parallel relational databases to massively distributed architectures, where hundreds or thousands of servers are used during the computation of a single query. The second is an increased complexity in the queries being issued, from single- or star-joins, to complex graph-like structured queries. This project develops new algorithms for query processing over large distributed systems, which are optimized for the cost of communication, then implements and evaluates these algorithms in an open-source big data management system and service.The project studies a new approach to query evaluation that computes the entire query at once, replacing the traditional approach based on a query plan. The theoretical part of this project builds on a new model, called the Massively Parallel Communication model (MPC), where the communication is the only cost. The system development is performed over the Myria big data management system and service.The Intellectual Merit of the project consists in advancing the state of the art in both the theory and systems approaches to query evaluation in modern, massive-scale shared-nothing clusters. It develops new, fundamental algorithms for processing queries over massively distributed architectures, with a provably optimal communication cost. The project implements and deploys these algorithms in a system, validating and informing the theoretical model. In particular, the project makes the following contributions: it develops provably optimal, one-round algorithms for skewed data; it studies how and when multiple rounds can be used to further reduce the communication cost; it experiments with these novel algorithms on clusters with up to 1000 worker processes; and it develops a new theoretical model for the communication cost on large shared-nothing architectures with heterogeneous hardware.The Broader Impact of the project is to contribute to a new architecture for massively parallel query processing, where the traditional multi-step, single-join query evaluation approaches are replaced with novel, single-step, multi-join algorithms. This change has the potential to lead to more efficient big data analytics engines, allowing data analysts to explore large datasets more efficiently. As an immediate application, the project will impact the domain scientists who already use the Myria big data management system and service. All algorithmic discoveries in this project will be implemented in the Myria system, and will significantly improve query performance, allowing domain scientists to conduct more complex analytics and explorations over their data.
大数据分析正在通过两种方式更改传统查询处理。 第一个是从单个服务器或小规模并行关系数据库转移到大量分布的架构,在计算单个查询期间,使用了数百或数千台服务器。 第二个是从单一或星际连接到复杂的图形结构化查询的要查询的复杂性提高。 该项目开发了针对大型分布式系统查询处理的新算法,这些算法是针对通信成本进行了优化的,然后在开源大数据管理系统和服务中实施并评估这些算法的。项目研究的新方法来查询评估,以基于查询计划替换了基于查询计划的整个疑问,以替代了整个疑问。该项目的理论部分建立在一个新模型的基础上,称为“大规模并行通信模型”(MPC),其中通信是唯一的成本。该系统开发是通过米里亚大数据管理系统和服务进行的。该项目的智力优点在于在理论和系统方法中都在现代,大规模的共享集群中提高最新技术的状态。 它开发了新的,基本的算法,用于处理大量分布的架构的查询,并具有最佳的沟通成本。该项目将这些算法实现并部署在系统中,从而验证和告知理论模型。特别是,该项目做出了以下贡献:它为偏斜数据开发了可证明的最佳单轮算法;它研究了如何以及何时使用多个回合来进一步降低沟通成本;它可以在最多1000个工作过程的簇上使用这些新型算法进行实验;它开发了一种新的理论模型,用于与具有异质硬件的大型共享架构的通信成本。该项目的更广泛影响是为新的建筑做出贡献,用于大规模平行的查询处理,传统的多步,单步质量查询评估方法由小说,单步,单型,多型 - join Algoriths代替。这种变化有可能导致更有效的大数据分析引擎,从而使数据分析师更有效地探索大型数据集。作为立即应用,该项目将影响已经使用Myria Big Data Management System和Service的领域科学家。该项目中的所有算法发现都将在Myria系统中实施,并将大大提高查询性能,从而使域科学家能够对其数据进行更复杂的分析和探索。

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Bag Query Containment and Information Theory
包查询遏制和信息论
  • DOI:
    10.1145/3472391
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    1.8
  • 作者:
    Khamis, Mahmoud Abo;Kolaitis, Phokion G.;Ngo, Hung Q.;Suciu, Dan
  • 通讯作者:
    Suciu, Dan
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Dan Suciu其他文献

Integrating Network-Bound XML Data
集成网络绑定的 XML 数据
A Dichotomy for the Generalized Model Counting Problem for Unions of Conjunctive Queries
连接查询并集广义模型计数问题的二分法
XViz: A Tool for Visualizing XPath Expressions
XViz:可视化 XPath 表达式的工具
Optimizing Large-Scale Semi-Naïve Datalog Evaluation in Hadoop
优化 Hadoop 中的大规模半简单数据记录评估
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Marianne Shaw;Paraschos Koutris;Bill Howe;Dan Suciu
  • 通讯作者:
    Dan Suciu
SlimShot: In-Database Probabilistic Inference for Knowledge Bases
SlimShot:知识库的数据库内概率推理

Dan Suciu的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Dan Suciu', 18)}}的其他基金

III: Small: Datalog with Aggregates: Complexity, Optimization, Evaluation
III:小:带有聚合的数据记录:复杂性、优化、评估
  • 批准号:
    2314527
  • 财政年份:
    2023
  • 资助金额:
    $ 72万
  • 项目类别:
    Standard Grant
NSF-BSF: III: Small: Data Driven Schema
NSF-BSF:III:小型:数据驱动模式
  • 批准号:
    2109922
  • 财政年份:
    2021
  • 资助金额:
    $ 72万
  • 项目类别:
    Continuing Grant
III: Medium: Collaborative Research: Reasoning about Optimizers for Data-Intensive Systems
III:媒介:协作研究:数据密集型系统优化器的推理
  • 批准号:
    1954222
  • 财政年份:
    2020
  • 资助金额:
    $ 72万
  • 项目类别:
    Continuing Grant
III:Small: Optimal Query Processing meets Information Theory: from Proofs to Algorithms
III:Small:最优查询处理遇到信息论:从证明到算法
  • 批准号:
    1907997
  • 财政年份:
    2019
  • 资助金额:
    $ 72万
  • 项目类别:
    Continuing Grant
III: Medium: Collaborative Research: A Unified and Declarative Approach to Causal Analysis for Big Data
III:媒介:协作研究:大数据因果分析的统一声明式方法
  • 批准号:
    1703281
  • 财政年份:
    2017
  • 资助金额:
    $ 72万
  • 项目类别:
    Standard Grant
III: Small: Scalable Probabilistic Inference for Large Knowledge Bases
III:小:大型知识库的可扩展概率推理
  • 批准号:
    1614738
  • 财政年份:
    2016
  • 资助金额:
    $ 72万
  • 项目类别:
    Standard Grant
BIGDATA: Mid-Scale: DCM: A Formal Foundation for Big Data Management
BIGDATA:中型:DCM:大数据管理的正式基础
  • 批准号:
    1247469
  • 财政年份:
    2013
  • 资助金额:
    $ 72万
  • 项目类别:
    Continuing Grant
III: Small: Query Compilation on Probabilistic Databases
III:小:概率数据库上的查询编译
  • 批准号:
    1115188
  • 财政年份:
    2011
  • 资助金额:
    $ 72万
  • 项目类别:
    Standard Grant
III: Small: BeliefDB - Adding Belief Annotations to Databases
III:小:BeliefDB - 向数据库添加信念注释
  • 批准号:
    0915054
  • 财政年份:
    2009
  • 资助金额:
    $ 72万
  • 项目类别:
    Standard Grant
III COR: Query Evaluation and View Materialization in Probabilistic Data
III COR:概率数据中的查询评估和视图具体化
  • 批准号:
    0713576
  • 财政年份:
    2007
  • 资助金额:
    $ 72万
  • 项目类别:
    Standard Grant

相似国自然基金

钴基Full-Heusler合金的掺杂效应和薄膜噪声特性研究
  • 批准号:
    51871067
  • 批准年份:
    2018
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于阿洛糖苯乙醇苷的厚朴“下气除满”的机理及其道地成因的研究
  • 批准号:
    81773895
  • 批准年份:
    2017
  • 资助金额:
    57.0 万元
  • 项目类别:
    面上项目

相似海外基金

Human-Robot Co-Evolution: Achieving the full potential of future workplaces
人机协同进化:充分发挥未来工作场所的潜力
  • 批准号:
    DP240100938
  • 财政年份:
    2024
  • 资助金额:
    $ 72万
  • 项目类别:
    Discovery Projects
SAFER - Secure Foundations: Verified Systems Software Above Full-Scale Integrated Semantics
SAFER - 安全基础:高于全面集成语义的经过验证的系统软件
  • 批准号:
    EP/Y035976/1
  • 财政年份:
    2024
  • 资助金额:
    $ 72万
  • 项目类别:
    Research Grant
Collaborative Research: NSFGEO-NERC: Advancing capabilities to model ultra-low velocity zone properties through full waveform Bayesian inversion and geodynamic modeling
合作研究:NSFGEO-NERC:通过全波形贝叶斯反演和地球动力学建模提高超低速带特性建模能力
  • 批准号:
    2341238
  • 财政年份:
    2024
  • 资助金额:
    $ 72万
  • 项目类别:
    Standard Grant
CAREER: Informed Testing — From Full-Field Characterization of Mechanically Graded Soft Materials to Student Equity in the Classroom
职业:知情测试 – 从机械分级软材料的全场表征到课堂上的学生公平
  • 批准号:
    2338371
  • 财政年份:
    2024
  • 资助金额:
    $ 72万
  • 项目类别:
    Standard Grant
CAREER: From Flamelet to Full-Scale: Advancing Plasma-Assisted Combustion for Low-Emission Sustainable Fuels
职业生涯:从小火焰到全面:推进低排放可持续燃料的等离子体辅助燃烧
  • 批准号:
    2339518
  • 财政年份:
    2024
  • 资助金额:
    $ 72万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了