III: Small: Datalog with Aggregates: Complexity, Optimization, Evaluation
III:小:带有聚合的数据记录:复杂性、优化、评估
基本信息
- 批准号:2314527
- 负责人:
- 金额:$ 60万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2023
- 资助国家:美国
- 起止时间:2023-09-01 至 2026-08-31
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
Computer applications are increasingly data driven. They rely on processing large datasets from which they learn models that drive the application. Machine learning on massive datasets is routinely done today by leading software companies and academic institutions, however, using ML tools effectively is still an obscure practice mostly done by ML experts. Future applications of ML will be developed by data scientists, who need friendly tools to help them manage data of massive scale. The goal of this project is to lay the foundations for building such tools. It extends relational databases that are already widely used today with the ability to perform iterations that are indispensable in machine learning applications.Relational databases are some of the best engineered systems to date, and they are used routinely to process datasets from small to massive. But the query language that they support, SQL, is only optimized for queries that do not require iteration. Yet virtually all modern data science tasks require some form of iteration. As SQL does not support iteration well, data scientists do not use SQL for most of their needs. Datalog is a query language proposed decades ago, precisely to support iteration, however, datalog does not support aggregates, such as summation or counting, which are indispensable in any data science task. This project overcomes the fundamental roadblock that prevents datalog from supporting aggregates by using a new abstraction, where standard relations are extended to relations over a semiring. This modification allows all traditional SQL optimizations to be carried over to datalog, and at the same time it allows recursion and aggregates to be interleaved freely.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
计算机应用越来越受数据驱动。他们依赖于处理大型数据集,从中学习驱动应用程序的模型。如今,领先的软件公司和学术机构通常会在海量数据集上进行机器学习,但是,有效使用机器学习工具仍然是一种鲜为人知的做法,主要由机器学习专家完成。机器学习的未来应用将由数据科学家开发,他们需要友好的工具来帮助他们管理大规模数据。该项目的目标是为构建此类工具奠定基础。它扩展了当今已广泛使用的关系数据库,能够执行机器学习应用程序中不可或缺的迭代。关系数据库是迄今为止最好的工程系统之一,它们通常用于处理从小到大的数据集。但它们支持的查询语言 SQL 仅针对不需要迭代的查询进行了优化。然而,几乎所有现代数据科学任务都需要某种形式的迭代。由于 SQL 不能很好地支持迭代,因此数据科学家不会使用 SQL 来满足大部分需求。 Datalog是几十年前提出的一种查询语言,正是为了支持迭代,但是Datalog不支持聚合,例如求和或计数,而这些在任何数据科学任务中都是必不可少的。该项目通过使用新的抽象克服了阻止数据记录支持聚合的基本障碍,其中标准关系扩展到半环上的关系。 这一修改允许将所有传统的 SQL 优化转移到数据记录中,同时允许递归和聚合自由交错。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力优势和评估进行评估,认为值得支持。更广泛的影响审查标准。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Dan Suciu其他文献
SQB : Session-based Query Browsing for More Effective Query Reuse
SQB:基于会话的查询浏览以实现更有效的查询重用
- DOI:
- 发表时间:
2024-09-14 - 期刊:
- 影响因子:0
- 作者:
Nodira Khoussainova;YongChul Kwon;W. Liao;M. Balazinska;Wolfgang Gatterbauer;Dan Suciu - 通讯作者:
Dan Suciu
Some experiments on the Marangoni effect
马兰戈尼效应的一些实验
- DOI:
10.1002/aic.690130616 - 发表时间:
1967-11-01 - 期刊:
- 影响因子:3.7
- 作者:
Dan Suciu;O. Smigelschi;E. Ruckenstein - 通讯作者:
E. Ruckenstein
Managing Structured Collections of Community Data
管理社区数据的结构化集合
- DOI:
- 发表时间:
2011 - 期刊:
- 影响因子:0
- 作者:
Wolfgang Gatterbauer;Dan Suciu - 通讯作者:
Dan Suciu
Color: A Framework for Applying Graph Coloring to Subgraph Cardinality Estimation
颜色:将图着色应用于子图基数估计的框架
- DOI:
- 发表时间:
2024 - 期刊:
- 影响因子:0
- 作者:
Kyle Deeds;Diandre Sabale;Moe Kayali;Dan Suciu - 通讯作者:
Dan Suciu
Query optimization in the presence of limited access patterns
存在有限访问模式时的查询优化
- DOI:
- 发表时间:
1999 - 期刊:
- 影响因子:0
- 作者:
D. Florescu;A. Halevy;I. Manolescu;Dan Suciu - 通讯作者:
Dan Suciu
Dan Suciu的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Dan Suciu', 18)}}的其他基金
NSF-BSF: III: Small: Data Driven Schema
NSF-BSF:III:小型:数据驱动模式
- 批准号:
2109922 - 财政年份:2021
- 资助金额:
$ 60万 - 项目类别:
Continuing Grant
III: Medium: Collaborative Research: Reasoning about Optimizers for Data-Intensive Systems
III:媒介:协作研究:数据密集型系统优化器的推理
- 批准号:
1954222 - 财政年份:2020
- 资助金额:
$ 60万 - 项目类别:
Continuing Grant
III:Small: Optimal Query Processing meets Information Theory: from Proofs to Algorithms
III:Small:最优查询处理遇到信息论:从证明到算法
- 批准号:
1907997 - 财政年份:2019
- 资助金额:
$ 60万 - 项目类别:
Continuing Grant
III: Medium: Collaborative Research: A Unified and Declarative Approach to Causal Analysis for Big Data
III:媒介:协作研究:大数据因果分析的统一声明式方法
- 批准号:
1703281 - 财政年份:2017
- 资助金额:
$ 60万 - 项目类别:
Standard Grant
III: Small: Scalable Probabilistic Inference for Large Knowledge Bases
III:小:大型知识库的可扩展概率推理
- 批准号:
1614738 - 财政年份:2016
- 资助金额:
$ 60万 - 项目类别:
Standard Grant
III: Small: Scalable Probabilistic Inference for Large Knowledge Bases
III:小:大型知识库的可扩展概率推理
- 批准号:
1614738 - 财政年份:2016
- 资助金额:
$ 60万 - 项目类别:
Standard Grant
AitF: FULL: Query Processing with Optimal Communication Cost
AitF:FULL:具有最佳通信成本的查询处理
- 批准号:
1535565 - 财政年份:2015
- 资助金额:
$ 60万 - 项目类别:
Standard Grant
BIGDATA: Mid-Scale: DCM: A Formal Foundation for Big Data Management
BIGDATA:中型:DCM:大数据管理的正式基础
- 批准号:
1247469 - 财政年份:2013
- 资助金额:
$ 60万 - 项目类别:
Continuing Grant
III: Small: Query Compilation on Probabilistic Databases
III:小:概率数据库上的查询编译
- 批准号:
1115188 - 财政年份:2011
- 资助金额:
$ 60万 - 项目类别:
Standard Grant
III: Small: BeliefDB - Adding Belief Annotations to Databases
III:小:BeliefDB - 向数据库添加信念注释
- 批准号:
0915054 - 财政年份:2009
- 资助金额:
$ 60万 - 项目类别:
Standard Grant
相似国自然基金
小分子代谢物Catechin与TRPV1相互作用激活外周感觉神经元介导尿毒症瘙痒的机制研究
- 批准号:82371229
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
DHEA抑制小胶质细胞Fis1乳酸化修饰减轻POCD的机制
- 批准号:82301369
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
异常激活的小胶质细胞通过上调CTSS抑制微血管特异性因子MFSD2A表达促进1型糖尿病视网膜病变的免疫学机制研究
- 批准号:82370827
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
SETDB1调控小胶质细胞功能及参与阿尔茨海默病发病机制的研究
- 批准号:82371419
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
PTBP1驱动H4K12la/BRD4/HIF1α复合物-PKM2正反馈环路促进非小细胞肺癌糖代谢重编程的机制研究及治疗方案探索
- 批准号:82303616
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
相似海外基金
微小悪性腫瘍の標的・診断・治療を実現するアパタイトナノ粒子の創成
创建用于靶向、诊断和治疗微恶性肿瘤的磷灰石纳米粒子
- 批准号:
24KJ1179 - 财政年份:2024
- 资助金额:
$ 60万 - 项目类别:
Grant-in-Aid for JSPS Fellows
小分子抗体を利用した標的タンパク質分解系の開発
使用小分子抗体开发靶向蛋白质降解系统
- 批准号:
24KJ1219 - 财政年份:2024
- 资助金额:
$ 60万 - 项目类别:
Grant-in-Aid for JSPS Fellows
レーザ照射による血小板の能動的rt-PA放出を用いた新規血栓治療法の開発
利用激光照射血小板释放活性 rt-PA 开发一种新的血栓治疗方法
- 批准号:
24KJ1977 - 财政年份:2024
- 资助金额:
$ 60万 - 项目类别:
Grant-in-Aid for JSPS Fellows
新規抗血小板療法を目指すインテグリンαIIbβ3活性化キネティクス制御の網羅的解析
新型抗血小板治疗整合素αIIbβ3激活动力学控制的综合分析
- 批准号:
24K11538 - 财政年份:2024
- 资助金额:
$ 60万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
短腸症候群治療を目的とした細胞シートによる新規小腸延長術式の開発
使用细胞片层开发新的小肠延长技术来治疗短肠综合征
- 批准号:
24K11787 - 财政年份:2024
- 资助金额:
$ 60万 - 项目类别:
Grant-in-Aid for Scientific Research (C)