III: Medium: Collaborative Research: A Unified and Declarative Approach to Causal Analysis for Big Data

III:媒介:协作研究:大数据因果分析的统一声明式方法

基本信息

  • 批准号:
    1703281
  • 负责人:
  • 金额:
    $ 40.8万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2017
  • 资助国家:
    美国
  • 起止时间:
    2017-09-01 至 2021-08-31
  • 项目状态:
    已结题

项目摘要

Observational data is available today in multi-relational form, often extracted from various sources, and stored in multiple flat and interrelated tables. Standard statistical methods for conducting causal inference on observational data assume a very simple data model: a single table with independent units. This research has the potential to significantly impact application domains where differentiating causality from correlation is essential, e.g., education policy and cancer genomics. The HUME project develops techniques for efficient causal analysis using a declarative approach, over complex views, and over large datasets that are integrated from disparate data sources. HUME uses a SQL-like language and is integrated with a relational database system.The project develops techniques for defining arbitrarily complex units, treatments, outcomes, and covariates, by combining joins, data mapping, and aggregates across multiple tables, and uses a causal network to choose a good set of covariates for causal inference. The first part of the project develops scalable techniques for sub-classification and matching for large data sets obtained by declaratively integrating multiple data sources. The second part of the project develops scalable methods for discovering causal relationships among the attributes in the views by constraint-based, search-based, and hybrid discovery processes. Finally, the third part of the project investigates interferences among units arising from the complex views by designing normal forms and automatic inference of underlying assumptions exploiting techniques from database theory.
如今,观测数据以多关系形式提供,通常从各种来源提取,并存储在多个平面且相互关联的表中。 对观测数据进行因果推断的标准统计方法假设一个非常简单的数据模型:具有独立单元的单个表。 这项研究有可能对区分因果关系和相关性至关重要的应用领域产生重大影响,例如教育政策和癌症基因组学。 HUME 项目开发了使用声明性方法、针对复杂视图以及从不同数据源集成的大型数据集进行有效因果分析的技术。 HUME 使用类似 SQL 的语言,并与关系数据库系统集成。该项目开发了通过组合联接、数据映射和跨多个表的聚合来定义任意复杂的单元、处理、结果和协变量的技术,并使用因果关系网络选择一组好的协变量进行因果推理。 该项目的第一部分开发可扩展的技术,用于对通过声明式集成多个数据源获得的大型数据集进行子分类和匹配。 该项目的第二部分开发可扩展的方法,通过基于约束、基于搜索和混合的发现过程来发现视图中属性之间的因果关系。最后,该项目的第三部分通过设计范式和利用数据库理论技术自动推断基本假设来研究由于复杂视图而产生的单元之间的干扰。

项目成果

期刊论文数量(7)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Bag Query Containment and Information Theory
包查询遏制和信息论
  • DOI:
    10.1145/3472391
  • 发表时间:
    2021-09
  • 期刊:
  • 影响因子:
    1.8
  • 作者:
    Khamis, Mahmoud Abo;Kolaitis, Phokion G.;Ngo, Hung Q.;Suciu, Dan
  • 通讯作者:
    Suciu, Dan
Bag Query Containment and Information Theory
包查询遏制和信息论
  • DOI:
    10.1145/3375395.3387645
  • 发表时间:
    2020-06
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Abo Khamis, Mahmoud;Kolaitis, Phokion G.;Ngo, Hung Q.;Suciu, Dan
  • 通讯作者:
    Suciu, Dan
Causal Relational Learning
因果关系学习
Probabilistic Databases for All
适合所有人的概率数据库
  • DOI:
    10.1145/3375395.3389129
  • 发表时间:
    2020-06
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Suciu; Dan
  • 通讯作者:
    Dan
HypDB: a demonstration of detecting, explaining and resolving bias in OLAP queries
HypDB:检测、解释和解决 OLAP 查询中偏差的演示
  • DOI:
    10.14778/3229863.3236260
  • 发表时间:
    2018-08
  • 期刊:
  • 影响因子:
    2.5
  • 作者:
    Salimi, Babak;Cole, Corey;Li, Peter;Gehrke, Johannes;Suciu, Dan
  • 通讯作者:
    Suciu, Dan
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Dan Suciu其他文献

SQB : Session-based Query Browsing for More Effective Query Reuse
SQB:基于会话的查询浏览以实现更有效的查询重用
  • DOI:
  • 发表时间:
    2024-09-14
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Nodira Khoussainova;YongChul Kwon;W. Liao;M. Balazinska;Wolfgang Gatterbauer;Dan Suciu
  • 通讯作者:
    Dan Suciu
Some experiments on the Marangoni effect
马兰戈尼效应的一些实验
  • DOI:
    10.1002/aic.690130616
  • 发表时间:
    1967-11-01
  • 期刊:
  • 影响因子:
    3.7
  • 作者:
    Dan Suciu;O. Smigelschi;E. Ruckenstein
  • 通讯作者:
    E. Ruckenstein
Managing Structured Collections of Community Data
管理社区数据的结构化集合
Color: A Framework for Applying Graph Coloring to Subgraph Cardinality Estimation
颜色:将图着色应用于子图基数估计的框架
  • DOI:
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kyle Deeds;Diandre Sabale;Moe Kayali;Dan Suciu
  • 通讯作者:
    Dan Suciu
Query optimization in the presence of limited access patterns
存在有限访问模式时的查询优化
  • DOI:
  • 发表时间:
    1999
  • 期刊:
  • 影响因子:
    0
  • 作者:
    D. Florescu;A. Halevy;I. Manolescu;Dan Suciu
  • 通讯作者:
    Dan Suciu

Dan Suciu的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Dan Suciu', 18)}}的其他基金

III: Small: Datalog with Aggregates: Complexity, Optimization, Evaluation
III:小:带有聚合的数据记录:复杂性、优化、评估
  • 批准号:
    2314527
  • 财政年份:
    2023
  • 资助金额:
    $ 40.8万
  • 项目类别:
    Standard Grant
NSF-BSF: III: Small: Data Driven Schema
NSF-BSF:III:小型:数据驱动模式
  • 批准号:
    2109922
  • 财政年份:
    2021
  • 资助金额:
    $ 40.8万
  • 项目类别:
    Continuing Grant
III: Medium: Collaborative Research: Reasoning about Optimizers for Data-Intensive Systems
III:媒介:协作研究:数据密集型系统优化器的推理
  • 批准号:
    1954222
  • 财政年份:
    2020
  • 资助金额:
    $ 40.8万
  • 项目类别:
    Continuing Grant
III:Small: Optimal Query Processing meets Information Theory: from Proofs to Algorithms
III:Small:最优查询处理遇到信息论:从证明到算法
  • 批准号:
    1907997
  • 财政年份:
    2019
  • 资助金额:
    $ 40.8万
  • 项目类别:
    Continuing Grant
III: Small: Scalable Probabilistic Inference for Large Knowledge Bases
III:小:大型知识库的可扩展概率推理
  • 批准号:
    1614738
  • 财政年份:
    2016
  • 资助金额:
    $ 40.8万
  • 项目类别:
    Standard Grant
III: Small: Scalable Probabilistic Inference for Large Knowledge Bases
III:小:大型知识库的可扩展概率推理
  • 批准号:
    1614738
  • 财政年份:
    2016
  • 资助金额:
    $ 40.8万
  • 项目类别:
    Standard Grant
AitF: FULL: Query Processing with Optimal Communication Cost
AitF:FULL:具有最佳通信成本的查询处理
  • 批准号:
    1535565
  • 财政年份:
    2015
  • 资助金额:
    $ 40.8万
  • 项目类别:
    Standard Grant
BIGDATA: Mid-Scale: DCM: A Formal Foundation for Big Data Management
BIGDATA:中型:DCM:大数据管理的正式基础
  • 批准号:
    1247469
  • 财政年份:
    2013
  • 资助金额:
    $ 40.8万
  • 项目类别:
    Continuing Grant
III: Small: Query Compilation on Probabilistic Databases
III:小:概率数据库上的查询编译
  • 批准号:
    1115188
  • 财政年份:
    2011
  • 资助金额:
    $ 40.8万
  • 项目类别:
    Standard Grant
III: Small: BeliefDB - Adding Belief Annotations to Databases
III:小:BeliefDB - 向数据库添加信念注释
  • 批准号:
    0915054
  • 财政年份:
    2009
  • 资助金额:
    $ 40.8万
  • 项目类别:
    Standard Grant

相似国自然基金

基于机器学习和经典电动力学研究中等尺寸金属纳米粒子的量子表面等离激元
  • 批准号:
    22373002
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
基于挥发性分布和氧化校正的大气半/中等挥发性有机物来源解析方法构建
  • 批准号:
    42377095
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
中等质量黑洞附近的暗物质分布及其IMRI系统引力波回波探测
  • 批准号:
    12365008
  • 批准年份:
    2023
  • 资助金额:
    32 万元
  • 项目类别:
    地区科学基金项目
复合低维拓扑材料中等离激元增强光学响应的研究
  • 批准号:
    12374288
  • 批准年份:
    2023
  • 资助金额:
    52 万元
  • 项目类别:
    面上项目
中等垂直风切变下非对称型热带气旋快速增强的物理机制研究
  • 批准号:
    42305004
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

III : Medium: Collaborative Research: From Open Data to Open Data Curation
III:媒介:协作研究:从开放数据到开放数据管理
  • 批准号:
    2420691
  • 财政年份:
    2024
  • 资助金额:
    $ 40.8万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Medium: New Machine Learning Empowered Nanoinformatics System for Advancing Nanomaterial Design
合作研究:III:媒介:新的机器学习赋能纳米信息学系统,促进纳米材料设计
  • 批准号:
    2402311
  • 财政年份:
    2023
  • 资助金额:
    $ 40.8万
  • 项目类别:
    Standard Grant
Collaborative Research: IIS: III: MEDIUM: Learning Protein-ish: Foundational Insight on Protein Language Models for Better Understanding, Democratized Access, and Discovery
协作研究:IIS:III:中等:学习蛋白质:对蛋白质语言模型的基础洞察,以更好地理解、民主化访问和发现
  • 批准号:
    2310114
  • 财政年份:
    2023
  • 资助金额:
    $ 40.8万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Medium: Towards Effective Detection and Mitigation for Shortcut Learning: A Data Modeling Framework
协作研究:III:媒介:针对捷径学习的有效检测和缓解:数据建模框架
  • 批准号:
    2310262
  • 财政年份:
    2023
  • 资助金额:
    $ 40.8万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Medium: Towards Effective Detection and Mitigation for Shortcut Learning: A Data Modeling Framework
协作研究:III:媒介:针对捷径学习的有效检测和缓解:数据建模框架
  • 批准号:
    2310260
  • 财政年份:
    2023
  • 资助金额:
    $ 40.8万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了