III: Medium: Collaborative Research: A Unified and Declarative Approach to Causal Analysis for Big Data

III:媒介:协作研究:大数据因果分析的统一声明式方法

基本信息

  • 批准号:
    1703431
  • 负责人:
  • 金额:
    $ 40.8万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2017
  • 资助国家:
    美国
  • 起止时间:
    2017-09-01 至 2022-08-31
  • 项目状态:
    已结题

项目摘要

Observational data is available today in multi-relational form, often extracted from various sources, and stored in multiple flat and interrelated tables. Standard statistical methods for conducting causal inference on observational data assume a very simple data model: a single table with independent units. This research has the potential to significantly impact application domains where differentiating causality from correlation is essential, e.g., education policy and cancer genomics. The HUME project develops techniques for efficient causal analysis using a declarative approach, over complex views, and over large datasets that are integrated from disparate data sources. HUME uses a SQL-like language and is integrated with a relational database system.The project develops techniques for defining arbitrarily complex units, treatments, outcomes, and covariates, by combining joins, data mapping, and aggregates across multiple tables, and uses a causal network to choose a good set of covariates for causal inference. The first part of the project develops scalable techniques for sub-classification and matching for large data sets obtained by declaratively integrating multiple data sources. The second part of the project develops scalable methods for discovering causal relationships among the attributes in the views by constraint-based, search-based, and hybrid discovery processes. Finally, the third part of the project investigates interferences among units arising from the complex views by designing normal forms and automatic inference of underlying assumptions exploiting techniques from database theory.
如今,观测数据以多关系形式提供,通常从各种来源提取,并存储在多个平面且相互关联的表中。 对观测数据进行因果推断的标准统计方法假设一个非常简单的数据模型:具有独立单元的单个表。 这项研究有可能对区分因果关系和相关性至关重要的应用领域产生重大影响,例如教育政策和癌症基因组学。 HUME 项目开发了使用声明性方法、针对复杂视图以及从不同数据源集成的大型数据集进行有效因果分析的技术。 HUME 使用类似 SQL 的语言,并与关系数据库系统集成。该项目开发了通过组合联接、数据映射和跨多个表的聚合来定义任意复杂的单元、处理、结果和协变量的技术,并使用因果关系网络选择一组好的协变量进行因果推理。 该项目的第一部分开发可扩展的技术,用于对通过声明式集成多个数据源获得的大型数据集进行子分类和匹配。 该项目的第二部分开发可扩展的方法,通过基于约束、基于搜索和混合的发现过程来发现视图中属性之间的因果关系。最后,该项目的第三部分通过设计范式和利用数据库理论技术自动推断基本假设来研究由于复杂视图而产生的单元之间的干扰。

项目成果

期刊论文数量(10)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
FLAME: A Fast Large-scale Almost Matching Exactly Approach to Causal Inference
FLAME:一种快速、大规模、几乎完全匹配的因果推理方法
  • DOI:
  • 发表时间:
    2017-07-19
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Sudeepa Roy;C. Rudin;A. Volfovsky;Tianyu Wang
  • 通讯作者:
    Tianyu Wang
Adaptive Hyper-box Matching for Interpretable Individualized Treatment Effect Estimation
用于可解释的个体化治疗效果估计的自适应超框匹配
iQCAR: inter-Query Contention Analyzer for Data Analytics Frameworks
iQCAR:数据分析框架的查询间争用分析器
Almost-Matching-Exactly for Treatment Effect Estimation under Network Interference
网络干扰下的几乎匹配-精确治疗效果估计
Interpretable Almost Matching Exactly With Instrumental Variables
可解释的几乎与工具变量完全匹配
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Sudeepa Roy其他文献

I-Rex
霸王龙
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    2.5
  • 作者:
    Zhengjie Miao;Tiangang Chen;Alexander Bendeck;Kevin Day;Sudeepa Roy;Jun Yang
  • 通讯作者:
    Jun Yang
Faster query answering in probabilistic databases using read-once functions
使用一次读取函数在概率数据库中更快地回答查询
dame-flame: A Python Library Providing Fast Interpretable Matching for Causal Inference
dame-flame:为因果推理提供快速可解释匹配的 Python 库
  • DOI:
    10.1093/infdis/jiad158
  • 发表时间:
    2021-01-06
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Neha R. Gupta;Vittorio Orlandi;Chia;Tianyu Wang;Marco Morucci;Pritam Dey;T. J. Howell;Xian Sun;Angikar Ghosal;Sudeepa Roy;C. Rudin;A. Volfovsky
  • 通讯作者:
    A. Volfovsky
On Multiple Semantics for Declarative Database Repairs
Interactive Summarization and Exploration of Top Aggregate Query Answers
顶级聚合查询答案的交互式总结和探索

Sudeepa Roy的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Sudeepa Roy', 18)}}的其他基金

III: Student Travel Fellowships for SIGMOD 2017
III:SIGMOD 2017 学生旅行奖学金
  • 批准号:
    1719628
  • 财政年份:
    2017
  • 资助金额:
    $ 40.8万
  • 项目类别:
    Standard Grant
CAREER: FIREFLY - Rich Explanations for Database Queries
CAREER: FIREFLY - 数据库查询的丰富解释
  • 批准号:
    1552538
  • 财政年份:
    2016
  • 资助金额:
    $ 40.8万
  • 项目类别:
    Continuing Grant

相似国自然基金

基于挥发性分布和氧化校正的大气半/中等挥发性有机物来源解析方法构建
  • 批准号:
    42377095
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
基于机器学习和经典电动力学研究中等尺寸金属纳米粒子的量子表面等离激元
  • 批准号:
    22373002
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
中等质量黑洞附近的暗物质分布及其IMRI系统引力波回波探测
  • 批准号:
    12365008
  • 批准年份:
    2023
  • 资助金额:
    32 万元
  • 项目类别:
    地区科学基金项目
复合低维拓扑材料中等离激元增强光学响应的研究
  • 批准号:
    12374288
  • 批准年份:
    2023
  • 资助金额:
    52 万元
  • 项目类别:
    面上项目
中等垂直风切变下非对称型热带气旋快速增强的物理机制研究
  • 批准号:
    42305004
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

III : Medium: Collaborative Research: From Open Data to Open Data Curation
III:媒介:协作研究:从开放数据到开放数据管理
  • 批准号:
    2420691
  • 财政年份:
    2024
  • 资助金额:
    $ 40.8万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Medium: New Machine Learning Empowered Nanoinformatics System for Advancing Nanomaterial Design
合作研究:III:媒介:新的机器学习赋能纳米信息学系统,促进纳米材料设计
  • 批准号:
    2402311
  • 财政年份:
    2023
  • 资助金额:
    $ 40.8万
  • 项目类别:
    Standard Grant
Collaborative Research: IIS: III: MEDIUM: Learning Protein-ish: Foundational Insight on Protein Language Models for Better Understanding, Democratized Access, and Discovery
协作研究:IIS:III:中等:学习蛋白质:对蛋白质语言模型的基础洞察,以更好地理解、民主化访问和发现
  • 批准号:
    2310114
  • 财政年份:
    2023
  • 资助金额:
    $ 40.8万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Medium: Towards Effective Detection and Mitigation for Shortcut Learning: A Data Modeling Framework
协作研究:III:媒介:针对捷径学习的有效检测和缓解:数据建模框架
  • 批准号:
    2310262
  • 财政年份:
    2023
  • 资助金额:
    $ 40.8万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Medium: Towards Effective Detection and Mitigation for Shortcut Learning: A Data Modeling Framework
协作研究:III:媒介:针对捷径学习的有效检测和缓解:数据建模框架
  • 批准号:
    2310260
  • 财政年份:
    2023
  • 资助金额:
    $ 40.8万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了