CAREER: FIREFLY - Rich Explanations for Database Queries
CAREER: FIREFLY - 数据库查询的丰富解释
基本信息
- 批准号:1552538
- 负责人:
- 金额:$ 55万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2016
- 资助国家:美国
- 起止时间:2016-08-01 至 2023-07-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
With the recent popularity of Big Data, a range of people including data analysts, scientists, decision makers, and ordinary Internet users are increasingly seeking high level explanations for trends and anomalies in available datasets. Such a user typically runs queries on the datasets, computes aggregates, plots the answers on a graph, and looks for explanations for what she observes. For example, she may ask: "Why are two graphs similar or different?", "Why is a sequence of points increasing or decreasing?", "Why is there a sudden spike or dip in a graph?", and so on. Existing data analysis systems focus on large-scale statistical analytics, multi-dimensional data aggregation, interactive data exploration, and sophisticated visualization support. However, there are no tools currently available that offer semantic explanations to users. This project develops a toolkit named FIREFLY (Formal Interactive Rich Explanations On-The-Fly) that provides fast, rich, insightful explanations in response to such 'why' questions asked by users. The automatic explanations provided by this tool will help users harness Big Data more effectively, and the research findings of the project will enrich Big Data analytics techniques. Furthermore, the courses developed in conjunction with this project and the research experience that it will provide students at various levels will help train them to be future researchers. Special attention will be paid to supporting diversity in this process. This project introduces a new perspective in data analysis principled upon the notions of causality, counterfactuals, and interventions. FIREFLY aims to find synopses of properties on input tuples as explanations, such that by restricting the database to tuples that entail a different value of these synopses, the answer to the query and the observation of the user changes, thereby explaining the observation. In order to efficiently return meaningful synopses as explanations, this project will develop theory, algorithms, and optimizations along three main research directions: (1) a rich framework will be established to support meaningful explanations, large classes of database queries, and a variety of questions asked by the users, (2) an interactive tool with a graphical user interface will be built to help users run queries, ask questions, and explore the explanations returned by the tool, and (3) new techniques will be developed to handle uncertainty in the input data and in the explanations themselves.
随着大数据最近的流行,包括数据分析师、科学家、决策者和普通互联网用户在内的许多人越来越多地寻求对可用数据集中的趋势和异常现象的高级解释。这样的用户通常对数据集运行查询,计算聚合,在图表上绘制答案,并寻找对她所观察到的内容的解释。例如,她可能会问:“为什么两个图表相似或不同?”、“为什么一系列点会增加或减少?”、“为什么图表中会突然出现峰值或下降?”等等。现有的数据分析系统侧重于大规模统计分析、多维数据聚合、交互式数据探索和复杂的可视化支持。然而,目前还没有可用的工具可以为用户提供语义解释。该项目开发了一个名为 FIREFLY(Formal Interactive Rich Explanations On-The-Fly)的工具包,它可以针对用户提出的此类“为什么”问题提供快速、丰富、富有洞察力的解释。该工具提供的自动解释将帮助用户更有效地利用大数据,该项目的研究成果将丰富大数据分析技术。此外,与该项目一起开发的课程以及它将为各个级别的学生提供的研究经验将有助于将他们培养成为未来的研究人员。在此过程中将特别关注支持多样性。该项目引入了基于因果关系、反事实和干预概念的数据分析的新视角。 FIREFLY 旨在找到输入元组上的属性概要作为解释,这样通过将数据库限制为需要这些概要的不同值的元组,查询的答案和用户的观察会发生变化,从而解释观察结果。为了有效地返回有意义的概要作为解释,该项目将沿着三个主要研究方向开发理论、算法和优化:(1)将建立丰富的框架来支持有意义的解释、大类数据库查询和各种用户提出的问题,(2) 将构建具有图形用户界面的交互式工具来帮助用户运行查询、提出问题并探索该工具返回的解释,以及 (3) 将开发新技术来处理不确定性在输入数据和解释本身中。
项目成果
期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
iQCAR: inter-Query Contention Analyzer for Data Analytics Frameworks
- DOI:10.1145/3299869.3319904
- 发表时间:2019-06-01
- 期刊:
- 影响因子:0
- 作者:Prajakta Kalmegh;S. Babu;Sudeepa Roy
- 通讯作者:Sudeepa Roy
iQCAR: A Demonstration of an Inter-Query Contention Analyzer for Cluster Computing Frameworks
iQCAR:集群计算框架的查询间争用分析器演示
- DOI:10.1145/3183713.3193567
- 发表时间:2018-01
- 期刊:
- 影响因子:0
- 作者:Kalmegh, Prajakta;Lundberg, Harrison;Xu, Frederick;Babu, Shivnath;Roy, Sudeepa
- 通讯作者:Roy, Sudeepa
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Sudeepa Roy其他文献
I-Rex
霸王龙
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:2.5
- 作者:
Zhengjie Miao;Tiangang Chen;Alexander Bendeck;Kevin Day;Sudeepa Roy;Jun Yang - 通讯作者:
Jun Yang
Faster query answering in probabilistic databases using read-once functions
使用一次读取函数在概率数据库中更快地回答查询
- DOI:
- 发表时间:
2010 - 期刊:
- 影响因子:0
- 作者:
Sudeepa Roy;Vittorio Perduca;V. Tannen - 通讯作者:
V. Tannen
dame-flame: A Python Library Providing Fast Interpretable Matching for Causal Inference
dame-flame:为因果推理提供快速可解释匹配的 Python 库
- DOI:
10.1093/infdis/jiad158 - 发表时间:
2021-01-06 - 期刊:
- 影响因子:0
- 作者:
Neha R. Gupta;Vittorio Orlandi;Chia;Tianyu Wang;Marco Morucci;Pritam Dey;T. J. Howell;Xian Sun;Angikar Ghosal;Sudeepa Roy;C. Rudin;A. Volfovsky - 通讯作者:
A. Volfovsky
On Multiple Semantics for Declarative Database Repairs
- DOI:
10.1145/3318464.3389721 - 发表时间:
2020-04-10 - 期刊:
- 影响因子:0
- 作者:
Amir Gilad;Daniel Deutch;Sudeepa Roy - 通讯作者:
Sudeepa Roy
Interactive Summarization and Exploration of Top Aggregate Query Answers
顶级聚合查询答案的交互式总结和探索
- DOI:
10.14778/3275366.3275369 - 发表时间:
2018-07-31 - 期刊:
- 影响因子:0
- 作者:
Yuhao Wen;Xiao;Sudeepa Roy;Jun Yang - 通讯作者:
Jun Yang
Sudeepa Roy的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Sudeepa Roy', 18)}}的其他基金
III: Medium: Collaborative Research: A Unified and Declarative Approach to Causal Analysis for Big Data
III:媒介:协作研究:大数据因果分析的统一声明式方法
- 批准号:
1703431 - 财政年份:2017
- 资助金额:
$ 55万 - 项目类别:
Standard Grant
III: Student Travel Fellowships for SIGMOD 2017
III:SIGMOD 2017 学生旅行奖学金
- 批准号:
1719628 - 财政年份:2017
- 资助金额:
$ 55万 - 项目类别:
Standard Grant
相似国自然基金
河源区水栖萤火虫环境行为调查与栖息地评价指数模型研究
- 批准号:
- 批准年份:2022
- 资助金额:33 万元
- 项目类别:地区科学基金项目
熠萤亚科萤火虫适应水环境的分子基础研究
- 批准号:31960286
- 批准年份:2019
- 资助金额:40 万元
- 项目类别:地区科学基金项目
面向大规模调度问题的并行参数自适应萤火虫优化算法研究
- 批准号:61866014
- 批准年份:2018
- 资助金额:37.0 万元
- 项目类别:地区科学基金项目
加权平方梯度萤火虫算法及其在断层自动识别中的应用
- 批准号:41804101
- 批准年份:2018
- 资助金额:25.0 万元
- 项目类别:青年科学基金项目
Hox基因Abd-B调控萤火虫闪光行为的分子机制研究
- 批准号:31872281
- 批准年份:2018
- 资助金额:62.0 万元
- 项目类别:面上项目
相似海外基金
ARTS: Deploying integrative systematics to untangle Lucidota, the Gordian knot of Neotropical firefly taxonomy.
艺术:运用综合系统学来解开新热带萤火虫分类学的棘手难题 Lucidota。
- 批准号:
2323041 - 财政年份:2023
- 资助金额:
$ 55万 - 项目类别:
Standard Grant
CAREER: Principles of Firefly Rhythmic Synchronization
职业:萤火虫节律同步原理
- 批准号:
2239331 - 财政年份:2023
- 资助金额:
$ 55万 - 项目类别:
Continuing Grant
Development of novel fetal hemoglobin inducers using targeted protein degradation
利用靶向蛋白质降解开发新型胎儿血红蛋白诱导剂
- 批准号:
10605620 - 财政年份:2023
- 资助金额:
$ 55万 - 项目类别:
AGR2-superantigen vaccine conjugate for the treatment of pancreaticductal adenocarcinoma
AGR2-超抗原疫苗缀合物用于治疗胰导管腺癌
- 批准号:
10377760 - 财政年份:2022
- 资助金额:
$ 55万 - 项目类别: