III: Small: Persistent Data Summaries: Temporal Analytics on Big Data Histories
III:小:持久数据摘要:大数据历史的时态分析
基本信息
- 批准号:1816149
- 负责人:
- 金额:$ 49.99万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2018
- 资助国家:美国
- 起止时间:2018-09-01 至 2023-08-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
An increasing number of applications require the storage of and access to all historical data to support rich analytics, learning, and mining operations. This project develops a series of methods to summarize data so that it can be queried with respect to not just the full data set, as is standard, but with respect to the state of the data set at any historical time. These summaries integrate with large temporal databases, in both offline batched-processing and online streaming application scenarios. The effectiveness of these methods will be demonstrated on an enormous scientific database of atmospheric data collected for 20 years from over 40,000 weather stations. We will work with industry collaborators to help deploy our new algorithms, and the results will be integrated into education and outreach efforts surrounding the growth of data science initiatives. More specifically, this project extends and combines approximate query processing with temporal big data. In particular, instead of (or on top of) using a multi-version database, this project designs and implements persistent data summaries (PDSs) that offer interactive temporal analytics with strong theoretical guarantees on their approximation quality. In additional to formalizing these models, this project develops practical PDS implementations for sampling-based summaries, data sketches, and core sets that support advanced analytical queries.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
越来越多的应用程序需要存储和访问所有历史数据,以支持丰富的分析、学习和挖掘操作。 该项目开发了一系列汇总数据的方法,以便不仅可以按照标准查询完整数据集,还可以查询任何历史时间数据集的状态。 这些摘要在离线批处理和在线流应用场景中与大型时态数据库集成。 这些方法的有效性将在一个庞大的科学数据库中得到证明,该数据库包含 20 年来从 40,000 多个气象站收集的大气数据。 我们将与行业合作者合作,帮助部署我们的新算法,并将结果纳入围绕数据科学计划发展的教育和推广工作中。 更具体地说,该项目扩展了近似查询处理并将其与时态大数据相结合。 特别是,该项目设计并实现了持久数据摘要(PDS),而不是(或在其之上)使用多版本数据库,该数据摘要提供交互式时间分析,并为其近似质量提供了强有力的理论保证。 除了形式化这些模型之外,该项目还为基于采样的摘要、数据草图和支持高级分析查询的核心集开发了实用的 PDS 实现。该奖项反映了 NSF 的法定使命,并通过使用基金会的知识进行评估,被认为值得支持。优点和更广泛的影响审查标准。
项目成果
期刊论文数量(10)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
The GaussianSketch for Almost Relative Error Kernel Distance
- DOI:10.4230/lipics.approx/random.2020.12
- 发表时间:2018-11
- 期刊:
- 影响因子:0
- 作者:J. M. Phillips;W. Tai
- 通讯作者:J. M. Phillips;W. Tai
Scalable Spatial Scan Statistics for Trajectories
- DOI:10.1145/3394046
- 发表时间:2019-06
- 期刊:
- 影响因子:0
- 作者:Michael Matheny;Dong Xie;J. M. Phillips
- 通讯作者:Michael Matheny;Dong Xie;J. M. Phillips
At-the-time and Back-in-time Persistent Sketches
当时和过去的持久草图
- DOI:10.1145/3448016.3452802
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:Shi, Benwei;Zhao, Zhuoyue;Peng, Yanqing;Li, Feifei;Phillips, Jeff M.
- 通讯作者:Phillips, Jeff M.
Simple Distances for Trajectories via Landmarks
- DOI:10.1145/3347146.3359098
- 发表时间:2018-04
- 期刊:
- 影响因子:0
- 作者:J. M. Phillips;Pingfan Tang
- 通讯作者:J. M. Phillips;Pingfan Tang
Persistent Bloom Filter: Membership Testing for the Entire History
- DOI:10.1145/3183713.3183737
- 发表时间:2018-05
- 期刊:
- 影响因子:0
- 作者:Yanqing Peng;Jinwei Guo;Feifei Li;Weining Qian;Aoying Zhou
- 通讯作者:Yanqing Peng;Jinwei Guo;Feifei Li;Weining Qian;Aoying Zhou
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Jeff Phillips其他文献
Cerebellar cortical degeneration in adult American Staffordshire Terriers.
成年美国斯塔福郡梗犬的小脑皮质变性。
- DOI:
10.1111/j.1939-1676.2004.tb00161.x - 发表时间:
2004 - 期刊:
- 影响因子:2.6
- 作者:
N. Olby;S. Blot;J. Thibaud;Jeff Phillips;D. O’Brien;J. Burr;J. Berg;T. Brown;M. Breen - 通讯作者:
M. Breen
Use of modified barium swallow study to measure posterior airway space in obstructive sleep apnea
使用改良的吞钡研究测量阻塞性睡眠呼吸暂停的后气道空间
- DOI:
- 发表时间:
2016 - 期刊:
- 影响因子:1.4
- 作者:
Tyler Crosby;Jeff Phillips;A. Carbo;Kelley Babcock;C. Nathan - 通讯作者:
C. Nathan
C APTURING U SER I NTENT WHEN B RUSHING IN S CATTERPLOTS
在刷 S Catterplots 时捕捉用户意图
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
K. Gadhave;Jochen Görtler;Zach Cutler;C. Nobre;Oliver Deussen;Miriah Meyer;Jeff Phillips;Alexander Lex;Carolina No - 通讯作者:
Carolina No
Interpretable Debiasing of Vectorized Language Representations with Iterative Orthogonalization
通过迭代正交化矢量化语言表示的可解释去偏
- DOI:
- 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
Prince Osei Aboagye;Yan Zheng;Jack Shunn;Chin-Chia Michael Yeh;Junpeng Wang;Zhongfang Zhuang;Huiyuan Chen;Liang Wang;Wei Zhang;Jeff Phillips - 通讯作者:
Jeff Phillips
Jeff Phillips的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Jeff Phillips', 18)}}的其他基金
III : Small : Integrating and Learning on Spatial Data via Multi-Agent Simulation
III:小:通过多智能体模拟集成和学习空间数据
- 批准号:
2311954 - 财政年份:2023
- 资助金额:
$ 49.99万 - 项目类别:
Standard Grant
AF: Small: The Geometry of Learning on Structured Data Objects
AF:小:结构化数据对象学习的几何
- 批准号:
2115677 - 财政年份:2021
- 资助金额:
$ 49.99万 - 项目类别:
Standard Grant
III: Small: Towards a Database Engine for Interactive and Online Sampling and Analytics
III:小型:面向交互式在线采样和分析的数据库引擎
- 批准号:
1619287 - 财政年份:2016
- 资助金额:
$ 49.99万 - 项目类别:
Standard Grant
CAREER: Foundations for Geometric Analysis of Noisy Data
职业:噪声数据几何分析的基础
- 批准号:
1350888 - 财政年份:2014
- 资助金额:
$ 49.99万 - 项目类别:
Continuing Grant
相似国自然基金
单细胞分辨率下的石杉碱甲介导小胶质细胞极化表型抗缺血性脑卒中的机制研究
- 批准号:82304883
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
小分子无半胱氨酸蛋白调控生防真菌杀虫活性的作用与机理
- 批准号:32372613
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
诊疗一体化PS-Hc@MB协同训练介导脑小血管病康复的作用及机制研究
- 批准号:82372561
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
非小细胞肺癌MECOM/HBB通路介导血红素代谢异常并抑制肿瘤起始细胞铁死亡的机制研究
- 批准号:82373082
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
FATP2/HILPDA/SLC7A11轴介导肿瘤相关中性粒细胞脂代谢重编程影响非小细胞肺癌放疗免疫的作用和机制研究
- 批准号:82373304
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
相似海外基金
III: Small: Partitioning Big Data for the High Performance Computation of Persistent Homology
III:小:对大数据进行分区以实现持久同调的高性能计算
- 批准号:
1909096 - 财政年份:2019
- 资助金额:
$ 49.99万 - 项目类别:
Standard Grant
Persistent microRNA changes in serum of cancer-free breast cancer patients
无癌乳腺癌患者血清中持续的 microRNA 变化
- 批准号:
8240038 - 财政年份:2011
- 资助金额:
$ 49.99万 - 项目类别:
Persistent microRNA changes in serum of cancer-free breast cancer patients
无癌乳腺癌患者血清中持续的 microRNA 变化
- 批准号:
8104694 - 财政年份:2011
- 资助金额:
$ 49.99万 - 项目类别:
Integrative And Molecular Studies Of Pain And Pain Control
疼痛和疼痛控制的综合和分子研究
- 批准号:
10691772 - 财政年份:
- 资助金额:
$ 49.99万 - 项目类别:
Integrative And Molecular Studies Of Pain And Pain Control
疼痛和疼痛控制的综合和分子研究
- 批准号:
10262642 - 财政年份:
- 资助金额:
$ 49.99万 - 项目类别: