III: Small: Data Analysis in the Cloud with Guaranteed and Explainable Performance
III:小型:云端数据分析,性能有保证且可解释
基本信息
- 批准号:1524535
- 负责人:
- 金额:$ 50万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2015
- 资助国家:美国
- 起止时间:2015-09-01 至 2019-08-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Increasingly many users have access to large datasets that they need to analyze. Astronomers, oceanographers, and other domain scientists rely on data analysis for their science. Journalists may want to analyze data to use in their articles. Over the past several years, cloud service providers have been offering an increasingly large selection of data management services for data analytics (e.g., Amazon Elastic MapReduce or Google BigQuery). Cloud services provide a seamless access to powerful data analysis tools, often directly through the browser. Too many services, however, remain too close to the traditional mode of operating a database management system. They reveal too much information about their internal architecture and deployment: Users are required to reason at the level of service instances, instance types, and gigabytes processed. As a result, users today must be data management experts to choose between these services and leverage them in a cost-effective manner. This project will develop new data management techniques that will enable cloud service providers to isolate users from the details of their service internals while offering the ability to trade off price and performance. The project will further develop tools to explain performance and help users re-write their queries to improve it.More specifically, the project will develop new approaches to (1) predict not only the query runtime but whether a query is likely to execute slower than estimated due to failures, skew, cardinality estimation errors, or contention; (2) guarantee query runtimes by dynamically changing both the resources allocated to a query and its failure-handling and skew-handling mechanisms as needed; (3) post specific slowdown factors in case of heavy load and guarantee them through novel scheduling algorithms; and (4) explain query performance and suggest rewrites in a way that does not require users to understand query plans. The project will implement all of the algorithms in the open source Myria cloud data management system (and service) recently developed and in continuous operation at the University of Washington.For further information see the project web site at: http://cloudperf.cs.washington.edu
越来越多的用户可以访问他们需要分析的大型数据集。天文学家、海洋学家和其他领域的科学家依靠数据分析来进行科学研究。记者可能想要分析数据以在他们的文章中使用。在过去几年中,云服务提供商为数据分析提供了越来越多的数据管理服务选择(例如 Amazon Elastic MapReduce 或 Google BigQuery)。云服务通常可以直接通过浏览器无缝访问强大的数据分析工具。然而,太多的服务仍然过于接近操作数据库管理系统的传统模式。它们揭示了太多有关其内部架构和部署的信息:用户需要在服务实例、实例类型和处理的千兆字节级别进行推理。因此,当今的用户必须是数据管理专家,才能在这些服务之间进行选择并以经济高效的方式利用它们。该项目将开发新的数据管理技术,使云服务提供商能够将用户与其服务内部的细节隔离开来,同时提供在价格和性能之间进行权衡的能力。该项目将进一步开发工具来解释性能并帮助用户重新编写查询以改进性能。更具体地说,该项目将开发新方法来 (1) 不仅预测查询运行时间,而且预测查询是否可能执行得比由于故障、偏差、基数估计错误或争用而估计; (2) 通过根据需要动态改变分配给查询的资源及其故障处理和倾斜处理机制来保证查询运行时间; (3) 在重负载的情况下发布特定的减速因素,并通过新颖的调度算法保证它们; (4) 解释查询性能并建议以不需要用户理解查询计划的方式重写。 该项目将实现华盛顿大学最近开发并持续运行的开源 Myria 云数据管理系统(和服务)中的所有算法。有关更多信息,请参阅该项目网站:http://cloudperf.cs .washington.edu
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Magdalena Balazinska其他文献
Sigmod Officers, Committees, and Awardees Chair Vice-chair Secretary/treasurer Sigmod Executive Committee: Advisory Board: Sigmod Information Director: Associate Information Directors: Sigmod Record Editor-in-chief: Sigmod Record Associate Editors: Pods E
Sigmod 官员、委员会和获奖者 主席 副主席 秘书/财务主管 Sigmod 执行委员会: 顾问委员会: Sigmod 信息总监: 副信息总监: Sigmod Record 主编: Sigmod Record 副编辑: Pods E
- DOI:
- 发表时间:
2024-09-13 - 期刊:
- 影响因子:0
- 作者:
Donald Kossmann;A. Ailamaki;Magdalena Balazinska;K. C;an;an;Y. Diao;C. Dyreson;Y. Ioannidis;Christia - 通讯作者:
Christia
USENIX Association Proceedings of MobiSys 2003 : The First International Conference on Mobile Systems , Applications , and Services
USENIX 协会 MobiSys 2003 会议录:第一届移动系统、应用程序和服务国际会议
- DOI:
10.1109/wcnc.2013.6554708 - 发表时间:
2024-09-13 - 期刊:
- 影响因子:0
- 作者:
Magdalena Balazinska - 通讯作者:
Magdalena Balazinska
Sigmod Officers, Committees, and Awardees Chair Vice-chair Secretary/treasurer Sigmod Executive Com Mittee: Advisory Board: Infor Mation Director: Associate Infor Mation Directors: Sigmod Record Associate Editors: Sigmod Disc and Sigmod Anthology Editor: Awards Com Mittee: Jim Gray Doctoral Disserta
Sigmod 官员、委员会和获奖者 主席 副主席 秘书/财务主管 Sigmod 执行委员会 委员会: 顾问委员会: 信息总监: 信息副总监: Sigmod Record 副编辑: Sigmod Disc 和 Sigmod 选集 编辑: Awards Com 委员会 委员会: Jim Gray Doctoral
- DOI:
- 发表时间:
2024-09-14 - 期刊:
- 影响因子:0
- 作者:
Y. Ioannidis;Christian S. Jensen;Ale;ros Labrinidis;ros;S. Amer;C. Dyreson;Maurizio Lenzerini;I. Manolescu;Lisa Singh;Raghu Ramakrishnan;Jeffrey Xu;Yu;Rakesh Agrawal;Phil Bernstein;P. Buneman;David Dewitt;Hector Garcia;Masaru Kitsuregawa;Jiawei Han;A. Laender;Tamer M. Özsu;K. Ramamritham;H. Schek;Rick Snodgrass;G. Weikum;Marcelo Arenas;Denilson Barbosa;U. Çetintemel;M. Jeusfeld;Dongwon Lee;Michael Ley;R. Pottinger;Altigran Soares;Danúbia Incutto Silva;Jun Yang;Magdalena Balazinska;U. Çetintemel;Brian Cooper;C. Galindo;Leonid Libkin;M. Winslett;Georg Gottlob;P. Kolaitis;Jan Paradaens;Jianwen Su;Laura M. Haas;J. Gehrke;Cornell Univ Beng;Chin Ooi;A. Kemper;Henry K Korth;Thau Loo;T. Sellis;Kyu - 通讯作者:
Kyu
SIGMOD Officers , Committees , and Awardees Chair Vice-Chair Secretary / Treasurer
SIGMOD 官员、委员会和获奖者 主席 副主席 秘书/财务主管
- DOI:
- 发表时间:
2011 - 期刊:
- 影响因子:0
- 作者:
Y. Ioannidis;Christian S. Jensen;Alexandros Labrinidis;S. Amer;C. Dyreson;Maurizio Lenzerini;I. Manolescu;Lisa Singh;Raghu Ramakrishnan;Jeffrey Xu;Yu;A. El Abbadi;S. Abiteboul;Rakesh Agrawal;Anastasia Ailamaki;Ricardo A. Baeza;Phil Bernstein;Elisa Bertino;Michael J. Carey;Surajit Chaudhuri;Christos Faloutsos;A. Halevy;Joe Hellerstein;Masaru Kitsuregawa;Donald Kossmann;Renée Miller;C. Mohan;B. Ooi;Meral Ozsoyoglu;Sunita Sarawagi;Min Wang;G. Weikum;Denilson Barbosa;U. Çetintemel;M. Jeusfeld;Georgia Koutrika;Michael Ley;Wim Martens;Rachel Pottinger;Altigran Soares;Danúbia Incutto Silva;Jun Yang;Magdalena Balazinska;Yong Chee;Ugur Chan;Brian Çetintemel;Cesar Cooper;Leonid Galindo;Marianne Libkin;Winslett;Michael Benedikt;P. Kolaitis;Leonid Libkin;Jan Paradaens;T. Schwentick;Laura M. Haas;P. Buneman;J. Gehrke;Cornell Univ Beng;Chin Ooi;A. Kemper;Hank F Korth;A. Laender;Thau Loo;T. Sellis;Kyu - 通讯作者:
Kyu
The BigDAWG Polystore System
- DOI:
10.1145/2814710.2814713 - 发表时间:
2015-06-01 - 期刊:
- 影响因子:0
- 作者:
J. Duggan;Aaron J. Elmore;Michael Stonebraker;Magdalena Balazinska;Bill Howe;Jeremy Kepner;Samuel Madden;David Maier;Timothy G. Mattson;Stanley B. Zdonik - 通讯作者:
Stanley B. Zdonik
Magdalena Balazinska的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Magdalena Balazinska', 18)}}的其他基金
III: Medium: VOCAL: Video Organization and Interactive Compositional AnaLytics
III:媒介:声乐:视频组织和交互式构图分析
- 批准号:
2211133 - 财政年份:2022
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
HDR: I-DIRSE-FW: Accelerating the Engineering Design and Manufacturing Life-Cycle with Data Science
HDR:I-DIRSE-FW:利用数据科学加速工程设计和制造生命周期
- 批准号:
1934292 - 财政年份:2019
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
SHF: Medium: A Visual Cloud for Virtual Reality Applications
SHF:Medium:虚拟现实应用程序的视觉云
- 批准号:
1703051 - 财政年份:2017
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
IGERT-CIF21: Big Data U: A Program for Integrated Multidisciplinary Education and Research for Big Data Science
IGERT-CIF21:大数据 U:大数据科学综合多学科教育和研究计划
- 批准号:
1258485 - 财政年份:2013
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
CiC RDDC: Relational Data Markets in the Cloud
CiC RDDC:云中的关系数据市场
- 批准号:
1047815 - 财政年份:2011
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
III: Large: Collaborative Research: SciDB - An Array Oriented Data Management System for Massive Scale Scientific Data
III:大型:协作研究:SciDB - 用于大规模科学数据的面向数组的数据管理系统
- 批准号:
1110370 - 财政年份:2011
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
CDI - Type II: Transforming Community-Based Elder Care through Heterogeneous Activity Sensing Analytics
CDI - II 类:通过异构活动感知分析转变基于社区的老年护理
- 批准号:
1028195 - 财政年份:2010
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CAREER: Interactive and Collaborative Data Management in the Cloud
职业:云中的交互式和协作数据管理
- 批准号:
0845397 - 财政年份:2009
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
III-COR: Exploiting History in Continuous Monitoring Systems
III-COR:利用连续监测系统的历史
- 批准号:
0713123 - 财政年份:2007
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
相似国自然基金
基于复杂抽样和时空效应下卫生服务调查数据的小域估计方法研究
- 批准号:82304238
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
融合多源异构数据的小微企业经营风险智能识别与应对策略研究
- 批准号:72301188
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
复杂场景下模型—数据联合驱动的红外小目标检测研究
- 批准号:62303165
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
员工算法规避行为的内涵结构、量表开发及多层次影响机制:基于大(小)数据研究方法整合视角
- 批准号:72372021
- 批准年份:2023
- 资助金额:40 万元
- 项目类别:面上项目
小程序中用户隐私数据的违规泄露行为检测方法
- 批准号:
- 批准年份:2022
- 资助金额:54 万元
- 项目类别:面上项目
相似海外基金
III: Small: Rethinking the Data Organization and Lifecycle in LSM Storage Systems
III:小:重新思考 LSM 存储系统中的数据组织和生命周期
- 批准号:
2227669 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Development of A Dual Chemokine CCL2/CCL5 Neutralizing Single-domainAntibody for Treating Non-alcoholic Steatohepatitis
双趋化因子 CCL2/CCL5 中和单域抗体的开发用于治疗非酒精性脂肪性肝炎
- 批准号:
10761039 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Hawaii Minority Health and Cancer Disparities SPORE
夏威夷少数民族健康与癌症差异 SPORE
- 批准号:
10716152 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Novel Drug Delivery Platform as Medical Countermeasure for treatment of Gastrointestinal Radiation Damage
新型给药平台作为治疗胃肠道辐射损伤的医学对策
- 批准号:
10698637 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别: