III: Small: Automatic Learning-based Services for Distributed Data Management Systems
III:小型:分布式数据管理系统的基于自动学习的服务
基本信息
- 批准号:1815701
- 负责人:
- 金额:$ 49.99万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2018
- 资助国家:美国
- 起止时间:2018-08-15 至 2023-07-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
The distributed nature of most database management systems (DBMSs) brings about new challenges to the daily tasks of database administrators. Apart from database tuning, today's administrators are often responsible for: (a) adapting data partitioning and replication schemes; (b) managing dynamic workloads to meet query prioritization and performance goals; as well as (c) provisioning computing resources on demand. Unfortunately, the complexity of these tasks often exceeds engineers' abilities to scientifically model them. To address this challenge, this project will couple existing learning-driven theory with distributed data management systems to have significant impact on the design of DBMSs. By leveraging advanced learning algorithms from machine learning and game theory, the project will allow DBMSs to move away from "hard-coded algorithmic intelligence," rigid data structures, and algorithms that are based on informal intuition. Instead, DBMSs will be able to incorporate "learning-based intelligence" that provides reasoning on numerous decisions based on pattern recognition capabilities and mathematically proven insights. Leveraging information to learn and adapt could unleash tremendous potential as databases evolve to systems capable of automatically tuning themselves. The results of this project will also reduce the human effort of database administrators as they will be offered predictive models, decision tools and insight to the interplay between data distribution, workload management, and query performance. The project will provide solutions to some of the key technical challenges that arise when tuning the performance of dynamic workloads on distributed data management systems. This research will lead to the design of new algorithms and learning-based frameworks for supporting data distribution, replication, query dispatching, query scheduling, and performance prediction without human intervention. These techniques will be automatically customized to application-level performance goals and user-defined query priorities and will allow distributed DBMSs to naturally handle dynamic workloads, changing data access patterns, and varying resource availability. By coupling unsupervised/supervised learning, deep learning and game theory to data management tasks the project will transform data management systems to "database science" tools through which system administrators will be able to explore and derive insight on the factors that affect the performance of a database and its deployed applications. As a result, the project will deliver complex predictive and correlation models between query, data, resource-related features and system performance.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
大多数数据库管理系统(DBMS)的分布式性质为数据库管理员的日常任务带来了新的挑战。除了数据库调整外,当今的管理员通常还负责:(a)调整数据分区和复制方案; (b)管理动态工作负载以满足查询优先级和绩效目标;以及(c)根据需求进行计算资源。不幸的是,这些任务的复杂性通常超出了工程师对它们进行科学建模的能力。为了应对这一挑战,该项目将将现有的学习驱动理论与分布式数据管理系统相结合,以对DBMS的设计产生重大影响。通过利用机器学习和游戏理论的高级学习算法,该项目将允许DBMS脱离“硬编码算法智能”,“刚性数据结构”以及基于非正式直觉的算法。取而代之的是,DBMS将能够合并“基于学习的智能”,这些智能基于模式识别能力和数学证明的见解提供了许多决策的推理。利用信息来学习和适应可能会释放出巨大的潜力,因为数据库发展为能够自动调整自己的系统。该项目的结果还将减少数据库管理员的人力努力,因为他们将获得预测模型,决策工具和洞察力,以实现数据分配,工作负载管理和查询性能之间的相互作用。该项目将为调整分布式数据管理系统的动态工作负载的性能时出现的一些关键技术挑战提供解决方案。这项研究将导致设计新算法和基于学习的框架,以支持数据分发,复制,查询调度,查询计划和绩效预测,而无需人工干预。这些技术将自动定制为应用程序级的性能目标和用户定义的查询优先级,并将允许分布式的DBMS自然处理动态工作负载,更改数据访问模式以及不同的资源可用性。通过将无监督/监督的学习,深度学习和游戏理论结合到数据管理任务,该项目将将数据管理系统转换为“数据库科学”工具,通过该工具,系统管理员将能够探索并洞悉影响数据库及其部署应用程序的性能的因素。结果,该项目将在查询,数据,与资源相关的功能和系统性能之间提供复杂的预测和相关模型。该奖项反映了NSF的法定任务,并使用基金会的智力优点和更广泛的影响评估审查标准,认为值得通过评估来获得支持。
项目成果
期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
NashDB: An End-to-End Economic Method for Elastic Database Fragmentation, Replication, and Provisioning
- DOI:10.1145/3183713.3196935
- 发表时间:2018-05
- 期刊:
- 影响因子:0
- 作者:Ryan Marcus;Olga Papaemmanouil;S. Semenova;Solomon Garber
- 通讯作者:Ryan Marcus;Olga Papaemmanouil;S. Semenova;Solomon Garber
NashDB: Fragmentation, Replication, and Provisioning using Economic Methods
NashDB:使用经济方法进行碎片、复制和配置
- DOI:10.14778/3352063.3352077
- 发表时间:2019
- 期刊:
- 影响因子:2.5
- 作者:Ryan Marcus, Chi Zhang
- 通讯作者:Ryan Marcus, Chi Zhang
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Olga Papaemmanouil其他文献
Devel-op: An optimizer development environment
Dev-op:优化器开发环境
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
Zhibo Peng;Mitch Cherniack;Olga Papaemmanouil - 通讯作者:
Olga Papaemmanouil
Semantic multicast for content-based stream dissemination
用于基于内容的流传播的语义多播
- DOI:
10.1145/1017074.1017085 - 发表时间:
2004 - 期刊:
- 影响因子:0
- 作者:
Olga Papaemmanouil;U. Çetintemel - 通讯作者:
U. Çetintemel
XFlow : Internet-Scale Distributed Stream Processing
XFlow:互联网规模的分布式流处理
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
Olga Papaemmanouil;U. Çetintemel;John Jannotti - 通讯作者:
John Jannotti
XFlow : Internet-Scale Extensible Stream Processing
XFlow:互联网规模的可扩展流处理
- DOI:
- 发表时间:
2008 - 期刊:
- 影响因子:0
- 作者:
Olga Papaemmanouil;U. Çetintemel;John Jannotti - 通讯作者:
John Jannotti
Adaptive Overlays for Shared Stream Processing Environments
共享流处理环境的自适应叠加
- DOI:
- 发表时间:
2008 - 期刊:
- 影响因子:0
- 作者:
Olga Papaemmanouil;Sujoy Basu;S. Banerjee - 通讯作者:
S. Banerjee
Olga Papaemmanouil的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Olga Papaemmanouil', 18)}}的其他基金
CAREER: Towards Extensible Performance Management for Cloud Data Services
职业:实现云数据服务的可扩展性能管理
- 批准号:
1253196 - 财政年份:2013
- 资助金额:
$ 49.99万 - 项目类别:
Continuing Grant
EAGER: Interaction History Management Systems and their Application to Evidence-Based Practice of Healthcare
EAGER:交互历史管理系统及其在循证医疗保健实践中的应用
- 批准号:
1049974 - 财政年份:2010
- 资助金额:
$ 49.99万 - 项目类别:
Standard Grant
相似国自然基金
自动化生产、人工智能与小微企业的市场进入——基于劳动者职业选择的视角
- 批准号:72103098
- 批准年份:2021
- 资助金额:24.00 万元
- 项目类别:青年科学基金项目
自动化生产、人工智能与小微企业的市场进入---基于劳动者职业选择的视角
- 批准号:
- 批准年份:2021
- 资助金额:30 万元
- 项目类别:
血液中自动披覆蛋白冠“马甲”的紫杉醇小分子自组装纳米药物的构建及其体内命运的研究
- 批准号:
- 批准年份:2020
- 资助金额:24 万元
- 项目类别:青年科学基金项目
三维属性直方图的概念与构建及其在海底小目标多波束前视声呐图像精细自动分割中的应用
- 批准号:61661038
- 批准年份:2016
- 资助金额:44.0 万元
- 项目类别:地区科学基金项目
小电流接地电网单相接地故障选线自动化的再研究
- 批准号:50177007
- 批准年份:2001
- 资助金额:15.0 万元
- 项目类别:面上项目
相似海外基金
Fluorescence lifetime imaging device for 5-ALA-guided neurosurgery
用于 5-ALA 引导神经外科手术的荧光寿命成像装置
- 批准号:
10698741 - 财政年份:2023
- 资助金额:
$ 49.99万 - 项目类别:
III: Small: Automatic Detection and Resolution of Anti-Patterns in Database Applications
III:小:数据库应用程序中反模式的自动检测和解决
- 批准号:
1908984 - 财政年份:2019
- 资助金额:
$ 49.99万 - 项目类别:
Continuing Grant
III: Small: Automatic Database Management System Tuning Through Large-scale Machine Learning
III:小型:通过大规模机器学习自动调整数据库管理系统
- 批准号:
1423210 - 财政年份:2014
- 资助金额:
$ 49.99万 - 项目类别:
Standard Grant
III-CXT-Small: Collaborative Research: Automatic Geomorphic Mapping and Analysis of Land Surfaces Using Pattern Recognition
III-CXT-Small:协作研究:利用模式识别自动地貌测绘和地表分析
- 批准号:
1103684 - 财政年份:2010
- 资助金额:
$ 49.99万 - 项目类别:
Standard Grant
III: Small: An Automatic Framework for Processing Drosophila Embryonic Images
III:小型:处理果蝇胚胎图像的自动框架
- 批准号:
1016668 - 财政年份:2010
- 资助金额:
$ 49.99万 - 项目类别:
Standard Grant