III: Small: Automatic Learning-based Services for Distributed Data Management Systems

III:小型:分布式数据管理系统的基于自动学习的服务

基本信息

  • 批准号:
    1815701
  • 负责人:
  • 金额:
    $ 49.99万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2018
  • 资助国家:
    美国
  • 起止时间:
    2018-08-15 至 2023-07-31
  • 项目状态:
    已结题

项目摘要

The distributed nature of most database management systems (DBMSs) brings about new challenges to the daily tasks of database administrators. Apart from database tuning, today's administrators are often responsible for: (a) adapting data partitioning and replication schemes; (b) managing dynamic workloads to meet query prioritization and performance goals; as well as (c) provisioning computing resources on demand. Unfortunately, the complexity of these tasks often exceeds engineers' abilities to scientifically model them. To address this challenge, this project will couple existing learning-driven theory with distributed data management systems to have significant impact on the design of DBMSs. By leveraging advanced learning algorithms from machine learning and game theory, the project will allow DBMSs to move away from "hard-coded algorithmic intelligence," rigid data structures, and algorithms that are based on informal intuition. Instead, DBMSs will be able to incorporate "learning-based intelligence" that provides reasoning on numerous decisions based on pattern recognition capabilities and mathematically proven insights. Leveraging information to learn and adapt could unleash tremendous potential as databases evolve to systems capable of automatically tuning themselves. The results of this project will also reduce the human effort of database administrators as they will be offered predictive models, decision tools and insight to the interplay between data distribution, workload management, and query performance. The project will provide solutions to some of the key technical challenges that arise when tuning the performance of dynamic workloads on distributed data management systems. This research will lead to the design of new algorithms and learning-based frameworks for supporting data distribution, replication, query dispatching, query scheduling, and performance prediction without human intervention. These techniques will be automatically customized to application-level performance goals and user-defined query priorities and will allow distributed DBMSs to naturally handle dynamic workloads, changing data access patterns, and varying resource availability. By coupling unsupervised/supervised learning, deep learning and game theory to data management tasks the project will transform data management systems to "database science" tools through which system administrators will be able to explore and derive insight on the factors that affect the performance of a database and its deployed applications. As a result, the project will deliver complex predictive and correlation models between query, data, resource-related features and system performance.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
大多数数据库管理系统 (DBMS) 的分布式特性给数据库管理员的日常任务带来了新的挑战。除了数据库调整之外,当今的管理员通常还负责: (a) 调整数据分区和复制方案; (b) 管理动态工作负载以满足查询优先级和性能目标;以及(c)按需配置计算资源。不幸的是,这些任务的复杂性往往超出了工程师对其进行科学建模的能力。为了应对这一挑战,该项目将把现有的学习驱动理论与分布式数据管理系统结合起来,对 DBMS 的设计产生重大影响。通过利用机器学习和博弈论中的先进学习算法,该项目将使 DBMS 摆脱“硬编码算法智能”、严格的数据结构和基于非正式直觉的算法。相反,DBMS 将能够整合“基于学习的智能”,根据模式识别功能和经过数学验证的见解对众多决策进行推理。随着数据库发展成为能够自动调整自身的系统,利用信息进行学习和适应可以释放巨大的潜力。该项目的结果还将减少数据库管理员的人力,因为他们将获得预测模型、决策工具以及对数据分布、工作负载管理和查询性能之间相互作用的洞察。该项目将为调整分布式数据管理系统上动态工作负载的性能时出现的一些关键技术挑战提供解决方案。这项研究将导致新算法和基于学习的框架的设计,以支持数据分发、复制、查询调度、查询调度和性能预测,而无需人工干预。这些技术将根据应用程序级性能目标和用户定义的查询优先级自动定制,并允许分布式 DBMS 自然地处理动态工作负载、不断变化的数据访问模式和变化的资源可用性。通过将无监督/监督学习、深度学习和博弈论与数据管理任务相结合,该项目将数据管理系统转变为“数据库科学”工具,系统管理员将能够通过这些工具探索并深入了解影响数据管理性能的因素。数据库及其部署的应用程序。因此,该项目将在查询、数据、资源相关功能和系统性能之间提供复杂的预测和关联模型。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力优点和更广泛的影响审查进行评估,被认为值得支持标准。

项目成果

期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
NashDB: An End-to-End Economic Method for Elastic Database Fragmentation, Replication, and Provisioning
NashDB: Fragmentation, Replication, and Provisioning using Economic Methods
NashDB:使用经济方法进行碎片、复制和配置
  • DOI:
    10.14778/3352063.3352077
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    2.5
  • 作者:
    Ryan Marcus, Chi Zhang
  • 通讯作者:
    Ryan Marcus, Chi Zhang
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Olga Papaemmanouil其他文献

Devel-op: An optimizer development environment
Dev-op:优化器开发环境
Semantic multicast for content-based stream dissemination
用于基于内容的流传播的语义多播
  • DOI:
    10.1145/1017074.1017085
  • 发表时间:
    2004
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Olga Papaemmanouil;U. Çetintemel
  • 通讯作者:
    U. Çetintemel
XFlow : Internet-Scale Distributed Stream Processing
XFlow:互联网规模的分布式流处理
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Olga Papaemmanouil;U. Çetintemel;John Jannotti
  • 通讯作者:
    John Jannotti
Adaptive Overlays for Shared Stream Processing Environments
共享流处理环境的自适应叠加
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Olga Papaemmanouil;Sujoy Basu;S. Banerjee
  • 通讯作者:
    S. Banerjee
XFlow : Internet-Scale Extensible Stream Processing
XFlow:互联网规模的可扩展流处理
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Olga Papaemmanouil;U. Çetintemel;John Jannotti
  • 通讯作者:
    John Jannotti

Olga Papaemmanouil的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Olga Papaemmanouil', 18)}}的其他基金

CAREER: Towards Extensible Performance Management for Cloud Data Services
职业:实现云数据服务的可扩展性能管理
  • 批准号:
    1253196
  • 财政年份:
    2013
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Continuing Grant
EAGER: Interaction History Management Systems and their Application to Evidence-Based Practice of Healthcare
EAGER:交互历史管理系统及其在循证医疗保健实践中的应用
  • 批准号:
    1049974
  • 财政年份:
    2010
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Standard Grant

相似国自然基金

诊疗一体化PS-Hc@MB协同训练介导脑小血管病康复的作用及机制研究
  • 批准号:
    82372561
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
非小细胞肺癌MECOM/HBB通路介导血红素代谢异常并抑制肿瘤起始细胞铁死亡的机制研究
  • 批准号:
    82373082
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
基于胆碱能皮层投射纤维探讨脑小血管病在帕金森病步态障碍中的作用及机制研究
  • 批准号:
    82301663
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
关于丢番图方程小素数解上界估计的研究
  • 批准号:
    12301005
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
嗅球小胶质细胞P2X7受体在变应性鼻炎发生帕金森病样改变中的作用与机制研究
  • 批准号:
    82371119
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目

相似海外基金

Fluorescence lifetime imaging device for 5-ALA-guided neurosurgery
用于 5-ALA 引导神经外科手术的荧光寿命成像装置
  • 批准号:
    10698741
  • 财政年份:
    2023
  • 资助金额:
    $ 49.99万
  • 项目类别:
III: Small: Automatic Detection and Resolution of Anti-Patterns in Database Applications
III:小:数据库应用程序中反模式的自动检测和解决
  • 批准号:
    1908984
  • 财政年份:
    2019
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Continuing Grant
III: Small: Automatic Database Management System Tuning Through Large-scale Machine Learning
III:小型:通过大规模机器学习自动调整数据库管理系统
  • 批准号:
    1423210
  • 财政年份:
    2014
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Standard Grant
III-CXT-Small: Collaborative Research: Automatic Geomorphic Mapping and Analysis of Land Surfaces Using Pattern Recognition
III-CXT-Small:协作研究:利用模式识别自动地貌测绘和地表分析
  • 批准号:
    1103684
  • 财政年份:
    2010
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Standard Grant
III: Small: An Automatic Framework for Processing Drosophila Embryonic Images
III:小型:处理果蝇胚胎图像的自动框架
  • 批准号:
    1016668
  • 财政年份:
    2010
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了