CAREER: Multi-Query Optimizations for Deep Learning Systems

职业:深度学习系统的多查询优化

基本信息

  • 批准号:
    1942724
  • 负责人:
  • 金额:
    $ 55万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2020
  • 资助国家:
    美国
  • 起止时间:
    2020-07-01 至 2025-06-30
  • 项目状态:
    未结题

项目摘要

Large-scale data analytics using predictive models called "deep learning" has revolutionized many digital applications, powering modern speech recognition, language translation, Web search, and more. This success of deep learning, primarily at resource-rich technology companies, has led to high interest in adopting deep learning in domain sciences, enterprise companies, healthcare, and even digital humanities. But a major bottleneck to broader adoption is the high resource cost of training deep learning models, which requires a computationally expensive empirical process with a large number of trials. This slow process raises resource costs, wastes energy, and impedes user productivity. This project tackles this problem by devising new techniques to substantially speedup up this process on deep learning systems. It will reduce resource costs and energy needs, and in turn, help democratize deep learning to more application domains. It will lead to a new open source system integrated with existing popular deep learning tools to make it cheaper, faster, and easier to adopt large-scale deep learning. The system will be used by domain scientists and also integrated into industrial products. The research will be disseminated via publications at top conferences and incorporated into new courses on data analytics systems. This project will support graduate, undergraduate, and high school students, including LGBT+ and female students.This project will improve the resource efficiency of scalable deep learning model selection, an empirical process that typically requires training dozens to hundreds of model configurations with varying data representations, neural architectures, and hyper-parameter values. Existing tools like TensorFlow and PyTorch focus on the efficiency of training one model a time, which wastes resources at scale during model selection. Some systems also sacrifice reproducibility, a showstopper for many users. This project resolves these issues by presenting a fresh database systems-inspired view of deep learning that re-imagines its executions as queries. Targeting small cluster settings, it raises the specification of three common deep learning model selection tasks to a declarative level and runs many related model configurations in one go. It proposes a suite of multi-query optimization and view materialization techniques that reduce communication costs and/or avoid computational redundancy, while not sacrificing reproducibility or prediction accuracy. The techniques combine the mathematical properties of stochastic gradient descent and the computational properties of deep learning queries with careful parallel data system design and implementation. Project website: https://adalabucsd.github.io/cerebrosystem/This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
使用称为“深度学习”的预测模型的大规模数据分析彻底改变了许多数字应用程序,为现代语音识别,语言翻译,Web搜索提供了动力。深度学习的成功,主要是在资源丰富的技术公司中,引起了人们对在领域科学,企业公司,医疗保健甚至数字人文方面采用深度学习的浓厚兴趣。但是,更广泛采用的主要瓶颈是培训深度学习模型的高资源成本,这需要经过大量试验的计算昂贵的经验过程。这个缓慢的过程提高了资源成本,浪费能源并阻碍用户生产力。该项目通过设计新技术来大大加速此过程,从而解决此问题。它将减少资源成本和能源需求,从而帮助将深入学习民主化到更多的应用领域。它将导致一个与现有流行的深度学习工具集成的新开源系统,以使其更便宜,更快,更易于采用大规模的深度学习。该系统将被域科学家使用,还将整合到工业产品中。该研究将通过顶级会议的出版物进行传播,并将其纳入数据分析系统的新课程中。该项目将支持毕业生,本科生和高中生,包括LGBT+和女学生。该项目将提高可扩展深度学习模型选择的资源效率,这是一个经验过程,通常需要对数百种模型配置进行数十种模型配置,并具有不同的数据表示,神经体系结构,神经体系结构和超参数值。诸如Tensorflow和Pytorch之类的现有工具专注于一次训练一个模型的效率,这在模型选择过程中会大规模浪费资源。有些系统还牺牲了可重复性,这是许多用户的震撼力。该项目通过介绍了一个新的数据库系统启发的深度学习观点来解决这些问题,从而将其执行为查询。针对小群集设置,它将三个常见的深度学习模型选择任务的规范提高到声明级别,并在一个GO中运行许多相关的模型配置。它提出了一套多Query优化的套件,并查看了降低通信成本和/或避免计算冗余的实现技术,同时又不牺牲可重复性或预测准确性。这些技术结合了随机梯度下降的数学特性以及深度学习查询的计算特性,并仔细的并行数据系统设计和实现。项目网站:https://adalabucsd.github.io/cerebrosystem/this Award反映了NSF的法定任务,并且使用基金会的知识分子优点和更广泛的影响审查标准,被认为值得通过评估来获得支持。

项目成果

期刊论文数量(9)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Cerebro: A Layered Data Platform for Scalable Deep Learning
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Arun Kumar;Advitya Gemawat;Kabir;Nagrecha;Yuhao Zhang;Side Li
  • 通讯作者:
    Arun Kumar;Advitya Gemawat;Kabir;Nagrecha;Yuhao Zhang;Side Li
Towards an Optimized GROUP BY Abstraction for Large-Scale Machine Learning
  • DOI:
    10.14778/3476249.3476284
  • 发表时间:
    2021-07
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Side Li;Arun Kumar
  • 通讯作者:
    Side Li;Arun Kumar
Cerebro: a data system for optimized deep learning model selection
Cerebro:用于优化深度学习模型选择的数据系统
  • DOI:
    10.14778/3407790.3407816
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    2.5
  • 作者:
    Nakandala, Supun;Zhang, Yuhao;Kumar, Arun
  • 通讯作者:
    Kumar, Arun
Distributed deep learning on data systems: a comparative analysis of approaches
数据系统的分布式深度学习:方法的比较分析
  • DOI:
    10.14778/3467861.3467867
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    2.5
  • 作者:
    Zhang, Yuhao;McQuillan, Frank;Jayaram, Nandish;Kak, Nikhil;Khanna, Ekta;Kislal, Orhan;Valdano, Domino;Kumar, Arun
  • 通讯作者:
    Kumar, Arun
Nautilus: An Optimized System for Deep Transfer Learning over Evolving Training Datasets
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Arun Kumar其他文献

Performance of a dual mode/single mode waveguide coupler as a modal filter
双模/单模波导耦合器作为模态滤波器的性能
  • DOI:
  • 发表时间:
    1992
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Arun Kumar;Saeed Ghadirli;Krishna Thyagarajan
  • 通讯作者:
    Krishna Thyagarajan
Quasi-static remanence as a generic-feature of spin-canting in Dzyaloshinskii-Moriya Interaction driven canted-antiferromagnets
准静态剩磁作为 Dzyaloshinskii-Moriya 相互作用驱动的倾斜反铁磁体中自旋倾斜的一般特征
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Namrata Pattanayak;Arun Kumar;A. K. Nigam;Vladimir Pomjakushin;Sunil Nair;A. Bajpai
  • 通讯作者:
    A. Bajpai
Friction Surfacing of Mild Steel by Copper: A Feasibility Study☆
铜低碳钢摩擦堆焊:可行性研究☆
  • DOI:
    10.1016/j.mspro.2014.07.445
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Tarunkumar Jujare;Arun Kumar;S. Kailas;K. Bhat
  • 通讯作者:
    K. Bhat
Mn2+ doped ZnS quantum dots in ferroelectric liquid crystal matrix: Analysis of new relaxation phenomenon, faster optical response, and concentration dependent quenching in photoluminescence
铁电液晶基质中的 Mn2 掺杂 ZnS 量子点:分析光致发光中新的弛豫现象、更快的光学响应和浓度依赖性猝灭
  • DOI:
    10.1063/1.4942663
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    D. Singh;A. Daoudi;S. K. Gupta;S. Pandey;T. Vimal;R. Manohar;A. Kole;P. Kumbhakar;Arun Kumar
  • 通讯作者:
    Arun Kumar
Monitoring of vertical aerosol profiles using micropulse lidar
使用微脉冲激光雷达监测垂直气溶胶剖面
  • DOI:
    10.1117/12.693684
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    4.9
  • 作者:
    S. Jain;B. C. Arya;Arun Kumar;Y. Ahammed
  • 通讯作者:
    Y. Ahammed

Arun Kumar的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Arun Kumar', 18)}}的其他基金

III: Small: Towards Speech-Driven Multimodal Querying
III:小型:迈向语音驱动的多模式查询
  • 批准号:
    1816701
  • 财政年份:
    2018
  • 资助金额:
    $ 55万
  • 项目类别:
    Standard Grant

相似国自然基金

新型血管微创介入智能碎溶栓系统设计与多物理效应下碎溶栓机理研究
  • 批准号:
    82302400
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
二元金属原子团簇协同催化多硫化锂转化机制研究
  • 批准号:
    22379001
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
温度作用下CA砂浆非线性老化蠕变性能的多尺度研究
  • 批准号:
    12302265
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
面向肉羊生命特征精准辨识的可穿戴柔性无创多模态传感信号检测方法研究
  • 批准号:
    62303471
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
全固态锂电池硫化物固体电解质的合成、调控及多尺度中子散射研究
  • 批准号:
    12375301
  • 批准年份:
    2023
  • 资助金额:
    53 万元
  • 项目类别:
    面上项目

相似海外基金

A scalable cloud-based framework for multi-modal mapping across single neuron omics, morphology and electrophysiology
一个可扩展的基于云的框架,用于跨单个神经元组学、形态学和电生理学的多模式映射
  • 批准号:
    10725550
  • 财政年份:
    2023
  • 资助金额:
    $ 55万
  • 项目类别:
Development of a Wake Forest Multi-Species NHP Biorepository to Support Interdisciplinary Aging Studies
开发维克森林多物种 NHP 生物样本库以支持跨学科衰老研究
  • 批准号:
    10294056
  • 财政年份:
    2021
  • 资助金额:
    $ 55万
  • 项目类别:
Part-based 3D shape retrieval using multi-modal query
使用多模态查询进行基于零件的 3D 形状检索
  • 批准号:
    21K11903
  • 财政年份:
    2021
  • 资助金额:
    $ 55万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Development of a Wake Forest Multi-Species NHP Biorepository to Support Interdisciplinary Aging Studies
开发维克森林多物种 NHP 生物样本库以支持跨学科衰老研究
  • 批准号:
    10468876
  • 财政年份:
    2021
  • 资助金额:
    $ 55万
  • 项目类别:
III:Small: Towards Cross-Model Query Optimizations for Multi-model Heterogeneous Data Analytics
III:Small:面向多模型异构数据分析的跨模型查询优化
  • 批准号:
    1909875
  • 财政年份:
    2019
  • 资助金额:
    $ 55万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了