III: Small: Towards the Foundations of Training Deep Neural Networks: New Theory and Algorithms

III:小:迈向训练深度神经网络的基础:新理论和算法

基本信息

  • 批准号:
    2008981
  • 负责人:
  • 金额:
    $ 50万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2020
  • 资助国家:
    美国
  • 起止时间:
    2020-10-01 至 2024-09-30
  • 项目状态:
    已结题

项目摘要

Deep learning has achieved tremendous successes in the past decade. Despite these empirical successes, the theoretical understanding of deep learning is still largely falling behind. There exists a huge gap between the empirical successes of deep learning and conventional optimization and machine learning theories. This project aims to bridge this gap by establishing the theoretical foundations of deep learning to understand why and how it works, and use this theory to develop new models and algorithms. The expected outcome of this project includes new theories and the state-of-the-art approaches for deep learning. The project will push the frontier of deep learning and train next-generation researchers and practitioners in artificial intelligence. Research demonstrations and lab tours will be given to K-12 school students by showing the wide range of applications of AI and their connection to society, to motivate them to pursue a STEM discipline.This project consists of two synergistic research thrusts: (1) understanding the optimization dynamics of training algorithms such as stochastic gradient descent for deep learning models, and deriving algorithm-dependent generalization error bounds to assess their generalization performance; and (2) developing a new suite of faster training algorithms for deep learning, as well as principled neural architecture search algorithms guided by the generalization error bounds to design better neural network models. To evaluate the developed approaches, both theoretical analyses and extensive experimental evaluations will be performed on real-world benchmarks including but not limited to image classification and natural language processing. The open source software and course materials developed in this project will be made publicly available to the broader community, to help engineers and scientists better understand and apply deep learning.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
深度学习在过去十年中取得了巨大的成功。尽管取得了这些实证上的成功,但对深度学习的理论理解仍然在很大程度上落后。深度学习的实证成功与传统优化和机器学习理论之间存在巨大差距。该项目旨在通过建立深度学习的理论基础来理解其工作原理和方式,并利用该理论开发新的模型和算法,从而弥补这一差距。该项目的预期成果包括深度学习的新理论和最先进的方法。该项目将推动深度学习的前沿发展,并培训下一代人工智能研究人员和从业者。将为 K-12 学校的学生提供研究演示和实验室参观,展示人工智能的广泛应用及其与社会的联系,以激励他们学习 STEM 学科。该项目由两个协同研究主旨组成:(1)了解训练算法的优化动态,例如深度学习模型的随机梯度下降,并导出算法相关的泛化误差界限以评估其泛化性能; (2) 开发一套新的更快的深度学习训练算法,以及以泛化误差界限为指导的原则性神经架构搜索算法,以设计更好的神经网络模型。为了评估所开发的方法,将在现实世界基准上进行理论分析和广泛的实验评估,包括但不限于图像分类和自然语言处理。该项目开发的开源软件和课程材料将向更广泛的社区公开,以帮助工程师和科学家更好地理解和应用深度学习。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力价值和更广泛的影响审查标准。

项目成果

期刊论文数量(38)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Provable Generalization of SGD-trained Neural Networks of AnyWidth in the Presence of Adversarial Label Noise
存在对抗性标签噪声时 SGD 训练的任意宽度神经网络的可证明泛化
Robust Learning with Progressive Data Expansion Against Spurious Correlation
通过渐进式数据扩展对抗虚假相关性的鲁棒学习
Faster Perturbed Stochastic Gradient Methods for Finding Local Minima
用于寻找局部最小值的更快扰动随机梯度方法
  • DOI:
  • 发表时间:
    2021-10-25
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Zixiang Chen;Dongruo Zhou;Quanquan Gu
  • 通讯作者:
    Quanquan Gu
Agnostic Learning of Halfspaces with Gradient Descent via Soft Margins
通过软边缘梯度下降进行半空间的不可知学习
  • DOI:
    10.5194/bg-2020-211
  • 发表时间:
    2020-10-01
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Spencer Frei;Yuan Cao;Quanquan Gu
  • 通讯作者:
    Quanquan Gu
Proxy Convexity: A Unified Framework for the Analysis of Neural Networks Trained by Gradient Descent
代理凸性:梯度下降训练的神经网络分析的统一框架
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Quanquan Gu其他文献

Mean-Field Analysis of Two-Layer Neural Networks: Non-Asymptotic Rates and Generalization Bounds
两层神经网络的平均场分析:非渐近率和泛化界限
  • DOI:
  • 发表时间:
    2020-02-10
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Zixiang Chen;Yuan Cao;Quanquan Gu;Tong Zhang
  • 通讯作者:
    Tong Zhang
Optimal Online Generalized Linear Regression with Stochastic Noise and Its Application to Heteroscedastic Bandits
随机噪声下的最优在线广义线性回归及其在异方差强盗中的应用
  • DOI:
  • 发表时间:
    2022-02-28
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Heyang Zhao;Dongruo Zhou;Jiafan He;Quanquan Gu
  • 通讯作者:
    Quanquan Gu
Pure Exploration in Asynchronous Federated Bandits
异步联邦强盗的纯粹探索
  • DOI:
    10.48550/arxiv.2310.11015
  • 发表时间:
    2023-10-17
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Zichen Wang;Chuanhao Li;Chenyu Song;Lianghui Wang;Quanquan Gu;Huazheng Wang
  • 通讯作者:
    Huazheng Wang
Differentially Private Hypothesis Transfer Learning
差分私有假设迁移学习
  • DOI:
    10.1007/978-3-030-10928-8_48
  • 发表时间:
    2018-09-10
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yang Wang;Quanquan Gu;Donald E. Brown
  • 通讯作者:
    Donald E. Brown
Fast and Sample Efficient Inductive Matrix Completion via Multi-Phase Procrustes Flow
通过多相 Procrustes 流快速高效地完成归纳矩阵
  • DOI:
  • 发表时间:
    2018-03-03
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Xiao Zhang;S. Du;Quanquan Gu
  • 通讯作者:
    Quanquan Gu

Quanquan Gu的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Quanquan Gu', 18)}}的其他基金

CPS: Medium: Collaborative Research: Provably Safe and Robust Multi-Agent Reinforcement Learning with Applications in Urban Air Mobility
CPS:中:协作研究:可证明安全且鲁棒的多智能体强化学习及其在城市空中交通中的应用
  • 批准号:
    2312094
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: Towards the Foundation of Approximate Sampling-Based Exploration in Sequential Decision Making
协作研究:为顺序决策中基于近似采样的探索奠定基础
  • 批准号:
    2323113
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CIF: Small: Collaborative Research: Rank Aggregation with Heterogeneous Information Sources: Efficient Algorithms and Fundamental Limits
CIF:小型:协作研究:异构信息源的排名聚合:高效算法和基本限制
  • 批准号:
    1911168
  • 财政年份:
    2019
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
BIGDATA: F: Collaborative Research: Taming Big Networks via Embedding
BIGDATA:F:协作研究:通过嵌入驯服大网络
  • 批准号:
    1741342
  • 财政年份:
    2018
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
BIGDATA: F: Collaborative Research: Taming Big Networks via Embedding
BIGDATA:F:协作研究:通过嵌入驯服大网络
  • 批准号:
    1855099
  • 财政年份:
    2018
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CAREER: Scaling Up Knowledge Discovery in High-Dimensional Data Via Nonconvex Statistical Optimization
职业:通过非凸统计优化扩大高维数据中的知识发现
  • 批准号:
    1906169
  • 财政年份:
    2018
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
III: Small: Collaborative Research: High-Dimensional Machine Learning Methods for Personalized Cancer Genomics
III:小:协作研究:个性化癌症基因组学的高维机器学习方法
  • 批准号:
    1903202
  • 财政年份:
    2018
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
III: Small: Collaborative Learning with Incomplete and Noisy Knowledge
III:小:知识不完整且有噪音的协作学习
  • 批准号:
    1904183
  • 财政年份:
    2018
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CAREER: Scaling Up Knowledge Discovery in High-Dimensional Data Via Nonconvex Statistical Optimization
职业:通过非凸统计优化扩大高维数据中的知识发现
  • 批准号:
    1652539
  • 财政年份:
    2017
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
III: Small: Collaborative Research: High-Dimensional Machine Learning Methods for Personalized Cancer Genomics
III:小:协作研究:个性化癌症基因组学的高维机器学习方法
  • 批准号:
    1717206
  • 财政年份:
    2017
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant

相似国自然基金

TIM-4调控小胶质细胞向吞噬型转化促进蛛网膜下腔出血后血液清除的作用及机制
  • 批准号:
    82301485
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
EGFR突变的肺腺癌向小细胞肺癌转变的分子机制及干预策略
  • 批准号:
    82341002
  • 批准年份:
    2023
  • 资助金额:
    200 万元
  • 项目类别:
    专项基金项目
巨噬细胞A20调控小管上皮细胞胞葬在AKI向CKD转变中的作用机制探讨
  • 批准号:
    82270728
  • 批准年份:
    2022
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
小胶质细胞外泌体调控卒中后星形胶质细胞亚型向神经干细胞转化的机制研究
  • 批准号:
    82271320
  • 批准年份:
    2022
  • 资助金额:
    52 万元
  • 项目类别:
    面上项目
小尺度场向电流时空分布特征及与沉降粒子关系的研究
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    59 万元
  • 项目类别:
    面上项目

相似海外基金

III: Small: A New Machine Learning Paradigm Towards Effective yet Efficient Foundation Graph Learning Models
III:小型:一种新的机器学习范式,实现有效且高效的基础图学习模型
  • 批准号:
    2321504
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: IIS-III: Small Towards Fair Outlier Detection
协作研究:IIS-III:小到公平的异常值检测
  • 批准号:
    2310481
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
III: Small: Towards Highly Accurate Map Services
III:小:迈向高精度地图服务
  • 批准号:
    2203553
  • 财政年份:
    2022
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
中国通俗小説受容の完全な体系化に向けた研究――民間翻訳の本格導入による多面的解析
中国通俗小说接受的完整体系研究——通过民间翻译的全面介绍进行多层面分析
  • 批准号:
    22K00287
  • 财政年份:
    2022
  • 资助金额:
    $ 50万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
III: Small: Towards Explainable Personalization
III:小:迈向可解释的个性化
  • 批准号:
    2007492
  • 财政年份:
    2020
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了