CIF: Medium: Collaborative Research: Theory of Optimization Geometry and Algorithms for Neural Networks
CIF:媒介:协作研究:神经网络优化几何理论和算法
基本信息
- 批准号:1900145
- 负责人:
- 金额:$ 40万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2019
- 资助国家:美国
- 起止时间:2019-10-01 至 2024-09-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Deep learning has attracted a significant amount of interest in recent years due to its widespread applicability in computer vision, artificial intelligence and natural language processing, alongside recent strides in autonomous driving. The theoretical underpinnings behind such success, however, remain elusive to a large extent, hindering its further adoption in other applications. This project aims to advance the theoretical foundations of training neural networks in terms of optimization landscape and algorithmic efficacy, which in turn should have a measurable impact on the practice of deep learning by providing guiding principles for network design, algorithm selection, hyperparameter tuning, and adversarial training. This project adopts an interdisciplinary approach fusing ideas from machine learning, optimization, statistical signal processing, high-dimensional statistics, nonparametric statistics, and information theory. This project will likewise develop courses and tutorials on theoretical foundations of large-scale machine learning and provide extensive training opportunities for students at all levels.This project aims to develop a comprehensive theory to characterize the optimization landscape and geometry of loss functions and algorithmic regularizations of major neural network training problems, and explore how the network architecture---including depth, width, and activation functions---affect these properties, thus providing guidelines for the design of algorithms to train these networks more efficiently with theoretical performance guarantees. The project will explore the geometric properties and their impact on the optimization performance in training multi-layer neural networks, auto-encoders, generative adversarial networks, and adversarial training involving non-convex and saddle-point problems.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
近年来,深度学习因其在计算机视觉、人工智能和自然语言处理方面的广泛适用性以及自动驾驶方面的最新进展而引起了人们的极大兴趣。然而,这种成功背后的理论基础在很大程度上仍然难以捉摸,阻碍了其在其他应用中的进一步采用。该项目旨在在优化景观和算法功效方面推进神经网络训练的理论基础,从而通过为网络设计、算法选择、超参数调整和优化提供指导原则,从而对深度学习实践产生可衡量的影响。对抗性训练。该项目采用跨学科方法,融合了机器学习、优化、统计信号处理、高维统计、非参数统计和信息论的思想。该项目还将开发有关大规模机器学习理论基础的课程和教程,并为各个级别的学生提供广泛的培训机会。该项目旨在开发一种全面的理论来描述损失函数的优化景观和几何以及算法正则化主要的神经网络训练问题,并探索网络架构(包括深度、宽度和激活函数)如何影响这些特性,从而为算法设计提供指导,以在理论性能保证的情况下更有效地训练这些网络。该项目将探索几何特性及其对训练多层神经网络、自动编码器、生成对抗网络以及涉及非凸和鞍点问题的对抗训练中优化性能的影响。该奖项反映了 NSF 的法定使命和通过使用基金会的智力价值和更广泛的影响审查标准进行评估,该项目被认为值得支持。
项目成果
期刊论文数量(26)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Convergence of meta-learning with task-specific adaptation over partial parameters
元学习与部分参数的特定任务适应的融合
- DOI:
- 发表时间:2020-01
- 期刊:
- 影响因子:0
- 作者:Ji, K;Lee, J D;Liang, Y;Poor, H V.
- 通讯作者:Poor, H V.
Provably efficient UCB-type algorithms for learning predictive state representation
用于学习预测状态表示的可证明有效的 UCB 型算法
- DOI:
- 发表时间:2024-05
- 期刊:
- 影响因子:0
- 作者:Huang, Ruiquan;Liang, Yingbin;Yang, Jing.
- 通讯作者:Yang, Jing.
Doubly robust off-policy actor-critic: Convergence and optimality
双稳健的离策略演员批评家:收敛性和最优性
- DOI:
- 发表时间:2021-01
- 期刊:
- 影响因子:0
- 作者:Xu, T;Yang, Z;Wang, Z;Liang, Y.
- 通讯作者:Liang, Y.
Proximal gradient descent-ascent: Variable convergence under KL geometry
近端梯度下降-上升:KL 几何下的可变收敛
- DOI:
- 发表时间:2021-01
- 期刊:
- 影响因子:0
- 作者:Chen, Ziyi;Zhou, Yi;Xu, Tengyu;Liang, Yingbin.
- 通讯作者:Liang, Yingbin.
When will generative adversarial imitation learning algorithms attain global convergence
生成对抗性模仿学习算法何时能实现全局收敛
- DOI:
- 发表时间:2021-01
- 期刊:
- 影响因子:0
- 作者:Guan, Ziwei;Xu, Tengyu;Liang, Yingbin.
- 通讯作者:Liang, Yingbin.
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Yingbin Liang其他文献
Feedback Capacities of Gaussian Multiple-Access Wiretap Channels
高斯多址窃听通道的反馈能力
- DOI:
10.1109/isit.2019.8849326 - 发表时间:
2020-07-29 - 期刊:
- 影响因子:0
- 作者:
Bin Dai;Chong Li;Yingbin Liang;Zheng Ma;S. Shamai - 通讯作者:
S. Shamai
A simple convergence analysis of Bregman proximal gradient algorithm
Bregman近端梯度算法的简单收敛性分析
- DOI:
10.1007/s10589-019-00092-y - 发表时间:
2015-03-18 - 期刊:
- 影响因子:2.2
- 作者:
Yi Zhou;Yingbin Liang;Lixin Shen - 通讯作者:
Lixin Shen
Local Geometry of Cross Entropy Loss in Learning One-Hidden-Layer Neural Networks
学习单隐层神经网络中交叉熵损失的局部几何
- DOI:
10.1109/isit.2019.8849289 - 发表时间:
2019-07-07 - 期刊:
- 影响因子:0
- 作者:
H. Fu;Yuejie Chi;Yingbin Liang - 通讯作者:
Yingbin Liang
Global Convergence of Two-timescale Actor-Critic for Solving Linear Quadratic Regulator
求解线性二次调节器的双时间尺度 Actor-Critic 全局收敛
- DOI:
10.48550/arxiv.2208.08744 - 发表时间:
2022-08-18 - 期刊:
- 影响因子:0
- 作者:
Xu;Jingliang Duan;Yingbin Liang;Lin Zhao - 通讯作者:
Lin Zhao
Critical Points of Neural Networks: Analytical Forms and Landscape Properties
神经网络的关键点:分析形式和景观属性
- DOI:
- 发表时间:
2017-10-30 - 期刊:
- 影响因子:0
- 作者:
Yi Zhou;Yingbin Liang - 通讯作者:
Yingbin Liang
Yingbin Liang的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Yingbin Liang', 18)}}的其他基金
RINGS: A Deep Reinforcement Learning Enabled Large-scale UAV Network with Distributed Navigation, Mobility Control, and Resilience
RINGS:深度强化学习支持的大规模无人机网络,具有分布式导航、移动控制和弹性
- 批准号:
2148253 - 财政年份:2022
- 资助金额:
$ 40万 - 项目类别:
Continuing Grant
Collaborative Research: CCSS: Learning to Optimize: From New Algorithms to New Theory
合作研究:CCSS:学习优化:从新算法到新理论
- 批准号:
2113860 - 财政年份:2021
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
Collaborative Research: SCALE MoDL: Adaptivity of Deep Neural Networks
合作研究:SCALE MoDL:深度神经网络的适应性
- 批准号:
2134145 - 财政年份:2021
- 资助金额:
$ 40万 - 项目类别:
Continuing Grant
CIF: Small: Collaborative Research: Acceleration Algorithms for Large-scale Nonconvex Optimization
CIF:小型:协作研究:大规模非凸优化的加速算法
- 批准号:
1909291 - 财政年份:2019
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
CIF: Medium: Collaborative Research: Nonconvex Optimization for High-Dimensional Signal Estimation: Theory and Fast Algorithms
CIF:中:协作研究:高维信号估计的非凸优化:理论和快速算法
- 批准号:
1761506 - 财政年份:2017
- 资助金额:
$ 40万 - 项目类别:
Continuing Grant
CIF: Medium: Collaborative Research: Nonconvex Optimization for High-Dimensional Signal Estimation: Theory and Fast Algorithms
CIF:中:协作研究:高维信号估计的非凸优化:理论和快速算法
- 批准号:
1704169 - 财政年份:2017
- 资助金额:
$ 40万 - 项目类别:
Continuing Grant
Management of Mobile Phone Sensing via Sparse Learning
通过稀疏学习管理手机传感
- 批准号:
1818904 - 财政年份:2017
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
CIF: Small: Collaborative Research: Network Event Detection with Multistream Observations
CIF:小型:协作研究:通过多流观察进行网络事件检测
- 批准号:
1801855 - 财政年份:2017
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
CIF: Small: Collaborative Research: Secret Key Generation Under Resource Constraints
CIF:小型:协作研究:资源限制下的密钥生成
- 批准号:
1801846 - 财政年份:2017
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
CIF: Small: Collaborative Research: Network Event Detection with Multistream Observations
CIF:小型:协作研究:通过多流观察进行网络事件检测
- 批准号:
1617789 - 财政年份:2016
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
相似国自然基金
基于挥发性分布和氧化校正的大气半/中等挥发性有机物来源解析方法构建
- 批准号:42377095
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
基于机器学习和经典电动力学研究中等尺寸金属纳米粒子的量子表面等离激元
- 批准号:22373002
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
中等质量黑洞附近的暗物质分布及其IMRI系统引力波回波探测
- 批准号:12365008
- 批准年份:2023
- 资助金额:32 万元
- 项目类别:地区科学基金项目
复合低维拓扑材料中等离激元增强光学响应的研究
- 批准号:12374288
- 批准年份:2023
- 资助金额:52 万元
- 项目类别:面上项目
中等垂直风切变下非对称型热带气旋快速增强的物理机制研究
- 批准号:42305004
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
相似海外基金
Collaborative Research: CIF: Medium: Snapshot Computational Imaging with Metaoptics
合作研究:CIF:Medium:Metaoptics 快照计算成像
- 批准号:
2403123 - 财政年份:2024
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
Collaborative Research: CIF-Medium: Privacy-preserving Machine Learning on Graphs
合作研究:CIF-Medium:图上的隐私保护机器学习
- 批准号:
2402816 - 财政年份:2024
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
Collaborative Research: CIF-Medium: Privacy-preserving Machine Learning on Graphs
合作研究:CIF-Medium:图上的隐私保护机器学习
- 批准号:
2402815 - 财政年份:2024
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
Collaborative Research: CIF:Medium:Theoretical Foundations of Compositional Learning in Transformer Models
合作研究:CIF:Medium:Transformer 模型中组合学习的理论基础
- 批准号:
2403074 - 财政年份:2024
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
Collaborative Research: CIF: Medium: Snapshot Computational Imaging with Metaoptics
合作研究:CIF:Medium:Metaoptics 快照计算成像
- 批准号:
2403122 - 财政年份:2024
- 资助金额:
$ 40万 - 项目类别:
Standard Grant