Collaborative Research: SCALE MoDL: Adaptivity of Deep Neural Networks
合作研究:SCALE MoDL:深度神经网络的适应性
基本信息
- 批准号:2134145
- 负责人:
- 金额:$ 30万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2021
- 资助国家:美国
- 起止时间:2021-10-01 至 2024-09-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
The overarching theme of the project is to systematically expand understanding of how deep neural networks (DNNs) work and why or when they are better than classical methods through the lens of "adaptivity." Adaptivity refers to the properties of an algorithm that take advantage of favorable structures in the input data without knowing that these structures exist. That is, adaptive algorithms are those that are free of tuning parameters and could automatically configure themselves to adapt to each input data. The anticipated outcome of the project includes a new theory that explains and quantifies the adaptivity of popular DNN models such as multi-layer perceptrons, self-attention mechanisms (namely, transformer models), and meta-learning. The theory could result in substantial savings in the statistical and computational complexity of these models, allowing them to be applied in resource-constrained settings and to have more environmentally friendly energy footprint. This project will also provide opportunities for students and postdocs to explore interdisciplinary research topics related to deep learning.Specifically, this project investigates (1) the "local adaptivity" of DNNs in estimating functions from noisy data; (2) the "relational adaptivity" of self-attention mechanism that parses a structure data point (such as an image or a chunk of text); and (3) the "task adaptivity" of multi-task and meta-learning algorithms that learn to share information across multiple tasks. The research covers some of the most popular DNN models. Technically the project leverages multiple branches of mathematics (such as function classes, nonparametric statistics, statistical learning theory, optimization, and compressed sensing) and involves innovations in the approximation-theoretic understanding, algorithmic insights, and statistical theory of DNNs. The new analytical tools to be developed are also of independent interest to the broader machine learning theory community.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
该项目的首要主题是通过“适应性”的视角,系统地扩展对深度神经网络 (DNN) 工作原理以及为何或何时优于经典方法的理解。适应性是指在不知道这些结构存在的情况下利用输入数据中有利的结构的算法的属性。也就是说,自适应算法是那些无需调整参数并且可以自动配置自身以适应每个输入数据的算法。该项目的预期成果包括一种新理论,该理论解释和量化了流行的 DNN 模型的适应性,例如多层感知器、自注意力机制(即 Transformer 模型)和元学习。该理论可以大大节省这些模型的统计和计算复杂性,使它们能够应用于资源有限的环境,并具有更环保的能源足迹。该项目还将为学生和博士后提供探索与深度学习相关的跨学科研究主题的机会。具体而言,该项目研究(1)DNN 在从噪声数据估计函数时的“局部适应性”; (2)解析结构数据点(例如图像或文本块)的自注意力机制的“关系适应性”; (3)多任务和元学习算法的“任务适应性”,学习跨多个任务共享信息。该研究涵盖了一些最流行的 DNN 模型。从技术上讲,该项目利用了数学的多个分支(例如函数类、非参数统计、统计学习理论、优化和压缩感知),并涉及 DNN 的近似理论理解、算法见解和统计理论方面的创新。待开发的新分析工具也对更广泛的机器学习理论界具有独立的兴趣。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力价值和更广泛的影响审查标准进行评估,被认为值得支持。
项目成果
期刊论文数量(9)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Provably faster algorithms for bilevel optimization
经证明更快的双层优化算法
- DOI:
- 发表时间:2021-01
- 期刊:
- 影响因子:0
- 作者:Yang, Junjie;Ji, Kaiyi;Liang, Yingbin.
- 通讯作者:Liang, Yingbin.
Will bilevel optimizers benefit from loops
双层优化器会从循环中受益吗
- DOI:
- 发表时间:2022-12
- 期刊:
- 影响因子:0
- 作者:Ji, Kaiyi;Liu, Mingrui;Liang, Yingbin;Ying, Lei.
- 通讯作者:Ying, Lei.
Will bilevel optimizers benefit from loops
双层优化器会从循环中受益吗
- DOI:
- 发表时间:2022-01
- 期刊:
- 影响因子:0
- 作者:Ji, Kaiyi;Liu, Mingrui;Liang, Yingbin;Ying, Lei.
- 通讯作者:Ying, Lei.
Theoretical characterization of the generalization performance of overfitted meta-learning
过拟合元学习泛化性能的理论表征
- DOI:
- 发表时间:2023-01
- 期刊:
- 影响因子:0
- 作者:Ju, Peizhong;Liang, Yingbin;Shroff, Ness.
- 通讯作者:Shroff, Ness.
M-L2O: Towards generalizable learning-to-optimize by test-time fast self-adaptation
M-L2O:通过测试时快速自适应实现可推广的学习优化
- DOI:
- 发表时间:2023-01
- 期刊:
- 影响因子:0
- 作者:Yang, Junjie;Chen, Xuxi;Chen, Tianlong;Wang, Zhangyang;Liang, Yingbin.
- 通讯作者:Liang, Yingbin.
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Yingbin Liang其他文献
Feedback Capacities of Gaussian Multiple-Access Wiretap Channels
高斯多址窃听通道的反馈能力
- DOI:
10.1109/isit.2019.8849326 - 发表时间:
2020-07-29 - 期刊:
- 影响因子:0
- 作者:
Bin Dai;Chong Li;Yingbin Liang;Zheng Ma;S. Shamai - 通讯作者:
S. Shamai
A simple convergence analysis of Bregman proximal gradient algorithm
Bregman近端梯度算法的简单收敛性分析
- DOI:
10.1007/s10589-019-00092-y - 发表时间:
2015-03-18 - 期刊:
- 影响因子:2.2
- 作者:
Yi Zhou;Yingbin Liang;Lixin Shen - 通讯作者:
Lixin Shen
Local Geometry of Cross Entropy Loss in Learning One-Hidden-Layer Neural Networks
学习单隐层神经网络中交叉熵损失的局部几何
- DOI:
10.1109/isit.2019.8849289 - 发表时间:
2019-07-07 - 期刊:
- 影响因子:0
- 作者:
H. Fu;Yuejie Chi;Yingbin Liang - 通讯作者:
Yingbin Liang
Global Convergence of Two-timescale Actor-Critic for Solving Linear Quadratic Regulator
求解线性二次调节器的双时间尺度 Actor-Critic 全局收敛
- DOI:
10.48550/arxiv.2208.08744 - 发表时间:
2022-08-18 - 期刊:
- 影响因子:0
- 作者:
Xu;Jingliang Duan;Yingbin Liang;Lin Zhao - 通讯作者:
Lin Zhao
Critical Points of Neural Networks: Analytical Forms and Landscape Properties
神经网络的关键点:分析形式和景观属性
- DOI:
- 发表时间:
2017-10-30 - 期刊:
- 影响因子:0
- 作者:
Yi Zhou;Yingbin Liang - 通讯作者:
Yingbin Liang
Yingbin Liang的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Yingbin Liang', 18)}}的其他基金
RINGS: A Deep Reinforcement Learning Enabled Large-scale UAV Network with Distributed Navigation, Mobility Control, and Resilience
RINGS:深度强化学习支持的大规模无人机网络,具有分布式导航、移动控制和弹性
- 批准号:
2148253 - 财政年份:2022
- 资助金额:
$ 30万 - 项目类别:
Continuing Grant
Collaborative Research: CCSS: Learning to Optimize: From New Algorithms to New Theory
合作研究:CCSS:学习优化:从新算法到新理论
- 批准号:
2113860 - 财政年份:2021
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
CIF: Medium: Collaborative Research: Theory of Optimization Geometry and Algorithms for Neural Networks
CIF:媒介:协作研究:神经网络优化几何理论和算法
- 批准号:
1900145 - 财政年份:2019
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
CIF: Small: Collaborative Research: Acceleration Algorithms for Large-scale Nonconvex Optimization
CIF:小型:协作研究:大规模非凸优化的加速算法
- 批准号:
1909291 - 财政年份:2019
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
CIF: Medium: Collaborative Research: Nonconvex Optimization for High-Dimensional Signal Estimation: Theory and Fast Algorithms
CIF:中:协作研究:高维信号估计的非凸优化:理论和快速算法
- 批准号:
1761506 - 财政年份:2017
- 资助金额:
$ 30万 - 项目类别:
Continuing Grant
CIF: Medium: Collaborative Research: Nonconvex Optimization for High-Dimensional Signal Estimation: Theory and Fast Algorithms
CIF:中:协作研究:高维信号估计的非凸优化:理论和快速算法
- 批准号:
1704169 - 财政年份:2017
- 资助金额:
$ 30万 - 项目类别:
Continuing Grant
Management of Mobile Phone Sensing via Sparse Learning
通过稀疏学习管理手机传感
- 批准号:
1818904 - 财政年份:2017
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
CIF: Small: Collaborative Research: Network Event Detection with Multistream Observations
CIF:小型:协作研究:通过多流观察进行网络事件检测
- 批准号:
1801855 - 财政年份:2017
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
CIF: Small: Collaborative Research: Secret Key Generation Under Resource Constraints
CIF:小型:协作研究:资源限制下的密钥生成
- 批准号:
1801846 - 财政年份:2017
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
CIF: Small: Collaborative Research: Network Event Detection with Multistream Observations
CIF:小型:协作研究:通过多流观察进行网络事件检测
- 批准号:
1617789 - 财政年份:2016
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
相似国自然基金
大规模基因预训练模型及其在基因结构与功能研究中的应用
- 批准号:62372098
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
大规模集成超表面高效逆向设计方法研究
- 批准号:12304436
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
面向超大规模多目标的进化迁移优化算法研究及应用
- 批准号:62306180
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
两类偏微分方程大规模离散系统的特征驱动的多水平算法及其新型解法器研究
- 批准号:12371373
- 批准年份:2023
- 资助金额:43.5 万元
- 项目类别:面上项目
面向大规模强化学习任务的预测控制理论与方法研究
- 批准号:62376179
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
相似海外基金
Collaborative Research: DMS/NIGMS 1: Simulating cell migration with a multi-scale 3D model fed by intracellular tension sensing measurements
合作研究:DMS/NIGMS 1:使用由细胞内张力传感测量提供的多尺度 3D 模型模拟细胞迁移
- 批准号:
2347956 - 财政年份:2024
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
Collaborative Research: SHF: Medium: Enabling Graphics Processing Unit Performance Simulation for Large-Scale Workloads with Lightweight Simulation Methods
合作研究:SHF:中:通过轻量级仿真方法实现大规模工作负载的图形处理单元性能仿真
- 批准号:
2402804 - 财政年份:2024
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
Collaborative Research: OAC Core: Distributed Graph Learning Cyberinfrastructure for Large-scale Spatiotemporal Prediction
合作研究:OAC Core:用于大规模时空预测的分布式图学习网络基础设施
- 批准号:
2403313 - 财政年份:2024
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
Collaborative Research: OAC Core: Large-Scale Spatial Machine Learning for 3D Surface Topology in Hydrological Applications
合作研究:OAC 核心:水文应用中 3D 表面拓扑的大规模空间机器学习
- 批准号:
2414185 - 财政年份:2024
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
Collaborative Research: Resilience, Experimentation, and Collapse in Small-Scale Fisheries
合作研究:小规模渔业的恢复力、实验和崩溃
- 批准号:
2312167 - 财政年份:2024
- 资助金额:
$ 30万 - 项目类别:
Standard Grant