Random Matrix Limit Theorems for Deep Neural Networks
深度神经网络的随机矩阵极限定理
基本信息
- 批准号:RGPIN-2021-02533
- 负责人:
- 金额:$ 1.89万
- 依托单位:
- 依托单位国家:加拿大
- 项目类别:Discovery Grants Program - Individual
- 财政年份:2022
- 资助国家:加拿大
- 起止时间:2022-01-01 至 2023-12-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Recent advances in deep neural networks (DNNs) have had a tremendous impact on the modern world. However, the theoretical understanding of these systems is still in its infancy. As a matter of course, the research in this area has been empirically driven and computationally focused rather than emphasizing mathematically rigorous results. There are many open theoretical questions which have been uncovered by empirical work that are now ripe for mathematical analysis. I propose a research program that will develop and apply tools from theoretical probability, specifically random matrix theory, to gain a better understanding of the theory of DNNs and other machine learning systems. I will focus on developing new limit theorems which describe behavior when the number of parameters and/or data becomes very large. These results will help us understand how DNNs work and help us design more effective systems in the future. My objectives of the research program include: 1. The neural tangent kernel: A random matrix that explains the behavior of large networks The neural tangent kernel (NTK) is a recently discovered non-random asymptotic object that explains the behavior of DNNs of fixed depth in the infinite width limit, when the number of neurons in each hidden layer tends to infinity. When applied to random data, the NTK gives a random matrix whose dimensions are the number of given data points. Analysis of this random matrix can explain how DNNs behave during training and can be used to understand the generalization error in deep neural networks. I propose to study this model using random matrix theory. 2. Applied free probability: Advanced tools for random matrix analysis The theory of free probability was originally developed in connection to pure problems in the field of operator algebras. More recently however, methods from free probability and its extensions have emerged as powerful tools for computing asymptotic features of complicated random matrix models. One application is to use free probability to compute the limiting spectrum of large random matrix models connected to DNNs. I also plan to investigate the use of operator valued free probability, a powerful extension of free probability, to study block random matrices related to DNNs. 3. Kardar-Parisi-Zhang (KPZ) universality: Fluctuations of random matrix eigenvalues The KPZ universality class is a collection of stochastic systems, including examples from stochastic PDEs and interacting particle systems, which all share the same type of universal asymptotic random behavior. An important application is the behaviour of the largest eigenvalues in many random matrix models. (As opposed to the bulk behavior of the spectrum captured by other random matrix tools). I plan to apply ideas from KPZ to random matrix problems coming from DNNs and other statistical learning models to analyze the evolution of the largest eigenvalues in these problems.
深度神经网络 (DNN) 的最新进展对现代世界产生了巨大影响,然而,对这些系统的理论理解仍处于起步阶段,这一领域的研究是基于经验和计算的。我提出了一个研究计划,该计划将开发和应用理论概率(特别是随机矩阵理论)的工具来进行数学分析。更好地了解我将专注于开发新的极限定理,这些定理描述参数和/或数据数量变得非常大时的行为,这些结果将帮助我们理解 DNN 的工作原理,并帮助我们设计更有效的系统。我的研究计划的未来目标包括: 1. 神经正切核:解释大型网络行为的随机矩阵 神经正切核 (NTK) 是最近发现的一种非随机渐近对象,它解释了 DNN 的行为。的在无限宽度限制下的固定深度,当每个隐藏层中的神经元数量趋于无穷大时,NTK给出一个随机矩阵,其维度是给定数据点的数量,分析这个随机矩阵可以解释。 DNN 在训练过程中的行为方式以及可用于理解深度神经网络中的泛化误差 我建议使用随机矩阵理论来研究该模型 2. 应用自由概率:随机矩阵分析的高级工具 自由概率理论最初是开发出来的。关于操作员领域的纯粹问题然而,最近,自由概率方法及其扩展已成为计算复杂随机矩阵模型渐近特征的强大工具,其中一个应用是使用自由概率来计算连接到 DNN 的大型随机矩阵模型的极限谱。还计划研究使用算子值自由概率(自由概率的强大扩展)来研究与 DNN 相关的块随机矩阵。 3. Kardar-Parisi-Zhang (KPZ) 普适性:随机矩阵的波动。特征值 KPZ 普适性类是随机系统的集合,包括随机偏微分方程和相互作用粒子系统的示例,它们都具有相同类型的普适渐近随机行为,一个重要的应用是许多系统中最大特征值的行为。 (与其他随机矩阵工具捕获的频谱的大量行为相反),我计划将 KPZ 的思想应用于来自 DNN 和其他统计学习模型的随机矩阵问题,以分析最大的演化。这些问题中的特征值。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Nica, Mihai其他文献
The Landscape of the Spiked Tensor Model
尖峰张量模型的景观
- DOI:
10.1002/cpa.21861 - 发表时间:
2019-05 - 期刊:
- 影响因子:3
- 作者:
Arous, Gérard Ben;Mei, Song;Montanari, Andrea;Nica, Mihai - 通讯作者:
Nica, Mihai
The Landscape of the Spiked Tensor Model
尖峰张量模型的景观
- DOI:
10.1002/cpa.21861 - 发表时间:
2019-05 - 期刊:
- 影响因子:3
- 作者:
Arous, Gérard Ben;Mei, Song;Montanari, Andrea;Nica, Mihai - 通讯作者:
Nica, Mihai
The Landscape of the Spiked Tensor Model
尖峰张量模型的景观
- DOI:
10.1002/cpa.21861 - 发表时间:
2019-05 - 期刊:
- 影响因子:3
- 作者:
Arous, Gérard Ben;Mei, Song;Montanari, Andrea;Nica, Mihai - 通讯作者:
Nica, Mihai
Nica, Mihai的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Nica, Mihai', 18)}}的其他基金
Random Matrix Limit Theorems for Deep Neural Networks
深度神经网络的随机矩阵极限定理
- 批准号:
DGECR-2021-00041 - 财政年份:2021
- 资助金额:
$ 1.89万 - 项目类别:
Discovery Launch Supplement
Random Matrix Limit Theorems for Deep Neural Networks
深度神经网络的随机矩阵极限定理
- 批准号:
DGECR-2021-00041 - 财政年份:2021
- 资助金额:
$ 1.89万 - 项目类别:
Discovery Launch Supplement
Random Matrix Limit Theorems for Deep Neural Networks
深度神经网络的随机矩阵极限定理
- 批准号:
RGPIN-2021-02533 - 财政年份:2021
- 资助金额:
$ 1.89万 - 项目类别:
Discovery Grants Program - Individual
Random Matrix Limit Theorems for Deep Neural Networks
深度神经网络的随机矩阵极限定理
- 批准号:
RGPIN-2021-02533 - 财政年份:2021
- 资助金额:
$ 1.89万 - 项目类别:
Discovery Grants Program - Individual
Random polymers and the Kardar-Parisi-Zhang universality class
无规聚合物和 Kardar-Parisi-Zhang 通用类
- 批准号:
502287-2017 - 财政年份:2018
- 资助金额:
$ 1.89万 - 项目类别:
Postdoctoral Fellowships
Random polymers and the Kardar-Parisi-Zhang universality class
无规聚合物和 Kardar-Parisi-Zhang 通用类
- 批准号:
502287-2017 - 财政年份:2018
- 资助金额:
$ 1.89万 - 项目类别:
Postdoctoral Fellowships
Random polymers and the Kardar-Parisi-Zhang universality class
无规聚合物和 Kardar-Parisi-Zhang 通用类
- 批准号:
502287-2017 - 财政年份:2017
- 资助金额:
$ 1.89万 - 项目类别:
Postdoctoral Fellowships
Random polymers and the Kardar-Parisi-Zhang universality class
无规聚合物和 Kardar-Parisi-Zhang 通用类
- 批准号:
502287-2017 - 财政年份:2017
- 资助金额:
$ 1.89万 - 项目类别:
Postdoctoral Fellowships
The generation of coastal mean flows by winds
由风产生的沿海平均流量
- 批准号:
399764-2010 - 财政年份:2010
- 资助金额:
$ 1.89万 - 项目类别:
University Undergraduate Student Research Awards
The generation of coastal mean flows by winds
由风产生的沿海平均流量
- 批准号:
399764-2010 - 财政年份:2010
- 资助金额:
$ 1.89万 - 项目类别:
University Undergraduate Student Research Awards
相似国自然基金
基于矩阵方法的电价博弈分析与控制策略研究
- 批准号:62303170
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于穆勒散射矩阵的海洋粒子宽粒径谱及折射率反演方法研究
- 批准号:42376182
- 批准年份:2023
- 资助金额:51 万元
- 项目类别:面上项目
矩阵非线性Schrödinger类系统的简并非线性波及其相互作用机制研究
- 批准号:12305001
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
鲁棒半监督深度非负矩阵分解方法研究
- 批准号:62306080
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
高维样本相关矩阵离群特征值的渐近理论及其应用
- 批准号:12301339
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
相似海外基金
A study of stochastic gradient descent algorithms in the high-dimensional limit using random matrix theory
利用随机矩阵理论研究高维极限下的随机梯度下降算法
- 批准号:
569306-2022 - 财政年份:2022
- 资助金额:
$ 1.89万 - 项目类别:
Alexander Graham Bell Canada Graduate Scholarships - Doctoral
A study of stochastic gradient descent algorithms in the high-dimensional limit using random matrix theory
利用随机矩阵理论研究高维极限下的随机梯度下降算法
- 批准号:
569306-2022 - 财政年份:2022
- 资助金额:
$ 1.89万 - 项目类别:
Alexander Graham Bell Canada Graduate Scholarships - Doctoral
Random Matrix Limit Theorems for Deep Neural Networks
深度神经网络的随机矩阵极限定理
- 批准号:
DGECR-2021-00041 - 财政年份:2021
- 资助金额:
$ 1.89万 - 项目类别:
Discovery Launch Supplement
Random Matrix Limit Theorems for Deep Neural Networks
深度神经网络的随机矩阵极限定理
- 批准号:
DGECR-2021-00041 - 财政年份:2021
- 资助金额:
$ 1.89万 - 项目类别:
Discovery Launch Supplement
Random Matrix Limit Theorems for Deep Neural Networks
深度神经网络的随机矩阵极限定理
- 批准号:
RGPIN-2021-02533 - 财政年份:2021
- 资助金额:
$ 1.89万 - 项目类别:
Discovery Grants Program - Individual