Algorithms and Theory for Compressing Deep Neural Networks

压缩深度神经网络的算法和理论

基本信息

  • 批准号:
    2208126
  • 负责人:
  • 金额:
    $ 27.66万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2022
  • 资助国家:
    美国
  • 起止时间:
    2022-09-01 至 2025-08-31
  • 项目状态:
    未结题

项目摘要

Deep neural networks (DNNs) have been the main driving force for recent advancements in artificial intelligence (AI) technology, profoundly impacting society in the areas of transportation, public safety, entertainment, health care, and other areas of public life. One of the biggest obstacles to AI's even broader impact on our daily lives is the typically enormous power consumption of DNNs upon deployment. The aim of this project is to develop mathematical and computational approaches for DNN compression to realize the fast and efficient deployment of AI systems on mobile platforms with low-power budgets such as smartphones. Results of this work will have a variety of applications which include video security systems, autopilot, smart robots, and face identification. The project will involve training of graduate students, development of data science courses, as well as collaboration with industry. The PI plans to (1) develop and analyze coarse gradient algorithms, featuring a biased first-order oracle, for the discretization of various neural architectures including transformer-based networks; (2) develop and analyze efficient thresholding-based algorithms for compressing networks via structured sparsity on both balanced and unbalanced data; (3) investigate the model capacity of compressed DNNs and establish universal finite-sample expressivity theory. The proposed research will also explore the applications of coarse gradient algorithms to other machine learning problems with discrete-valued loss functions and advance knowledge in discrete optimization.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
深度神经网络(DNN)一直是人工智能(AI)技术近期进步的主要驱动力,深刻影响着社会的交通、公共安全、娱乐、医疗保健和其他公共生活领域。人工智能对我们日常生活产生更广泛影响的最大障碍之一是 DNN 在部署时通常会产生巨大的功耗。该项目的目标是开发 DNN 压缩的数学和计算方法,以实现人工智能系统在智能手机等低功耗移动平台上的快速高效部署。这项工作的成果将具有多种应用,包括视频安全系统、自动驾驶仪、智能机器人和人脸识别。该项目将涉及研究生培训、数据科学课程开发以及与行业的合作。 PI 计划 (1) 开发和分析粗梯度算法,以有偏差的一阶预言机为特色,用于各种神经架构的离散化,包括基于 Transformer 的网络; (2) 开发和分析有效的基于阈值的算法,通过平衡和不平衡数据的结构化稀疏性来压缩网络; (3) 研究压缩 DNN 的模型容量并建立通用的有限样本表达理论。拟议的研究还将探索粗梯度算法在具有离散值损失函数的其他机器学习问题中的应用,以及离散优化方面的先进知识。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力价值进行评估,被认为值得支持以及更广泛的影响审查标准。

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Feature Affinity Assisted Knowledge Distillation and Quantization of Deep Neural Networks on Label-Free Data
  • DOI:
    10.1109/access.2023.3297890
  • 发表时间:
    2023-02
  • 期刊:
  • 影响因子:
    3.9
  • 作者:
    Zhijian Li;Biao Yang;Penghang Yin;Y. Qi;J. Xin
  • 通讯作者:
    Zhijian Li;Biao Yang;Penghang Yin;Y. Qi;J. Xin
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Penghang Yin其他文献

Link Flow Correction For Inconsistent Traffic Flow Data Via ?1-Minimization
通过 ?1-最小化对不一致的流量数据进行链路流量校正
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Penghang Yin;Zhe Sun;W. Jin;J. Xin
  • 通讯作者:
    J. Xin
$\ell_1$-minimization method for link flow correction
$ell_1$-链路流量修正的最小化方法
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Penghang Yin;Zhe Sun;W. Jin;J. Xin
  • 通讯作者:
    J. Xin
On the complexity of convex inertial proximal algorithms
凸惯性近端算法的复杂度
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Tao Sun;Penghang Yin
  • 通讯作者:
    Penghang Yin
Non-convex Optimization Methods for Sparse and Low-rank Reconstruction
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Penghang Yin
  • 通讯作者:
    Penghang Yin
Training Ternary Neural Networks with Exact Proximal Operator
使用精确近端算子训练三元神经网络
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Penghang Yin;Shuai Zhang;J. Xin;Y. Qi
  • 通讯作者:
    Y. Qi

Penghang Yin的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Penghang Yin', 18)}}的其他基金

Collaborative Research: RI: Small: Robust Deep Learning with Big Imbalanced Data
合作研究:RI:小型:具有大不平衡数据的鲁棒深度学习
  • 批准号:
    2110546
  • 财政年份:
    2021
  • 资助金额:
    $ 27.66万
  • 项目类别:
    Continuing Grant

相似国自然基金

数据科学与人工智能中的一些算法理论分析
  • 批准号:
    12126365
  • 批准年份:
    2021
  • 资助金额:
    20.0 万元
  • 项目类别:
    数学天元基金项目
数据科学与人工智能中的一些算法理论分析
  • 批准号:
    12126320
  • 批准年份:
    2021
  • 资助金额:
    10.0 万元
  • 项目类别:
    数学天元基金项目
基于A*OMP算法的稀疏信号重构理论及应用研究
  • 批准号:
    61907014
  • 批准年份:
    2019
  • 资助金额:
    25.0 万元
  • 项目类别:
    青年科学基金项目
基于信号的不完全信息实现信号的重构与逼近的理论和算法研究
  • 批准号:
    11871109
  • 批准年份:
    2018
  • 资助金额:
    55.0 万元
  • 项目类别:
    面上项目
二维多快拍无网格压缩波束形成声源识别理论及算法研究
  • 批准号:
    11874096
  • 批准年份:
    2018
  • 资助金额:
    63.0 万元
  • 项目类别:
    面上项目

相似海外基金

Problems in Ramsey theory
拉姆齐理论中的问题
  • 批准号:
    2582036
  • 财政年份:
    2025
  • 资助金额:
    $ 27.66万
  • 项目类别:
    Studentship
Opening Spaces and Places for the Inclusion of Indigenous Knowledge, Voice and Identity: Moving Indigenous People out of the Margins
为包容土著知识、声音和身份提供开放的空间和场所:使土著人民走出边缘
  • 批准号:
    477924
  • 财政年份:
    2024
  • 资助金额:
    $ 27.66万
  • 项目类别:
    Salary Programs
A statistical decision theory of cognitive capacity
认知能力的统计决策理论
  • 批准号:
    DP240101511
  • 财政年份:
    2024
  • 资助金额:
    $ 27.66万
  • 项目类别:
    Discovery Projects
Numerical simulations of lattice field theory
晶格场论的数值模拟
  • 批准号:
    2902259
  • 财政年份:
    2024
  • 资助金额:
    $ 27.66万
  • 项目类别:
    Studentship
Dynamical Approaches to Number Theory and Additive Combinatorics
数论和加法组合学的动态方法
  • 批准号:
    EP/Y014030/1
  • 财政年份:
    2024
  • 资助金额:
    $ 27.66万
  • 项目类别:
    Research Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了