CNS Core: Small: Harnessing Weight Repetition for Efficient Deep Neural Network Inference on General-Purpose Platforms

CNS 核心:小型:利用权重重复在通用平台上进行高效深度神经网络推理

基本信息

项目摘要

Society is witnessing an explosion in the use of Deep Neural Networks (DNNs) across all facets of daily life including health, finances, entertainment and transportation. DNNs are used by performing DNN inference, which queries the DNN with an input (for example, an image) to get an answer (for example, a classification). Society relies on inference every day, where it is run on devices ranging from cloud servers to personal computers. The goal of this project is to develop new ways to make inference efficient (fast, low power) on these devices.The technical approach is to explore how a new phenomenon, called weight repetition, can be applied to general-purpose devices such as Central Processing Units (CPUs) and Graphical Processing Units (GPUs). The idea is, when a DNN weight is repeated, DNN inference operations can be simplified. The first project thrust will develop high-efficiency weight repetition-aware software kernels that can run on un-modified hardware. The second thrust will develop novel training techniques to co-design the DNN with the weight repetition-aware kernels. Finally, the third thrust will explore what point hardware modifications can be made to further improve efficiency in the first two thrusts.By proving weight repetition's effectiveness on general-purpose devices, this project will unlock innovation in software, algorithms and hardware. The project will also amplify the improvement possible from related, but orthogonal, techniques such as weight quantization and weight sparsity. To support the cross-stack approach, the project will train a new class of students and researchers who can work across high-performance software, hardware and DNN training algorithms to build co-designed Machine Learning stacks and, in the future, apply the lessons learned to other high-impact problems that require cross-layer solutions.The project will store all publications, code and data-sets on public-facing websites, hosted at the University of Illinois for at least 3 years after the end of the project. This information will be made available via commercial websites. Links to these websites will be mirrored at http://cwfletcher.net/weightrepetition.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
社会正在见证深度神经网络 (DNN) 在日常生活各个方面的使用呈爆炸式增长,包括健康、金融、娱乐和交通。 DNN 通过执行 DNN 推理来使用,即使用输入(例如图像)查询 DNN 以获得答案(例如分类)。 社会每天都依赖于推理,推理运行在从云服务器到个人电脑的各种设备上。 该项目的目标是开发新方法,使这些设备上的推理高效(快速、低功耗)。技术方法是探索如何将一种称为权重重复的新现象应用于 Central 等通用设​​备处理单元 (CPU) 和图形处理单元 (GPU)。 这个想法是,当重复 DNN 权重时,可以简化 DNN 推理操作。 第一个项目主旨将开发可在未修改的硬件上运行的高效权重重复感知软件内核。 第二个重点将开发新颖的训练技术,以共同设计 DNN 和权重重复感知内核。 最后,第三个主旨将探讨在前两个主旨中可以对哪些硬件进行修改,以进一步提高效率。通过证明权重重复在通用设备上的有效性,该项目将释放软件、算法和硬件方面的创新。 该项目还将扩大相关但正交的技术(例如权重量化和权重稀疏性)可能带来的改进。 为了支持跨堆栈方法,该项目将培训一批新的学生和研究人员,他们可以跨高性能软件、硬件和 DNN 训练算法进行工作,以构建共同设计的机器学习堆栈,并在未来应用所学到的经验教训了解其他需要跨层解决方案的高影响力问题。该项目将在项目结束后将所有出版物、代码和数据集存储在伊利诺伊大学托管的面向公众的网站上至少 3 年。 该信息将通过商业网站提供。 这些网站的链接将反映在 http://cwfletcher.net/weightrepetition。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Speculative Taint Tracking (STT): A Comprehensive Protection for Speculatively Accessed Data
推测性污点跟踪 (STT):对推测性访问数据的全面保护
  • DOI:
    10.1145/3352460.3358274
  • 发表时间:
    2019-10
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yu, Jiyong;Yan, Mengjia;Khyzha, Artem;Morrison, Adam;Torrellas, Josep;Fletcher, Christopher W.
  • 通讯作者:
    Fletcher, Christopher W.
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Christopher Fletcher其他文献

Social housing construction and improvements in housing outcomes for Inuit in Northern Canada
加拿大北部因纽特人的社会住房建设和住房状况改善
  • DOI:
    10.1080/02673037.2020.1739233
  • 发表时间:
    2020-05-04
  • 期刊:
  • 影响因子:
    3.2
  • 作者:
    M. Riva;K. Perreault;P. Dufresne;Christopher Fletcher;G. Muckle;L. Potvin;R. Bailie;Marie Baron
  • 通讯作者:
    Marie Baron
RJR Nabisco's cartoon camel promotes camel cigarettes to children.
RJR纳贝斯克公司的卡通骆驼向儿童推销骆驼香烟。
Conceptualisation and Operationalisation of a Holistic Indicator of Health for Older Inuit: Results of a Sequential Mixed-Methods Project
老年因纽特人整体健康指标的概念化和实施:连续混合方法项目的结果
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    3.1
  • 作者:
    Marie Baron;M. Riva;Christopher Fletcher;Melody Lynch;Marie;E. L. Laouan Sidi
  • 通讯作者:
    E. L. Laouan Sidi
Beyond the Public Meeting: Building a Field-Based Participatory GIS for Land Use Planning in Monongalia County, West Virginia
公开会议之外:为西弗吉尼亚州莫农加利亚县的土地利用规划构建基于现场的参与式 GIS
  • DOI:
    10.4018/978-1-59140-845-1.ch003
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    6.4
  • 作者:
    Timothy L. Hawthorne;M. Dougherty;G. Elmes;Christopher Fletcher;B. McCusker;Marta Pinto;Daniel Weiner
  • 通讯作者:
    Daniel Weiner
Culturally and contextually adaptive indicators of organizational success: Nunavik, Quebec
组织成功的文化和环境适应性指标:魁北克省努纳维克
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    S. Fraser;Marie;M. Riva;Christopher Fletcher;N. Beauregard;Jennifer Thompson;Raymond Mickpegak;Laury
  • 通讯作者:
    Laury

Christopher Fletcher的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Christopher Fletcher', 18)}}的其他基金

SaTC: CORE: Medium: Collaborative: Hardening Off-the-Shelf Software Against Side Channel Attacks
SaTC:核心:媒介:协作:强化现成软件以抵御侧通道攻击
  • 批准号:
    2425665
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
Collaborative Research: SaTC: CORE: Medium: Systematic Detection Of and Defenses Against Next-Generation Microarchitectural Attacks
协作研究:SaTC:核心:中:下一代微架构攻击的系统检测和防御
  • 批准号:
    2154183
  • 财政年份:
    2022
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
CAREER: Fortifying Leaky Hardware Interfaces with Distinguishability Set Architectures
职业:通过可区分性集架构强化泄漏硬件接口
  • 批准号:
    1942888
  • 财政年份:
    2020
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
SaTC: CORE: Medium: Collaborative: Hardening Off-the-Shelf Software Against Side Channel Attacks
SaTC:核心:媒介:协作:强化现成软件以抵御侧通道攻击
  • 批准号:
    1954521
  • 财政年份:
    2020
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
SaTC: CORE: Small: Collaborative: Oblivious ISAs for Secure and Efficient Enclave Programming
SaTC:核心:小型:协作:用于安全高效 Enclave 编程的不经意的 ISA
  • 批准号:
    1816226
  • 财政年份:
    2018
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant

相似国自然基金

polyG蛋白聚集体诱导小胶质细胞活化在神经元核内包涵体病中的作用及机制研究
  • 批准号:
    82301603
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于NRF2调控KPNB1促进PD-L1核转位介导非小细胞肺癌免疫治疗耐药的机制研究
  • 批准号:
    82303969
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
前丘脑室旁核小胶质细胞经由TNF-α参与强迫进食行为的作用及机制研究
  • 批准号:
    82301521
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
小胶质细胞调控外侧隔核-腹侧被盖区神经环路介导社交奖赏障碍的机制研究
  • 批准号:
    82304474
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
空间邻近标记技术研究莱茵衣藻蛋白核小管与碳浓缩机制的潜在关系
  • 批准号:
    32300220
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

CNS Core: Small: Core Scheduling Techniques and Programming Abstractions for Scalable Serverless Edge Computing Engine
CNS Core:小型:可扩展无服务器边缘计算引擎的核心调度技术和编程抽象
  • 批准号:
    2322919
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CNS Core: Small: Network Wide Sensing by Leveraging Cellular Communication Networks
CNS 核心:小型:利用蜂窝通信网络进行全网络传感
  • 批准号:
    2343469
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
NSF-BSF: CNS Core: Small: Reliable and Zero-Power Timekeepers for Intermittently Powered Computing Devices via Stochastic Magnetic Tunnel Junctions
NSF-BSF:CNS 核心:小型:通过随机磁隧道结为间歇供电计算设备提供可靠且零功耗的计时器
  • 批准号:
    2400463
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: CNS Core: Small: Accelerating Serverless Cloud Network Performance
协作研究:CNS 核心:小型:加速无服务器云网络性能
  • 批准号:
    2229454
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: CNS Core: Small: A Compilation System for Mapping Deep Learning Models to Tensorized Instructions (DELITE)
合作研究:CNS Core:Small:将深度学习模型映射到张量化指令的编译系统(DELITE)
  • 批准号:
    2230945
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了