CCF: SHF: Small: Transformer synthesis

CCF:SHF:小型:变压器综合

基本信息

  • 批准号:
    2203399
  • 负责人:
  • 金额:
    $ 60万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2022
  • 资助国家:
    美国
  • 起止时间:
    2022-02-01 至 2025-01-31
  • 项目状态:
    未结题

项目摘要

Just within four years of being first proposed, transformers have had a dramatic impact on the natural language processing (NLP) field and are also beginning to have an impact on other fields, such as computer vision. This success has largely been driven by large-scale pre-training datasets, increasing computational power, and robust training techniques. However, a major challenge that remains is efficient optimal transformer model synthesis for a specific task and set of user requirements. However, this is not easy to do since the design space of transformer models is vast. This project addresses this challenge through the development of transformer-synthesis methodologies and tools. Given the importance of transformers, such tools are likely to have a transformative impact on many application areas. The research will be disseminated to industry via tech transfer e.g., via open-source online distribution of source codes, summer internships, and by leveraging PIs involvement with local companies. Outreach and curriculum development plans will also be undertaken within the context of the proposed research.There is currently no universal framework that can navigate the vast transformer hyperparameter design space. Previously proposed transformer models are homogeneous in terms of data flow through the network. Unfortunately, this leads to very suboptimal transformer architectures. This project expands the transformer design space to incorporate heterogeneous architectures that venture beyond self-attention by employing other operations like convolutions and linear transforms. It will also explore novel projection layers and positional encodings to make hidden sizes flexible across various transformer layers. It will use a dense embedding to capture model similarity to significantly enhance search efficiency. It will develop a heteroscedastic surrogate model to further speed up search. It will include operations that optimize long-range interactions for long input sequences. It will also explore skipped connections and block-level grow-and-prune synthesis to improve architectural search efficiency.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
在首次提出的短短四年内,Transformer 就对自然语言处理 (NLP) 领域产生了巨大影响,并且也开始对计算机视觉等其他领域产生影响。这一成功很大程度上得益于大规模预训练数据集、不断增强的计算能力和强大的训练技术。然而,仍然存在的一个主要挑战是针对特定任务和一组用户需求进行高效的最佳变压器模型综合。然而,这并不容易做到,因为变压器模型的设计空间很大。 该项目通过开发变压器综合方法和工具来应对这一挑战。 鉴于变压器的重要性,此类工具可能会对许多应用领域产生变革性影响。该研究将通过技术转让向业界传播,例如通过源代码的开源在线分发、暑期实习以及利用 PI 与当地公司的合作。外展和课程开发计划也将在拟议研究的背景下进行。目前还没有可以驾驭广阔的变压器超参数设计空间的通用框架。先前提出的变压器模型在通过网络的数据流方面是同质的。不幸的是,这会导致变压器架构非常次优。该项目扩展了变压器的设计空间,纳入了异构架构,通过采用卷积和线性变换等其他操作来超越自注意力。它还将探索新颖的投影层和位置编码,以使隐藏尺寸在各种变换器层上灵活。它将使用密集嵌入来捕获模型相似性,以显着提高搜索效率。它将开发异方差代理模型以进一步加快搜索速度。它将包括优化长输入序列的远程交互的操作。它还将探索跳过连接和块级生长和修剪综合,以提高架构搜索效率。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Niraj Jha其他文献

Niraj Jha的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Niraj Jha', 18)}}的其他基金

I-Corps: Advanced Security for Healthcare Systems
I-Corps:医疗保健系统的高级安全性
  • 批准号:
    2404652
  • 财政年份:
    2024
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
CNS Core: Small: CNN-Accelerator Co-Design
CNS 核心:小型:CNN 加速器协同设计
  • 批准号:
    2216746
  • 财政年份:
    2022
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
CNS Core: Small: Ultra-Efficient Neural Network and LSTM Architectures
CNS 核心:小型:超高效神经网络和 LSTM 架构
  • 批准号:
    1907381
  • 财政年份:
    2019
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
SHF: Small:Extremely Energy-Efficient Monolithic 3D System Architectures
SHF:小型:极其节能的单片 3D 系统架构
  • 批准号:
    1811109
  • 财政年份:
    2018
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
SHF: Small: Exploration of the Transistor-level Monolithic 3D SRAM Design Space
SHF:小型:晶体管级单片 3D SRAM 设计空间的探索
  • 批准号:
    1714161
  • 财政年份:
    2017
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
TWC: Small: Physiological Information Leakage: A New Front on Health Information Security
TWC:小:生理信息泄露:健康信息安全新战线
  • 批准号:
    1617628
  • 财政年份:
    2016
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
CSR: Small: Energy-efficient Embedded Signal-processing Inference Systems
CSR:小型:节能嵌入式信号处理推理系统
  • 批准号:
    1617640
  • 财政年份:
    2016
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
SHF: Small: Parasitics-aware Exploration of the FinFET SRAM Design Space
SHF:小型:FinFET SRAM 设计空间的寄生感知探索
  • 批准号:
    1318603
  • 财政年份:
    2013
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
SHF:Small: Fine-grain Dynamically Reconfigurable FPGA Architecture Aimed at Reducing the ASIC-FPGA Gaps
SHF:Small:旨在缩小 ASIC-FPGA 差距的细粒度动态可重构 FPGA 架构
  • 批准号:
    1216457
  • 财政年份:
    2012
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
SHF: Small: Efficient and Accurate Methodologies for Unifying the Layout, Device Simulation, and Process Simulation Worlds
SHF:小型:统一布局、器件仿真和过程仿真领域的高效且准确的方法
  • 批准号:
    1217076
  • 财政年份:
    2012
  • 资助金额:
    $ 60万
  • 项目类别:
    Continuing Grant

相似国自然基金

超高频同步整流DC-DC变换器效率优化关键技术研究
  • 批准号:
    62301375
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
衔接蛋白SHF负向调控胶质母细胞瘤中EGFR/EGFRvIII再循环和稳定性的功能及机制研究
  • 批准号:
    82302939
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
面向5G通信的超高频FBAR耗散机理和耗散稳定性研究
  • 批准号:
    12302200
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
宽运行范围超高频逆变系统架构拓扑与调控策略研究
  • 批准号:
    52377175
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
加速器用大功率密度超高频铁基纳米晶合金设计及性能调控机理
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    54 万元
  • 项目类别:
    面上项目

相似海外基金

CCF: SHF: CORE: Small: Towards Systematic Quality Control of Physically Unclonable Functions (PUFs)
CCF:SHF:CORE:小型:迈向物理不可克隆功能(PUF)的系统质量控制
  • 批准号:
    2244479
  • 财政年份:
    2023
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
CCF: SHF: Small: Self-Adaptive Interference-Avoiding Wireless Receiver Hardware through Real-Time Learning-Based Automatic Optimization of Power-Efficient Integrated Circuits
CCF:SHF:小型:通过基于实时学习的高能效集成电路自动优化实现自适应干扰避免无线接收器硬件
  • 批准号:
    2218845
  • 财政年份:
    2022
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
CCF:SHF:Small:NAND gate based integrated DNA circuits
CCF:SHF:Small:基于与非门的集成 DNA 电路
  • 批准号:
    2226021
  • 财政年份:
    2022
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
CISE Core: CCF: SHF: Small: Future-Proof Test Corpus Synthesis for Evolving Software
CISE 核心:CCF:SHF:小型:面向发展软件的面向未来的测试语料库合成
  • 批准号:
    2120955
  • 财政年份:
    2021
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
CCF:SHF: Small: Some New Class of Error Control Codes for VLSI and Computer Systems
CCF:SHF:小型:用于 VLSI 和计算机系统的一些新型错误控制代码
  • 批准号:
    2006571
  • 财政年份:
    2020
  • 资助金额:
    $ 60万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了