SHF: Small: Enabling Efficient Context Switching and Effective Latency Hiding in GPUs

SHF:小:在 GPU 中实现高效的上下文切换和有效的延迟隐藏

基本信息

  • 批准号:
    1618509
  • 负责人:
  • 金额:
    $ 33万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2016
  • 资助国家:
    美国
  • 起止时间:
    2016-08-01 至 2019-07-31
  • 项目状态:
    已结题

项目摘要

Graphics processing units (GPUs), initially designed for computer graphics, are becoming widely used for general purpose computing. This project addresses two important challenges in GPU computing. First, it investigates schemes to enable GPUs to be preempted efficiently, which is critical for GPUs to satisfy the quality of service (QOS) requirement in the cloud environment. Second, the project looks into approaches to significantly improve the latency hiding capability of GPUs. This interdisciplinary research has two practical uses, efficient preemption empowering GPUs as truly shared resource and effective latency hiding improving both the GPU performance and energy efficiency. Graduate student advising and industry collaboration are two key aspects of the project.The design philosophy of GPUs is to exploit very high degrees of data-level parallelism (DLP), expressed as thread-level parallelism (TLP), to hide long instruction latency. As a side effect, GPUs feature high amounts of on-chip resources to store the contexts or the architectural states of the large numbers of concurrent threads. The large contexts result in long latency for context switching, which makes it difficult for GPUs to be truly shared in cloud servers. This research project leverages the nature of the single-instruction multiple-thread (SIMT) execution model to drastically reduce and compress the GPU context size. Software and hardware approaches are integrated to enable instruction-level preemption for GPUs to meet the QOS requirements. Fast context switching is also used to switch out stalled threads and switch in new ones such that the otherwise idle computing resources can be utilized to provide much higher latency-hiding capability. It essentially achieves higher TLP on GPUs without enlarging their critical on-chip resources.
图形处理单元 (GPU) 最初是为计算机图形设计的,现在正广泛用于通用计算。该项目解决了 GPU 计算中的两个重要挑战。首先,它研究了使 GPU 能够被有效抢占的方案,这对于 GPU 满足云环境中的服务质量 (QOS) 要求至关重要。其次,该项目研究了显着提高 GPU 延迟隐藏能力的方法。这项跨学科研究有两个实际用途:高效抢占使 GPU 成为真正的共享资源,以及有效的延迟隐藏提高 GPU 性能和能源效率。研究生建议和行业合作是该项目的两个关键方面。GPU 的设计理念是利用非常高程度的数据级并行性 (DLP),表示为线程级并行性 (TLP),以隐藏较长的指令延迟。副作用是,GPU 具有大量片上资源来存储大量并发线程的上下文或架构状态。大的上下文导致上下文切换的延迟很长,这使得GPU很难在云服务器中真正共享。该研究项目利用单指令多线程 (SIMT) 执行模型的性质来大幅减少和压缩 GPU 上下文大小。通过软硬件结合的方式,实现GPU指令级抢占,满足QOS要求。快速上下文切换还用于切换出停滞的线程并切换到新的线程,以便可以利用空闲的计算资源来提供更高的延迟隐藏能力。它本质上在 GPU 上实现了更高的 TLP,而无需扩大其关键的片上资源。

项目成果

期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Scatter-and-Gather Revisited: High-Performance Side-Channel-Resistant AES on GPUs
重新审视分散和聚集:GPU 上的高性能抗侧通道 AES
Coordinated CTA Combination and Bandwidth Partitioning for GPU Concurrent Kernel Execution
GPU 并发内核执行的协调 CTA 组合和带宽分区
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Huiyang Zhou其他文献

Systematic Approaches for Precise and Approximate Quantum State Runtime Assertion
精确且近似量子态运行时断言的系统方法
Bonsai Merkle Forests: Efficiently Achieving Crash Consistency in Secure Persistent Memory
Bonsai Merkle Forests:在安全持久内存中有效实现崩溃一致性
Hardware-software integrated approaches to defend against software cache-based side channel attacks
防御基于软件缓存的侧通道攻击的软硬件集成方法
A Highly Efficient FFT Using Shared-Memory Multiplexing
使用共享内存复用的高效 FFT
PMPM: Prediction by Combining Multiple Partial Matches
PMPM:通过组合多个部分匹配进行预测
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Hongliang Gao;Huiyang Zhou
  • 通讯作者:
    Huiyang Zhou

Huiyang Zhou的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Huiyang Zhou', 18)}}的其他基金

SHF: Small: Collaborative Research: Efficient Memory Persistency for GPUs
SHF:小型:协作研究:GPU 的高效内存持久性
  • 批准号:
    1908406
  • 财政年份:
    2019
  • 资助金额:
    $ 33万
  • 项目类别:
    Standard Grant
SaTC: CORE: Small: Towards Smart and Secure Non Volatile Memory
SaTC:核心:小型:迈向智能、安全的非易失性存储器
  • 批准号:
    1717550
  • 财政年份:
    2017
  • 资助金额:
    $ 33万
  • 项目类别:
    Standard Grant
SHF: Small: CPU-GPU Collaborative Execution in Fusion Architectures
SHF:小型:融合架构中的 CPU-GPU 协作执行
  • 批准号:
    1216569
  • 财政年份:
    2012
  • 资助金额:
    $ 33万
  • 项目类别:
    Standard Grant
TC: Medium: Collaborative Research: Side-Channel-Proof Embedded Processors with Integrated Multi-Layer Protection
TC:中:协作研究:具有集成多层保护的侧通道防护嵌入式处理器
  • 批准号:
    1004945
  • 财政年份:
    2009
  • 资助金额:
    $ 33万
  • 项目类别:
    Standard Grant
CAREER: Architectural Support for Automated Software Debugging
职业:自动化软件调试的架构支持
  • 批准号:
    0968667
  • 财政年份:
    2009
  • 资助金额:
    $ 33万
  • 项目类别:
    Continuing Grant
TC: Medium: Collaborative Research: Side-Channel-Proof Embedded Processors with Integrated Multi-Layer Protection
TC:中:协作研究:具有集成多层保护的侧通道防护嵌入式处理器
  • 批准号:
    0905223
  • 财政年份:
    2009
  • 资助金额:
    $ 33万
  • 项目类别:
    Standard Grant
CAREER: Architectural Support for Automated Software Debugging
职业:自动化软件调试的架构支持
  • 批准号:
    0747062
  • 财政年份:
    2008
  • 资助金额:
    $ 33万
  • 项目类别:
    Continuing Grant
Support for the 39th Annual ACM/IEEE International Symposium on Microarchitecture, 2006
支持 2006 年第 39 届 ACM/IEEE 国际微架构研讨会
  • 批准号:
    0652216
  • 财政年份:
    2007
  • 资助金额:
    $ 33万
  • 项目类别:
    Standard Grant

相似国自然基金

小分子代谢物Catechin与TRPV1相互作用激活外周感觉神经元介导尿毒症瘙痒的机制研究
  • 批准号:
    82371229
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
DHEA抑制小胶质细胞Fis1乳酸化修饰减轻POCD的机制
  • 批准号:
    82301369
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
SETDB1调控小胶质细胞功能及参与阿尔茨海默病发病机制的研究
  • 批准号:
    82371419
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
PTBP1驱动H4K12la/BRD4/HIF1α复合物-PKM2正反馈环路促进非小细胞肺癌糖代谢重编程的机制研究及治疗方案探索
  • 批准号:
    82303616
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Collaborative Research: SHF: Small: Enabling Efficient 3D Perception: An Architecture-Algorithm Co-Design Approach
协作研究:SHF:小型:实现高效的 3D 感知:架构-算法协同设计方法
  • 批准号:
    2334624
  • 财政年份:
    2023
  • 资助金额:
    $ 33万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Software Hardware Architecture Co-Design for Enabling True Virtual Reality on Mobile Devices
合作研究:SHF:小型:软件硬件架构协同设计,在移动设备上实现真正的虚拟现实
  • 批准号:
    2215042
  • 财政年份:
    2022
  • 资助金额:
    $ 33万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Enabling Caches and GPUs for Energy Harvesting Systems
合作研究:SHF:小型:为能量收集系统启用缓存和 GPU
  • 批准号:
    2153747
  • 财政年份:
    2022
  • 资助金额:
    $ 33万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Enabling Caches and GPUs for Energy Harvesting Systems
合作研究:SHF:小型:为能量收集系统启用缓存和 GPU
  • 批准号:
    2153748
  • 财政年份:
    2022
  • 资助金额:
    $ 33万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Software Hardware Architecture Co-Design for Enabling True Virtual Reality on Mobile Devices
合作研究:SHF:小型:软件硬件架构协同设计,在移动设备上实现真正的虚拟现实
  • 批准号:
    2215043
  • 财政年份:
    2022
  • 资助金额:
    $ 33万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了