CAREER: Compiler and Runtime Support for Multi-Tasking on Commodity GPUs

职业:商用 GPU 上多任务的编译器和运行时支持

基本信息

  • 批准号:
    1750760
  • 负责人:
  • 金额:
    $ 50.15万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2018
  • 资助国家:
    美国
  • 起止时间:
    2018-05-01 至 2024-04-30
  • 项目状态:
    已结题

项目摘要

General-purpose Graphics Processing Units (GPU) computing has become mainstream, as witnessed in various domains such as machine learning, graph analytics, and scientific simulation. One notable trend is employing GPUs in data centers and cloud computing infrastructures to satisfy users' increasing demand to accelerate their applications. In such multi-tasking environments, applications from different users contend to use the shared GPU, leading to unpredictable and unacceptable performance degradation. This CAREER project aims at developing a set of compiler and runtime techniques to support multi-tasking on commodity GPUs in a transparent and efficient manner. The compiler techniques circumvent the hardware limitations to enable a set of features, such as preemption, and the runtime system schedules applications to utilize the potential of the GPU and guarantees quality of service. In addition, the investigator advances GPU education in the University to target both Computer Science (CS) and non-CS students based on a GPU education center.Specifically, the project investigates how to integrate compiler and runtime techniques to support multi-tasking on GPUs by building a system that achieves three goals. First, the system addresses GPU core contention by enabling flexible GPU kernel preemption. The compiler transforms the GPU program to be a preemptable form by circumventing the limitation imposed by the hardware thread scheduler. The runtime intercepts all GPU kernel launch requests and makes global preemption and scheduling decisions to maximize performance. Second, the system supports fine-grained sharing for threads from different applications to fully utilize hardware resources within GPU streaming multi-processors. The runtime guarantees the QoS of user-facing applications while optimizing overall throughput aided by performance prediction. Third, the system addresses GPU memory contention by coordinating GPU memory transfers, which considers memory access patterns and array reuse patterns.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
通用图形处理单元 (GPU) 计算已成为主流,机器学习、图形分析和科学模拟等各个领域都见证了这一点。一个显着的趋势是在数据中心和云计算基础设施中使用 GPU 来满足用户日益增长的加速应用程序的需求。在这种多任务环境中,不同用户的应用程序会争用共享 GPU,从而导致不可预测且不可接受的性能下降。该 CAREER 项目旨在开发一套编译器和运行时技术,以透明且高效的方式支持商用 GPU 上的多任务处理。编译器技术规避了硬件限制,以启用一系列功能,例如抢占,并且运行时系统调度应用程序以利用 GPU 的潜力并保证服务质量。此外,研究人员还基于 GPU 教育中心推进大学的 GPU 教育,以针对计算机科学 (CS) 和非 CS 学生。具体来说,该项目研究如何集成编译器和运行时技术以支持 GPU 上的多任务处理通过建立一个实现三个目标的系统。首先,系统通过启用灵活的 GPU 内核抢占来解决 GPU 内核争用问题。编译器通过规避硬件线程调度器施加的限制,将GPU程序转换为可抢占的形式。运行时拦截所有 GPU 内核启动请求,并做出全局抢占和调度决策,以最大限度地提高性能。其次,系统支持不同应用线程的细粒度共享,充分利用GPU流多处理器内的硬件资源。运行时保证面向用户的应用程序的 QoS,同时通过性能预测优化整体吞吐量。第三,该系统通过协调 GPU 内存传输来解决 GPU 内存争用,其中考虑了内存访问模式和阵列重用模式。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(8)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
DGSM: A GPU-Based Subgraph Isomorphism framework with DFS exploration
DGSM:基于 GPU 的子图同构框架,具有 DFS 探索
GraphZero: A High-Performance Subgraph Matching System
GraphZero:高性能子图匹配系统
  • DOI:
    10.1145/3469379.3469383
  • 发表时间:
    2021-06
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Mawhirter, Daniel;Reinehr, Sam;Holmes, Connor;Liu, Tongping;Wu, Bo
  • 通讯作者:
    Wu, Bo
Dryadic: Flexible and Fast Graph Pattern Matching at Scale
Dryadic:灵活快速的大规模图形模式匹配
GRNN: Low-Latency and Scalable RNN Inference on GPUs
NxMTransformer: Semi-Structured Sparsification for Natural Language Understanding via ADMM
NxMTransformer:通过 ADMM 进行自然语言理解的半结构化稀疏化
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Bo Wu其他文献

Risk factors and clinical outcomes associated with intracranial and extracranial atherosclerotic stenosis acute ischemic stroke.
与颅内和颅外动脉粥样硬化性狭窄急性缺血性卒中相关的危险因素和临床结果。
An adaptive sliding mode control technology for weld seam tracking
焊缝跟踪的自适应滑模控制技术
  • DOI:
    10.1007/s11465-015-0332-3
  • 发表时间:
    2015-03-27
  • 期刊:
  • 影响因子:
    4.5
  • 作者:
    Jie Liu;Youmin Hu;Bo Wu;Kaibo Zhou;Ming‐Feng Ge
  • 通讯作者:
    Ming‐Feng Ge
Thermodynamic stability, magnetism and half-metallicity of Heusler alloy Co2MnX(X = Si, Ge, Sn)(1 0 0) surface
Heusler合金Co2MnX(X = Si, Ge, Sn)(1 0 0)表面的热力学稳定性、磁性和半金属性
  • DOI:
    10.1016/j.apsusc.2012.01.125
  • 发表时间:
    2012-03-15
  • 期刊:
  • 影响因子:
    6.7
  • 作者:
    Bo Wu;Hongkuan Yuan;A. Kuang;Hong Chen;Yu Feng
  • 通讯作者:
    Yu Feng
Autogenous healing of the interface between hollow natural fiber (HNF) and reactive magnesia cement (RMC) matrix
中空天然纤维(HNF)和活性氧化镁水泥(RMC)基质之间界面的自愈合
  • DOI:
    10.1016/j.conbuildmat.2024.135843
  • 发表时间:
    2024-04-01
  • 期刊:
  • 影响因子:
    7.4
  • 作者:
    Bo Wu;Peng Wang;Jishen Qiu
  • 通讯作者:
    Jishen Qiu
Crosstalk of dynamic functional modules in lung development of rhesus macaques.
恒河猴肺部发育中动态功能模块的串扰。
  • DOI:
    10.1039/c5mb00881f
  • 发表时间:
    2016-03-22
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Xuexin Yu;Lin Feng;Zujing Han;Bo Wu;Shuyuan Wang;Yun Xiao;Feng Li;Lianfeng Zhang;B. Cao;Xue;Dan Lu;Xia Li;Wei Jiang;Kaitai Zhang;S. Cheng
  • 通讯作者:
    S. Cheng

Bo Wu的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Bo Wu', 18)}}的其他基金

SPX: Collaborative Research: Pinpointing and Resolving Scalability Culprits Hidden in Different Components of the Whole System Stack
SPX:协作研究:查明并解决隐藏在整个系统堆栈不同组件中的可扩展性问题
  • 批准号:
    1823005
  • 财政年份:
    2018
  • 资助金额:
    $ 50.15万
  • 项目类别:
    Standard Grant
CSR: Small: Collaborative Research: Exploring Portable Data Placement on Massively Parallel Platforms with Heterogeneous Memory Architectures
CSR:小型:协作研究:探索具有异构内存架构的大规模并行平台上的便携式数据放置
  • 批准号:
    1618912
  • 财政年份:
    2016
  • 资助金额:
    $ 50.15万
  • 项目类别:
    Standard Grant
CRII: SHF: A Compiler and Runtime Infrastructure for Flexible Scheduling and Scheduling-Enabled Optimizations on GPUs
CRII:SHF:用于 GPU 上灵活调度和启用调度优化的编译器和运行时基础架构
  • 批准号:
    1464216
  • 财政年份:
    2015
  • 资助金额:
    $ 50.15万
  • 项目类别:
    Standard Grant

相似国自然基金

基于编译器多级中间表示的跨语言开源软件漏洞检测与修复方法研究
  • 批准号:
    62372373
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
编译器优化场景下的智能软件逆向
  • 批准号:
    62302497
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于通用开放语义的可组合编译器验证研究
  • 批准号:
    62372290
  • 批准年份:
    2023
  • 资助金额:
    51 万元
  • 项目类别:
    面上项目
面向国产自主处理器的高质量编译器生成技术研究
  • 批准号:
    62302505
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
数据驱动的编译器测试关键技术
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    284 万元
  • 项目类别:
    重点项目

相似海外基金

CAREER: Compiler and Runtime Support for Sampled Sparse Computations on Heterogeneous Systems
职业:异构系统上采样稀疏计算的编译器和运行时支持
  • 批准号:
    2338144
  • 财政年份:
    2024
  • 资助金额:
    $ 50.15万
  • 项目类别:
    Continuing Grant
CAREER: An Automated Compiler-Runtime Framework for Democratizing Secure Collaborative Computation
职业:用于民主化安全协作计算的自动编译器运行时框架
  • 批准号:
    2238671
  • 财政年份:
    2023
  • 资助金额:
    $ 50.15万
  • 项目类别:
    Continuing Grant
CAREER: Compiler and Runtime Support for Irregular Applications on Many-core Processors
职业:多核处理器上不规则应用程序的编译器和运行时支持
  • 批准号:
    1741683
  • 财政年份:
    2017
  • 资助金额:
    $ 50.15万
  • 项目类别:
    Continuing Grant
CAREER: Compiler and Runtime Support for Irregular Applications on Many-core Processors
职业:多核处理器上不规则应用程序的编译器和运行时支持
  • 批准号:
    1452454
  • 财政年份:
    2015
  • 资助金额:
    $ 50.15万
  • 项目类别:
    Continuing Grant
CAREER: Compiler-Inserted Runtime Adaptation for Multicore Processors
职业:针对多核处理器的编译器插入运行时适配
  • 批准号:
    1054075
  • 财政年份:
    2011
  • 资助金额:
    $ 50.15万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了