异构GPU集群混合粒度任务协同调度与动态均衡机制研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61202005
  • 项目类别:
    青年科学基金项目
  • 资助金额:
    22.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0204.计算机系统结构与硬件技术
  • 结题年份:
    2015
  • 批准年份:
    2012
  • 项目状态:
    已结题
  • 起止时间:
    2013-01-01 至2015-12-31

项目摘要

GPU cluster computing technology is a research hotspot in the community of high performance computing nowadays. It is playing an important role in biology, finance, meteorology and any other areas which need large-scale data processing. Although the general parallel computing architecture such as CUDA can effectively exert the computing power of GPUs, the usage of these accelerators also brings new problems, such as CPU-GPU and GPU-GPU communication, data storage, and so on. The whole computing power of GPU cluster cannot be used efficiently. The project builds a performance model suitable for the GPU clusters from three aspects: computation, communication and data storage, regarding the architecture factors that affect performance. Then, the project proposes a hybrid-grained task model for the heterogenous GPU clusters by analyzing the computing model of typical applications executed on GPU clusters, including the concurrency in and between threads and the CPU-GPU cooperation mechanism. The porject also proposes the co-scheduling and dynamic load balancing mechanisms based on the task model. In the end, the project implements a high performance computing framework to support multiple scheduling strategies, which are based on the distributed data management and highly efficient communication. Its performance is tested and tuned by running several applications on large-scale data. As to the new structural features and programming model introduced by GPUs, hybrid-grained task scheduling and dynamic balancing mechanisms are proposed to increase efficiency of computation, thus providing new ideas and methods for large-scale heterogeneous GPU cluster computing.
GPU集群计算技术是目前国内外高性能计算研究的热点,对生物、金融、气象等需要进行大规模数据处理的领域具有重要意义。虽然通用并行计算架构如CUDA能够有效地发挥GPU的计算能力,但这些加速(协)处理器的使用带来了新的通信和存储等问题,使GPU集群整体的计算能力难以得到高效利用。本课题从计算、通信和存储三方面考虑与性能相关的体系结构因素,建立适用于异构GPU集群的性能模型;通过分析GPU集群上典型应用的计算模式,提出面向异构GPU集群的混合粒度任务模型,在此基础上实现任务协同调度与动态均衡机制;基于分布式数据管理机制和高效通信机制实现支持多种调度策略的高性能计算框架,并采用大规模计算问题进行效能测试与调优。课题针对GPU带来的新结构特征和编程模型,从提高异构GPU集群计算效能角度提出混合粒度任务调度与动态均衡机制,为异构GPU集群大规模计算研究和应用提供新思路和方法。

结项摘要

异构GPU集群在大规模数据处理领域中发挥着重要作用。为了提高异构CPU-GPU计算平台的计算效能,需解决任务划分和组织方式、任务均衡机制、任务转移策略以及通信机制等方面的问题。.本课题首先将异构CPU-GPU计算平台应用到机器学习领域中,在实际应用中发现异构GPU集群计算时存在的问题并思考解决方法。本课题提出了基于混合编程模型的支持向量机训练并行化和CPU-GPU异构计算环境下的并行T近邻谱聚类算法PSCH,实现了计算任务的合理划分,取得了良好的加速效果。.第二,本课题研究了异构系统上的任务调度算法,提出了表调度和任务复制相结合的任务调度算法CEFT。为了提升计算任务在多节点异构平台上的性能,把科学计算应用划分成多个细粒度任务,根据任务之间的数据依赖关系建立DAG,利用CEFT可以减少处理器之间的通信开销进而提高计算性能。.第三,为了解决异构GPU集群中任务调度与负载均衡方面的问题,本课题深入研究了CPU-GPU异构NUMA体系结构,明确提出了共享内存式GPU程序设计概念,并利用页锁定内存的共享特性,以异构CPU-GPU的NUMA属性为切入点提出了支持CPU-GPU低交互开销任务调度的CAGTP模型。该模型通过细粒度的CPU-GPU任务交互以及GPU端高效的细粒度任务并发,使异构CPU-GPU系统可以高效处理相对复杂的DAG应用,并且在处理复杂依赖关系的任务时能够充分利用GPU端资源。.第四,为了将已有的GPU应用代码转换为CAGTP任务,本课题首次提出了一种可将PTX层代码转换为CUDA C层代码的工具,即PTX2Kernel代码转化器。PTX2Kernel可将PTX代码转换成容易编译的CUDA C层kernel,以较少的工作量使CAGTP可以利用第三方高性能计算库的代码,从而使CAGTP模型不仅仅停留在理论层面,而具有了重要的使用价值。.本课题在线性代数、机器学习等方面进行了实验验证,结果表明CAGTP模型在线性代数乘、楚列斯基分解、T近邻谱聚类算法等应用中取得了良好的效果;CEFT算法相比PEFT、HDCPD以及HEFT等调度算法具有更高的性能。同时,本课题利用异构CPU-GPU计算平台实现了支持向量机、谱聚类、多目标追踪、疾病表型与基因集关系推断、字符识别和文本区域标识等应用的高性能求解。

项目成果

期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(10)
专利数量(0)
HPSC: CPU-GPU混合架构上的异构并行T近邻谱聚类算法及实现
  • DOI:
    --
  • 发表时间:
    2015
  • 期刊:
    计算机研究与发展
  • 影响因子:
    --
  • 作者:
    李涛;焦晓帆;王艺峰;杨愚鲁
  • 通讯作者:
    杨愚鲁
噪声引导的二维超混沌同步身份认证模型设计
  • DOI:
    --
  • 发表时间:
    2013
  • 期刊:
    计算机科学与探索
  • 影响因子:
    --
  • 作者:
    李涛;赵可昭;任赛赛;古力
  • 通讯作者:
    古力
Improving MapReduce Performance by Data Prefetching in Heterogeneous or Shared Environments
通过异构或共享环境中的数据预取提高 MapReduce 性能
  • DOI:
    10.14257/ijgdc.2013.6.5.07
  • 发表时间:
    2013-10
  • 期刊:
    International Journal of Grid and Distributed Computing
  • 影响因子:
    --
  • 作者:
    Chuang Zuo;Qun Liao;Yulu Yang;Tao Li
  • 通讯作者:
    Tao Li
基于混合编程模型的支持向量机训练并行化
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    计算机研究与发展
  • 影响因子:
    --
  • 作者:
    刘学臣;张帅;王恺;杨愚鲁
  • 通讯作者:
    杨愚鲁

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

熟三七多糖的结构分析及抗氧化活性研究
  • DOI:
    10.13193/j.issn.1673-7717.2018.06.024
  • 发表时间:
    2018
  • 期刊:
    中华中医药学刊
  • 影响因子:
    --
  • 作者:
    黎江华;李涛;黄永亮;余志杰;莫雪林;刘玉杰;吴纯洁
  • 通讯作者:
    吴纯洁
新化合物HNPC-A13351 优化物的杀螨活性研究
  • DOI:
    10.19342/j.cnki.issn.1009-9212.2017.01.004
  • 发表时间:
    2017
  • 期刊:
    精细化工中间体
  • 影响因子:
    --
  • 作者:
    刘卫东;柳爱平;郑希;刘兴平;龙楚云;张萍;聂思桥;李涛
  • 通讯作者:
    李涛
一种同步研究透明材料折射率和动力学特性的实验方法
  • DOI:
    10.7498/aps.70.20210414
  • 发表时间:
    2021
  • 期刊:
    物理学报
  • 影响因子:
    --
  • 作者:
    种涛;傅华;李涛;莫建军;张旭平;马骁;郑贤旭
  • 通讯作者:
    郑贤旭
全膝关节置换术治疗膝骨关节炎合并帕金森病临床效果
  • DOI:
    10.3977/j.issn.1005-8478.2019.11.18
  • 发表时间:
    2019
  • 期刊:
    中国矫形外科杂志
  • 影响因子:
    --
  • 作者:
    任远中;王英振;李涛;余永波;虞丁柱;姜雅萍
  • 通讯作者:
    姜雅萍
轻度认知障碍患者多模态磁共振特征
  • DOI:
    10.3760/cma.j.issn.0578-1426.2010.08.012
  • 发表时间:
    2010-08
  • 期刊:
    中华内科杂志
  • 影响因子:
    --
  • 作者:
    王华丽;袁慧书;苏敏莹;朱玥;廖晶;张美燕;李涛;于欣
  • 通讯作者:
    于欣

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

李涛的其他基金

可信协作分布式医学图像分析深度学习系统研究
  • 批准号:
    62272248
  • 批准年份:
    2022
  • 资助金额:
    54.00 万元
  • 项目类别:
    面上项目
可信协作分布式医学图像分析深度学习系统研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    54 万元
  • 项目类别:
    面上项目
基于深度学习的小物体检测及其异构计算技术研究
  • 批准号:
    61872200
  • 批准年份:
    2018
  • 资助金额:
    64.0 万元
  • 项目类别:
    面上项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码