基于GPU异构集群的FFT算法数学库研究

项目介绍
AI项目解读

基本信息

  • 批准号:
    61240045
  • 项目类别:
    专项基金项目
  • 资助金额:
    15.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0204.计算机系统结构与硬件技术
  • 结题年份:
    2013
  • 批准年份:
    2012
  • 项目状态:
    已结题
  • 起止时间:
    2013-01-01 至2013-12-31

项目摘要

In GPU clusters, each computer node is equipped with one or more GPU cards. GPU clusters are becoming more and more popular nowadays and will be widely used in data centers. FFT is a basic algorithm widely used in cloud computing, data mining, scientific and engineering computing. Because of the deep storage hierarchy of GPU clusters, it is a great challenge to transplant a large-scale FFT code from one GPU cluster to another while keeping the high performance. This research seeks to develop a FFT math library prototype of GPU clusters. The research work includes: (1) in order to get a FFT math library prototype, the programming methodology of GPU clusters must be researched; (2) based on the new programming methodology, a FFT math library prototype is developed; (3) the new technology, method and tools applied in the development of FFT math library prototype can be used in future work when transporting other similar algorithms. This research result will improve the using efficiency of GPU clusters.
GPU集群中的每一个节点配备GPU 卡,使机器的处理能力大幅提高。GPU 集群成为将来集群配置的重要模式,在未来的数据中心成为重要角色。FFT 算法是云计算、数据挖掘、科学与工程计算领域的基础算法。由于GPU 集群存储层次深,大规模FFT 算法在保持高性能的前提下移植到其他机器极具挑战。本项目针对大规模数据集,研究建立可移植的FFT 数学库原型。主要研究内容包括:(1)针对FFT数学库原型这一最终目标,研究GPU集群编程新机制;(2)基于GPU集群编程新机制,研究GPU集群性能模型,开发FFT数学库原型;(3)此研究过程中积累的关于GPU集群编程新机制的技术、方法和工具可以广泛应用于解决其他算法的GPU集群移植问题。项目研究成果将提高GPU集群硬件平台的使用效率。

结项摘要

本项目所进行的研究工作分为相辅相成的两方面:首先研究GPU集群程序设计方法的新机制;而后基于GPU集群程序设计方法的新机制,实现FFT数学库算法原型。当前GPU和GPU异构集群程序设计方法存在的最大问题是:缺乏有效的软件工具和编程接口,帮助程序员简化程序设计。我们初步实现了Parray接口:该编程接口使用数组类型对数据的物理存储和逻辑结构进行分离;提供统一的方式表示各种进程(线程)的创建以及它们之间的控制流转。Parray接口是位于MPI、Pthread和CUDA等程序库之上的一层软件层,它暴露了与性能相关的底层因素,又封装了实现细节,且不以牺牲性能为代价。Parray提供了GPU集群并行化的新语言机制。其主要思想是将多维数组扩展为多层次的树状结构;这一扩展间接反映了GPU集群树状存储器结构和不同处理器在集群架构中的异构性。数据的划分、分布、转置与变形均可以在新数组类型这一层次得以简洁表示和处理,而同类的线程也组成数组。在天河1A上,使用Parray书写的3维FFT代码最大运行到14336×14336×14336单精度复数的规模,共使用7168个节点。使用Parray实现的GPU集群3维FFT在天河1A上进行了性能测试,并与Intel MKL 10.3.1.048进行了比较,PKUFFT算法的性能远远超出MKL。同时,与MKL相比较,PKUFFT具有更好的性能延展性。

项目成果

期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Programming Heterogeneous Architectures with Array Types of Parray
使用 Parray 的数组类型对异构架构进行编程
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    Journal of Parallel and Distributed Computing
  • 影响因子:
    3.8
  • 作者:
    崔翔;李晓雯;李捷;陈一峯
  • 通讯作者:
    陈一峯
基于Parray数组类型的矩阵乘法实现
  • DOI:
    --
  • 发表时间:
    2014
  • 期刊:
    计算机学报
  • 影响因子:
    --
  • 作者:
    崔翔;李晓雯;陈一峯
  • 通讯作者:
    陈一峯
GPU矩阵乘法和FFT算法的性能优化
  • DOI:
    --
  • 发表时间:
    2013
  • 期刊:
    现代电子技术
  • 影响因子:
    --
  • 作者:
    李晓雯;崔翔
  • 通讯作者:
    崔翔
共 3 条
  • 1
前往

其他文献

基于后推技术的绳驱动拟人肩关节动力学控制
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    北京航空航天大学学报
  • 影响因子:
    --
  • 作者:
    游贤强;于守谦;陈伟海;崔翔
  • 通讯作者:
    崔翔
考虑位移电流的部分电感计算方法
  • DOI:
    10.13334/j.0258-8013.pcsee.162261
  • 发表时间:
    2017
  • 期刊:
    中国电机工程学报
  • 影响因子:
    --
  • 作者:
    倪筹帷;赵志斌;崔翔
  • 通讯作者:
    崔翔
压接式IGBT器件内部并联支路瞬态电流均衡特性的研究
  • DOI:
    10.13334/j.0258-8013.pcsee.152780
  • 发表时间:
    2017
  • 期刊:
    中国电机工程学报
  • 影响因子:
    --
  • 作者:
    唐新灵;崔翔;赵志斌
  • 通讯作者:
    赵志斌
等离子体处理技术促进高分子聚合物在骨组织工程中的应用综述
  • DOI:
    --
  • 发表时间:
    2020
  • 期刊:
    解放军医学院学报
  • 影响因子:
    --
  • 作者:
    李明;刘建恒;崔翔;张里程;唐佩福
  • 通讯作者:
    唐佩福
含碳酸盐混合砂的三轴剪切试验研究
  • DOI:
    10.16285/j.rsm.2019.0572
  • 发表时间:
    2020
  • 期刊:
    岩土力学
  • 影响因子:
    --
  • 作者:
    李小刚;朱长歧;崔翔;张珀瑜;王睿
  • 通讯作者:
    王睿
共 120 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 24
前往

正在为您生成内容...

崔翔的其他基金

基于新型语言机制的异构系统通信自动优化及其应用研究
  • 批准号:
    61672208
  • 批准年份:
    2016
  • 资助金额:
    62.0 万元
  • 项目类别:
    面上项目