SHF: Small: Solving the Problems of Scalability and Portability while Maximizing Performance of Multiprecision Scalar and Vector Arithmetic on Clusters of GPUs

SHF:小型:解决可扩展性和可移植性问题,同时最大限度地提高 GPU 集群上多精度标量和矢量算术的性能

基本信息

  • 批准号:
    1525754
  • 负责人:
  • 金额:
    $ 40万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2015
  • 资助国家:
    美国
  • 起止时间:
    2015-07-15 至 2019-06-30
  • 项目状态:
    已结题

项目摘要

This project extends the PI's prior research into achieving high performance for multiprecision arithmetic utilizing commodity graphics processors (GPUs). Multiprecision (MP) arithmetic has important applications in science, engineering, and mathematics when computations require greater numerical precision than standard computer systems support. It is also an important part of cryptography used in secure internet communication. GPUs can accelerate MP arithmetic by more than two orders of magnitude. However, achieving this performance requires novel algorithms and software tools. The world-record performance for exponentiation achieved under the prior grant will be extended to include floating point vector arithmetic. A new code generation model will enable handling a wider range of precisions across newer generations of graphics processors. Support for clusters of GPUs to work together on larger problems, and practical demonstrations of the effectiveness of MP library such as showing how one GPU can offload decryption work from more than a hundred servers, with higher levels of security than are currently in common use, is being developed. Each generation of GPU architecture requires extensive experimentation and reworking of multiprecision code to obtain a new optimum. Yet the potential benefits of a portable and scalable package could be transformational in certain application areas. This effort extends PI's prior work to include floating point and vectors, and begin the transition to GPU clusters. The result will be a publicly available multi-precision arithmetic package and implementation toolset that enables the scientific community to easily take full advantage of GPU scaling to obtain at least an order of magnitude improvement in performance per dollar and performance per watt over CPUs at the same technology step. The approach relies on a novel set of models for GPU storage that provide a higher level of abstraction over which the code generation tools can search for optimal combinations of algorithm, register/memory layout, and kernel launch geometry for a given precision size and GPU architectural generation to achieve maximum resource utilization.
该项目将PI的先前研究扩展到利用商品图形处理器(GPU)的多次算术算术的高性能。当计算需要比标准的计算机系统支持更高的数值精度时,多重复(MP)算术在科学,工程和数学中具有重要的应用。它也是安全互联网通信中使用的密码学的重要组成部分。 GPU可以将MP算术加速两个以上的数量级加速。但是,实现此性能需要新颖的算法和软件工具。在先前赠款下实现的企业的世界记录表现将扩展到包括浮点矢量算术。一个新的代码生成模型将使在新一代的图形处理器上处理更广泛的精度。支持GPU的群集在更大的问题上共同努力,并实际证明了MP库的有效性,例如显示一个GPU如何从一百多个服务器中卸载解密工作,具有比目前使用的普遍使用更高的安全性。每一代GPU体系结构都需要对多重复代码进行广泛的实验和重新加工,以获得新的最佳选择。然而,在某些应用领域,便携式和可扩展包的潜在好处可能是转化的。这项工作扩展了PI的先前工作,以包括浮点和向量,并开始过渡到GPU群集。结果将是一个公开可用的多精神算术软件包和实施工具集,使科学界能够轻松地充分利用GPU缩放量表,以在同一技术步骤下至少获得每美元的性能和每瓦的绩效的数量级提高。该方法依赖于GPU存储的一组新型模型,该模型提供了更高水平的抽象,代码生成工具可以搜索算法,寄存器/内存布局和内核启动几何形状的最佳组合,以提供给定的精度尺寸和GPU架构生成以实现最大资源利用。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Charles Weems其他文献

DPF-ECC: A Framework for Efficient ECC With Double Precision Floating-Point Computing Power
DPF-ECC:具有双精度浮点计算能力的高效 ECC 框架
Retrorectus prosthetic mesh repair of midline abdominal hernia.
直肠后肌假体网片修复腹部中线疝。
  • DOI:
  • 发表时间:
    1997
  • 期刊:
  • 影响因子:
    3
  • 作者:
    D. Mclanahan;L. King;Charles Weems;Michael L. Novotney;K. Gibson
  • 通讯作者:
    K. Gibson
The smallest eigenvalue of large Hankel matrices
  • DOI:
    10.1016/j.amc.2018.04.012
  • 发表时间:
    2018-10-01
  • 期刊:
  • 影响因子:
  • 作者:
    Mengkun Zhu;Yang Chen;Niall Emmart;Charles Weems
  • 通讯作者:
    Charles Weems

Charles Weems的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Charles Weems', 18)}}的其他基金

Collaborative Research:CyberTraining:Implementation:Medium: Modern Course Exemplars infused with Parallel and Distributed Computing for the Introductory Computing Course Sequence
协作研究:网络培训:实施:中:为入门计算课程序列注入并行和分布式计算的现代课程范例
  • 批准号:
    2321016
  • 财政年份:
    2023
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
Collaborative Research:CyberTraining: Implementation: Medium:Broadening Adoption of Parallel and Distributed Computing in Undergraduate Computer Science and Engineering Curricula
协作研究:网络培训:实施:中:在本科计算机科学与工程课程中扩大并行和分布式计算的采用
  • 批准号:
    2017427
  • 财政年份:
    2020
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
Collaborative Research:CyberTraining:Conceptualization: Planning a Sustainable Ecosystem for Incorporating Parallel and Distributed Computing into Undergraduate Education
合作研究:网络培训:概念化:规划可持续生态系统,将并行和分布式计算纳入本科教育
  • 批准号:
    1924023
  • 财政年份:
    2019
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
Collaborative Research: CyberTraining: CDL: Preparing Instructors to Offer Experimental Courses in an Updated PDC Curriculum, and Broadening Participation
协作研究:网络培训:CDL:准备教师在更新的 PDC 课程中提供实验课程,并扩大参与范围
  • 批准号:
    1730527
  • 财政年份:
    2017
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
Workshop for Updating and Broadening the Parallel and Distributed Computing Curriculum in Undergraduate Education; Arlington, VA, August 17-18, 2015
更新和扩展本科教育并行和分布式计算课程研讨会;
  • 批准号:
    1546086
  • 财政年份:
    2015
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
EAGER: Collaborative Research: Developing a Parallel and Distributed Computing Concepts Curriculum Enhancement for the Computer Science Principles Course
EAGER:协作研究:为计算机科学原理课程开发并行和分布式计算概念课程增强
  • 批准号:
    1550794
  • 财政年份:
    2015
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
SHF:Small: Solving the Problem of Scalable Multi-Precision Matrix Arithmetic on GPUs
SHF:Small:解决 GPU 上可扩展多精度矩阵算术问题
  • 批准号:
    1217590
  • 财政年份:
    2012
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
Collaborative Research: CI-ADDO-NEW: Parallel and Distributed Computing Curriculum Development and Educational Resources
合作研究:CI-ADDO-NEW:并行和分布式计算课程开发和教育资源
  • 批准号:
    1205492
  • 财政年份:
    2012
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant

相似国自然基金

靶向Treg-FOXP3小分子抑制剂的筛选及其在肺癌免疫治疗中的作用和机制研究
  • 批准号:
    32370966
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
化学小分子激活YAP诱导染色质可塑性促进心脏祖细胞重编程的表观遗传机制研究
  • 批准号:
    82304478
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
靶向小胶质细胞的仿生甘草酸纳米颗粒构建及作用机制研究:脓毒症相关性脑病的治疗新策略
  • 批准号:
    82302422
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
HMGB1/TLR4/Cathepsin B途径介导的小胶质细胞焦亡在新生大鼠缺氧缺血脑病中的作用与机制
  • 批准号:
    82371712
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
小分子无半胱氨酸蛋白调控生防真菌杀虫活性的作用与机理
  • 批准号:
    32372613
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目

相似海外基金

SHF: Small: Efficient, Deterministic and Formally Certified Methods for Solving Low-dimensional Linear Programs with Floating-point Precision
SHF:小型:用于以浮点精度求解低维线性程序的高效、确定性且经过正式认证的方法
  • 批准号:
    2312220
  • 财政年份:
    2023
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
SHF: Small: Solving the Parallel Functional Programming Challenge
SHF:小型:解决并行函数式编程挑战
  • 批准号:
    2115104
  • 财政年份:
    2021
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
SHF: Small: MaPaMaP: Massively Parallel Solving of Math Problems
SHF:小型:MaPaMaP:数学问题的大规模并行解决
  • 批准号:
    2006363
  • 财政年份:
    2019
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
SHF: Small: MaPaMaP: Massively Parallel Solving of Math Problems
SHF:小型:MaPaMaP:数学问题的大规模并行解决
  • 批准号:
    1813993
  • 财政年份:
    2018
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
SHF: Small: Bilinear Constraint Solving and Optimization for Program Verification and Synthesis Problems
SHF:小型:程序验证和综合问题的双线性约束求解和优化
  • 批准号:
    1527075
  • 财政年份:
    2015
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了