异构多核平台上基于软件分布式共享内存的编程模型研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61202049
  • 项目类别:
    青年科学基金项目
  • 资助金额:
    23.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0204.计算机系统结构与硬件技术
  • 结题年份:
    2015
  • 批准年份:
    2012
  • 项目状态:
    已结题
  • 起止时间:
    2013-01-01 至2015-12-31

项目摘要

Heterogeneous multicore architecture has been becoming the mainstream architecture in high performance computing community. However, due to its architecture is so complexity and diversity, neither of the traditional mainstream message-passing and shared memory programming models could describe the role of the computing units. So the some challenge is unavoidable to face, include programing on it is very difficult, achieving productivity and portability is also hard. This project aims to meet these challenges through studying a new programming model based on software distributed shared memory. The research focus on the following topics :(1) Data consistency maintenance through main memory to the GPU device memory.(2) the address space mapping mechanism from GPU device memory to main memory.(3) the load balancing strategy between CPU and GPU. (4) the data prefetching scheme for shared data. The project aims to do some fundamental research to reduce the programming complexity for the heterogeneous multicore platforms and improve programming productivity.
异构多核是由架构不同的核心组成的计算平台,由于其能够在特定的领域中针对应用的特点充分发挥不同处理器核的作用,成为了高性能计算平台主流架构和硬件基础。但也由于其不同架构组合复杂多样,传统的单一消息或者共享的编程模型都难以清晰描述各个计算部件之间的协同关系,导致其面临着编程要求高、产能低和调试的困难等挑战。本项目在由GPU集群构成的异构多核计算平台上,以软件分布式共享内存模型为基础,研究基于GPU设备内存的分布式共享设备内存的编程模型,达到简化编程,优化性能的目的。重点研究如下几个问题:(1)基于GPU设备内存、主存的两级共享内存的数据一致性维护;(2)GPU设备内存地址空间到主存地址空间的映射机制;(3)CPU-GPU间负载合理分配策略;(4)共享内存中数据预取策略。本项目旨在能为降低异构多核平台上的编程复杂性,提高编程效率奠定理论和技术基础。

结项摘要

图形处理器GPU善于处理大规模密集型数据和并行数据,通用并行架构CUDA让GPU在通用计算领域越来越普及。由于GPU集群的高性价比,高性能计算领域中GPU集群的使用越来越普遍,但GPU集群并行编程并没有一个标准的通信模型,绝大多数集群应用采取CUDA+MPI的方法实现,而CUDA和MPI编程都非常困难,需要程序员了解GPU硬件架构和MPI消息传递机制,显式控制内存与显存、节点与节点间的数据传输。因此,对编程人员来说,GPU集群并行编程仍是一个复杂的问题。.本项目基于GPU集群,结合分布式内存上的共享内存编程模型GA与通用并行架构CUDA的特征,采用共享显存方式,通过全局共享地址空间实现节点间GPU-to-GPU的数据通信,并通过内部透明的CPU端临时全局数组和GPU端全局数组来维护数据一致性,保证通信数据的正确性。同时,该接口解决了多进程多GPU环境下GPU设备的初始化问题,并提供GPU集群信息查询接口及图形化监控界面两种方式,帮助用户及时了解设备使用情况。设计开发了CUDA-GA原型系统,从数据传输和计算内核两方面对GA库中的数组运算进行优化,加速后的函数库可供用户直接使用。CUDA-GA为用户提供了一个简单方便的GPU集群并行编程通信接口,在保证通信性能的同时简化编程难度,提高程序员编写GPU集群应用程序的效率。我们还结合具体的典型应用:乔姆斯基预处理共轭梯度算法来解三维抛物线方程,分析出调优的特征,为CUDA-GA加入性能自动调优做准备。

项目成果

期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(1)
专利数量(0)
Research on the conjugate gradient algorithm with a modified incomplete Cholesky preconditioner on GPU
GPU上改进的不完全Cholesky预处理器共轭梯度算法研究
  • DOI:
    10.1016/j.jpdc.2013.10.002
  • 发表时间:
    2014
  • 期刊:
    Journal of Parallel and Distributed Computing
  • 影响因子:
    3.8
  • 作者:
    Jiaquan Gao;Ronghua Liang;Jun Wang
  • 通讯作者:
    Jun Wang

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

砷污染湖滨湿地底泥微生物群落结构及多样性
  • DOI:
    10.19674/j.cnki.issn1000-6923.2019.0461
  • 发表时间:
    2019
  • 期刊:
    中国环境科学
  • 影响因子:
    --
  • 作者:
    赵立君;刘云根;王妍;赵蓉;李波;郑毅
  • 通讯作者:
    郑毅
湍流驱动的太阳风模型中的流管曲率效应
  • DOI:
    10.1360/sspma2017-00367
  • 发表时间:
    2018
  • 期刊:
    中国科学:物理学 力学 天文学
  • 影响因子:
    --
  • 作者:
    李波
  • 通讯作者:
    李波
球形棕囊藻赤潮消亡过程环境因子变化及其消亡原因
  • DOI:
    10.13292/j.1000-4890.20150311.050
  • 发表时间:
    2015
  • 期刊:
    生态学杂志
  • 影响因子:
    --
  • 作者:
    李波;蓝文陆;李天深;黎明民
  • 通讯作者:
    黎明民
温度、电场及梯度系数对BaTiO3双手性畴壁的影响 Effects of Temperature, Electric Field and Gradient Coefficient on the Bichiral Domain Walls of BaTiO3
温度、电场和梯度系数对 BaTiO3 双手性畴壁的影响
  • DOI:
    10.12677/ms.2017.73039
  • 发表时间:
    2017
  • 期刊:
    Material Sciences
  • 影响因子:
    --
  • 作者:
    王芳;刘兰英;李波;刘龙飞;欧云;王伟
  • 通讯作者:
    王伟
3D打印组织工程支架成形过程建模与数值模拟
  • DOI:
    10.16182/j.issn1004731x.joss.201803030
  • 发表时间:
    2018
  • 期刊:
    系统仿真学报
  • 影响因子:
    --
  • 作者:
    陈从平;黄杰光;胡琼;冉艳华;李波
  • 通讯作者:
    李波

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

李波的其他基金

激光诱导原位氮化反应调控冷喷涂Ti6Al4V颗粒界面结合及性能研究
  • 批准号:
    52375469
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
基于肠源性SCFAs-GPCR43/41通路探讨铁皮石斛超微粉抗“肥甘醇酒”致代谢性高血压的机制
  • 批准号:
    81803760
  • 批准年份:
    2018
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
绝热剪切失稳与激光辐照软化协同作用下的金刚石/Ni60复合材料沉积特性及其结合机理研究
  • 批准号:
    51701182
  • 批准年份:
    2017
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码