众核集群上基于MPI的模型扩展及性能优化研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61502450
  • 项目类别:
    青年科学基金项目
  • 资助金额:
    20.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0202.系统软件、数据库与工业软件
  • 结题年份:
    2018
  • 批准年份:
    2015
  • 项目状态:
    已结题
  • 起止时间:
    2016-01-01 至2018-12-31

项目摘要

Many-core clusters have gradually become the mainstream of supercomputer architectures, which feature massive intra-node parallelism and hardware complexity. Traditional programming models and optimization techniques exhibit more limitations to deal with the issues of workload imbalance, nonlinear scalability of the parallel applications. To address the above problems, this program is based on one of the most important programming models in the area of high performance computing - MPI, and does research on MPI model extension and performance optimization. The main contents include: 1) Programming model extension for irregular applications. To efficiently describe the traditional irregular applications with workload imbalance and emerging large-scale deep learning algorithms with irregular communication patterns, we extend the MPI programming model to support irregular task parallelism and active message; 2) Communication performance model. We establish a novel performance model to abstract the multi-level hardware details, especially for the cache coherence architecture, predict the communication cost, and further guide the performance tuning of parallel softwares; 3) Communication performance optimization. Utilizing the techniques of shared address space, topology-aware communication and multi-level collaborative optimization, the intra-node communication overhead is reduced and overlapped. Communication interfaces are automatically tuned based on performance model.
众核集群已逐渐成为超级计算机的主流架构,其节点内大规模并行及复杂的硬件架构等特点使得传统编程模型及优化技术难以应对并行应用的负载不均衡、非线性可扩展等问题。为解决上述众核集群系统的并行难题,本项目基于高性能计算重要编程模型MPI,进行模型扩展及性能优化研究,主要内容包括:1)面向非规则应用的编程模型扩展研究。针对传统非规则应用的负载不均衡以及新兴的大规模深度学习算法的非规则通信模式等问题,扩展MPI模型以高效支持众核集群上任务并行及活动消息通信;2)通信性能模型研究。对多层次硬件信息进行抽象,特别是对缓存一致性架构上通信开销建模,形成一套新颖的面向众核集群的通信性能模型,进而对并行软件性能优化进行指导;3)通信性能优化研究。通过共享地址空间、拓扑感知以及多通信层次协同优化等,降低及隐藏多核及众核节点内的MPI通信开销,并利用基于性能模型的最优算法自适应选择方法,对通信接口实现进行自动调优。

结项摘要

超级计算机硬件的不断发展为高性能并行软件带来挑战。超级计算机具有并行度高、存储层次丰富、网络互联复杂等特点。当今并行编程模型及工具的发展难以满足当今超级计算机上高性能及高生产率并行软件开发的需求。. 首先,本课题扩展了MPI消息传递编程模型以高效支持非规则任务并行,从而显著降低通信冗余,提高非规则并行应用的性能及可扩展性。再次,提出一个新颖的缓存无关集合通信性能模型,并基于该模型充分挖掘集合通信操作在共享内存及分布式内存架构上的数据时间局部性及空间局部性,继而实现了一套新颖的缓存无关集合通信共性算法。最后,通过气候模拟、深度学习、以及材料模拟等实际应用,充分验证了本课题在MPI编程模型、性能模型、集合通信新算法、以及通信优化技术等方面所取得的成果。. 在不同众核架构上的实验测试表明,缓存无关集合通信算法相对于已有最新MPI实现平均获得2-3倍性能提升。基于按需通信的非规则编程模型,动力学模特卡罗并行算法在“神威-太湖之光”超级计算机上可扩展至10万CPU核(MPE),并行效率达到74%,通信量降低了97%;分子动力学算法可扩展至600万神威众核(MPE+CPE),并行效率达到85%;去中心化异步随机梯度下降(SGD)算法消除了全部进程参与的同步操作,降低通信开销。通过通信避免及层次化通信等优化技术,大气模式动力框架在“天河二号”超级计算机上可扩展至3.2万CPU核,0.5度网格分辨率情况下模拟速度达到15.6模式年/天。. 本课题研究成果具有多方面科学意义。第一,通过扩展MPI编程模型以支持非规则通信模式及非规则任务并行,在一定程度上解决了众核集群系统上非规则应用的负载不均衡问题。第二,通信开销通常是影响并行应用可扩展性的瓶颈。通过通信避免及层次化通信等优化技术,可显著降低并行应用的通信开销,从而缓解并行应用亚线性并行可扩展问题。第三,建立通信性能模型,达到准确性和简易性的良好折中,即在理论上简单易用,又能在实际应用中较准确的对性能、可扩展性等进行预估。

项目成果

期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(6)
专利数量(5)
Kernel optimization for short-range molecular dynamic
短程分子动力学的核优化
  • DOI:
    --
  • 发表时间:
    2016
  • 期刊:
    Computer Physics Communications
  • 影响因子:
    6.3
  • 作者:
    Changjun Hu;Xianmeng Wang;Jianjiang Li;Xinfu He;Shigang Li;Yangde Feng;Shaofeng Yang;He Bai
  • 通讯作者:
    He Bai
Cache-Oblivious MPI All-to-All Communications Based on Morton Order
基于 Morton 顺序的缓存无关 MPI 多对多通信
  • DOI:
    10.1109/tpds.2017.2768413
  • 发表时间:
    2018-03
  • 期刊:
    IEEE Transactions on Parallel and Distributed Systems
  • 影响因子:
    5.3
  • 作者:
    Shigang Li;Yunquan Zhang;Torsten Hoefler
  • 通讯作者:
    Torsten Hoefler
Hybrid-optimization strategy for the communication of large-scale Kinetic Monte Carlo simulation
大规模动力学蒙特卡罗模拟通信的混合优化策略
  • DOI:
    10.1016/j.cpc.2016.07.008
  • 发表时间:
    2017-02
  • 期刊:
    Computer Physics Communications
  • 影响因子:
    6.3
  • 作者:
    Baodong Wu;Shigang Li;Yunquan Zhang;Ningming Nie
  • 通讯作者:
    Ningming Nie
Parallel Processing Systems for Big Data: A Survey
大数据并行处理系统:调查
  • DOI:
    10.1109/jproc.2016.2591592
  • 发表时间:
    2016-08
  • 期刊:
    Proceedings of the IEEE
  • 影响因子:
    20.6
  • 作者:
    Zhang Yunquan;Cao Ting;Li Shigang;Tian Xinhui;Yuan Liang;Jia Haipeng;Vasilakos Athanasios V.
  • 通讯作者:
    Vasilakos Athanasios V.

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

基于OpenCL的Viola-Jones人脸检测算法性能优化研究
  • DOI:
    --
  • 发表时间:
    2015
  • 期刊:
    计算机学报
  • 影响因子:
    --
  • 作者:
    贾海鹏;张云泉;袁良;李士刚
  • 通讯作者:
    李士刚
材料微观结构演化大规模分子动力学软件比较
  • DOI:
    --
  • 发表时间:
    2016
  • 期刊:
    计算机科学与探索
  • 影响因子:
    --
  • 作者:
    张云泉;贺新福;张博尧;李士刚
  • 通讯作者:
    李士刚
异构多核上多级并行模型支持及性能优化
  • DOI:
    --
  • 发表时间:
    2013
  • 期刊:
    软件学报
  • 影响因子:
    --
  • 作者:
    李士刚;胡长军;王珏;李建江
  • 通讯作者:
    李建江
关键工艺参数对铬酸镧粉体形态的
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    金属热处理
  • 影响因子:
    --
  • 作者:
    李士刚;李胜利;王笑;敖青;孙
  • 通讯作者:

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码