面向气候和湍流模拟的百万量级异构众核可扩展并行算法与优化方法
项目介绍
AI项目解读
基本信息
- 批准号:61432018
- 项目类别:重点项目
- 资助金额:300.0万
- 负责人:
- 依托单位:
- 学科分类:F0201.计算机科学的基础理论
- 结题年份:2019
- 批准年份:2014
- 项目状态:已结题
- 起止时间:2015-01-01 至2019-12-31
- 项目参与者:张凤; 陈一峯; 冯晓兵; 张贺; 姚二林; 张东凌; 袁良; 崔翔; 杨鲲;
- 关键词:
项目摘要
With more and more obvious development trend of future hundreds of Petaflops and Exascale supercomputing systems architecture may adopt heterogeneous manycore architecture, more and more parallel application software face with the performance continuous linear scalable and portability challenge. In this project, aims at the above mentioned challenges on performance scalability and portability of two key application fields, i.e. Global Climate and Direct Turbulence simulation applications, we plan to carry out researches on the multi-level non-continuous and non-linear scalability theory and the physical modeling methods with millions of parallelism. Focused on the typical computation pattern and communication pattern of the above two key application fields, including structural and non-structural mesh, FFT, dense and sparse linear algebra, we plan to carry out researches on the interconnection network topology-aware and communication avoiding scalable parallel algorithms, semantic and resource-aware parallel programming framework and self-adaptive performance optimization techniques based on template methods. With the (physical modeling)-(parallel algorithm)-(paralel software)-architecture multi-level co-design and fusion research scheme, we try to realize the demonstrative scalable running on millions of heterogeneous manycores of two key application software. Based on the whole research and development requirements of large scale scalable parallel software, we carry out three levels researches on physical modeling, parallel algorithm design and optimization methods for parallel software, and try to propose new scalable theory, physical and algorithm modeling methods, parallel programming framework and key techniques. This project will have important theorical and application value since we can provide support on theory, methods, platform, and key techniques for the software development of other key application field.
随着异构众核日渐成为未来E级超级计算系统主流体系架构,越来越多并行软件面临着性能难以连续线性可扩展和可移植的挑战。本课题针对全球气候和直接湍流模拟等重点应用领域并行软件研制中出现的上述难题,研究多层次不连续非线性可扩展理论和支持百万量级并行度的物理建模方法;针对其结构与非结构网格、FFT、稠密和稀疏线性代数等典型计算和通信模式,研究网络拓扑感知和通信避免可扩展并行算法,语义与资源感知的并行编程框架和基于模板自适应优化技术。采用物理建模-并行算法-并行软件-体系结构多层协同和融合的研究方法,实现百万量级异构众核并行可扩展应用示范。本项目从大规模并行应用软件研制整体出发,在物理建模、并行算法设计和并行软件优化方法等三个层次开展研究,相互融合形成新的可扩展理论、物理和算法建模方法、并行编程框架和关键技术,可为其它重点领域应用软件研制提供理论、方法、平台和关键技术支撑,具有重要理论价值和应用前景。
结项摘要
项目围绕高性能计算中可扩展性这一核心问题,沿着物理模型、并行算法设计、并行软件优化这一技术路线,以可扩展理论、新型并行算法、大规模并行软件、高效通信实现、并行编程模型等为研究内容,较为完整的形成了一套多层次应用协同设计优化的方法,并在三个重点应用领域进行示范。.首次发现E级大规模异构众核并行计算系统上的多层次不连续非线性可扩展现象并展开理论分析,提出了一套物理建模、并行算法设计和并行软件优化方法分层次可扩展的理论和方法体系,形成了新颖的应用-算法-体系结构两层协同设计思想,指导三个重点示范应用研究工作。论文发表在《计算机学报》上。.针对应用中的FFT、SpMV和Stencil等共性函数设计新颖算法和自适应优化实现,性能达到国际领先水平,性能分别优于FFTW、CUSPARSE、Pluto等国际知名软件包。论文发表在CCF A类会议SC、PPoPP、CCF A类期刊TPDS、B类期刊TACO、TOMS上。.提出一种语义和资源感知的异构众核系统并行编程框架AceMesh,实现数据驱动的细粒度任务并行,在国产神威平台对气候模拟热点函数性能提升49%,并应用在多重网格、粒子模拟等其他应用中。论文发表在CCF A类会议PPoPP和B类会议CC上。.全球气候模拟应用首次在国际上设计实现三维剖分方案并应用新颖跳点算法和高效通信优化方法,可扩展性提升两个数量级,突破十万核可扩展性瓶颈,获得2019年国家最高科技奖获得者曾庆存院士高度评价。相关结果将会被IPCC第六次评估报告采用。论文发表在CCF B类会议IPDPS上。.核材料数值模拟应用方面,研制出世界上第一款可进行千亿粒子模拟的OpenKMC软件,神威太湖之光上五百万核效率高于80%,已经交付中国原子能科学研究院进行模拟研究,成为国产核材料模拟软件生态的重要组成部分。论文发表在CCF A类会议SC上。.直接法湍流计算采用了基于通信动态拓扑模型优化,在神威太湖之光系统上实现了世界最大规模为16384立方的直接数值法湍流模拟,104万核性能40.2TFLOP/S。.项目共发表60篇论文,其中高水平论文25篇(国内历史上首次同一年同一研究组在SC上发表两篇正文,国内历史上首次连续三年在PPoPP上发表正文)。项目拟冲击2020年Gordon Bell奖,申请专利11项,软件著作权5项。培养博士生10名,硕士研究生10名。完成了预期目标。
项目成果
期刊论文数量(23)
专著数量(1)
科研奖励数量(4)
会议论文数量(27)
专利数量(11)
A scalable parallel algorithm for atmospheric general circulation models on a multi-core cluster
多核集群上大气环流模型的可扩展并行算法
- DOI:10.1016/j.future.2017.02.008
- 发表时间:2017-07
- 期刊:Future Generation Computer Systems
- 影响因子:--
- 作者:Yuzhu Wang;Jinrong Jiang;He Zhang;Xiao Dong;Lizhe Wang;Rajiv Ranjan;Albert Y. Zomaya
- 通讯作者:Albert Y. Zomaya
一种偶数基 Cooley-Tukey FFT 高性能实现方法
- DOI:--
- 发表时间:2020
- 期刊:计算机科学
- 影响因子:--
- 作者:龚彤艳;张广婷;贾海鹏;袁良
- 通讯作者:袁良
Automatic Generation of High-Performance FFT Kernels on Arm and x86 CPUs
在 Arm 和 x86 CPU 上自动生成高性能 FFT 内核
- DOI:10.1109/tpds.2020.2977629
- 发表时间:2020
- 期刊:IEEE Transactions on Parallel and Distributed Systems
- 影响因子:5.3
- 作者:Z. Li;H. Jia;Y. Zhang;T. Chen;L. Yuan;R. Vuduc
- 通讯作者:R. Vuduc
一个面向任务图并行程序的错误检查工具
- DOI:--
- 发表时间:2017
- 期刊:计算机科学
- 影响因子:--
- 作者:刘艳娜;陈莉;唐生林
- 通讯作者:唐生林
数组维度类型程序设计方法及高性能FFT
- DOI:--
- 发表时间:2015
- 期刊:软件学报
- 影响因子:--
- 作者:崔翔;李晓雯;陈一峯
- 通讯作者:陈一峯
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
曙光5000A天体大规模数值模拟软件性能测试
- DOI:--
- 发表时间:--
- 期刊:西安交通大学学报
- 影响因子:--
- 作者:孙相征;姚继峰;李力刚;管文华;刘芳芳;王婷;唐雨新;张云泉;杨超
- 通讯作者:杨超
HPCC在IBM刀片机群上的诊断测试与结果分析
- DOI:--
- 发表时间:--
- 期刊:计算机工程
- 影响因子:--
- 作者:王宣强;王向前;张云泉
- 通讯作者:张云泉
基于OpenCL的Viola-Jones人脸检测算法性能优化研究
- DOI:--
- 发表时间:2015
- 期刊:计算机学报
- 影响因子:--
- 作者:贾海鹏;张云泉;袁良;李士刚
- 通讯作者:李士刚
有限元单元计算子程序的OpenMP并行化
- DOI:--
- 发表时间:--
- 期刊:计算机工程
- 影响因子:--
- 作者:张云泉;蒋孟奇;宋刚;李玉成
- 通讯作者:李玉成
基于OpenCL的直方图生成算法优化方法研究
- DOI:--
- 发表时间:2015
- 期刊:计算机科学
- 影响因子:--
- 作者:安小景;张云泉;贾海鹏
- 通讯作者:贾海鹏
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
张云泉的其他基金
面向众核体系架构的并行计算模型与性能自适应优化研究
- 批准号:61972376
- 批准年份:2019
- 资助金额:60 万元
- 项目类别:面上项目
众核体系架构并行计算模型与算法自适应调优框架研究
- 批准号:61272136
- 批准年份:2012
- 资助金额:82.0 万元
- 项目类别:面上项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}