面向国产处理器的数值计算核心算法性能建模与优化方法研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61902411
  • 项目类别:
    青年科学基金项目
  • 资助金额:
    20.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0204.计算机系统结构与硬件技术
  • 结题年份:
    2022
  • 批准年份:
    2019
  • 项目状态:
    已结题
  • 起止时间:
    2020-01-01 至2022-12-31

项目摘要

Key numerical algorithms such as dense linear algebraic solving algorithm, sparse linear algebraic solving algorithm and iterative computing algorithm on structural grid are the foundation of high-performance numerical simulation. An important cause of this problem is the mismatch between hardware architecture and algorithmic computing and data access patterns. At the same time, the complexity of the hardware architecture presents great challenges for performance bottleneck analysis and algorithm performance optimization. As the core device of the new-generation Chinese-made Exascale supercomputer systems, the Chinese-made processors will completely replace the current mainstream commercial processors and accelerators. At present, the work related to the performance analysis and performance optimization of key numerical algorithms for Chinese-made processors is not systematic and the practice remains a gap..This project is aimed at performance modeling and optimization methods for key numerical algorithms on chinese-made Fhytium series processor. The main contents include: to introduce a computational memory access execution model for key numerical algorithms on FT processor, to propose a analytical performance model for the given execution model of calculation and memory access, quantitatively evaluating the floating point performance and the actual use of the memory bandwidth of algorithms on the Fhytium processor, to design an performance model based optimization parameter selection method achieving efficient and accurate automatic selection of performance optimization parameters, and to propose an model-guided automatic performance optimization technology to realize the efficient and automatic performance optimization of key algorithms on the Fhytium processor.
稠密线性代数求解算法、稀疏线性代数求解算法和结构网格上迭代计算算法等数值计算核心算法作为高性能数值模拟的基石,在超算系统上普遍存在浮点计算效率低问题。导致这一问题的重要原因是国产处理器体系结构与算法计算和数据访问模式的不匹配。同时硬件体系结构的复杂度提⾼导致性能瓶颈原因分析和算法性能优化带来了很大挑战。国产自主处理器将全面取代目前主流商用处理器和加速器,成为国产E级超算系统的核心器件。目前面向国产处理的数值计算核心算法性能分析和性能优化的相关工作尚不成熟。.本项目面向国产飞腾系列处理器开展数值计算核心算法计算访存性能建模与优化方法研究,主要包括:建立针对FT处理器上数值计算核心算法的计算访存执行模型,建立针对给定计算访存模型的分析型计算访存性能模型,实现定量评估给定算法在飞腾处理器上的浮点计算性能和实际访存带宽,提出模型指导的自动性能优化技术,实现飞腾处理器上核心算法的高效自动性能优化。

结项摘要

Stencil计算和蒙特卡罗(MC)粒子输运是两类重要的数值计算核心算法,广泛应用于高性能科学与工程计算应用领域。两类算法由于具备计算访存比低、随机访存、分支多等特点,在通用CPU上计算效率较低,随着硬件体系结构的复杂度提高,针对两类计算的性能优化遇到很多挑战,需要算法性能模型指导。同时,目前普遍认为有效提升两类算法性能的最有效方法是软硬件协同设计,其关键是性能模型。本项目面向飞腾FT处理器,开展结构网格Stencil计算和蒙特卡罗粒子输运两类数值计算核心算法的解析性能建模和优化方法研究。.建立网格结构上Stencil计算计算访存性能模型。首先,利用排队论方法描述Stencil计算在FT处理器上延迟、并发度与实际使用访存带宽的相互关系,建立访存并发度预测模型。然后,建立预取性能模型,量化预测硬件预取对访存缺失率和访存并发度的影响模型。最后,基于前面的访存并发度模型、访存缺失率模型和预取性能模型建立了面向网格结构Stencil计算的访存性能模型。实验结果显示本文提出模型的预测性能与实际性能的误差小于10%。当内存带宽使用率不高时,本文模型的预测精度远高于已有的ECM模型。.建立一种基于子过程特征分析的MC粒子输运性能模型。该模型将子过程执行时间分为基础时间、访存时间和分支预测失败时间,通过分析子过程行为获得子过程的特征,包括指令、访存和分支特征,基于这些特征建立解析模型,预测每个子过程的执行时间。实验结果表明本文提出的模型的预测平均误差为22%。基于此模型,分析了每个子过程的 CPI 组成以及分支预测器和 L3 缓存的大小的影响。.该工作一方面可以用于快速定位FT处理器上Stencil计算和MC粒子输运模拟访存瓶颈,指导高效的性能优化;同时还可作为软硬件协同设计的桥梁,指导下一步面向两类计算的专用加速器和算法设计优化。

项目成果

期刊论文数量(3)
专著数量(0)
科研奖励数量(1)
会议论文数量(2)
专利数量(1)
shiftX:基于异或快速算子图生成并行优化方法
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    计算机工程与科学
  • 影响因子:
    --
  • 作者:
    邓慧明;甘新标;白皓;陈再高;龚春叶;杨博;袁璠;刘杰
  • 通讯作者:
    刘杰
Efficient data redistribution algorithms from irregular to block cyclic data distribution
从不规则数据分布到块循环数据分布的高效数据重新分布算法
  • DOI:
    10.1109/tpds.2022.3166484
  • 发表时间:
    2022
  • 期刊:
    IEEE Transactions on Parallel and Distributed Systems
  • 影响因子:
    5.3
  • 作者:
    Shengguo Li;Hao Jiang;Dezun Dong;Chun Huang;Jie Liu;Xia Liao;Xuguang Chen
  • 通讯作者:
    Xuguang Chen

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

人诱导性多能干细胞建系及肝细胞定向分化的研究
  • DOI:
    10.3760/cma.j.issn.1001-9030.2016.10.017
  • 发表时间:
    2016
  • 期刊:
    中华实验外科杂志
  • 影响因子:
    --
  • 作者:
    杨博;王兰;谭如梦;代辰;张波;王媒西;魏来;黄霞;陈知水
  • 通讯作者:
    陈知水
超短超强激光与固体靶相互作用所致X射线剂量实验研究
  • DOI:
    10.7538/yzk.2019.53.10.2098
  • 发表时间:
    2019
  • 期刊:
    原子能科学技术
  • 影响因子:
    --
  • 作者:
    邱睿;魏朔阳;杨博;于明海;矫金龙;路伟;马驰;闫永宏;吴玉迟;周维民;张辉;李君利
  • 通讯作者:
    李君利
面向异构IoT设备协作的DNN推断加速研究
  • DOI:
    --
  • 发表时间:
    2020
  • 期刊:
    计算机研究与发展
  • 影响因子:
    --
  • 作者:
    孙胜;李叙晶;刘敏;杨博;过晓冰
  • 通讯作者:
    过晓冰
基于QEMU的可重构专用处理器模拟器实现
  • DOI:
    10.16208/j.issn1000-7024.2016.05.042
  • 发表时间:
    2016
  • 期刊:
    计算机工程与设计
  • 影响因子:
    --
  • 作者:
    李可生;杨博;徐天伟;李丽;何书专;潘红兵
  • 通讯作者:
    潘红兵
冲刷现象对海上风力机单桩基础水平承载性的影响
  • DOI:
    --
  • 发表时间:
    2020
  • 期刊:
    湖南工程学院学报(自然科学版)
  • 影响因子:
    --
  • 作者:
    杨博;魏克湘;杨文献;宁立伟;周舟
  • 通讯作者:
    周舟

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码