面向百核处理器Cache一致性协议的高效片上网络研究

项目介绍
AI项目解读

基本信息

  • 批准号:
    61303065
  • 项目类别:
    青年科学基金项目
  • 资助金额:
    25.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0204.计算机系统结构与硬件技术
  • 结题年份:
    2016
  • 批准年份:
    2013
  • 项目状态:
    已结题
  • 起止时间:
    2014-01-01 至2016-12-31

项目摘要

The advancement of semiconduct technology continuously increases the core count. The industry has entered the era of hundred-core processors. The traditional bus communication mechanism has several disadvantages in hundred-core processors. The Network-on-Chip (NoC) effectively overcomes these disadvantages, and becomes the de facto communication standard for hundred-core processors. On the other hand, due to the difficulty of parallel programming and compatibility requirements of history codes, cache coherence protocols will exist in hundred-core platforms. However, coherence protocols in hundred-core processors face several challenges, including the increase of transaction latency, the hierachical structure, the growth of message count, and the bottleneck of multicast and reduction communication. To address these challenges, it is necessary to optimze the design of NoC based on the structure of the protocol and the characteristics of the coherent traffic. This project mainly researches on key techniques of designing efficient NoC to support the coherence protocols in hundred-core processors. We will delve into four research directions: 1. reconfigurable topology with low latency; 2. high performance routing algorithm which dynamically isolates different regions; 3. efficient flow control for short packets; 4. hardware support for multicast and reduction communication. The study of this project establishes a solid theoretical and technical foundation for the design of the communication mechanism for hundred-core processors. It has both important engineering value and theoretical significance.
半导体技术的发展不断增加芯片集成的核数,业界已进入百核处理器时代。片上网络较好地克服了传统总线互联结构的诸多不足,它已成为百核处理器事实上片内互联标准。另一方面,并行编程的高难度和兼容遗留代码的需求使得百核处理器依然采用cache 一致性协议,但百核处理器上的cache一致性协议面临着事务延迟上升、层次化结构、消息量剧增、多播和归约通信瓶颈诸多挑战。为缓解这些挑战,需要在分析一致性协议结构和通信特征的基础上优化设计片上网络。本课题主要研究高效支持百核处理器cache一致性协议的片上网络关键技术,包括低延迟的动态可重构拓扑结构、维持区域隔离的高性能路由算法、高效传输短报文的流控机制、多播和归约通信的硬件支持等。本课题的研究可以为百核处理器片内互联架构的设计与实现奠定坚实的理论和技术基础,具有重要的理论意义和应用价值。

结项摘要

百核处理器上的cache一致性协议面临着事务延迟上升、层次化结构、消息量剧增、多播和归约通信瓶颈诸多挑战。为缓解这些挑战,需要在分析一致性协议结构和通信特征的基础上优化设计片上网络。本课题主要研究高效支持百核处理器cache一致性协议的片上网络关键技术,项目研究进展顺利,在面向一致性协议的低延迟拓扑结构、动态隔离一致性区域的路由算法、无死锁高效传输短控制报文的流控机制和消除一致性协议多播和归约通信瓶颈等方面取得了一些关键技术的突破和创新,在拓扑结构方面提出了多链路无阻塞环网拓扑结构和异构环-链拓扑结构,这两种拓扑结构都有效地降低了报文传输延迟。在路由算法方面提出了动态延迟感知的负载均衡路由算法和基于区域洪水算法的容错路由算法,并提出了一种高效的容错路由器结构。在流控机制方面提出了面向完全自适应路由算法的新颖流控机制和面向torus网络的无死锁流控机制,这两种流控机制都能高效传输短报文。在消除聚合通信瓶颈方面提出了提高服务质量的自适应剩余跳数流控机制和低开销的无冲突片上网络结构。本课题的研究可以为百核处理器片内互联架构的设计与实现奠定坚实的理论和技术基础,具有重要的理论意义和应用价值。本课题全面完成了研究计划。

项目成果

期刊论文数量(14)
专著数量(4)
科研奖励数量(3)
会议论文数量(7)
专利数量(0)
一种高效的DMA核间同步传输方法
  • DOI:
    --
  • 发表时间:
    2016
  • 期刊:
    计算机工程与科学
  • 影响因子:
    --
  • 作者:
    田玉恒;马胜;鲁建壮;杨柳
  • 通讯作者:
    杨柳
Exploiting Parallelism in the Simulation of GPGPU Program
在 GPGPU 程序仿真中利用并行性
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    Journal of Shanghai Jiaotong University
  • 影响因子:
    --
  • 作者:
    ZHAO Xia;MA Sheng;CHEN Wei;WANG Zhi-ying
  • 通讯作者:
    WANG Zhi-ying
A SIMD Multiple-Precision Floating-Point Multiplier For Digital Signal Processors
用于数字信号处理器的SIMD多精度浮点乘法器
  • DOI:
    --
  • 发表时间:
    2014
  • 期刊:
    IEICE Electronics Express
  • 影响因子:
    0.8
  • 作者:
    Zonglin Liu;Sheng Ma;Yang Guo
  • 通讯作者:
    Yang Guo
片上多链路无阻塞环网的设计与性能评价
  • DOI:
    --
  • 发表时间:
    2014
  • 期刊:
    东北大学学报
  • 影响因子:
    --
  • 作者:
    马胜;陈胜刚;郭阳;王鹏
  • 通讯作者:
    王鹏
多逻辑通道DMA快速启动的设计与优化
  • DOI:
    --
  • 发表时间:
    2015
  • 期刊:
    计算机技术与发展
  • 影响因子:
    --
  • 作者:
    胡月安;马胜;陈书明;张帅
  • 通讯作者:
    张帅
共 7 条
  • 1
  • 2
前往

其他文献

甘蓝型油菜种子中油体的超微结构及蛋白质组分析
  • DOI:
    --
  • 发表时间:
    2017
  • 期刊:
    植物科学学报
  • 影响因子:
    --
  • 作者:
    何宇清;操春燕;沈文忠;黄冬;马胜;吴燕
  • 通讯作者:
    吴燕
黄土丘陵沟壑区生态风险动态变化及其地形梯度分析——以陕西省米脂县为例
  • DOI:
    --
  • 发表时间:
    2018
  • 期刊:
    生态学报
  • 影响因子:
    --
  • 作者:
    刘迪;陈海;梁小英;马胜;王嘉妮
  • 通讯作者:
    王嘉妮
基于星载SAR数据的台风参数估计及风场构建
  • DOI:
    --
  • 发表时间:
    2014
  • 期刊:
    中国科学:地球科学
  • 影响因子:
    --
  • 作者:
    于暘;毕海波;马胜;李晓峰
  • 通讯作者:
    李晓峰
缩醛化葡聚糖的制备及其酸响应性
  • DOI:
    10.14133/j.cnki.1008-9357.20190415001
  • 发表时间:
    2019
  • 期刊:
    功能高分子学报
  • 影响因子:
    --
  • 作者:
    徐玉笛;马胜;汤朝晖
  • 通讯作者:
    汤朝晖
QIAEA算法及其在重油热解参数估计中的应用
  • DOI:
    --
  • 发表时间:
    2015
  • 期刊:
    计算机与应用化学
  • 影响因子:
    --
  • 作者:
    宗雪鹏;马胜;杨一航;李绍军
  • 通讯作者:
    李绍军
共 13 条
  • 1
  • 2
  • 3
前往

正在为您生成内容...

马胜的其他基金

面向深度学习训练的2.5D堆叠加速器结构研究
  • 批准号:
    62172430
  • 批准年份:
    2021
  • 资助金额:
    59.00 万元
  • 项目类别:
    面上项目
面向深度学习训练的2.5D堆叠加速器结构研究
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    59 万元
  • 项目类别:
    面上项目
2.5D堆叠众核协处理器片上网络结构研究
  • 批准号:
    61672526
  • 批准年份:
    2016
  • 资助金额:
    62.0 万元
  • 项目类别:
    面上项目