易编程的异构并行处理器结构

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61432016
  • 项目类别:
    重点项目
  • 资助金额:
    350.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0204.计算机系统结构与硬件技术
  • 结题年份:
    2019
  • 批准年份:
    2014
  • 项目状态:
    已结题
  • 起止时间:
    2015-01-01 至2019-12-31

项目摘要

Heterogeneous parallel processor, which integrates a number of general-purpose core and accelerator cores on a chip, is becoming a mainstream of the computer architecture society. However, there has no common standard for the behavior, abstract, and interaction of accelerator cores. As a result, few programmers can be proficient in programming each accelerator, let alone writing efficient parallel program for heterogeneous parallel processor. In fact, the programming wall of heterogeneous parallel processor has greatly encumbered its development and deployment...The difficulty of programming heterogeneous parallel processor comes from hardware: the heterogeneity between cores. Hence, we propose to conduct integrative software-hardware investigations, so as to solve the difficult of programming heterogeneous parallel processor. Through building a theoretical model for heterogeneous parallel processor, we can find a contract between software designers and hardware designers of heterogeneous parallel processor. Under this contract, each accelerator can be simply treated as an apparatus for algorithm execution. Hardware designers can use this contract to constrain the uncore architecture and accelerator architecture of heterogeneous parallel processor, while software designers can use this contract to build algorithm-centric programming framework and runtime. Correspondingly, heterogeneous parallel processor will become east to program, while preserving highly energy-efficient. Through this project, we will produce a reference design, a prototype chip and a programming environment for heterogeneous parallel processor, which can provide reference for the society (especially designers of domestic processor).
在单芯片上集成多种核的异构并行处理器正在成为业界的主流发展趋势。然而,各种加速核没有统一的行为、抽象、交互标准。很少有程序员能掌握每种加速核的编程,更遑论让它们高效地并行执行。这使得本来就很突出的多/众核处理器的编程墙问题愈发严峻起来,成为了制约异构处理器发展和应用的关键。..异构处理器编程困难来源于硬件:核的异构化。因此,本项目提出对异构并行处理器的软硬件进行整体性的探索来解决其编程困难。通过构建异构处理器的并行理论模型,可以形成一套软硬件设计者之间的契约。在此软硬件契约下,异构处理器各核可被看成是算法运行工具。硬件设计者基于此契约约束处理器总体架构和各个算法加速核具体结构,而软件设计者则可基于此契约构建以算法组件为中心的编程范式和运行时环境,从而使得异构并行处理器易编程、高效能。最终我们将形成一套异构处理器的参考结构方案、样片和编程环境,为国内外同行(尤其是国产处理器设计者)提供借鉴。

结项摘要

异构并行处理器正在成为业界的主流发展趋势,然而各种加速核没有统一的行为、抽象、交互标准。很少有程序员能掌握每种加速核的编程,更遑论让它们高效地并行执行。这使得本来就很突出的多/众核处理器的编程墙问题愈发严峻起来,成为了制约异构处理器发展和应用的关键。本项目针对异构并行处理器存在的缺乏统一核级编程方法、缺乏统一核级硬件抽象和缺乏统一核间交互协议这三大编程挑战,实现易编程的异构并行处理器结构。. 我们以深度学习和机器学习为代表性应用,突破异构并行处理器编程困难的问题,提出了多核处理器全局时钟理论,并基于此理论创新性地提出了领域指令自动化抽取方法,提出了一套符合异构处理器总体结构。我们设计了国际首个神经网络通用指令集架构Cambricon,通过MPW方式完成了深度学习处理器Cambricon-1A原理性样片的流片,样片采用40nm工艺,芯片版图面积50.5平方毫米,能效达到2.5Tops/W,超过同期主流GPU十倍。针对异构并行处理器我们提出了异构并行编程模型,设计了以算法组件为中心的协作式编程范式及相应的编译工具链,实现了可进行任务调度和资源管理的异构并行运行时系统,最终形成了一套易编程的高效能异构并行的处理器参考结构和编程环境,可望为国产智能处理器的设计提供借鉴。. 项目相关工作形成了54篇论文和15项发明专利,其中包括10篇CCF A类会议论文和11篇IEEE/ACM Transactions论文。团队工作受到全球5大洲、30个国家/地区、200余家机构(包括哈佛、斯坦福、麻省理工、谷歌、英伟达等),以及2位图灵奖得主、15位中美院士、120余位ACM/IEEE会士的跟踪和引用。项目成果被Science杂志刊文评价为深度学习处理器研究的“开创性进展”、“先驱”和“引领者”,所开创的深度学习处理器研究方向,已经成为当前国际计算机体系结构领域最重要的研究热点之一。项目所突破的部分关键技术已经应用于国产智能处理器的研发,现已完成了量产与商用,为近亿台国产智能手机和国产云端服务器插上了智慧之翼。

项目成果

期刊论文数量(24)
专著数量(0)
科研奖励数量(0)
会议论文数量(19)
专利数量(12)
A High-Throughput Neural Network Accelerator
高通量神经网络加速器
  • DOI:
    10.1109/mm.2015.41
  • 发表时间:
    2015-05
  • 期刊:
    IEEE Micro
  • 影响因子:
    3.6
  • 作者:
    Tianshi Chen;Zidong Du;Ninghui Sun;Jia Wang;Chengyong Wu;Yunji Chen;Olivier Temam
  • 通讯作者:
    Olivier Temam
A survey of routing algorithm for mesh Network-on-Chip
网状片上网络路由算法综述
  • DOI:
    10.1007/s11704-016-5431-8
  • 发表时间:
    2016-08
  • 期刊:
    Frontiers of Computer Science
  • 影响因子:
    4.2
  • 作者:
    Yue Wu;Chao Lu;Yunji Chen
  • 通讯作者:
    Yunji Chen
Deterministic Replay: A Survey
确定性重播:调查
  • DOI:
    10.1145/2790077
  • 发表时间:
    2015-11-01
  • 期刊:
    ACM COMPUTING SURVEYS
  • 影响因子:
    16.6
  • 作者:
    Chen, Yunji;Zhang, Shijin;Chen, Tianshi
  • 通讯作者:
    Chen, Tianshi
A survey of neural network accelerators
神经网络加速器综述
  • DOI:
    10.1007/s11704-016-6159-1
  • 发表时间:
    2017-10-01
  • 期刊:
    FRONTIERS OF COMPUTER SCIENCE
  • 影响因子:
    4.2
  • 作者:
    Li, Zhen;Wang, Yuqing;Chen, Tianshi
  • 通讯作者:
    Chen, Tianshi
Accelerating Architectural Simulation Via Statistical Techniques: A Survey
通过统计技术加速建筑模拟:调查
  • DOI:
    10.1109/tcad.2015.2481796
  • 发表时间:
    2016-03
  • 期刊:
    IEEE Transactions ON Computer-Aided Design of Integrated Circuits and Systems
  • 影响因子:
    2.9
  • 作者:
    Qi Guo;Tianshi Chen;Yunji Chen;Franz Franchetti
  • 通讯作者:
    Franz Franchetti

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

覆盖率驱动的随机测试生成技术综述
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    计算机辅助设计与图形学学报
  • 影响因子:
    --
  • 作者:
    陈云霁;沈海华;卫文丽
  • 通讯作者:
    卫文丽
低面积低功耗的机器学习运算单元设计
  • DOI:
    --
  • 发表时间:
    2019
  • 期刊:
    高技术通讯
  • 影响因子:
    --
  • 作者:
    周聖元;周聖元;杜子东;杜子东;刘道福;刘道福;支天;支天;陈云霁;陈云霁
  • 通讯作者:
    陈云霁
可重塑处理器:用户可定义的加速器中处理器架构
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    网络新媒体技术
  • 影响因子:
    --
  • 作者:
    张磊;王颖;陈云霁;徐志伟;张立新
  • 通讯作者:
    张立新
基于模型树的多核设计空间探索技术
  • DOI:
    --
  • 发表时间:
    2012
  • 期刊:
    计算机辅助设计与图形学学报
  • 影响因子:
    --
  • 作者:
    郭崎;陈天石;陈云霁
  • 通讯作者:
    陈云霁
片上多核处理器共享资源分配与调度策略研究综述
  • DOI:
    --
  • 发表时间:
    2013
  • 期刊:
    计算机研究与发展
  • 影响因子:
    --
  • 作者:
    刘道福;陈云霁;陈天石;李玲
  • 通讯作者:
    李玲

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

陈云霁的其他基金

基于全局时钟的并行程序调试的若干关键技术研究
  • 批准号:
    61003064
  • 批准年份:
    2010
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码