基于弱同步策略的分布式深度学习并行优化理论与方法研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61672250
  • 项目类别:
    面上项目
  • 资助金额:
    63.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0204.计算机系统结构与硬件技术
  • 结题年份:
    2020
  • 批准年份:
    2016
  • 项目状态:
    已结题
  • 起止时间:
    2017-01-01 至2020-12-31

项目摘要

Deep learning is an emerging powerful method for big data analysis. The huge amount and high complexity make the parallelization for deep learning necessary. However, current ideas for parallelization of deep learning still mainly stay the primary stage with the strict synchronization model, matrixes parallel optimization, coarse-grained parallelization. The degree and efficiency of parallelization are very limited. To explore higher efficient parallelization methods and their related theories inside, this project plans to do the following researches: 1) studying the theories of stale synchronization model for deep learning to provide theoretical support for more flexible and efficient parallelization; 2) Exploring new multi-level data parallelization methods, based on layered stale synchronization strategies; 3) studying novel highly frequent data exchange methods by exploring pipeline-based stale synchronization strategies for model parallelization; 4) Exploring new distributed network parameter model management model, which can break the bottleneck of the current centralized model for parameters, based on stale synchronization theory. The achievements from this project are breakthroughs of the traditional parallelization of deep learning. They will provide more flexible and efficient strategies and powerful theories for distributed deep learning.
深度学习是当前大数据分析挖掘一个重要研究热点。巨量数据和超大网络规模使得采用并行分布式方法成为必然。然而,当前深度学习主流并行优化思想还处在以严格同步策略为基础、以矩阵计算优化、大粒度并行为手段的初级阶段,算法的效率和灵活性受到很大限制。为研究探索更高效的并行优化理论模型和方法,课题拟开展如下研究:1)深入研究分布式深度学习的弱同步策略及其理论基础,探索并行优化方法内在的基本规律和理论依据;2)研究多粒度融合的新的数据并行方法及分层弱同步策略,挖掘潜在的数据并行效能;3)研究参数模型并行中高频数据交换的流水线弱同步方法,突破数据交换的瓶颈;4)研究新的模型参数管理及维护模式,突破当前集中式参数服务模型的瓶颈,探索高效分布式参数管理方法及其在弱同步模式下的工作机制。本课题是对传统深度学习并行优化思想的一次突破,将为分布式深度学习提供更灵活高效的并行化策略及更强有力的理论支持。

结项摘要

本项目着重针对并行分布式深度学习系统中存在的同步策略效率偏低、资源利用率不高、数据组织粒度过大等若干科学问题,开展同步策略理论、并行分布式算法、模型维护与通信策略优化等方面的研究。具体包括:1)深入研究分布式深度学习的弱同步策略及其理论基础,探索并行优化方法内在的基本规律和理论依据,主要工作包括提出了分布式深度学习中基于组策略的弱一致性同步理论与方法,研究了基于陈旧补偿的参数梯度稀疏策略及近似理论模型,这些工作显著提高了分布式系统的训练效率。相关研究成果发表在CCGrid 2019, GPC 2020等会议上。另TOIT论文处于小修状态;2)研究多粒度融合的新的数据并行方法及高效的数据组织及内存管理方法,挖掘潜在的数据并行效能。主要工作包括提出了深度学习系统细粒度内存重用及优化方法,研究了基于空间复用的特征映射数据组织与内存管理机制、混合内存环境下深度学习数据预取策略等。显著提升了内存的利用率及对更多模型的支撑能力。相关工作发表在TACO 2019, PPoPP 2018, TACO 2018, ICCD 2019等会议和期刊上。其中TACO 2019的工作被该期刊主编推荐为期刊近期最值得关注的5篇论文工作之一;3)研究参数模型并行中高频数据交换策略及通信优化方法,突破数据交换的瓶颈,主要研究工作包括基于模型结构特性的混合通信优化方法、基于梯度参数特性的量化压缩优化传输方法、内存高效的分布式稀疏通信机制、基于固定比特数的梯度压缩及通信优化策略等,有效地降低了系统通信负载,提升了系统的性能;相关成果发表在APWeb 2020、GPC 2020等会议上;4)研究模型参数维护模式及并行分布式策略,探索高效参数管理及性能优化方法。主要工作包括细粒度模型参数维护模式及混合并行分布式方法、基于新型指令集的模型训练混合优化方法等。明显提升了众核系统的资源利用效率。相关成果发表在FGCS 2020、ICANN 2018等期刊和会议上。在此基础上,将上述研究成果和系统应用到了诸如医学图像分析等深度学习任务当中,取得了不错的效果。以上工作从多个层面突破了已有传统深度学习系统优化思想和方法存在的不足,为构建高效率、低损耗的分布式深度学习系统奠定了理论和实践基础。

项目成果

期刊论文数量(7)
专著数量(0)
科研奖励数量(0)
会议论文数量(9)
专利数量(6)
深度学习自适应学习率算法研究
  • DOI:
    10.13245/j.hust.190515
  • 发表时间:
    2019
  • 期刊:
    华中科技大学学报(自然科学版)
  • 影响因子:
    --
  • 作者:
    蒋文斌;彭晶;叶阁焰
  • 通讯作者:
    叶阁焰
Layup: Layer-adaptive and Multi-type Intermediate-oriented Memory Optimization for GPU-based CNNs
Layup:基于 GPU 的 CNN 的层自适应和多类型中间导向内存优化
  • DOI:
    10.1145/3357238
  • 发表时间:
    2019-12-01
  • 期刊:
    ACM TRANSACTIONS ON ARCHITECTURE AND CODE OPTIMIZATION
  • 影响因子:
    1.6
  • 作者:
    Jiang, Wenbin;Ma, Yang;Jin, Hai
  • 通讯作者:
    Jin, Hai
一种基于4Bit编码的深度学习梯度压缩算法
  • DOI:
    --
  • 发表时间:
    2020
  • 期刊:
    计算机科学
  • 影响因子:
    --
  • 作者:
    蒋文斌;符 智;彭 晶;祝 简
  • 通讯作者:
    祝 简
Exploiting potential of deep neural networks by layer-wise fine-grained parallelism
通过分层细粒度并行开发深度神经网络的潜力
  • DOI:
    10.1016/j.future.2019.07.054
  • 发表时间:
    2020-01-01
  • 期刊:
    FUTURE GENERATION COMPUTER SYSTEMS-THE INTERNATIONAL JOURNAL OF ESCIENCE
  • 影响因子:
    7.5
  • 作者:
    Jiang, Wenbin;Zhang, Yangsong;Jin, Hai
  • 通讯作者:
    Jin, Hai
Layer-Centric Memory Reuse and Data Migration for Extreme-Scale Deep Learning on Many-Core Architectures
用于多核架构上超大规模深度学习的以层为中心的内存重用和数据迁移
  • DOI:
    10.1145/3243904
  • 发表时间:
    2018-09
  • 期刊:
    ACM Transactions on Architecture and Code Optimization
  • 影响因子:
    1.6
  • 作者:
    Hai Jin;Bo Liu;Wenbin Jiang;Yang Ma;Xuanhua Shi;Bingsheng He;Shaofeng Zhao
  • 通讯作者:
    Shaofeng Zhao

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

经后路全脊椎切除术治疗重度僵硬性脊柱畸形的围手术期非神经并发症分析
  • DOI:
    10.3969/j.issn.1004-406x.2016.01.10
  • 发表时间:
    2016
  • 期刊:
    中国脊柱脊髓杂志
  • 影响因子:
    --
  • 作者:
    王迎松;解京明;赵智;李韬;毕尼;蒋文斌;彭 丰
  • 通讯作者:
    彭 丰
基于价格传导视角的“稻强米弱”成因探析:国际价格冲击抑或产业链传导受阻?
  • DOI:
    --
  • 发表时间:
    2016
  • 期刊:
    当代经济科学
  • 影响因子:
    --
  • 作者:
    武舜臣;蒋文斌;曹宝明
  • 通讯作者:
    曹宝明
不对称重组酶介导扩增结合分子信标检测金黄色葡萄球菌方法的建立与应用
  • DOI:
    10.3760/cma.j.issn.1009-9158.2017.04.019
  • 发表时间:
    2017
  • 期刊:
    中华检验医学杂志
  • 影响因子:
    --
  • 作者:
    周琳;徐欢;杨成;张峰领;罗杰;蒋文斌;汪超;唱凯;鲁卫平;陈鸣
  • 通讯作者:
    陈鸣
LDR-ULP结合荧光定量PCR快速检测β-地中海贫血的应用研究
  • DOI:
    --
  • 发表时间:
    2016
  • 期刊:
    中国检验医学杂志
  • 影响因子:
    --
  • 作者:
    徐欢;杨成;李发科;罗杰;蒋文斌;张峰领;汪超;颜保松;唱凯;陈鸣
  • 通讯作者:
    陈鸣
肺癌细胞中NF-κB2基因表达及启动子区域甲基化状态分析
  • DOI:
    --
  • 发表时间:
    2014
  • 期刊:
    免疫学杂志
  • 影响因子:
    --
  • 作者:
    蒋文斌;李时飞;王丰;许雪青;杨绍俊;贾双荣;李发科;商亚;陈鸣
  • 通讯作者:
    陈鸣

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

蒋文斌的其他基金

深度图神经网络系统与模型融合优化方法研究
  • 批准号:
    62372199
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
面向普适环境的流媒体柔性机理与调度策略研究
  • 批准号:
    60903173
  • 批准年份:
    2009
  • 资助金额:
    18.0 万元
  • 项目类别:
    青年科学基金项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码