基于弱同步策略的分布式深度学习并行优化理论与方法研究
项目介绍
AI项目解读
基本信息
- 批准号:61672250
- 项目类别:面上项目
- 资助金额:63.0万
- 负责人:
- 依托单位:
- 学科分类:F0204.计算机系统结构与硬件技术
- 结题年份:2020
- 批准年份:2016
- 项目状态:已结题
- 起止时间:2017-01-01 至2020-12-31
- 项目参与者:刘小白; 郭人通; 朱亮; 范学鹏; 池也; 张杨松; 叶阁焰; 李陈希; 石翔;
- 关键词:
项目摘要
Deep learning is an emerging powerful method for big data analysis. The huge amount and high complexity make the parallelization for deep learning necessary. However, current ideas for parallelization of deep learning still mainly stay the primary stage with the strict synchronization model, matrixes parallel optimization, coarse-grained parallelization. The degree and efficiency of parallelization are very limited. To explore higher efficient parallelization methods and their related theories inside, this project plans to do the following researches: 1) studying the theories of stale synchronization model for deep learning to provide theoretical support for more flexible and efficient parallelization; 2) Exploring new multi-level data parallelization methods, based on layered stale synchronization strategies; 3) studying novel highly frequent data exchange methods by exploring pipeline-based stale synchronization strategies for model parallelization; 4) Exploring new distributed network parameter model management model, which can break the bottleneck of the current centralized model for parameters, based on stale synchronization theory. The achievements from this project are breakthroughs of the traditional parallelization of deep learning. They will provide more flexible and efficient strategies and powerful theories for distributed deep learning.
深度学习是当前大数据分析挖掘一个重要研究热点。巨量数据和超大网络规模使得采用并行分布式方法成为必然。然而,当前深度学习主流并行优化思想还处在以严格同步策略为基础、以矩阵计算优化、大粒度并行为手段的初级阶段,算法的效率和灵活性受到很大限制。为研究探索更高效的并行优化理论模型和方法,课题拟开展如下研究:1)深入研究分布式深度学习的弱同步策略及其理论基础,探索并行优化方法内在的基本规律和理论依据;2)研究多粒度融合的新的数据并行方法及分层弱同步策略,挖掘潜在的数据并行效能;3)研究参数模型并行中高频数据交换的流水线弱同步方法,突破数据交换的瓶颈;4)研究新的模型参数管理及维护模式,突破当前集中式参数服务模型的瓶颈,探索高效分布式参数管理方法及其在弱同步模式下的工作机制。本课题是对传统深度学习并行优化思想的一次突破,将为分布式深度学习提供更灵活高效的并行化策略及更强有力的理论支持。
结项摘要
本项目着重针对并行分布式深度学习系统中存在的同步策略效率偏低、资源利用率不高、数据组织粒度过大等若干科学问题,开展同步策略理论、并行分布式算法、模型维护与通信策略优化等方面的研究。具体包括:1)深入研究分布式深度学习的弱同步策略及其理论基础,探索并行优化方法内在的基本规律和理论依据,主要工作包括提出了分布式深度学习中基于组策略的弱一致性同步理论与方法,研究了基于陈旧补偿的参数梯度稀疏策略及近似理论模型,这些工作显著提高了分布式系统的训练效率。相关研究成果发表在CCGrid 2019, GPC 2020等会议上。另TOIT论文处于小修状态;2)研究多粒度融合的新的数据并行方法及高效的数据组织及内存管理方法,挖掘潜在的数据并行效能。主要工作包括提出了深度学习系统细粒度内存重用及优化方法,研究了基于空间复用的特征映射数据组织与内存管理机制、混合内存环境下深度学习数据预取策略等。显著提升了内存的利用率及对更多模型的支撑能力。相关工作发表在TACO 2019, PPoPP 2018, TACO 2018, ICCD 2019等会议和期刊上。其中TACO 2019的工作被该期刊主编推荐为期刊近期最值得关注的5篇论文工作之一;3)研究参数模型并行中高频数据交换策略及通信优化方法,突破数据交换的瓶颈,主要研究工作包括基于模型结构特性的混合通信优化方法、基于梯度参数特性的量化压缩优化传输方法、内存高效的分布式稀疏通信机制、基于固定比特数的梯度压缩及通信优化策略等,有效地降低了系统通信负载,提升了系统的性能;相关成果发表在APWeb 2020、GPC 2020等会议上;4)研究模型参数维护模式及并行分布式策略,探索高效参数管理及性能优化方法。主要工作包括细粒度模型参数维护模式及混合并行分布式方法、基于新型指令集的模型训练混合优化方法等。明显提升了众核系统的资源利用效率。相关成果发表在FGCS 2020、ICANN 2018等期刊和会议上。在此基础上,将上述研究成果和系统应用到了诸如医学图像分析等深度学习任务当中,取得了不错的效果。以上工作从多个层面突破了已有传统深度学习系统优化思想和方法存在的不足,为构建高效率、低损耗的分布式深度学习系统奠定了理论和实践基础。
项目成果
期刊论文数量(7)
专著数量(0)
科研奖励数量(0)
会议论文数量(9)
专利数量(6)
深度学习自适应学习率算法研究
- DOI:10.13245/j.hust.190515
- 发表时间:2019
- 期刊:华中科技大学学报(自然科学版)
- 影响因子:--
- 作者:蒋文斌;彭晶;叶阁焰
- 通讯作者:叶阁焰
Layup: Layer-adaptive and Multi-type Intermediate-oriented Memory Optimization for GPU-based CNNs
Layup:基于 GPU 的 CNN 的层自适应和多类型中间导向内存优化
- DOI:10.1145/3357238
- 发表时间:2019-12-01
- 期刊:ACM TRANSACTIONS ON ARCHITECTURE AND CODE OPTIMIZATION
- 影响因子:1.6
- 作者:Jiang, Wenbin;Ma, Yang;Jin, Hai
- 通讯作者:Jin, Hai
一种基于4Bit编码的深度学习梯度压缩算法
- DOI:--
- 发表时间:2020
- 期刊:计算机科学
- 影响因子:--
- 作者:蒋文斌;符 智;彭 晶;祝 简
- 通讯作者:祝 简
Exploiting potential of deep neural networks by layer-wise fine-grained parallelism
通过分层细粒度并行开发深度神经网络的潜力
- DOI:10.1016/j.future.2019.07.054
- 发表时间:2020-01-01
- 期刊:FUTURE GENERATION COMPUTER SYSTEMS-THE INTERNATIONAL JOURNAL OF ESCIENCE
- 影响因子:7.5
- 作者:Jiang, Wenbin;Zhang, Yangsong;Jin, Hai
- 通讯作者:Jin, Hai
Layer-Centric Memory Reuse and Data Migration for Extreme-Scale Deep Learning on Many-Core Architectures
用于多核架构上超大规模深度学习的以层为中心的内存重用和数据迁移
- DOI:10.1145/3243904
- 发表时间:2018-09
- 期刊:ACM Transactions on Architecture and Code Optimization
- 影响因子:1.6
- 作者:Hai Jin;Bo Liu;Wenbin Jiang;Yang Ma;Xuanhua Shi;Bingsheng He;Shaofeng Zhao
- 通讯作者:Shaofeng Zhao
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
经后路全脊椎切除术治疗重度僵硬性脊柱畸形的围手术期非神经并发症分析
- DOI:10.3969/j.issn.1004-406x.2016.01.10
- 发表时间:2016
- 期刊:中国脊柱脊髓杂志
- 影响因子:--
- 作者:王迎松;解京明;赵智;李韬;毕尼;蒋文斌;彭 丰
- 通讯作者:彭 丰
基于价格传导视角的“稻强米弱”成因探析:国际价格冲击抑或产业链传导受阻?
- DOI:--
- 发表时间:2016
- 期刊:当代经济科学
- 影响因子:--
- 作者:武舜臣;蒋文斌;曹宝明
- 通讯作者:曹宝明
不对称重组酶介导扩增结合分子信标检测金黄色葡萄球菌方法的建立与应用
- DOI:10.3760/cma.j.issn.1009-9158.2017.04.019
- 发表时间:2017
- 期刊:中华检验医学杂志
- 影响因子:--
- 作者:周琳;徐欢;杨成;张峰领;罗杰;蒋文斌;汪超;唱凯;鲁卫平;陈鸣
- 通讯作者:陈鸣
LDR-ULP结合荧光定量PCR快速检测β-地中海贫血的应用研究
- DOI:--
- 发表时间:2016
- 期刊:中国检验医学杂志
- 影响因子:--
- 作者:徐欢;杨成;李发科;罗杰;蒋文斌;张峰领;汪超;颜保松;唱凯;陈鸣
- 通讯作者:陈鸣
肺癌细胞中NF-κB2基因表达及启动子区域甲基化状态分析
- DOI:--
- 发表时间:2014
- 期刊:免疫学杂志
- 影响因子:--
- 作者:蒋文斌;李时飞;王丰;许雪青;杨绍俊;贾双荣;李发科;商亚;陈鸣
- 通讯作者:陈鸣
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}

内容获取失败,请点击重试

查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图

请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
蒋文斌的其他基金
深度图神经网络系统与模型融合优化方法研究
- 批准号:62372199
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
面向普适环境的流媒体柔性机理与调度策略研究
- 批准号:60903173
- 批准年份:2009
- 资助金额:18.0 万元
- 项目类别:青年科学基金项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}