CIF: Small: Coding Techniques for Distributed Machine Learning

CIF:小型:分布式机器学习的编码技术

基本信息

  • 批准号:
    1910447
  • 负责人:
  • 金额:
    $ 50万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2019
  • 资助国家:
    美国
  • 起止时间:
    2019-10-01 至 2020-12-31
  • 项目状态:
    已结题

项目摘要

Modern machine learning models have achieved great success and have been widely deployed across many sectors. As the size of data used to train machine learning models keeps growing, it is now routine to use distributed computing infrastructures such as the cloud. This strategy allows the computation of training to be distributed among a large number of nodes hosted in the cloud, where each node processes a partition of the whole data set. However, the performance of nodes in the cloud is often unreliable, due to system failures, resource contention, load imbalance, etc., and that unreliability can significantly delay the training process. This project pursues a coding-based framework that not only tolerates the effects of faulty nodes, but also further enhances the performance of machine learning training by dynamically taking advantage of the resources available on all nodes, whether they are faulty or not. The outcomes of this project should lead to a significant performance boost for distributed training of machine learning models.To enable the efficient use of distributed computing across unreliable infrastructure for training machine learning models from big data sets, the technical objectives of this project are divided into three levels. This project will first study coding theory for distributed matrix multiplication, a universal operation in various machine learning algorithms, and propose a coding framework with both fault tolerance and a significant performance boost. This framework will then be applied into parameter servers at the architecture level and deep neural networks at the model level, respectively. Combining these three parts, this work will lead to a practical coding framework that can efficiently scale out computation on heterogeneous unreliable nodes, where the coding schemes will be applied to distributed machine learning at different levels including fundamental arithmetic, architectures, and models.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
现代机器学习模型取得了巨大的成功,并已广泛部署在许多领域。随着用于训练机器学习模型的数据的大小不断增长,现在使用分布式计算基础架构(例如云)是常规的。该策略允许对训练的计算分布在云中托管的大量节点之间,其中每个节点都会处理整个数据集的分区。但是,由于系统故障,资源争夺,负载不平衡等,云中节点的性能通常是不可靠的,并且不可靠会大大延迟培训过程。该项目追求一个基于编码的框架,该框架不仅可以容忍故障节点的效果,而且还通过动态利用所有节点上可用的资源(无论它们是否有故障)而进一步增强了机器学习培训的性能。该项目的结果应为机器学习模型的分布式培训带来重大的性能提升。为了有效利用来自不可靠的基础架构的分布式计算,用于从大数据集中培训机器学习模型,该项目的技术目标被分为三个级别。该项目将首先研究用于分布式矩阵乘法的编码理论,这是各种机器学习算法中的通用操作,并提出了具有故障耐受性和显着性能提升的编码框架。然后,该框架将分别在体系结构级别和模型级别的深神经网络上应用于参数服务器。结合这三个部分,这项工作将导致一个实用的编码框架,可以有效地扩展对异质不可靠的节点进行计算,在该节点中,编码方案将应用于不同级别的分布式机器学习,包括基本算术,建筑,建筑和模型,这些奖项通过NSF的法规及其构成的范围来表现出来,这反映了NSF的范围,并具有宽广的影响。 标准。

项目成果

期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Leveraging Stragglers in Coded Computing with Heterogeneous Servers
Straggler-free Coding for Concurrent Matrix Multiplications
Local Re-encoding for Coded Matrix Multiplication
编码矩阵乘法的本地重新编码
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Jun Li其他文献

Long-term failure of alveologenesis after an early short-term exposure to a PDGF-receptor antagonist.
早期短期暴露于 PDGF 受体拮抗剂后肺泡发生长期失败。
The space of surface group representations
  • DOI:
    10.1007/bf02599310
  • 发表时间:
    1993-12
  • 期刊:
  • 影响因子:
    0.6
  • 作者:
    Jun Li
  • 通讯作者:
    Jun Li
Analysis of Pixel-level Remote Sensing Image Fusion Methods: Analysis of Pixel-level Remote Sensing Image Fusion Methods
  • DOI:
    10.3724/sp.j.1047.2008.00128
  • 发表时间:
    2008-01
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Jun Li
  • 通讯作者:
    Jun Li
Translational research of a novel humanized epidermal growth factor receptor-related protein: a putative inhibitor of pan-ErbB
新型人源化表皮生长因子受体相关蛋白的转化研究:泛 ErbB 的假定抑制剂
Intrinsic Adjuvanticity of Branched Polyethylenemine In Vitro and Subcutaneously
支化聚乙烯胺体外和皮下的内在佐剂作用
  • DOI:
    10.1021/acsapm.9b01016
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    5
  • 作者:
    Chen Shen;Yujie Gao;Jun Li;Hongyao Du;Ruijing Liang;Yanhong Sun;Jun Xie;Liyun Dong;Yamin Zhang;Jinjin Zhu;Bo Zhang;Guanxin Shen;Xiang Chen;Jintao Zhu;Juan Tao
  • 通讯作者:
    Juan Tao

Jun Li的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Jun Li', 18)}}的其他基金

Integrated Multiscale Computational and Experimental Investigations on Fracture of Additively Manufactured Polymer Composites
增材制造聚合物复合材料断裂的综合多尺度计算和实验研究
  • 批准号:
    2309845
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Discovery Projects - Grant ID: DP210101100
发现项目 - 拨款 ID:DP210101100
  • 批准号:
    ARC : DP210101100
  • 财政年份:
    2021
  • 资助金额:
    $ 50万
  • 项目类别:
    Discovery Projects
Explore Electrocatalysis to Improve the Cathode Performance in Li-S Batteries
探索电催化提高锂硫电池正极性能
  • 批准号:
    2054754
  • 财政年份:
    2021
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CIF: Small: Coding Techniques for Distributed Machine Learning
CIF:小型:分布式机器学习的编码技术
  • 批准号:
    2101388
  • 财政年份:
    2020
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Offline and Online Change-point Analysis for Large-scale Time Series Data
大规模时间序列数据的离线和在线变点分析
  • 批准号:
    1916239
  • 财政年份:
    2019
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
A Novel Fuel Cell Catalyst and Support Architecture Based on Edge-site Pyridinic Nitrogen-Doping on Vertically Aligned Conical Carbon Nanofibers
基于垂直排列锥形碳纳米纤维边缘位吡啶氮掺杂的新型燃料电池催化剂和支撑结构
  • 批准号:
    1703263
  • 财政年份:
    2017
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
SUSCHEM: Exploring Specific Heating in Microwave-assisted Synthesis of Hierarchical Hybrid Nanomaterials for Future Sustainable Batteries
SUSCHEM:探索微波辅助合成未来可持续电池的分层混合纳米材料中的比热
  • 批准号:
    1707585
  • 财政年份:
    2017
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CAREER: Genetic and Molecular Mechanisms of Parasite Infection in Insects
职业:昆虫寄生虫感染的遗传和分子机制
  • 批准号:
    1742644
  • 财政年份:
    2017
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
TWC: Medium: Collaborative: Online Social Network Fraud and Attack Research and Identification
TWC:媒介:协作:在线社交网络欺诈和攻击研究与识别
  • 批准号:
    1564348
  • 财政年份:
    2016
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CAREER: Genetic and Molecular Mechanisms of Parasite Infection in Insects
职业:昆虫寄生虫感染的遗传和分子机制
  • 批准号:
    1453287
  • 财政年份:
    2015
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant

相似国自然基金

BmNPV circRNA-000010编码小肽VSP39抑制NF-κB信号通路促进病毒增殖的分子机制
  • 批准号:
    32302815
  • 批准年份:
    2023
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目
PTEN上游uORF编码的小肽MP31破坏线粒体质控网络抑制恶性胶质瘤进展的机制探究
  • 批准号:
    82372694
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
tRNA来源的新型非编码小RNA调控成骨分化的作用机制研究
  • 批准号:
    82360177
  • 批准年份:
    2023
  • 资助金额:
    32 万元
  • 项目类别:
    地区科学基金项目
CircFBXO7编码小肽调控合并糖尿病的下肢动脉硬化闭塞症血管内皮细胞铁死亡的机制探索
  • 批准号:
    82300554
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于翻译组学理论探究LncRNA H19编码多肽PELRM促进小胶质细胞活化介导电针巨刺改善膝关节术后疼痛的机制研究
  • 批准号:
    82305399
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Collaborative Research: CIF: Small: Maximizing Coding Gain in Coded Computing
协作研究:CIF:小型:最大化编码计算中的编码增益
  • 批准号:
    2327509
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: Theory for Learning Lossless and Lossy Coding
协作研究:CIF:小型:学习无损和有损编码的理论
  • 批准号:
    2324396
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: Maximizing Coding Gain in Coded Computing
协作研究:CIF:小型:最大化编码计算中的编码增益
  • 批准号:
    2327510
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: Theory for Learning Lossless and Lossy Coding
协作研究:CIF:小型:学习无损和有损编码的理论
  • 批准号:
    2324397
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CIF: Small: Fundamental Communication Latency Limits Beyond the Traditional Block-Coding Architecture
CIF:小:超越传统块编码架构的基本通信延迟限制
  • 批准号:
    2309887
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了