EAGER: Collaborative Research: Inexactness and Data-Awareness in Network Stacks for Distributed Machine Learning

EAGER:协作研究:分布式机器学习网络堆栈中的不精确性和数据感知

基本信息

  • 批准号:
    1940109
  • 负责人:
  • 金额:
    $ 15万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2019
  • 资助国家:
    美国
  • 起止时间:
    2019-10-01 至 2021-09-30
  • 项目状态:
    已结题

项目摘要

The architectures underlying modern network hardware and software have their roots in designs that were developed decades ago. Even though these architectures have evolved in many ways over the years, they remain unchanged in two key aspects: (1) They support ?exact? or complete/absolute reliable communication (either hop-by-hop, or end-to-end, or both); (2) They adhere to strict layering, and the resulting encapsulation and interfaces hide from lower network layers the semantics of the data applications transmit over the network.These design principles place serious impediments for emerging distributed machine learning (ML) training and inference applications. These applications are seeing adoption in a wide variety of important domains, such as, computer vision, robotics, data science, graphics, and speech recognition. Two distinguishing attributes of these applications are: (1) their computations are intrinsically inexact in nature, because these applications rely on computing or utilizing statistical models, and (2) their input and intermediate data have well-defined structure, i.e., tensors, or multi-dimensional arrays of typed data. Give these attributes, enforcing exact communication in a data semantics-unaware fashion limits the potentially enormous benefits of embracing inexactness in these approximate applications.This project explores co-designing ML applications with layers of the network software and hardware stack to allow application-driven cross-layer optimization for energy efficiency, hardware density/capacity, and performance. Given an application-provided overall inexactness budget, this research will explore both how to systematically apportion the budget across network layers, and how different layers can reconfigure their functionality to achieve different levels of approximation. This project will develop strawman approaches to encoding structured data and to achieving budget-driven inexact computation over it. The research will use experiments, simulations, and analysis to identify performance benefits to ML applications, and fundamental trade-offs that determine the feasibility of this approach. The resulting inexactness-aware ML software stack could drive hitherto unseen performance and accuracy improvements, and potentially drive future innovations in ML algorithms, systems, and applications.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
现代网络硬件和软件的架构源于几十年前的设计。即使这些几年来这些架构在许多方面发展了,但它们在两个关键方面保持不变:(1)它们支持吗?或完整/绝对可靠的通信(无论是跳跃还是端到端,或两者兼而有之); (2)它们遵守严格的分层,由此产生的封装和接口隐藏在下层网络层中数据应用程序通过网络传输的语义。这些设计原理为新兴分布式机器学习(ML)培训和推理应用带来了严重的障碍。这些应用程序正在在各种重要领域中采用,例如计算机视觉,机器人技术,数据科学,图形和语音识别。这些应用程序的两个区别属性是:(1)它们的计算本质上是不确定的,因为这些应用程序依赖于计算或利用统计模型,并且(2)它们的输入和中间数据具有明确定义的结构,即张紧器或多维数据的多维阵列。给出这些属性,在数据语义上实施精确的沟通 - unaware的时尚限制了在这些近似应用中拥抱不精确的巨大好处。本项目探索了具有网络软件和硬件堆栈的共同设计的ML应用程序,以允许应用程序驱动的跨层次驾驶跨层的优化,以优化能源效率,硬件量,硬件密度,硬度/硬度/容量,和性能。鉴于应用程序提供的总体不符合性预算,这项研究将探索如何系统地分配跨网络层的预算,以及不同的层如何重新配置​​其功能以实现不同级别的近似级别。该项目将开发出稻草人的方法来编码结构化数据并实现预算驱动的不精确计算。该研究将使用实验,模拟和分析来确定对ML应用程序的绩效益处,以及决定这种方法可行性的基本权衡。由此产生的不注重的ML软件堆栈可能会推动迄今未见的性能和准确性提高,并有可能推动ML算法,系统和应用程序中未来的创新。该奖项反映了NSF的法定任务,并被认为是通过该基金会的知识功能和广泛影响的评估来评估CRETIRIA的评估,并被视为值得通过评估的支持。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Aditya Akella其他文献

From Dumb Pipes to Rivers of Money: a Network Payment System
从愚蠢的管道到金钱的河流:网络支付系统
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Cristian Estan;Suman Banerjee;Aditya Akella;Yi Pan
  • 通讯作者:
    Yi Pan
Handheld vs. Non-Handheld Traffic: Implications for Campus WiFi Networks
手持设备与非手持设备流量:对校园 WiFi 网络的影响
  • DOI:
  • 发表时间:
    2010
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Aaron Gember;Ashok Anand;Aditya Akella
  • 通讯作者:
    Aditya Akella
Using strongly typed networking to architect for tussle
使用强类型网络来构建斗争
  • DOI:
    10.1145/1868447.1868456
  • 发表时间:
    2010
  • 期刊:
  • 影响因子:
    0
  • 作者:
    C. Muthukrishnan;V. Paxson;M. Allman;Aditya Akella
  • 通讯作者:
    Aditya Akella
Toward Representative Internet Measurements
迈向具有代表性的互联网测量
  • DOI:
  • 发表时间:
    2003
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Aditya Akella;S. Seshan
  • 通讯作者:
    S. Seshan
Running BGP in Data Centers at Scale
在数据中心大规模运行 BGP
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Anubhavnidhi Abhashkumar;Kausik Subramanian;A. Andreyev;Hyojeong Kim;Nanda Kishore Salem;Jingyi Yang;Petr Lapukhov;Aditya Akella;Hongyi Zeng
  • 通讯作者:
    Hongyi Zeng

Aditya Akella的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Aditya Akella', 18)}}的其他基金

Collaborative Research: CNS Core: Medium: Innovating Volumetric Video Streaming with Motion Forecasting, Intelligent Upsampling, and QoE Modeling
合作研究:CNS 核心:中:通过运动预测、智能上采样和 QoE 建模创新体积视频流
  • 批准号:
    2212297
  • 财政年份:
    2022
  • 资助金额:
    $ 15万
  • 项目类别:
    Continuing Grant
Collaborative Research: CNS Core: Large: Runtime Programmable Networks
合作研究:CNS 核心:大型:运行时可编程网络
  • 批准号:
    2214015
  • 财政年份:
    2022
  • 资助金额:
    $ 15万
  • 项目类别:
    Continuing Grant
Collaborative Research: CNS Core: Medium: Systems Support for Federated Learning
协作研究:CNS 核心:中:联邦学习的系统支持
  • 批准号:
    2105890
  • 财政年份:
    2021
  • 资助金额:
    $ 15万
  • 项目类别:
    Continuing Grant
NeTS: Large: Collaborative Research: Design Principles for a Future-Proof Internet Control Plane
NetS:大型:协作研究:面向未来的互联网控制平面的设计原则
  • 批准号:
    2202649
  • 财政年份:
    2021
  • 资助金额:
    $ 15万
  • 项目类别:
    Continuing Grant
CSR: Medium: Security and Isolation in the Era of Microservices
CSR:中:微服务时代的安全与隔离
  • 批准号:
    2203152
  • 财政年份:
    2021
  • 资助金额:
    $ 15万
  • 项目类别:
    Continuing Grant
NeTS: Small: New Abstractions for First-hop Networking in Cloud Data Centers
NeTS:小型:云数据中心第一跳网络的新抽象
  • 批准号:
    2203167
  • 财政年份:
    2021
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
Collaborative Research: CNS Core: Medium: Systems Support for Federated Learning
协作研究:CNS 核心:中:联邦学习的系统支持
  • 批准号:
    2207317
  • 财政年份:
    2021
  • 资助金额:
    $ 15万
  • 项目类别:
    Continuing Grant
CSR: Medium: Security and Isolation in the Era of Microservices
CSR:中:微服务时代的安全与隔离
  • 批准号:
    1763810
  • 财政年份:
    2018
  • 资助金额:
    $ 15万
  • 项目类别:
    Continuing Grant
NeTS: Small: New Abstractions for First-hop Networking in Cloud Data Centers
NeTS:小型:云数据中心第一跳网络的新抽象
  • 批准号:
    1717039
  • 财政年份:
    2017
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
Workshop titled "Toward a Research Agenda for Cloud 3.0"
题为“迈向云 3.0 研究议程”的研讨会
  • 批准号:
    1749528
  • 财政年份:
    2017
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant

相似国自然基金

临时团队协作历史对协作主动行为的影响研究:基于社会网络视角
  • 批准号:
    72302101
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
在线医疗团队协作模式与绩效提升策略研究
  • 批准号:
    72371111
  • 批准年份:
    2023
  • 资助金额:
    41 万元
  • 项目类别:
    面上项目
数智背景下的团队人力资本层级结构类型、团队协作过程与团队效能结果之间关系的研究
  • 批准号:
    72372084
  • 批准年份:
    2023
  • 资助金额:
    40 万元
  • 项目类别:
    面上项目
A-型结晶抗性淀粉调控肠道细菌协作产丁酸机制研究
  • 批准号:
    32302064
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
面向人机接触式协同作业的协作机器人交互控制方法研究
  • 批准号:
    62373044
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目

相似海外基金

Collaborative Research: EAGER: The next crisis for coral reefs is how to study vanishing coral species; AUVs equipped with AI may be the only tool for the job
合作研究:EAGER:珊瑚礁的下一个危机是如何研究正在消失的珊瑚物种;
  • 批准号:
    2333604
  • 财政年份:
    2024
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
EAGER/Collaborative Research: An LLM-Powered Framework for G-Code Comprehension and Retrieval
EAGER/协作研究:LLM 支持的 G 代码理解和检索框架
  • 批准号:
    2347624
  • 财政年份:
    2024
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
EAGER/Collaborative Research: Revealing the Physical Mechanisms Underlying the Extraordinary Stability of Flying Insects
EAGER/合作研究:揭示飞行昆虫非凡稳定性的物理机制
  • 批准号:
    2344215
  • 财政年份:
    2024
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
Collaborative Research: EAGER: Designing Nanomaterials to Reveal the Mechanism of Single Nanoparticle Photoemission Intermittency
合作研究:EAGER:设计纳米材料揭示单纳米粒子光电发射间歇性机制
  • 批准号:
    2345581
  • 财政年份:
    2024
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
Collaborative Research: EAGER: Designing Nanomaterials to Reveal the Mechanism of Single Nanoparticle Photoemission Intermittency
合作研究:EAGER:设计纳米材料揭示单纳米粒子光电发射间歇性机制
  • 批准号:
    2345582
  • 财政年份:
    2024
  • 资助金额:
    $ 15万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了