AF: Small: Communication-Aware Algorithms for Dynamic Allocation of Heterogeneous Resources

AF:小型:用于异构资源动态分配的通信感知算法

基本信息

  • 批准号:
    2335187
  • 负责人:
  • 金额:
    $ 59.94万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2024
  • 资助国家:
    美国
  • 起止时间:
    2024-02-15 至 2027-01-31
  • 项目状态:
    未结题

项目摘要

Modern computer infrastructure systems need to manage vast heterogeneous resources and run computations that are complex, distributed, and dynamic. Often, the distributed nature of the computations demands efficient communication; dynamic resources and computations demand online solutions without full knowledge of the future. For instance, scalable artificial intelligence (AI) requires the effective mapping of dynamic neural network computations into networks of computing devices. This project concerns the design of efficient and effective algorithms for scheduling large-scale computations in distributed infrastructure such as cloud systems and datacenter networks. The expected outcomes of the project are solutions for more effective processing of large AI tasks and resource allocation policies in cloud computing systems, with improved performance for business operations and mission-critical systems. The integrated educational component of the project includes training undergraduate and doctoral students in infrastructure algorithms, curriculum development, and outreach to engage high school students and inspire them to explore careers in math and computing.This project has two major thrusts. The first concerns the scheduling of precedence-constrained jobs and computation graphs in distributed networks and reconfigurable machines. This is motivated by the fact that as computational workloads get larger and more complex, it is often necessary to distribute many communicating jobs across a large network of devices. These devices may have different speeds, different computing capabilities, and restrictions on which jobs they can execute due to resource and security concerns. The second thrust concerns the online migration of computations and servers in a distributed system in response to dynamic requests. One motivation comes from data intensive applications that generate significant network traffic; to enable efficient communication among processes dispersed across many clusters, distributed systems are increasingly reconfigurable and strategically migrate processes to reduce communication. The presented problems include communication-aware scheduling of precedence-constrained jobs in networks with general delays, scheduling of split table jobs in reconfigurable machines, minimum-stretch embedding of graphs, heterogeneous variants of the classic online k-server problem, and online balanced graph partitioning. The technical approaches include new linear-programming based techniques that address communication and topological constraints, and new methods in online algorithms. This project also explores new frameworks for studying these problems, including learning-augmented algorithms through predictions of processing times and communication needs, reconfigurable architectures, and mobile ad hoc networks with heterogeneous devices.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
现代计算机基础设施系统需要管理大量异构资源并运行复杂、分布式和动态的计算。 通常,计算的分布式特性需要高效的通信;动态资源和计算需要在线解决方案,而无需完全了解未来。例如,可扩展的人工智能(AI)需要将动态神经网络计算有效映射到计算设备网络中。该项目涉及设计高效且有效的算法,用于在云系统和数据中心网络等分布式基础设施中调度大规模计算。 该项目的预期成果是更有效地处理大型人工智能任务和云计算系统中的资源分配策略的解决方案,并提高业务运营和关键任务系统的性能。 该项目的综合教育部分包括在基础设施算法、课程开发和外展方面对本科生和博士生进行培训,以吸引高中生并激励他们探索数学和计算领域的职业生涯。该项目有两个主要目标。 第一个涉及分布式网络和可重构机器中优先级约束作业和计算图的调度。 这是因为随着计算工作负载变得越来越大、越来越复杂,通常需要在大型设备网络上分配许多通信作业。这些设备可能具有不同的速度、不同的计算能力,并且由于资源和安全问题,它们可以执行的作业受到限制。 第二个重点涉及分布式系统中计算和服务器的在线迁移,以响应动态请求。动机之一来自于产生大量网络流量的数据密集型应用程序;为了实现分散在多个集群中的进程之间的有效通信,分布式系统越来越可重新配置,并有策略地迁移进程以减少通信。提出的问题包括具有一般延迟的网络中优先级约束作业的通信感知调度、可重构机器中的拆分表作业调度、图的最小拉伸嵌入、经典在线 k-server 问题的异构变体以及在线平衡图分区。这些技术方法包括解决通信和拓扑约束的基于线性规划的新技术,以及在线算法的新方法。该项目还探索了研究这些问题的新框架,包括通过预测处理时间和通信需求的学习增强算法、可重构架构以及具有异构设备的移动自组织网络。该奖项反映了 NSF 的法定使命,并被认为值得支持通过使用基金会的智力优点和更广泛的影响审查标准进行评估。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Rajmohan Rajaraman其他文献

A FIELD THEORY FOR THE READ OPERATOR
读操作符的场理论
Stability of the rotating Skyrmion.
旋转斯格明子的稳定性。
Time-Constrained Scheduling of Weighted Packets on Trees and Meshes
树和网格上加权数据包的时间约束调度
  • DOI:
    10.1007/s00453-002-1019-9
  • 发表时间:
    2003-06-01
  • 期刊:
  • 影响因子:
    1.1
  • 作者:
    Micah Adler;Sanjeev Khanna;Rajmohan Rajaraman;Adi Rosén
  • 通讯作者:
    Adi Rosén
Stability of P2P Networks Under Greedy Peering (Full Version)
贪婪对等下 P2P 网络的稳定性(完整版)
  • DOI:
    10.48550/arxiv.2402.14666
  • 发表时间:
    2024-02-22
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Lucianna Kiffer;Rajmohan Rajaraman
  • 通讯作者:
    Rajmohan Rajaraman

Rajmohan Rajaraman的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Rajmohan Rajaraman', 18)}}的其他基金

AF: Small: Embedding Distributed Computations and Flows in Networks
AF:小型:在网络中嵌入分布式计算和流程
  • 批准号:
    1909363
  • 财政年份:
    2019
  • 资助金额:
    $ 59.94万
  • 项目类别:
    Standard Grant
AF: Small: Network Algorithms Under Adversarial and Stochastic Uncertainty
AF:小:对抗性和随机不确定性下的网络算法
  • 批准号:
    1422715
  • 财政年份:
    2014
  • 资助金额:
    $ 59.94万
  • 项目类别:
    Standard Grant
ICES: Large: Collaborative: The Role of Space, Time and Information in Controlling Epidemics
ICES:大:协作:空间、时间和信息在控制流行病中的作用
  • 批准号:
    1216038
  • 财政年份:
    2012
  • 资助金额:
    $ 59.94万
  • 项目类别:
    Standard Grant
How Blissful is Ignorance? The Role of Obliviousness in Network Optimization
无知有多幸福?
  • 批准号:
    0635119
  • 财政年份:
    2006
  • 资助金额:
    $ 59.94万
  • 项目类别:
    Standard Grant
CAREER: Algorithms for Organizing and Scheduling Distributed Resources
职业:组织和调度分布式资源的算法
  • 批准号:
    9983901
  • 财政年份:
    2000
  • 资助金额:
    $ 59.94万
  • 项目类别:
    Continuing Grant

相似国自然基金

小分子代谢物Catechin与TRPV1相互作用激活外周感觉神经元介导尿毒症瘙痒的机制研究
  • 批准号:
    82371229
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
DHEA抑制小胶质细胞Fis1乳酸化修饰减轻POCD的机制
  • 批准号:
    82301369
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
SETDB1调控小胶质细胞功能及参与阿尔茨海默病发病机制的研究
  • 批准号:
    82371419
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
PTBP1驱动H4K12la/BRD4/HIF1α复合物-PKM2正反馈环路促进非小细胞肺癌糖代谢重编程的机制研究及治疗方案探索
  • 批准号:
    82303616
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

AF: Small: Polynomials, Communication, and Query Complexity
AF:小:多项式、通信和查询复杂性
  • 批准号:
    2220232
  • 财政年份:
    2022
  • 资助金额:
    $ 59.94万
  • 项目类别:
    Standard Grant
AF: Small: Fundamental Questions in Communication and Computation Regarding Edit Type String Measures
AF:小:有关编辑类型字符串测量的通信和计算的基本问题
  • 批准号:
    2127575
  • 财政年份:
    2021
  • 资助金额:
    $ 59.94万
  • 项目类别:
    Standard Grant
Collaborative Research: AF: Small: Parallel Reinforcement Learning with Communication and Adaptivity Constraints
协作研究:AF:小型:具有通信和适应性约束的并行强化学习
  • 批准号:
    2006591
  • 财政年份:
    2020
  • 资助金额:
    $ 59.94万
  • 项目类别:
    Standard Grant
AF: Small: Computational Complexity Lower Bounds: Time, Space and Communication
AF:小:计算复杂度下限:时间、空间和通信
  • 批准号:
    2007462
  • 财政年份:
    2020
  • 资助金额:
    $ 59.94万
  • 项目类别:
    Standard Grant
AF: Small: Intermediate models between communication complexity and query complexity
AF:小:通信复杂度和查询复杂度之间的中间模型
  • 批准号:
    2006443
  • 财政年份:
    2020
  • 资助金额:
    $ 59.94万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了