CAREER: Structure Exploiting Multi-Agent Reinforcement Learning for Large Scale Networked Systems: Locality and Beyond
职业:为大规模网络系统利用多智能体强化学习的结构:局部性及其他
基本信息
- 批准号:2339112
- 负责人:
- 金额:$ 50万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2024
- 资助国家:美国
- 起止时间:2024-01-01 至 2028-12-31
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
This project aims to develop a suite of Multi-Agent Reinforcement Learning (MARL) algorithms for the control of networked systems, which are ubiquitous and play an indispensable role in advancing our modern society. Examples cut across a broad spectrum, including power/energy grid, transportation systems, networked robots, etc. The control and operation of such systems have long been a tremendous challenge, due to the complex interdependence between different components in the system, the increasing number of connected and interacting agents, and the increasing environmental uncertainties. The project will bring transformative change to how networked systems are controlled and operated, achieved by using MARL to design novel policies with order-of-magnitude improvement in efficiency and reliability under complex and uncertain environments. The intellectual merit focuses on a unique structure-exploiting approach for MARL. Most of the existing MARL approaches take a black-box view of the underlying system without utilizing the underlying structure and are known to have scalability and stability/safety issues. In contrast, real-world systems have rich structural properties that are readily available to exploit, e.g. the connectivity topology in the power grid. In light of the above structural properties, the project exploits the underlying structure to design scalable, stable, and safe MARL for large-scale networked systems. The proposed framework is not only theoretically sound but also widely applicable. To show the wide applicability of the approach, this project will demonstrate it on power systems and load balancing in multiserver systems. The broader impacts introduce a unique structure-exploiting perspective, that is machine learning should be integrated with the structural property of specific engineering applications. The project includes plans to broaden the impact of this perspective. Beyond the research itself, the project includes a synergistic education, diversity, and a broadening participation plan: (a) development of a new course at the intersection of machine learning and engineering networked systems; (b) K12 curriculum development and outreach activities through the CMU Gelfand Outreach program; and (c) undergraduates research through the SURF program.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
该项目旨在开发一套用于控制网络系统的多智能体强化学习(MARL)算法,这些算法无处不在,在推动现代社会发展中发挥着不可或缺的作用。例子涉及广泛,包括电力/能源网、交通系统、网络机器人等。由于系统中不同组件之间复杂的相互依赖关系,此类系统的控制和操作长期以来一直是一个巨大的挑战。相互关联和相互作用的主体的数量,以及日益增加的环境不确定性。 该项目将为网络系统的控制和操作方式带来革命性的变化,通过使用 MARL 设计新颖的策略来实现,在复杂和不确定的环境下,效率和可靠性将得到数量级的提高。 智力优势集中在 MARL 独特的结构开发方法上。大多数现有的 MARL 方法都采用底层系统的黑盒视图,而不利用底层结构,并且已知存在可扩展性和稳定性/安全性问题。相比之下,现实世界的系统具有丰富的结构属性,很容易被利用,例如电网中的连接拓扑。鉴于上述结构特性,该项目利用底层结构为大规模网络系统设计可扩展、稳定、安全的MARL。所提出的框架不仅理论上合理,而且具有广泛的适用性。为了展示该方法的广泛适用性,该项目将在多服务器系统中的电源系统和负载平衡上进行演示。 更广泛的影响引入了独特的结构利用视角,即机器学习应该与特定工程应用的结构特性相结合。该项目包括扩大这一观点影响的计划。除了研究本身之外,该项目还包括协同教育、多样性和扩大参与计划:(a) 开发机器学习和工程网络系统交叉点的新课程; (b) 通过卡内基梅隆大学格尔凡德外展计划开展 K12 课程开发和外展活动; (c) 本科生通过 SURF 计划进行研究。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力价值和更广泛的影响审查标准进行评估,被认为值得支持。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Guannan Qu其他文献
Deep Reinforcement Learning-Based Spatiotemporal Decision of Utility-Scale Highway Portable Energy Storage Systems
基于深度强化学习的公用事业规模高速公路便携式储能系统时空决策
- DOI:
10.1109/tia.2023.3274729 - 发表时间:
2024-01-01 - 期刊:
- 影响因子:4.4
- 作者:
Yongkang Ding;Guannan Qu;Xinjiang Chen;Jianxiao Wang;Jie Song;Guannan He - 通讯作者:
Guannan He
Accelerated Distributed Nesterov Gradient Descent for smooth and strongly convex functions
用于平滑和强凸函数的加速分布式 Nesterov 梯度下降
- DOI:
10.1109/allerton.2016.7852231 - 发表时间:
2016-09-01 - 期刊:
- 影响因子:0
- 作者:
Guannan Qu;Na Li - 通讯作者:
Na Li
Distributed Optimal Voltage Control With Asynchronous and Delayed Communication
具有异步和延迟通信的分布式最优电压控制
- DOI:
- 发表时间:
2019 - 期刊:
- 影响因子:9.6
- 作者:
S. Magnússon;Guannan Qu;Na Li - 通讯作者:
Na Li
Elastic scaling of virtual clusters in cloud data center networks
云数据中心网络中虚拟集群的弹性扩展
- DOI:
10.1109/pccc.2017.8280437 - 发表时间:
2017-12-01 - 期刊:
- 影响因子:0
- 作者:
Shuaibing Lu;Zhiyi Fang;Jie Wu;Guannan Qu - 通讯作者:
Guannan Qu
Equipping Black-Box Policies with Model-Based Advice for Stable Nonlinear Control
为黑盒策略配备基于模型的建议以实现稳定的非线性控制
- DOI:
10.48550/arxiv.2206.01341 - 发表时间:
2022-06-02 - 期刊:
- 影响因子:0
- 作者:
Tongxin Li;Ruixiao Yang;Guannan Qu;Yiheng Lin;S. Low;A. Wierman - 通讯作者:
A. Wierman
Guannan Qu的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Guannan Qu', 18)}}的其他基金
Collaborative Research: Data-driven Power Systems Control with Stability Guarantees
合作研究:数据驱动的电力系统控制与稳定性保证
- 批准号:
2154171 - 财政年份:2022
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
相似国自然基金
钢-镍异种金属激光焊接过渡层组织结构精准调控机理及高温性能
- 批准号:52305390
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
SVCI疾病进展中多尺度脑结构-功能耦合演变规律的研究
- 批准号:82302142
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
睡眠剥夺通过上调BMAL1/IL-17轴促进三级淋巴结构形成加重哮喘的研究
- 批准号:82300039
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于传统桥梁营造智慧的现代木结构模块化集成建筑(T-MiC)设计体系
- 批准号:52378023
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
随机阻尼波动方程的高效保结构算法研究
- 批准号:12301518
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
相似海外基金
CAREER: Advancing Efficient Global Optimization of Extremely Expensive Functions under Uncertainty using Structure-Exploiting Bayesian Methods
职业:使用结构利用贝叶斯方法在不确定性下推进极其昂贵的函数的高效全局优化
- 批准号:
2237616 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
CAREER: Exploiting Time Dependent Behavior and Structure in Developing Programmable Materials
职业:利用时间相关行为和结构开发可编程材料
- 批准号:
2145803 - 财政年份:2022
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Exploiting the Hydrophobic Glycosyl Pocket of IgG1 for Imaging and Drug Delivery Applications
利用 IgG1 的疏水性糖基口袋进行成像和药物输送应用
- 批准号:
10458034 - 财政年份:2021
- 资助金额:
$ 50万 - 项目类别:
Exploiting the Hydrophobic Glycosyl Pocket of IgG1 for Imaging and Drug Delivery Applications
利用 IgG1 的疏水性糖基口袋进行成像和药物输送应用
- 批准号:
10627830 - 财政年份:2021
- 资助金额:
$ 50万 - 项目类别:
CAREER: Structure-Exploiting Optimization for Power Systems and Applications to Large-Scale Networks
职业:电力系统的结构利用优化和大规模网络的应用
- 批准号:
2047462 - 财政年份:2021
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant