CRII: CPS: Towards a Model-Based Reinforcement Learning Approach for Safe Operation of Distributed Energy Systems
CRII:CPS:面向分布式能源系统安全运行的基于模型的强化学习方法
基本信息
- 批准号:1850206
- 负责人:
- 金额:$ 17.2万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2019
- 资助国家:美国
- 起止时间:2019-05-01 至 2022-04-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
With the increasing penetration of renewables on the electric grid and ready availability of real-time data about electricity usage, the electric power grid is becoming a large-scale complex Cyber-Physical System (CPS) to meet consumer demands for electricity through the day, every day. Reinforcement learning (RL) algorithms offer these CPS systems an approach to seamlessly integrating distributed energy sources into the legacy electric grid more efficiently, effectively and affordably. It also offers significant potential savings in capital investment cost and labor, and greater resiliency to disruptions in service. This research project develops a framework for model-based online reinforcement learning to address several classes of problems. First, it models control of energy CPS as finite horizon RL problems. Second, instead of focusing on asymptotic convergence, this project focuses on optimal finite time performance. Third, while a simplistic learning algorithm might drive an energy CPS to an unsafe region of operations, thereby risking unwanted consequences, this project develops safe RL algorithms that optimize performance and respect safety constraints. Fourth, this project exploits the physical properties of the energy CPS to avoid the dimensionality problems, often associated with RL problems. Lastly, the project develops sequential algorithms using a "contextual bandits" approach for learning consumer specific parameters and adaptively scheduling to account for consumer usage.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
随着可再生能源在电网中的渗透率不断提高以及实时用电数据的可用性,电网正在成为一个大型复杂的网络物理系统(CPS),以满足消费者全天的用电需求,每天。 强化学习 (RL) 算法为这些 CPS 系统提供了一种更高效、更有效且经济实惠地将分布式能源无缝集成到传统电网的方法。 它还可以显着节省资本投资成本和劳动力,并提高对服务中断的恢复能力。该研究项目开发了一个基于模型的在线强化学习框架,以解决几类问题。首先,它将能量 CPS 的控制建模为有限视野 RL 问题。其次,该项目不关注渐近收敛,而是关注最优有限时间性能。第三,虽然简单的学习算法可能会将能源 CPS 驱动到不安全的操作区域,从而冒出现不良后果的风险,但该项目开发了安全的 RL 算法,可以优化性能并尊重安全约束。第四,该项目利用能量 CPS 的物理特性来避免通常与 RL 问题相关的维数问题。 最后,该项目使用“上下文强盗”方法开发顺序算法,用于学习消费者特定参数并自适应调度以考虑消费者的使用情况。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力优势和更广泛的评估进行评估,被认为值得支持。影响审查标准。
项目成果
期刊论文数量(9)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Learning with Safety Constraints: Sample Complexity of Reinforcement Learning for Constrained MDPs.
安全约束学习:受限 MDP 强化学习的样本复杂性。
- DOI:
- 发表时间:2021-01
- 期刊:
- 影响因子:0
- 作者:Aria HasanzadeZonuzy; Archana Bura
- 通讯作者:Archana Bura
Reinforcement Learning for Mean Field Games with Strategic Complementarities
具有战略互补性的平均场博弈的强化学习
- DOI:
- 发表时间:2024-09-14
- 期刊:
- 影响因子:0
- 作者:Kiyeob Lee;Desik Rengarajan;D. Kalathil;S. Shakkottai
- 通讯作者:S. Shakkottai
Bounded Regret for Finitely Parameterized Multi-Armed Bandits
有限参数化多臂老虎机的有限遗憾
- DOI:10.1109/lcsys.2020.3008798
- 发表时间:2021-07
- 期刊:
- 影响因子:3
- 作者:Panaganti, Kishan;Kalathil, Dileep
- 通讯作者:Kalathil, Dileep
Fully Decentralized Reinforcement Learning-Based Control of Photovoltaics in Distribution Grids for Joint Provision of Real and Reactive Power
完全分散的基于强化学习的配电网光伏控制,共同提供有功和无功功率
- DOI:10.1109/oajpe.2021.3077218
- 发表时间:2020-08-03
- 期刊:
- 影响因子:3.8
- 作者:Rayan El Helou;D. Kalathil;Le Xie
- 通讯作者:Le Xie
Sample Complexity of Robust Reinforcement Learning with a Generative Model
使用生成模型的鲁棒强化学习的样本复杂性
- DOI:
- 发表时间:2022-03
- 期刊:
- 影响因子:0
- 作者:Panaganti, Kishan;Kalathil, Dileep
- 通讯作者:Kalathil, Dileep
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Dileep Kalathil其他文献
Decoupled Data-Based Approach for Learning to Control Nonlinear Dynamical Systems
用于学习控制非线性动力系统的基于解耦数据的方法
- DOI:
10.1109/tac.2021.3108552 - 发表时间:
2021 - 期刊:
- 影响因子:6.8
- 作者:
Ran Wang;Karthikeya S. Parun;i;Dan Yu;Dileep Kalathil;Suman Chakravorty - 通讯作者:
Suman Chakravorty
Dileep Kalathil的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Dileep Kalathil', 18)}}的其他基金
CAREER: Towards a Principled Framework for Resilient, Data Efficient and Scalable Reinforcement Learning for Control
职业:建立一个有弹性、数据高效且可扩展的强化学习控制原则框架
- 批准号:
2045783 - 财政年份:2021
- 资助金额:
$ 17.2万 - 项目类别:
Continuing Grant
相似国自然基金
CPs/MOFs介导多烯衍生物拓扑光聚合的高立体选择性构建策略研究
- 批准号:22361004
- 批准年份:2023
- 资助金额:32 万元
- 项目类别:地区科学基金项目
尿素循环关键酶CPS1表达异常在肺癌转移中的作用和机制研究
- 批准号:82273390
- 批准年份:2022
- 资助金额:52 万元
- 项目类别:面上项目
基于数字孪生的智能车间CPS混沌预测与控制方法
- 批准号:
- 批准年份:2022
- 资助金额:54 万元
- 项目类别:面上项目
具有cps4I的植物乳杆菌在拮抗空肠弯曲杆菌中的作用和机制解析
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
面向复杂时序逻辑任务的CPS系统分布式预测控制
- 批准号:62173224
- 批准年份:2021
- 资助金额:58 万元
- 项目类别:面上项目
相似海外基金
CRII: CPS: Towards Efficient Shared Electric Micromobility: An Interaction-aware Management Framework for Mobile Cyber-Physical Systems
CRII:CPS:迈向高效共享电动微移动:移动网络物理系统的交互感知管理框架
- 批准号:
2246080 - 财政年份:2023
- 资助金额:
$ 17.2万 - 项目类别:
Standard Grant
CRII: CPS: Towards Optimal Information Gathering in Unknown Stochastic Environments
CRII:CPS:在未知随机环境中实现最佳信息收集
- 批准号:
1929571 - 财政年份:2018
- 资助金额:
$ 17.2万 - 项目类别:
Standard Grant
CRII: CPS: Towards an Intelligent Low-Altitude UAS Traffic Management System
CRII:CPS:迈向智能低空无人机交通管理系统
- 批准号:
1565979 - 财政年份:2016
- 资助金额:
$ 17.2万 - 项目类别:
Standard Grant
CRII: CPS: Towards Optimal Information Gathering in Unknown Stochastic Environments
CRII:CPS:在未知随机环境中实现最佳信息收集
- 批准号:
1566240 - 财政年份:2016
- 资助金额:
$ 17.2万 - 项目类别:
Standard Grant
CRII: CPS: Towards Reliable Cyber-Physical Systems using Unreliable Human Sensors
CRII:CPS:使用不可靠的人体传感器实现可靠的网络物理系统
- 批准号:
1566465 - 财政年份:2016
- 资助金额:
$ 17.2万 - 项目类别:
Standard Grant