Data-efficient Safe Control with Recovery-to-Optimality Guarantees
数据高效的安全控制,并保证恢复最佳性
基本信息
- 批准号:2227311
- 负责人:
- 金额:$ 40万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2023
- 资助国家:美国
- 起止时间:2023-08-15 至 2026-07-31
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
As rapid developments on learning-enabled systems in recent years have been advancing autonomy capabilities of systems, their safety certification becomes exceedingly important. While the recent progress on safe reinforcement learning (RL) algorithms for autonomous control design has been promising, these algorithms are accountable only in stable environments and under the availability of comprehensive and high-quality data sets. However, many systems must operate in unpredictable environments under which dangerous divergence might arise between safety and performance. In these environments, adaptation of safety and performance specifications to the context is required. Besides, RL agent must perform learning under realistic data quantity and quality. Current RL practice assumes availability of rich and high-quality data with full observability of the entire system’s states. These assumptions can be violated in many practical systems. This award supports research to create low-complexity safe learning-enabled algorithms for partially observable systems that are equipped with highly-efficient conflict management mechanisms to deliver as much performance as possible safely. Advances will have broad implications in applications of autonomous systems, robots, manufacturing, smart grids, and more.This research project aims to develop low-complexity, safe learning-enabled algorithms for partially observable systems equipped with highly efficient conflict management mechanisms. The objectives of this project are two-fold: 1) Proposing direct data-driven learning approaches for backup safe control policies in partially observable nonlinear systems with uncertain dynamics. The utilization of concepts such as L-extra sample dynamics, probabilistic contractivity, and convex lifting will enable the learning of safe control policies for nonlinear systems with nonconvex safe sets using only measured noisy input-output data. 2) Introducing novel merging approaches to proactively manage conflicts by merging learned backup safe control policies with learning-enabled control policies. Instead of providing reactive quick fixes to conflicts as they arise, these approaches will enable proactive conflict management to avoid destructive future conflicts. Towards conflict management, the level sets of the RL agent will be adapted to the situation to make the agent align with the safety constraint. That is, safety-shaped value functions will be learned to effectively resolve conflicts by considering safety and optimality concerns across the relevant domains.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
近年来,学习型系统的快速发展不断提高系统的自主能力,其安全认证变得极其重要。虽然用于自主控制设计的安全强化学习(RL)算法的最新进展令人鼓舞,但这些算法是负责任的。然而,许多系统必须在不可预测的环境中运行,在这些环境中,安全和性能规范可能会出现危险的差异。此外,RL 代理必须在现实条件下进行学习。当前的强化学习实践假设可以提供丰富且高质量的数据,并且可以完全观察整个系统的状态。该奖项支持创建低复杂性安全学习算法的研究。对于配备高效冲突管理机制以安全地提供尽可能多的性能的部分可观察系统,进步将对自主系统、机器人、制造、智能电网等应用产生广泛影响。该研究项目旨在开发。该项目的目标有两个:1)提出直接数据驱动的学习方法,用于部分可观测非线性系统中的备份安全控制策略。利用 L-额外样本动力学、概率收缩性和凸提升等概念,将能够仅使用测量的噪声来学习具有非凸安全集的非线性系统的安全控制策略。 2) 引入新颖的合并方法,通过将学习的备份安全控制策略与支持学习的控制策略合并来主动管理冲突,这些方法将实现主动的冲突管理,以避免冲突发生。对于冲突管理,强化学习智能体的水平集将根据情况进行调整,使智能体与安全约束保持一致,即学习安全形价值函数,以通过考虑安全性和安全性来有效解决冲突。最优性该奖项反映了 NSF 的法定使命,并通过使用基金会的智力价值和更广泛的影响审查标准进行评估,被认为值得支持。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Bahare Kiumarsi其他文献
Data-Driven Safety-Certified Predictive Control for Linear Systems
线性系统的数据驱动、安全认证的预测控制
- DOI:
- 发表时间:
2023 - 期刊:
- 影响因子:3
- 作者:
Marjan Khaledi;P. Tooranjipour;Bahare Kiumarsi - 通讯作者:
Bahare Kiumarsi
Optimal control of nonlinear discrete time-varying systems using a new neural network approximation structure
使用新的神经网络近似结构的非线性离散时变系统的优化控制
- DOI:
10.1016/j.neucom.2014.12.067 - 发表时间:
2015-05-25 - 期刊:
- 影响因子:6
- 作者:
Bahare Kiumarsi;F. Lewis;D. Levine - 通讯作者:
D. Levine
Safe Off-policy Reinforcement Learning Using Barrier Functions
使用屏障函数的安全离策略强化学习
- DOI:
10.23919/acc45564.2020.9147584 - 发表时间:
2020-07-01 - 期刊:
- 影响因子:0
- 作者:
Z. Marvi;Bahare Kiumarsi - 通讯作者:
Bahare Kiumarsi
Employing Adaptive Particle Swarm Optimization Algorithm for Parameter Estimation of an Exciter Machine
采用自适应粒子群优化算法进行励磁机参数估计
- DOI:
10.1115/1.4005371 - 发表时间:
2024-09-13 - 期刊:
- 影响因子:1.7
- 作者:
A. Darabi;A. Alfi;Bahare Kiumarsi;H. Modares - 通讯作者:
H. Modares
Secure Linear Quadratic Regulator Using Sparse Model-Free Reinforcement Learning
使用稀疏无模型强化学习的安全线性二次调节器
- DOI:
10.1109/cdc40024.2019.9028861 - 发表时间:
2019-12-01 - 期刊:
- 影响因子:0
- 作者:
Bahare Kiumarsi;T. Başar - 通讯作者:
T. Başar
Bahare Kiumarsi的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似国自然基金
基于多维数据特征的异构内存系统高效安全保障方法研究
- 批准号:62302182
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于区块链的跨域数据高效安全共享机制研究
- 批准号:62372266
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
面向多源异构物联网的高效安全数据融合与计算方法研究
- 批准号:62372324
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
面向6G高效数据安全流通的可重构分布式学习机理
- 批准号:62371059
- 批准年份:2023
- 资助金额:52 万元
- 项目类别:面上项目
保障所有权的安全高效数据流通交易机制研究
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
相似海外基金
Integrating spatial and non-spatial data to examine multilevel drivers of HIV risk among adolescent mothers in sub-Saharan Africa
整合空间和非空间数据来研究撒哈拉以南非洲地区青少年母亲艾滋病毒风险的多层次驱动因素
- 批准号:
10700436 - 财政年份:2023
- 资助金额:
$ 40万 - 项目类别:
Development of NAD+ loaded nanoparticles as a safe and efficient strategy to combat sepsis.
开发负载 NAD 的纳米粒子作为对抗脓毒症的安全有效策略。
- 批准号:
10448923 - 财政年份:2022
- 资助金额:
$ 40万 - 项目类别:
Development of NAD+ loaded nanoparticles as a safe and efficient strategy to combat sepsis.
开发负载 NAD 的纳米粒子作为对抗脓毒症的安全有效策略。
- 批准号:
10612911 - 财政年份:2022
- 资助金额:
$ 40万 - 项目类别:
A Novel Oral Insulin Enabling Safe and Efficient Gastrointestinal Transport and Absorption
一种新型口服胰岛素,可实现安全、高效的胃肠道运输和吸收
- 批准号:
10022124 - 财政年份:2019
- 资助金额:
$ 40万 - 项目类别:
A Novel Oral Insulin Enabling Safe and Efficient Gastrointestinal Transport and Absorption
一种新型口服胰岛素,可实现安全、高效的胃肠道运输和吸收
- 批准号:
10412988 - 财政年份:2019
- 资助金额:
$ 40万 - 项目类别: