CPS: Medium: Collaborative Research: Developing Data-driven Robustness and Safety from Single Agent Settings to Stochastic Dynamic Teams: Theory and Applications

CPS:中:协作研究:从单代理设置到随机动态团队开发数据驱动的鲁棒性和安全性:理论与应用

基本信息

  • 批准号:
    2240982
  • 负责人:
  • 金额:
    $ 32万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2023
  • 资助国家:
    美国
  • 起止时间:
    2023-06-01 至 2026-05-31
  • 项目状态:
    未结题

项目摘要

This Cyber-Physical Systems (CPS) project will make foundational methodological advances that enable safe and robust reinforcement learning (RL)-based control algorithmic solutions that are driven by problems in smart traffic signal control systems. Recent advances in computation, communication, storage, and sensing have led to a demand for data-driven learning-based decision-making and control in modern cyber-physical systems (CPSs), such as smart transportation systems. In such systems, decision-making agents need to operate safely and in a robust manner while working in complex environments with constraints that need to be respected. This project will develop foundational advances in robust RL solutions, and safe and constrained RL with provable guarantees by taking traffic signal control systems within smart transportation systems as our motivating CPS application and evaluation platform. This work will additionally focus on advancing curriculum development, recruitment of students from under-represented groups, involvement of undergraduate students in research, K-12 outreach, and also research community outreach via workshops, conference sessions, and seminars. The researchers will interface with companies and other stakeholders to communicate the results of the research as well as provide them with educational material on methodology. The technical approaches include: 1. Robust RL solutions incorporating model class knowledge, use of future predictions and robustness characterizations, and off-policy methods to address distributional shifts and data paucity arising from the use of a simulator/emulator or offline data; and 2. Efficient, safe, and constrained RL algorithms using model-free approaches and function-approximated methods, and also methods for partially-observed systems. To close the loop with the motivating CPS application, the RL algorithms will be evaluated in the context of traffic signal control via a comprehensive simulation-based evaluation using models of two instrumented sites.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
该网络物理系统(CPS)项目将使基础方法学进步能够实现安全,强大的增强学习(RL)基于控制的控制算法解决方案,这些解决方案是由智能交通信号控制系统中问题驱动的。计算,通信,存储和感知的最新进展已导致对基于数据驱动的学习的决策和控制的需求,例如智能运输系统等现代网络物理系统(CPSS)。在这样的系统中,决策代理需要在需要受到尊重的限制的复杂环境中工作,在复杂的环境中工作。该项目将在强大的RL解决方案中发展基本进步,并通过将交通信号控制系统在智能运输系统中作为我们激励的CPS应用程序和评估平台,并获得可证明的保证和可证明的保证。 这项工作还将着重于推进课程开发,从代表性不足的群体中招募学生,本科生参与研究,K-12外展活动,以及通过研讨会,会议课程和研讨会的研究社区外展活动。研究人员将与公司和其他利益相关者进行交流,以传达研究结果,并为他们提供有关方法论的教育材料。技术方法包括:1。结合模型类知识的鲁棒RL解决方案,使用未来的预测和鲁棒性特征以及通过使用模拟器/emulator或离线数据引起的分布变化和数据匮乏的非政策方法;和2。使用无模型方法和功能评估方法的有效,安全和约束的RL算法,以及针对部分观察到的系统的方法。为了通过激励CPS应用程序结束循环,将通过使用两个仪器站点的模型进行基于综合的基于仿真的评估来评估RL算法。该奖项反映了NSF的法定任务,并被认为是值得通过基金会的智力和更广泛影响的评估来通过评估来获得支持的值得审查。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Debankur Mukherjee其他文献

Asymptotic Optimality of Power-of-d Load Balancing in Large-Scale Systems
大型系统中 d 次方负载平衡的渐近最优性
  • DOI:
    10.1287/moor.2019.1042
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Debankur Mukherjee;S. Borst;J. V. Leeuwaarden;P. Whiting
  • 通讯作者:
    P. Whiting
Rates of convergence of the join the shortest queue policy for large-system heavy traffic
大型系统大流量加入最短队列策略的收敛率
  • DOI:
    10.1007/s11134-022-09803-5
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    1.2
  • 作者:
    Debankur Mukherjee
  • 通讯作者:
    Debankur Mukherjee
Aktueller Stand zur Neurobiologie von COVID-19
COVID-19 神经生物学最新立场
  • DOI:
    10.1055/a-1213-1778
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Daan Rutten;Nicolas H. Christianson;Debankur Mukherjee;A. Wierman
  • 通讯作者:
    A. Wierman
Best of Both Worlds: Stochastic and Adversarial Convex Function Chasing
两全其美:随机和对抗性凸函数追逐
  • DOI:
    10.48550/arxiv.2311.00181
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Neelkamal Bhuyan;Debankur Mukherjee;Adam Wierman
  • 通讯作者:
    Adam Wierman
Independent-set reconfiguration thresholds of hereditary graph classes
  • DOI:
    10.1016/j.dam.2018.05.029
  • 发表时间:
    2018-12-11
  • 期刊:
  • 影响因子:
  • 作者:
    Mark de Berg;Bart M.P. Jansen;Debankur Mukherjee
  • 通讯作者:
    Debankur Mukherjee

Debankur Mukherjee的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Debankur Mukherjee', 18)}}的其他基金

CIF: Small: Load Balancing for Cloud Networks: Data Locality Issues and Modern Algorithms
CIF:小型:云网络的负载平衡:数据局部性问题和现代算法
  • 批准号:
    2113027
  • 财政年份:
    2021
  • 资助金额:
    $ 32万
  • 项目类别:
    Standard Grant

相似国自然基金

复合低维拓扑材料中等离激元增强光学响应的研究
  • 批准号:
    12374288
  • 批准年份:
    2023
  • 资助金额:
    52 万元
  • 项目类别:
    面上项目
基于管理市场和干预分工视角的消失中等企业:特征事实、内在机制和优化路径
  • 批准号:
    72374217
  • 批准年份:
    2023
  • 资助金额:
    41.00 万元
  • 项目类别:
    面上项目
托卡马克偏滤器中等离子体的多尺度算法与数值模拟研究
  • 批准号:
    12371432
  • 批准年份:
    2023
  • 资助金额:
    43.5 万元
  • 项目类别:
    面上项目
中等质量黑洞附近的暗物质分布及其IMRI系统引力波回波探测
  • 批准号:
    12365008
  • 批准年份:
    2023
  • 资助金额:
    32 万元
  • 项目类别:
    地区科学基金项目
中等垂直风切变下非对称型热带气旋快速增强的物理机制研究
  • 批准号:
    42305004
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Collaborative Research: CPS: Medium: Automating Complex Therapeutic Loops with Conflicts in Medical Cyber-Physical Systems
合作研究:CPS:中:自动化医疗网络物理系统中存在冲突的复杂治疗循环
  • 批准号:
    2322534
  • 财政年份:
    2024
  • 资助金额:
    $ 32万
  • 项目类别:
    Standard Grant
Collaborative Research: CPS: Medium: Automating Complex Therapeutic Loops with Conflicts in Medical Cyber-Physical Systems
合作研究:CPS:中:自动化医疗网络物理系统中存在冲突的复杂治疗循环
  • 批准号:
    2322533
  • 财政年份:
    2024
  • 资助金额:
    $ 32万
  • 项目类别:
    Standard Grant
Collaborative Research: CPS: Medium: Physics-Model-Based Neural Networks Redesign for CPS Learning and Control
合作研究:CPS:中:基于物理模型的神经网络重新设计用于 CPS 学习和控制
  • 批准号:
    2311084
  • 财政年份:
    2023
  • 资助金额:
    $ 32万
  • 项目类别:
    Standard Grant
CPS: Medium: Collaborative Research: Provably Safe and Robust Multi-Agent Reinforcement Learning with Applications in Urban Air Mobility
CPS:中:协作研究:可证明安全且鲁棒的多智能体强化学习及其在城市空中交通中的应用
  • 批准号:
    2312092
  • 财政年份:
    2023
  • 资助金额:
    $ 32万
  • 项目类别:
    Standard Grant
Collaborative Research: CPS: Medium: Sensor Attack Detection and Recovery in Cyber-Physical Systems
合作研究:CPS:中:网络物理系统中的传感器攻击检测和恢复
  • 批准号:
    2333980
  • 财政年份:
    2023
  • 资助金额:
    $ 32万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了