CRII: RI: Planning and learning with macro-actions in cooperative multiagent systems

CRII:RI:协作多智能体系统中宏观行动的规划和学习

基本信息

  • 批准号:
    1463945
  • 负责人:
  • 金额:
    $ 17.48万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2015
  • 资助国家:
    美国
  • 起止时间:
    2015-02-01 至 2016-11-30
  • 项目状态:
    已结题

项目摘要

The proposal aims at studying the problem of decentralized planning. The general technical area is decentralized partially observable Markov decision process (Dec-POMDP). The PI proposes a theory on macro-actions by using finite-state controllers of Dec-POMDPs. Macro-actions enable the planner to perform multiple planning steps in a single computation cycle whereas a planner using regular actions can only perform one action in each computation cycles. As a result, macro-actions have the potential to solve planning problems much more efficiently enabling (1) distributed planning tasks across multiple agents, (2) planning in environments where agents have only limited knowledge about the state of the world, and (3) planning in uncertain environments where actions might have multiple outcomes.There are many potential areas of application of this research including distributed agents monitoring a network for security breaches, distributed military planning, and coordinating multiple robots involved in disaster recovery tasks.
该提案旨在研究分散规划的问题。通用技术领域是去中心化部分可观察马尔可夫决策过程(Dec-POMDP)。 PI 通过使用 Dec-POMDP 的有限状态控制器提出了宏观行为理论。宏操作使规划器能够在单个计算周期中执行多个规划步骤,而使用常规操作的规划器只能在每个计算周期中执行一个操作。因此,宏观行动有可能更有效地解决规划问题,从而实现 (1) 跨多个智能体的分布式规划任务,(2) 在智能体对世界状况了解有限的环境中进行规划,以及 (3 )在行动可能产生多种结果的不确定环境中进行规划。这项研究有许多潜在的应用领域,包括监控网络安全漏洞的分布式代理、分布式军事规划以及协调参与灾难恢复任务的多个机器人。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Christopher Amato其他文献

Entropy Seeking Constrained Multiagent Reinforcement Learning
熵寻求约束多智能体强化学习
  • DOI:
    10.5555/3635637.3663087
  • 发表时间:
    2024-09-13
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Ayhan Alp Aydeniz;Enrico Marchesini;Christopher Amato;Kagan Tumer
  • 通讯作者:
    Kagan Tumer
SleeperNets: Universal Backdoor Poisoning Attacks Against Reinforcement Learning Agents
SleeperNets:针对强化学习代理的通用后门中毒攻击
Equivariant Reinforcement Learning under Partial Observability
部分可观测性下的等变强化学习
  • DOI:
    10.1186/s41601-022-00252-z
  • 发表时间:
    2024-09-14
  • 期刊:
  • 影响因子:
    11
  • 作者:
    Hai Huu Nguyen;Andrea Baisero;David Klee;Dian Wang;Robert Platt;Christopher Amato
  • 通讯作者:
    Christopher Amato
(A Partial Survey of) Decentralized, Cooperative Multi-Agent Reinforcement Learning
(部分调查)去中心化、协作式多智能体强化学习
Vision and Language Navigation in the Real World via Online Visual Language Mapping
通过在线视觉语言映射在现实世界中进行视觉和语言导航
  • DOI:
    10.48550/arxiv.2310.10822
  • 发表时间:
    2023-10-16
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Chengguang Xu;Hieu T. Nguyen;Christopher Amato;Lawson L.S. Wong
  • 通讯作者:
    Lawson L.S. Wong

Christopher Amato的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Christopher Amato', 18)}}的其他基金

Career: IIS: RI: Improving Multi-Agent Reinforcement Learning for Cooperative, Partially Observable Settings
职业:IIS:RI:改进合作、部分可观察设置的多智能体强化学习
  • 批准号:
    2044993
  • 财政年份:
    2021
  • 资助金额:
    $ 17.48万
  • 项目类别:
    Continuing Grant
Doctoral Mentoring Consortium at the Nineteenth International Conference on Autonomous Agents and Multi-Agent Systems
第十九届自主代理和多代理系统国际会议博士生导师联盟
  • 批准号:
    2002606
  • 财政年份:
    2020
  • 资助金额:
    $ 17.48万
  • 项目类别:
    Standard Grant
NRI: FND: Coordinating and Incorporating Trust in Teams of Humans and Robots with Multi-Robot Reinforcement Learning
NRI:FND:通过多机器人强化学习协调和整合人类和机器人团队的信任
  • 批准号:
    2024790
  • 财政年份:
    2020
  • 资助金额:
    $ 17.48万
  • 项目类别:
    Standard Grant
NSF-BSF: RI: Small: Decentralized Active Goal Recognition
NSF-BSF:RI:小型:去中心化主动目标识别
  • 批准号:
    1816382
  • 财政年份:
    2018
  • 资助金额:
    $ 17.48万
  • 项目类别:
    Standard Grant
NRI: FND: COLLAB: Coordinating Human-Robot Teams in Uncertain Environments
NRI:FND:COLLAB:在不确定环境中协调人机团队
  • 批准号:
    1734497
  • 财政年份:
    2017
  • 资助金额:
    $ 17.48万
  • 项目类别:
    Standard Grant
CRII: RI: Planning and learning with macro-actions in cooperative multiagent systems
CRII:RI:协作多智能体系统中宏观行动的规划和学习
  • 批准号:
    1664923
  • 财政年份:
    2016
  • 资助金额:
    $ 17.48万
  • 项目类别:
    Standard Grant

相似国自然基金

跨膜蛋白LRP5胞外域调控膜受体TβRI促钛表面BMSCs归巢、分化的研究
  • 批准号:
    82301120
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于“免疫-神经”网络探讨眼针活化CI/RI大鼠MC靶向H3R调节“免疫监视”的抗炎机制
  • 批准号:
    82374375
  • 批准年份:
    2023
  • 资助金额:
    51 万元
  • 项目类别:
    面上项目
Dectin-2通过促进FcεRI聚集和肥大细胞活化加剧哮喘发作的机制研究
  • 批准号:
    82300022
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
MRGPRX2激活“皮肤-神经轴”在非FcεRI介导慢性自发性荨麻疹中的作用及分子机制
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
抗体介导的PRRSV感染通过FcγRI抑制I型干扰素产生的分子机制
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Collaborative Research: CompCog: RI: Medium: Understanding human planning through AI-assisted analysis of a massive chess dataset
合作研究:CompCog:RI:中:通过人工智能辅助分析海量国际象棋数据集了解人类规划
  • 批准号:
    2312374
  • 财政年份:
    2023
  • 资助金额:
    $ 17.48万
  • 项目类别:
    Standard Grant
Collaborative Research: CompCog: RI: Medium: Understanding human planning through AI-assisted analysis of a massive chess dataset
合作研究:CompCog:RI:中:通过人工智能辅助分析海量国际象棋数据集了解人类规划
  • 批准号:
    2312373
  • 财政年份:
    2023
  • 资助金额:
    $ 17.48万
  • 项目类别:
    Standard Grant
RI: Small: Approximate Inference for Planning and Reinforcement Learning
RI:小:规划和强化学习的近似推理
  • 批准号:
    2246261
  • 财政年份:
    2023
  • 资助金额:
    $ 17.48万
  • 项目类别:
    Standard Grant
RI: Small: Cooperative Planning and Learning via Scalable and Learnable Multi-Agent Commitments
RI:小型:通过可扩展和可学习的多代理承诺进行合作规划和学习
  • 批准号:
    2154904
  • 财政年份:
    2022
  • 资助金额:
    $ 17.48万
  • 项目类别:
    Standard Grant
IMR: RI-P: Safe And Flexible Experimental Dataset Access and Sharing-Planning (SAFED-ASP)
IMR:RI-P:安全灵活的实验数据集访问和共享规划 (SAFED-ASP)
  • 批准号:
    2224467
  • 财政年份:
    2022
  • 资助金额:
    $ 17.48万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了