NRI: FND: Coordinating and Incorporating Trust in Teams of Humans and Robots with Multi-Robot Reinforcement Learning

NRI:FND:通过多机器人强化学习协调和整合人类和机器人团队的信任

基本信息

  • 批准号:
    2024790
  • 负责人:
  • 金额:
    $ 64.7万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2020
  • 资助国家:
    美国
  • 起止时间:
    2020-10-01 至 2024-09-30
  • 项目状态:
    已结题

项目摘要

The decreasing cost and increasing sophistication of robot hardware has created new opportunities for applications where teams of robots can be deployed in combination with skilled humans to automate labor-intensive tasks. However, if such systems are to become widely deployable, they must be able to appropriately reason about human teamwork. Therefore, this project will create new methods for generating and solving models for teams of multiple humans and robots working together to solve complex problems. These approaches will be able to learn quickly from limited interactions and consider the dynamic and uncertain nature of coordinating teams of robots and humans. Furthermore, the project will develop methods that allows for communication between the robots and humans and incorporates models of trust to permit humans and robots to appropriately establish trust in each other.In particular, this project will produce several novel methods for modeling and learning solutions for teams of robots interacting with multiple people. The approaches will leverage the strengths of POMDPs to consider the dynamic and uncertain nature of coordinating teams of robots and humans. Because sample efficiency is of utmost importance when dealing with humans and real-world tasks when the number of interactions will be limited, the project will develop Bayesian reinforcement learning methods that scale by exploiting hierarchy and deep learning. The project will also develop methods for communication and shared mental models to allow the humans and robots to have confidence in what each other is doing. These methods will allow tight cooperation between the humans and robots. Furthermore, humans will not want to use our system if they cannot trust the robots. Therefore, the project will develop methods that model and incorporate trust into the approach while generating interpretable POMDP models and solutions that can be shared with humans during or after execution. These advances will produce high-quality solutions for mixed human-robot teams in realistic scenarios.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
机器人硬件成本的下降和复杂性的提高为应用创造了新的机会,在这些应用中,可以将机器人团队与熟练的人类结合部署,以实现劳动密集型任务的自动化。然而,如果此类系统要广泛部署,它们必须能够适当地推理人类团队合作。因此,该项目将创建新的方法来生成和解决多个人类和机器人团队共同解决复杂问题的模型。这些方法将能够从有限的交互中快速学习,并考虑机器人和人类协调团队的动态和不确定性。此外,该项目将开发允许机器人和人类之间进行通信的方法,并结合信任模型,以允许人类和机器人适当地相互建立信任。特别是,该项目将产生几种用于建模和学习解决方案的新颖方法与多人互动的机器人团队。这些方法将利用 POMDP 的优势来考虑机器人和人类协调团队的动态和不确定性。由于在交互数量有限的情况下处理人类和现实世界任务时,样本效率至关重要,因此该项目将开发通过利用层次结构和深度学习进行扩展的贝叶斯强化学习方法。该项目还将开发沟通方法和共享心理模型,让人类和机器人对彼此所做的事情充满信心。这些方法将使人类和机器人之间能够紧密合作。此外,如果人类不能信任机器人,他们就不会想使用我们的系统。因此,该项目将开发对信任进行建模并将信任融入该方法的方法,同时生成可解释的 POMDP 模型和解决方案,可以在执行期间或执行后与人类共享。这些进步将为现实场景中的混合人机团队提供高质量的解决方案。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
BADDr: Bayes-Adaptive Deep Dropout RL for POMDPs
  • DOI:
    10.5555/3535850.3535932
  • 发表时间:
    2022-02
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Sammie Katt;Hai V. Nguyen;F. Oliehoek;Chris Amato
  • 通讯作者:
    Sammie Katt;Hai V. Nguyen;F. Oliehoek;Chris Amato
Asymmetric DQN for partially observable reinforcement learning
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Andrea Baisero;Brett Daley;Chris Amato
  • 通讯作者:
    Andrea Baisero;Brett Daley;Chris Amato
Leveraging Fully Observable Policies for Learning under Partial Observability
  • DOI:
    10.48550/arxiv.2211.01991
  • 发表时间:
    2022-11
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Hai V. Nguyen;Andrea Baisero;Dian Wang;Chris Amato;Robert W. Platt
  • 通讯作者:
    Hai V. Nguyen;Andrea Baisero;Dian Wang;Chris Amato;Robert W. Platt
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Christopher Amato其他文献

(A Partial Survey of) Decentralized, Cooperative Multi-Agent Reinforcement Learning
  • DOI:
    10.48550/arxiv.2405.06161
  • 发表时间:
    2024-05
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Christopher Amato
  • 通讯作者:
    Christopher Amato

Christopher Amato的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Christopher Amato', 18)}}的其他基金

Career: IIS: RI: Improving Multi-Agent Reinforcement Learning for Cooperative, Partially Observable Settings
职业:IIS:RI:改进合作、部分可观察设置的多智能体强化学习
  • 批准号:
    2044993
  • 财政年份:
    2021
  • 资助金额:
    $ 64.7万
  • 项目类别:
    Continuing Grant
Doctoral Mentoring Consortium at the Nineteenth International Conference on Autonomous Agents and Multi-Agent Systems
第十九届自主代理和多代理系统国际会议博士生导师联盟
  • 批准号:
    2002606
  • 财政年份:
    2020
  • 资助金额:
    $ 64.7万
  • 项目类别:
    Standard Grant
NSF-BSF: RI: Small: Decentralized Active Goal Recognition
NSF-BSF:RI:小型:去中心化主动目标识别
  • 批准号:
    1816382
  • 财政年份:
    2018
  • 资助金额:
    $ 64.7万
  • 项目类别:
    Standard Grant
NRI: FND: COLLAB: Coordinating Human-Robot Teams in Uncertain Environments
NRI:FND:COLLAB:在不确定环境中协调人机团队
  • 批准号:
    1734497
  • 财政年份:
    2017
  • 资助金额:
    $ 64.7万
  • 项目类别:
    Standard Grant
CRII: RI: Planning and learning with macro-actions in cooperative multiagent systems
CRII:RI:协作多智能体系统中宏观行动的规划和学习
  • 批准号:
    1664923
  • 财政年份:
    2016
  • 资助金额:
    $ 64.7万
  • 项目类别:
    Standard Grant
CRII: RI: Planning and learning with macro-actions in cooperative multiagent systems
CRII:RI:协作多智能体系统中宏观行动的规划和学习
  • 批准号:
    1463945
  • 财政年份:
    2015
  • 资助金额:
    $ 64.7万
  • 项目类别:
    Standard Grant

相似国自然基金

基于Piezo2快速信号传导研究气滞胃痛方干预机械刺激诱导FD胃黏膜内脏高敏状态的作用机制
  • 批准号:
    82305136
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于双展示工程噬菌体fd388-BH-WV应用于三阴性乳腺癌脑转移瘤的靶向“饥饿”治疗
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于Piezo蛋白介导SCF/c-kit-JAK-STAT信号通路促进Cajal间质细胞增殖研究腹部推拿调控FD胃动力的作用机制
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
FD-OCT联合CMR成像技术探索LncRNA NEAT1在动脉粥样硬化进程中的作用与机制
  • 批准号:
    82072030
  • 批准年份:
    2020
  • 资助金额:
    54 万元
  • 项目类别:
    面上项目

相似海外基金

オンライン授業のピアレビューを活用した相互研修型大学横断FDによる教育の質向上
利用在线课程的同行评审,通过互训型跨校FD提高教育质量
  • 批准号:
    23K22295
  • 财政年份:
    2024
  • 资助金额:
    $ 64.7万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
研究指導能力向上に向けた看護系大学院修士・博士課程教育連動型FDモデルの開発
开发与护理研究生院硕士和博士课程挂钩的FD模型,以提高研究指导能力
  • 批准号:
    23K24629
  • 财政年份:
    2024
  • 资助金额:
    $ 64.7万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Movement perception in Functional Neurological Disorder (FND)
功能性神经疾病 (FND) 的运动感知
  • 批准号:
    MR/Y004000/1
  • 财政年份:
    2024
  • 资助金额:
    $ 64.7万
  • 项目类别:
    Research Grant
「看護学教員のための倫理的行動改善向上FDプログラム」の開発と普及
制定并传播“护理人员道德行为改善FD计划”
  • 批准号:
    23K20343
  • 财政年份:
    2024
  • 资助金额:
    $ 64.7万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
超好熱性アーキアへのFd依存型嫌気的TCAサイクルの実装と水素生産への利用
在超嗜热古菌中实现 Fd 依赖性厌氧 TCA 循环及其用于产氢
  • 批准号:
    23K23502
  • 财政年份:
    2024
  • 资助金额:
    $ 64.7万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了