CAREER: Safe and Efficient Robot Learning from Demonstration in the Real World

职业:安全高效的机器人从现实世界的演示中学习

基本信息

  • 批准号:
    1749204
  • 负责人:
  • 金额:
    $ 52.46万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2018
  • 资助国家:
    美国
  • 起止时间:
    2018-06-01 至 2023-05-31
  • 项目状态:
    已结题

项目摘要

General purpose robots are poised to enter the home and workplace in unprecedented numbers in coming years, but face the significant challenge of customization - the ability to perform user-specified tasks in many different unstructured environments. In response to this need, robot learning from demonstration (LfD) has emerged as a paradigm that allows users to quickly and naturally program robots by simply showing them how to perform a task, rather than by writing code. This methodology aims to allow non-expert users to program robots, as well as communicate embodied knowledge that is difficult to translate into formal code. However, current state-of-the-art LfD algorithms are not yet ready for widespread deployment, as they are often unreliable, need too much data, and are designed to learn in a single session in a laboratory setting. This work addresses these issues to help enable future robots to perform important tasks ranging from in-home elderly care to reconfigurable manufacturing.Specifically, this work identifies three significant technical improvements to current LfD algorithms that are needed before they can be deployed in the real world: the need for safety guarantees, the ability to learn from very limited amounts of data, and the ability to continually improve in an ongoing, life-long fashion. A formal theory of safe LfD is developed, along with practical algorithms that provide strong probabilistic lower bounds on agent performance. Algorithmic efficiency is addressed via a re-examining of common statistical assumptions (such as independent and identically distributed data) and through the use of multimodal side-information, such as natural language and gaze. Finally, active learning strategies and modeling of human beliefs are used to enable interactive, continual learning.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
通用机器人有望在未来几年内以前所未有的数字进入家庭和工作场所,但是面临定制的重大挑战 - 在许多不同的非结构化环境中执行用户指定的任务的能力。为了应对这一需求,机器人从演示中学习(LFD)已成为一种范式,该范式允许用户通过简单地向他们展示如何执行任务而不是通过编写代码来快速自然地编程机器人。该方法旨在允许非专家用户编程机器人,并传达难以转化为正式代码的体现知识。但是,当前的最新LFD算法尚未准备好进行广泛的部署,因为它们通常不可靠,需要太多数据,并且旨在在实验室环境中进行一次学习。 这项工作解决了这些问题,以帮助使未来的机器人执行重要任务,从家庭护理到可重新配置的制造业。具体来说,这项工作确定了当前的LFD算法的三个重大技术改进,需要将它们部署到现实世界中:从事安全的能力,以及在生活中的能力以及在生活中的能力以及在生活中的能力,并且在生活中的学习能力不断,并且在生活中的能力不断,并且在一定的能力中学习。 制定了安全LFD的形式理论,以及实用算法,为代理性能提供了强大的概率下限。 通过重新检查常见统计假设(例如独立和相同分布的数据)以及使用多模式侧信息,例如自然语言和凝视,可以解决算法效率。 最后,积极的学习策略和人类信念的建模用于实现互动,持续学习。该奖项反映了NSF的法定使命,并被认为是值得通过基金会的知识分子优点和更广泛的影响评估标准通过评估来支持的。

项目成果

期刊论文数量(33)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
PixL2R: Guiding Reinforcement Learning Using Natural Language by Mapping Pixels to Rewards
  • DOI:
  • 发表时间:
    2020-07
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Prasoon Goyal;S. Niekum;R. Mooney
  • 通讯作者:
    Prasoon Goyal;S. Niekum;R. Mooney
A Review of Robot Learning for Manipulation: Challenges, Representations, and Algorithms
  • DOI:
  • 发表时间:
    2019-07
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Oliver Kroemer;S. Niekum;G. Konidaris
  • 通讯作者:
    Oliver Kroemer;S. Niekum;G. Konidaris
SCAPE: Learning Stiffness Control from Augmented Position Control Experiences
SCAPE:从增强的位置控制经验中学习刚度控制
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kim, M;Niekum, S;Deshpande, A
  • 通讯作者:
    Deshpande, A
Better-than-Demonstrator Imitation Learning via Automatically-Ranked Demonstrations
  • DOI:
  • 发表时间:
    2019-07
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Daniel S. Brown;Wonjoon Goo;S. Niekum
  • 通讯作者:
    Daniel S. Brown;Wonjoon Goo;S. Niekum
Uncertainty-Aware Data Aggregation for Deep Imitation Learning
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Scott Niekum其他文献

Scott Niekum的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Scott Niekum', 18)}}的其他基金

CAREER: Safe and Efficient Robot Learning from Demonstration in the Real World
职业:安全高效的机器人从现实世界的演示中学习
  • 批准号:
    2323384
  • 财政年份:
    2023
  • 资助金额:
    $ 52.46万
  • 项目类别:
    Continuing Grant
S&AS: INT: Socially-Aware Autonomy for Long-Term Deployment of Always-On Heterogeneous Robot Teams
S
  • 批准号:
    1724157
  • 财政年份:
    2017
  • 资助金额:
    $ 52.46万
  • 项目类别:
    Standard Grant
NRI: Collaborative Research: Scalable Robot Autonomy through Remote Operator Assistance and Lifelong Learning
NRI:协作研究:通过远程操作员协助和终身学习实现可扩展的机器人自主性
  • 批准号:
    1638107
  • 财政年份:
    2016
  • 资助金额:
    $ 52.46万
  • 项目类别:
    Standard Grant
RI: Small: High Confidence, Efficient Learning Under Rich Task Specifications
RI:小:丰富任务规格下的高置信度、高效学习
  • 批准号:
    1617639
  • 财政年份:
    2016
  • 资助金额:
    $ 52.46万
  • 项目类别:
    Standard Grant

相似国自然基金

面向高效和安全扑救决策的森林火灾场景自动识别研究
  • 批准号:
    32360392
  • 批准年份:
    2023
  • 资助金额:
    32 万元
  • 项目类别:
    地区科学基金项目
可验证、高效率的图神经网络安全训练方法研究
  • 批准号:
    62302308
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于多维数据特征的异构内存系统高效安全保障方法研究
  • 批准号:
    62302182
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
安全高效的点对点内容分发网络关键技术研究
  • 批准号:
    62302403
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
面向高通量互联网视频的高效内容理解与安全分析研究
  • 批准号:
    62372451
  • 批准年份:
    2023
  • 资助金额:
    52.00 万元
  • 项目类别:
    面上项目

相似海外基金

CAREER: Intelligent Battery Management with Safe, Efficient, Fast-Adaption Reinforcement Learning and Physics-Inspired Machine Learning: From Cells to Packs
职业:具有安全、高效、快速适应的强化学习和物理启发机器学习的智能电池管理:从电池到电池组
  • 批准号:
    2340194
  • 财政年份:
    2024
  • 资助金额:
    $ 52.46万
  • 项目类别:
    Continuing Grant
CAREER: Safe and Efficient Robot Learning from Demonstration in the Real World
职业:安全高效的机器人从现实世界的演示中学习
  • 批准号:
    2323384
  • 财政年份:
    2023
  • 资助金额:
    $ 52.46万
  • 项目类别:
    Continuing Grant
Integrating spatial and non-spatial data to examine multilevel drivers of HIV risk among adolescent mothers in sub-Saharan Africa
整合空间和非空间数据来研究撒哈拉以南非洲地区青少年母亲艾滋病毒风险的多层次驱动因素
  • 批准号:
    10700436
  • 财政年份:
    2023
  • 资助金额:
    $ 52.46万
  • 项目类别:
CAREER: Toward Hierarchical Game Theory and Hybrid Learning Framework for Safe, Efficient Large-scale Multi-agent Systems
职业:面向安全、高效的大规模多智能体系统的分层博弈论和混合学习框架
  • 批准号:
    2144646
  • 财政年份:
    2022
  • 资助金额:
    $ 52.46万
  • 项目类别:
    Continuing Grant
CAREER: Towards Elastic Security with Safe and Efficient Network Security Function Virtualization
职业:通过安全高效的网络安全功能虚拟化迈向弹性安全
  • 批准号:
    2129164
  • 财政年份:
    2021
  • 资助金额:
    $ 52.46万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了