RI: Small: High Confidence, Efficient Learning Under Rich Task Specifications

RI:小:丰富任务规格下的高置信度、高效学习

基本信息

  • 批准号:
    1617639
  • 负责人:
  • 金额:
    $ 47万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2016
  • 资助国家:
    美国
  • 起止时间:
    2016-08-01 至 2020-07-31
  • 项目状态:
    已结题

项目摘要

Artificially intelligent machines such as autonomous vehicles and personal robots are poised to contribute in many economic sectors, but cannot be deployed on a large scale without measurable confidence that they will operate correctly. This is especially true for safety-critical systems in which humans could be injured or infrastructure could be damaged by incorrect behavior. The proposed research will address this key issue by developing methods that allow intelligent agents to learn to perform challenging tasks and adapt to new situations, while simultaneously providing strong guarantees of correctness and safety. Once deployed, these future robotic systems will have broad impacts on society ranging from automating small manufacturing to giving new freedom to disabled and elderly populations through safe and personalized in-home care. The proposed robotics applications will additionally create opportunities for interactive educational K-12 programs to encourage interest in STEM areas, as well as undergraduate and graduate education.Towards these goals, the proposed work focuses on three primary research thrusts: 1) We will design safe learning algorithms that provide theoretical probabilistic satisfaction and data efficiency guarantees over both the expected reward of a policy and its correctness with respect to a high-level specification. 2) In order to account for the gap between theoretical and practical efficiency in learning, we will develop model-based and model-free off-policy evaluation methods that leverage active sampling strategies and bootstrapping to achieve practical efficiency. 3) We will develop hybrid techniques that combine and amplify the advantages of both strong theoretical and efficient practical guarantees. The merit of the proposed algorithms will be systematically evaluated on complex, real-world problems in robotic reconfigurable manufacturing that require learning optimized, yet safe policies with a high degree of confidence in settings with low-to-medium quantities of available data.
人工智能的机器(例如自动驾驶汽车和个人机器人)准备在许多经济领域做出贡献,但不能大规模部署,而没有可衡量的信心可以正确运行。 对于可能受伤或基础设施可能会因不正确的行为而受伤的安全系统尤其如此。 拟议的研究将通过开发允许智能代理人学习执行具有挑战性的任务并适应新情况的方法来解决这一关键问题,同时提供了强大的正确性和安全性的保证。 部署后,这些未来的机器人系统将对社会产生广泛的影响,从自动化小型制造业到通过安全和个性化的家庭护理为残疾人和老年人提供新的自由。 拟议的机器人技术应用程序还将为互动式教育K-12计划创造机会,以鼓励对STEM领域以及本科和研究生教育的兴趣。在这些目标上,拟议的工作重点介绍了三个主要的研究推力:1)我们将设计安全的学习算法,以提供对概率的满意度和数据的确定性,以确保对较高的奖励,并确保对一项正确的奖励,并确保其适当的奖励,并适用于一项正确的奖励。 2)为了说明学习理论和实践效率之间的差距,我们将开发基于模型和无模型的外部评估方法,以利用主动采样策略和引导程序来实现实践效率。 3)我们将开发混合技术,以结合和扩大强大的理论和有效实际保证的优势。 在机器人重新配置的制造中,将对所提出的算法的优点进行系统的评估,这些制造需要学习优化,但对低到中等数量的可用数据的设置具有高度信心。

项目成果

期刊论文数量(17)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Bayesian Robust Optimization for Imitation Learning
  • DOI:
  • 发表时间:
    2020-07
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Daniel S. Brown;S. Niekum;Marek Petrik
  • 通讯作者:
    Daniel S. Brown;S. Niekum;Marek Petrik
Active Reward Learning from Critiques
Extrapolating Beyond Suboptimal Demonstrations via Inverse Reinforcement Learning from Observations
  • DOI:
  • 发表时间:
    2019-04
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Daniel S. Brown;Wonjoon Goo;P. Nagarajan;S. Niekum
  • 通讯作者:
    Daniel S. Brown;Wonjoon Goo;P. Nagarajan;S. Niekum
Risk-Aware Active Inverse Reinforcement Learning
风险意识主动逆强化学习
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Brown, Daniel;Cui, Yuchen;Niekum, Scott
  • 通讯作者:
    Niekum, Scott
A Review of Robot Learning for Manipulation: Challenges, Representations, and Algorithms
  • DOI:
  • 发表时间:
    2019-07
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Oliver Kroemer;S. Niekum;G. Konidaris
  • 通讯作者:
    Oliver Kroemer;S. Niekum;G. Konidaris
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Scott Niekum其他文献

Scott Niekum的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Scott Niekum', 18)}}的其他基金

CAREER: Safe and Efficient Robot Learning from Demonstration in the Real World
职业:安全高效的机器人从现实世界的演示中学习
  • 批准号:
    2323384
  • 财政年份:
    2023
  • 资助金额:
    $ 47万
  • 项目类别:
    Continuing Grant
CAREER: Safe and Efficient Robot Learning from Demonstration in the Real World
职业:安全高效的机器人从现实世界的演示中学习
  • 批准号:
    1749204
  • 财政年份:
    2018
  • 资助金额:
    $ 47万
  • 项目类别:
    Continuing Grant
S&AS: INT: Socially-Aware Autonomy for Long-Term Deployment of Always-On Heterogeneous Robot Teams
S
  • 批准号:
    1724157
  • 财政年份:
    2017
  • 资助金额:
    $ 47万
  • 项目类别:
    Standard Grant
NRI: Collaborative Research: Scalable Robot Autonomy through Remote Operator Assistance and Lifelong Learning
NRI:协作研究:通过远程操作员协助和终身学习实现可扩展的机器人自主性
  • 批准号:
    1638107
  • 财政年份:
    2016
  • 资助金额:
    $ 47万
  • 项目类别:
    Standard Grant

相似国自然基金

SERT-nNOS蛋白相互作用的结构基础及其小分子互作抑制剂的设计、合成及快速抗抑郁活性研究
  • 批准号:
    82373728
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
APOE调控小胶质细胞脂代谢模式在ASD认知和社交损伤中的作用及机制研究
  • 批准号:
    82373597
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
小胶质细胞外泌体通过miR-486抑制神经元铁死亡介导电针修复脊髓损伤的机制研究
  • 批准号:
    82360454
  • 批准年份:
    2023
  • 资助金额:
    32 万元
  • 项目类别:
    地区科学基金项目
CUL4B正反馈调控FOXO3a-FOXM1通路促进非小细胞肺癌放疗抵抗的机制研究
  • 批准号:
    82360584
  • 批准年份:
    2023
  • 资助金额:
    32 万元
  • 项目类别:
    地区科学基金项目
葡萄糖饥饿条件下AMPK-CREB-PPA1信号通路促进非小细胞肺癌细胞增殖的分子机制研究
  • 批准号:
    82360518
  • 批准年份:
    2023
  • 资助金额:
    32 万元
  • 项目类别:
    地区科学基金项目

相似海外基金

Biological validation of phage host-range identified by proximity guided metagenomics
通过邻近引导宏基因组学鉴定噬菌体宿主范围的生物学验证
  • 批准号:
    10761394
  • 财政年份:
    2023
  • 资助金额:
    $ 47万
  • 项目类别:
Developing Active Stimulation and Monitoring Technologies to Optimize Pain and Nociception Management During Regional Anesthesia, General Anesthesia, and Post-Operative Care
开发主动刺激和监测技术,以优化区域麻醉、全身麻醉和术后护理期间的疼痛和伤害感受管理
  • 批准号:
    10604993
  • 财政年份:
    2023
  • 资助金额:
    $ 47万
  • 项目类别:
Software Platform for Automatic, Opportunistic Screening of Vertebral Compression Fractures
用于自动、机会性筛查椎骨压缩性骨折的软件平台
  • 批准号:
    10755827
  • 财政年份:
    2023
  • 资助金额:
    $ 47万
  • 项目类别:
Near InfraRed Layered Imaging of Tissue Hemodynamics (NIR-LITH)
组织血流动力学近红外分层成像 (NIR-LITH)
  • 批准号:
    10758694
  • 财政年份:
    2023
  • 资助金额:
    $ 47万
  • 项目类别:
Digital Uroflowmetry for Office and Home
适用于办公室和家庭的数字尿流计
  • 批准号:
    10821803
  • 财政年份:
    2023
  • 资助金额:
    $ 47万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了