NRI: Collaborative Research: A Framework for Hierarchical, Probabilistic Planning and Learning

NRI:协作研究:分层、概率规划和学习的框架

基本信息

  • 批准号:
    1637614
  • 负责人:
  • 金额:
    $ 54.27万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2016
  • 资助国家:
    美国
  • 起止时间:
    2016-09-01 至 2019-08-31
  • 项目状态:
    已结题

项目摘要

This project is an effort to create a unified framework for solving very large problems with uncertain states and actions, such as manipulator robots acting in real-world environments. The results may have especially great promise for assistive technologies, including autonomous robots that can be used by elderly and disabled populations to aid them in their daily activities. The proposed integrated framework will represent, apply, and learn hierarchical domain knowledge, and will include the ability to transfer knowledge from simpler problems to more complex ones. The research will enable autonomous agents to develop a structured representation of complex domains based on experience. The agents will use learned representations to interpret natural language commands for both low-level and high-level requests. The technical focus is enabling tractable planning in large, uncertain domains by generating and leveraging probabilistic domain knowledge at multiple levels of abstraction. Agents will autonomously create layered representations in which the layers build on one another to produce complex behaviors. Agents will learn to perform useful behaviors, such as navigating using low-level sensor feedback or assembling complex objects such as a bridge or a table. The key technical contributions will be methods for (1) planning in large state/action spaces using the abstract object-oriented Markov decision process (AMDP) model, a new formalism for representing probabilistic domain knowledge at multiple levels of abstraction; (2) learning hierarchical task knowledge in the form of AMDPs; and (3) interpreting natural language commands at multiple levels of abstraction by mapping to the learned hierarchical structure. The formalism will be demonstrated and validated in several domains, including a simulated "cleanup" toy domain, challenging and complex video games, and a robot manipulation task.
该项目致力于创建一个统一的框架,用于解决具有不确定状态和动作的非常大的问题,例如在现实环境中运行的机械手机器人。 研究结果可能对辅助技术有特别大的前景,包括可供老年人和残疾人使用的自主机器人来帮助他们进行日常活动。 所提出的集成框架将表示、应用和学习分层领域知识,并将包括将知识从更简单的问题转移到更复杂的问题的能力。该研究将使自主代理能够根据经验开发复杂领域的结构化表示。代理将使用学习到的表示来解释低级和高级请求的自然语言命令。 技术重点是通过在多个抽象级别生成和利用概率领域知识,在大型、不确定的领域中实现易于处理的规划。代理将自主创建分层表示,其中各层相互构建以产生复杂的行为。智能体将学习执行有用的行为,例如使用低级传感器反馈进行导航或组装复杂的物体(例如桥梁或桌子)。 关键的技术贡献将是以下方法:(1)使用抽象的面向对象的马尔可夫决策过程(AMDP)模型在大型状态/动作空间中进行规划,这是一种在多个抽象级别表示概率领域知识的新形式主义; (2)以AMDP的形式学习分层任务知识; (3) 通过映射到学习的层次结构来解释多个抽象级别的自然语言命令。该形式主义将在多个领域进行论证和验证,包括模拟“清理”玩具领域、具有挑战性和复杂性的视频游戏以及机器人操纵任务。

项目成果

期刊论文数量(10)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Planning with Abstract Markov Decision Processes
使用抽象马尔可夫决策过程进行规划
  • DOI:
    10.1609/icaps.v27i1.13867
  • 发表时间:
    2017-06-05
  • 期刊:
  • 影响因子:
    0
  • 作者:
    N. Gopalan;Marie desJardins;M. Littman;J. MacGlashan;S. Squire;Stefanie Tellex;J. Winder;Lawson L. S. Wong
  • 通讯作者:
    Lawson L. S. Wong
Policy and Value Transfer in Lifelong Reinforcement Learning
终身强化学习中的政策和价值转移
  • DOI:
    10.1108/fs-04-2018-0034
  • 发表时间:
    2018-07-03
  • 期刊:
  • 影响因子:
    2
  • 作者:
    David Abel;Yuu Jinnai;Yue (Sophie) Guo;G. Konidaris;M. Littman
  • 通讯作者:
    M. Littman
State Abstractions for Lifelong Reinforcement Learning
终身强化学习的状态抽象
  • DOI:
  • 发表时间:
    2018-07-03
  • 期刊:
  • 影响因子:
    0
  • 作者:
    David Abel;Dilip Arumugam;Lucas Lehnert;M. Littman
  • 通讯作者:
    M. Littman
The Expected-Length Model of Options
期权的预期长度模型
  • DOI:
  • 发表时间:
    2019-01
  • 期刊:
  • 影响因子:
    0
  • 作者:
    David Abel*; John Winder*
  • 通讯作者:
    John Winder*
Near Optimal Behavior via Approximate State Abstraction
通过近似状态抽象实现近乎最优的行为
  • DOI:
  • 发表时间:
    2016-06-19
  • 期刊:
  • 影响因子:
    0
  • 作者:
    David Abel;D. E. Hershkowitz;M. Littman
  • 通讯作者:
    M. Littman
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Stefanie Tellex其他文献

Hierarchical planning with state abstractions for temporal task specifications
具有状态抽象的分层规划用于时间任务规范
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    3.5
  • 作者:
    Yoonseon Oh;Roma Patel;Thao Nguyen;Baichuan Huang;Matthew Berg;Ellie Pavlick;Stefanie Tellex
  • 通讯作者:
    Stefanie Tellex
Advantages and Limitations of using Successor Features for Transfer in Reinforcement Learning
在强化学习中使用后继特征进行迁移的优点和局限性
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Lucas Lehnert;Stefanie Tellex;M. Littman
  • 通讯作者:
    M. Littman
Time-Lapse Light Field Photography for Perceiving Non-Lambertian Scenes
用于感知非朗伯场景的延时光场摄影
  • DOI:
    10.15607/rss.2017.xiii.026
  • 发表时间:
    2017-07-12
  • 期刊:
  • 影响因子:
    0
  • 作者:
    John G. Oberlin;Stefanie Tellex
  • 通讯作者:
    Stefanie Tellex
Communicating Robot Arm Motion Intent Through Mixed Reality Head-mounted Displays
通过混合现实头戴式显示器传达机器人手臂的运动意图
  • DOI:
    10.1007/978-3-030-28619-4_26
  • 发表时间:
    2017-08-11
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Eric Rosen;David Whitney;Elizabeth Phillips;Gary Chien;J. Tompkin;G. Konidaris;Stefanie Tellex
  • 通讯作者:
    Stefanie Tellex
Bootstrapping Motor Skill Learning with Motion Planning
通过运动规划引导运动技能学习

Stefanie Tellex的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Stefanie Tellex', 18)}}的其他基金

Collaborative Research: CPS: Medium: Closing the Teleoperation Gap: Integrating Scene and Network Understanding for Dexterous Control of Remote Robots
协作研究:CPS:中:缩小远程操作差距:集成场景和网络理解以实现远程机器人的灵巧控制
  • 批准号:
    2038897
  • 财政年份:
    2021
  • 资助金额:
    $ 54.27万
  • 项目类别:
    Standard Grant
EAGER: A Gateway Drone for High School Students
EAGER:面向高中生的网关无人机
  • 批准号:
    1940970
  • 财政年份:
    2020
  • 资助金额:
    $ 54.27万
  • 项目类别:
    Standard Grant
CAREER: Robots that Help People
职业:帮助人们的机器人
  • 批准号:
    1652561
  • 财政年份:
    2017
  • 资助金额:
    $ 54.27万
  • 项目类别:
    Continuing Grant
NRI: Collaborative Research: Jointly Learning Language and Affordances
NRI:协作研究:共同学习语言和功能可供性
  • 批准号:
    1426452
  • 财政年份:
    2014
  • 资助金额:
    $ 54.27万
  • 项目类别:
    Standard Grant

相似国自然基金

基于交易双方异质性的工程项目组织间协作动态耦合研究
  • 批准号:
    72301024
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
医保基金战略性购买促进远程医疗协作网价值共创的制度创新研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    45 万元
  • 项目类别:
    面上项目
面向协作感知车联网的信息分发时效性保证关键技术研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
面向5G超高清移动视频传输的协作NOMA系统可靠性研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于自主性边界的人机协作-对抗混合智能控制研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

NRI/Collaborative Research: Robotic Disassembly of High-Precision Electronic Devices
NRI/合作研究:高精度电子设备的机器人拆卸
  • 批准号:
    2422640
  • 财政年份:
    2024
  • 资助金额:
    $ 54.27万
  • 项目类别:
    Standard Grant
NRI/Collaborative Research: Robust Design and Reliable Autonomy for Transforming Modular Hybrid Rigid-Soft Robots
NRI/合作研究:用于改造模块化混合刚软机器人的稳健设计和可靠自主性
  • 批准号:
    2327702
  • 财政年份:
    2023
  • 资助金额:
    $ 54.27万
  • 项目类别:
    Standard Grant
Collaborative Research: NRI: Understanding Underlying Risks and Sociotechnical Challenges of Powered Wearable Exoskeleton to Construction Workers
合作研究:NRI:了解建筑工人动力可穿戴外骨骼的潜在风险和社会技术挑战
  • 批准号:
    2410255
  • 财政年份:
    2023
  • 资助金额:
    $ 54.27万
  • 项目类别:
    Standard Grant
NRI: FND: Collaborative Research: DeepSoRo: High-dimensional Proprioceptive and Tactile Sensing and Modeling for Soft Grippers
NRI:FND:合作研究:DeepSoRo:软抓手的高维本体感受和触觉感知与建模
  • 批准号:
    2348839
  • 财政年份:
    2023
  • 资助金额:
    $ 54.27万
  • 项目类别:
    Standard Grant
NRI/Collaborative Research: Robust Design and Reliable Autonomy for Transforming Modular Hybrid Rigid-Soft Robots
NRI/合作研究:用于改造模块化混合刚软机器人的稳健设计和可靠自主性
  • 批准号:
    2327702
  • 财政年份:
    2023
  • 资助金额:
    $ 54.27万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了