NRI: Collaborative Research: A Framework for Hierarchical, Probabilistic Planning and Learning
NRI:协作研究:分层、概率规划和学习的框架
基本信息
- 批准号:1637614
- 负责人:
- 金额:$ 54.27万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2016
- 资助国家:美国
- 起止时间:2016-09-01 至 2019-08-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
This project is an effort to create a unified framework for solving very large problems with uncertain states and actions, such as manipulator robots acting in real-world environments. The results may have especially great promise for assistive technologies, including autonomous robots that can be used by elderly and disabled populations to aid them in their daily activities. The proposed integrated framework will represent, apply, and learn hierarchical domain knowledge, and will include the ability to transfer knowledge from simpler problems to more complex ones. The research will enable autonomous agents to develop a structured representation of complex domains based on experience. The agents will use learned representations to interpret natural language commands for both low-level and high-level requests. The technical focus is enabling tractable planning in large, uncertain domains by generating and leveraging probabilistic domain knowledge at multiple levels of abstraction. Agents will autonomously create layered representations in which the layers build on one another to produce complex behaviors. Agents will learn to perform useful behaviors, such as navigating using low-level sensor feedback or assembling complex objects such as a bridge or a table. The key technical contributions will be methods for (1) planning in large state/action spaces using the abstract object-oriented Markov decision process (AMDP) model, a new formalism for representing probabilistic domain knowledge at multiple levels of abstraction; (2) learning hierarchical task knowledge in the form of AMDPs; and (3) interpreting natural language commands at multiple levels of abstraction by mapping to the learned hierarchical structure. The formalism will be demonstrated and validated in several domains, including a simulated "cleanup" toy domain, challenging and complex video games, and a robot manipulation task.
该项目是为了创建一个统一的框架,以解决不确定的状态和行动,例如在现实世界环境中作用的机器人机器人。 结果可能对辅助技术特别有希望,包括老年人和残疾人人群可以使用的自主机器人,以帮助他们进行日常活动。 所提出的集成框架将代表,应用和学习层次结构域知识,并将包括将知识从简单问题转移到更复杂问题的能力。该研究将使自主代理能够根据经验开发复杂领域的结构化表示。代理商将使用学习的表示形式来解释低级和高级请求的自然语言命令。 技术重点是通过在多个抽象层面上产生和利用概率域知识来实现大型,不确定的领域的可牵引计划。代理人将自主创建分层表示,其中层相互构建以产生复杂的行为。代理人将学会执行有用的行为,例如使用低级传感器反馈导航或组装复杂的对象,例如桥梁或桌子。 关键的技术贡献将是(1)使用面向对象的马尔可夫决策过程(AMDP)模型在大型状态/行动空间中进行计划的方法,这是一种新的形式主义,用于在多个抽象级别上代表概率领域知识; (2)以AMDP的形式学习层次任务知识; (3)通过映射到学到的层次结构来解释多个抽象级别的自然语言命令。形式主义将在几个领域进行演示和验证,包括模拟的“清理”玩具域,具有挑战性且复杂的视频游戏以及机器人操纵任务。
项目成果
期刊论文数量(10)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Multi-Object Search using Object-Oriented POMDPs
- DOI:10.1109/icra.2019.8793888
- 发表时间:2019-01-01
- 期刊:
- 影响因子:0
- 作者:Wandzel, Arthur;Oh, Yoonseon;Tellex, Stefanie
- 通讯作者:Tellex, Stefanie
The Expected-Length Model of Options
期权的预期长度模型
- DOI:
- 发表时间:2019
- 期刊:
- 影响因子:0
- 作者:David Abel*, John Winder*
- 通讯作者:David Abel*, John Winder*
State Abstractions for Lifelong Reinforcement Learning
- DOI:
- 发表时间:2018-07
- 期刊:
- 影响因子:0
- 作者:David Abel;Dilip Arumugam;Lucas Lehnert;M. Littman
- 通讯作者:David Abel;Dilip Arumugam;Lucas Lehnert;M. Littman
Near Optimal Behavior via Approximate State Abstraction
- DOI:
- 发表时间:2016-06
- 期刊:
- 影响因子:0
- 作者:David Abel;D. E. Hershkowitz;M. Littman
- 通讯作者:David Abel;D. E. Hershkowitz;M. Littman
Planning with State Abstractions for Non-Markovian Task Specifications
非马尔可夫任务规范的状态抽象规划
- DOI:
- 发表时间:2019
- 期刊:
- 影响因子:0
- 作者:Yoonseon Oh, Roma Patel
- 通讯作者:Yoonseon Oh, Roma Patel
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Stefanie Tellex其他文献
Grounding Language Attributes to Objects using Bayesian Eigenobjects
使用贝叶斯特征对象将语言属性基础化为对象
- DOI:
10.1109/iros40897.2019.8968603 - 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
Vanya Cohen;B. Burchfiel;Thao Nguyen;N. Gopalan;Stefanie Tellex;G. Konidaris - 通讯作者:
G. Konidaris
Advantages and Limitations of using Successor Features for Transfer in Reinforcement Learning
在强化学习中使用后继特征进行迁移的优点和局限性
- DOI:
- 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
Lucas Lehnert;Stefanie Tellex;M. Littman - 通讯作者:
M. Littman
Time-Lapse Light Field Photography for Perceiving Non-Lambertian Scenes
用于感知非朗伯场景的延时光场摄影
- DOI:
10.15607/rss.2017.xiii.026 - 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
John G. Oberlin;Stefanie Tellex - 通讯作者:
Stefanie Tellex
Spoken Language Interaction with Robots: Research Issues and Recommendations, Report from the NSF Future Directions Workshop
与机器人的口语交互:研究问题和建议,美国国家科学基金会未来方向研讨会的报告
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:4.3
- 作者:
M. Marge;C. Espy;Nigel G. Ward;A. Alwan;Yoav Artzi;Mohit Bansal;Gil;Blankenship;J. Chai;Hal Daumé;Debadeepta Dey;M. Harper;T. Howard;Casey;Kennington;Ivana Kruijff;Dinesh Manocha;Cynthia Matuszek;Ross Mead;Raymond;Mooney;Roger K. Moore;M. Ostendorf;Heather Pon;A. Rudnicky;Matthias;Scheutz;R. Amant;Tong Sun;Stefanie Tellex;D. Traum;Zhou Yu - 通讯作者:
Zhou Yu
A Tale of Two DRAGGNs: A Hybrid Approach for Interpreting Action-Oriented and Goal-Oriented Instructions
两个 DRAGGN 的故事:解释面向行动和面向目标的指令的混合方法
- DOI:
10.18653/v1/w17-2809 - 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
Siddharth Karamcheti;Edward C. Williams;Dilip Arumugam;Mina Rhee;N. Gopalan;Lawson L. S. Wong;Stefanie Tellex - 通讯作者:
Stefanie Tellex
Stefanie Tellex的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Stefanie Tellex', 18)}}的其他基金
Collaborative Research: CPS: Medium: Closing the Teleoperation Gap: Integrating Scene and Network Understanding for Dexterous Control of Remote Robots
协作研究:CPS:中:缩小远程操作差距:集成场景和网络理解以实现远程机器人的灵巧控制
- 批准号:
2038897 - 财政年份:2021
- 资助金额:
$ 54.27万 - 项目类别:
Standard Grant
EAGER: A Gateway Drone for High School Students
EAGER:面向高中生的网关无人机
- 批准号:
1940970 - 财政年份:2020
- 资助金额:
$ 54.27万 - 项目类别:
Standard Grant
NRI: Collaborative Research: Jointly Learning Language and Affordances
NRI:协作研究:共同学习语言和功能可供性
- 批准号:
1426452 - 财政年份:2014
- 资助金额:
$ 54.27万 - 项目类别:
Standard Grant
相似国自然基金
数智背景下的团队人力资本层级结构类型、团队协作过程与团队效能结果之间关系的研究
- 批准号:72372084
- 批准年份:2023
- 资助金额:40 万元
- 项目类别:面上项目
在线医疗团队协作模式与绩效提升策略研究
- 批准号:72371111
- 批准年份:2023
- 资助金额:41 万元
- 项目类别:面上项目
面向人机接触式协同作业的协作机器人交互控制方法研究
- 批准号:62373044
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
基于数字孪生的颅颌面人机协作智能手术机器人关键技术研究
- 批准号:82372548
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
A-型结晶抗性淀粉调控肠道细菌协作产丁酸机制研究
- 批准号:32302064
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
相似海外基金
NRI/Collaborative Research: Robotic Disassembly of High-Precision Electronic Devices
NRI/合作研究:高精度电子设备的机器人拆卸
- 批准号:
2422640 - 财政年份:2024
- 资助金额:
$ 54.27万 - 项目类别:
Standard Grant
NRI/Collaborative Research: Robust Design and Reliable Autonomy for Transforming Modular Hybrid Rigid-Soft Robots
NRI/合作研究:用于改造模块化混合刚软机器人的稳健设计和可靠自主性
- 批准号:
2327702 - 财政年份:2023
- 资助金额:
$ 54.27万 - 项目类别:
Standard Grant
Collaborative Research: NRI: Understanding Underlying Risks and Sociotechnical Challenges of Powered Wearable Exoskeleton to Construction Workers
合作研究:NRI:了解建筑工人动力可穿戴外骨骼的潜在风险和社会技术挑战
- 批准号:
2410255 - 财政年份:2023
- 资助金额:
$ 54.27万 - 项目类别:
Standard Grant
NRI: FND: Collaborative Research: DeepSoRo: High-dimensional Proprioceptive and Tactile Sensing and Modeling for Soft Grippers
NRI:FND:合作研究:DeepSoRo:软抓手的高维本体感受和触觉感知与建模
- 批准号:
2348839 - 财政年份:2023
- 资助金额:
$ 54.27万 - 项目类别:
Standard Grant
Collaborative Research: NRI: Reducing Falling Risk in Robot-Assisted Retail Environments
合作研究:NRI:降低机器人辅助零售环境中的跌倒风险
- 批准号:
2132936 - 财政年份:2022
- 资助金额:
$ 54.27万 - 项目类别:
Standard Grant