CRII: RI: Active Learning of Preferences for Human-Aware Autonomy

CRII:RI:主动学习人类意识自主偏好

基本信息

  • 批准号:
    1849952
  • 负责人:
  • 金额:
    $ 17.5万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2019
  • 资助国家:
    美国
  • 起止时间:
    2019-06-01 至 2022-11-30
  • 项目状态:
    已结题

项目摘要

Humans' preferences play a key role in specifying how robotics systems should act, i.e., how an assistive robot arm should move, or how an autonomous car should drive. The learned human preferences are an important element in planning for interactive autonomous systems, e.g., robots collaborating with different types of human teammates, or shared autonomy with a human to efficiently teleoperate a robot arm. One hopes that learning techniques can be used to learn reward functions representing humans' preferences for robotics applications. However, a significant part of the success of learning algorithms can be attributed to the availability of large amounts of labeled data. Unfortunately, collecting and labeling data can be costly and time-consuming in robotics applications. In addition, humans are not always capable of reliably assigning a success value (reward) to a given robot action, and their demonstrations are usually suboptimal due to the difficulty of operating robots with more than a few degrees of freedom. The proposed research develops foundational techniques to address the key challenges of using learning techniques in human-robot interaction. The goal of this project is to develop efficient methods and algorithms to first better model and understand humans preferences while operating, interacting, and collaborating with robots. Furthermore, the investigator will design algorithms that plan for robots that are aware of such preferences and can initiate a safe and seamless interaction with humans. This project involves two main contributions: (1) Developing efficient and active algorithms to learn probabilistic mixture models for humans preferences about how a robot should operate based on comparisons and rankings., and (2) Developing planning algorithms for robots that leverage humans preferences to enable seamless shared autonomy and more efficient human-robot interaction. Preliminary results in the domain of autonomous driving suggest that one can learn driving preferences of humans and this approach can improve efficiency and safety of robotics systems.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
人类的偏好在指定机器人系统应如何运作方面发挥着关键作用,即辅助机器人手臂应如何移动,或者自动驾驶汽车应如何驾驶。学习到的人类偏好是规划交互式自主系统的重要元素,例如,机器人与不同类型的人类队友协作,或与人类共享自主权以有效地远程操作机器人手臂。人们希望学习技术可以用来学习代表人类对机器人应用的偏好的奖励函数。然而,学习算法成功的很大一部分可以归因于大量标记数据的可用性。不幸的是,在机器人应用中收集和标记数据可能既昂贵又耗时。此外,人类并不总是能够可靠地为给定的机器人动作分配成功值(奖励),并且由于操作具有多个自由度的机器人很困难,因此他们的演示通常不是最佳的。拟议的研究开发了基础技术,以解决在人机交互中使用学习技术的关键挑战。该项目的目标是开发有效的方法和算法,以便在与机器人操作、交互和协作时首先更好地建模和理解人类的偏好。此外,研究人员将设计算法,让机器人能够意识到这些偏好,并能够与人类进行安全、无缝的交互。该项目涉及两个主要贡献:(1)开发高效且主动的算法来学习人类偏好的概率混合模型,了解机器人应如何基于比较和排名进行操作。(2)开发机器人规划算法,利用人类偏好来实现无缝共享自主和更高效的人机交互。自动驾驶领域的初步结果表明,人们可以学习人类的驾驶偏好,这种方法可以提高机器人系统的效率和安全性。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力优势和能力进行评估,认为值得支持。更广泛的影响审查标准。

项目成果

期刊论文数量(17)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
PLATO: Predicting Latent Affordances Through Object-Centric Play
柏拉图:通过以对象为中心的游戏来预测潜在的可供性
  • DOI:
    10.48550/arxiv.2203.05630
  • 发表时间:
    2022-03-10
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Suneel Belkhale;Dorsa Sadigh
  • 通讯作者:
    Dorsa Sadigh
Active Learning of Reward Dynamics from Hierarchical Queries
从分层查询中主动学习奖励动态
Learning From Imperfect Demonstrations From Agents With Varying Dynamics
从动态变化的代理的不完美演示中学习
Learning Human Objectives from Sequences of Physical Corrections
从一系列物理矫正中学习人类目标
The Green Choice: Learning and Influencing Human Decisions on Shared Roads
绿色选择:学习并影响人类在共享道路上的决策
  • DOI:
    10.1109/cdc40024.2019.9030169
  • 发表时间:
    2019-12
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Biyik, Erdem;Lazar, Daniel A.;Sadigh, Dorsa;Pedarsani, Ramtin
  • 通讯作者:
    Pedarsani, Ramtin
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Dorsa Sadigh其他文献

Active Preference-Based Learning of Reward Functions
基于偏好的主动奖励函数学习
  • DOI:
    10.15607/rss.2017.xiii.053
  • 发表时间:
    2017-07-12
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Dorsa Sadigh;A. Dragan;S. Sastry;S. Seshia
  • 通讯作者:
    S. Seshia
BLEU Neighbors: A Reference-less Approach to Automatic Evaluation
BLEU 邻居:一种无参考自动评估方法
  • DOI:
    10.18653/v1/2020.eval4nlp-1.5
  • 发表时间:
    2020-04-27
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kawin Ethayarajh;Dorsa Sadigh
  • 通讯作者:
    Dorsa Sadigh
Object Exchangeability in Reinforcement Learning: Extended Abstract
强化学习中的对象可交换性:扩展摘要
  • DOI:
    10.1109/tpami.2021.3069005
  • 发表时间:
    2019-05-07
  • 期刊:
  • 影响因子:
    0
  • 作者:
    John Mern;Dorsa Sadigh;Mykel J. Kochenderfer
  • 通讯作者:
    Mykel J. Kochenderfer
Altruistic Autonomy: Beating Congestion on Shared Roads
无私的自治:克服共享道路上的拥堵
SpatialVLM: Endowing Vision-Language Models with Spatial Reasoning Capabilities
SpatialVLM:赋予视觉语言模型空间推理能力
  • DOI:
    10.48550/arxiv.2401.12168
  • 发表时间:
    2024-01-22
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Boyuan Chen;Zhuo Xu;Sean Kirmani;Brian Ichter;Danny Driess;Pete Florence;Dorsa Sadigh;Leonidas Guibas;Fei Xia
  • 通讯作者:
    Fei Xia

Dorsa Sadigh的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Dorsa Sadigh', 18)}}的其他基金

Collaborative Research: CPS: Small: Risk-Aware Planning and Control for Safety-Critical Human-CPS
合作研究:CPS:小型:安全关键型人类 CPS 的风险意识规划和控制
  • 批准号:
    2218760
  • 财政年份:
    2022
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
NRI/Collaborative Research: Robot-Assisted Feeding: Towards Efficient, Safe, and Personalized Caregiving Robots
NRI/合作研究:机器人辅助喂养:迈向高效、安全和个性化的护理机器人
  • 批准号:
    2132847
  • 财政年份:
    2022
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
CPS: Medium: Sufficient Statistics for Learning Multi-Agent Interactions
CPS:中:学习多智能体交互的足够统计数据
  • 批准号:
    2125511
  • 财政年份:
    2021
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
CHS: Small: Learning and Leveraging Conventions in Human-Robot Interaction
CHS:小:学习和利用人机交互中的约定
  • 批准号:
    2006388
  • 财政年份:
    2020
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
Collaborative Research: Mixed-Autonomy Traffic Networks: Routing Games and Learning Human Choice Models
合作研究:混合自主交通网络:路由博弈和学习人类选择模型
  • 批准号:
    1953032
  • 财政年份:
    2020
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
CAREER: Safe and Influencing Interactions for Human-Robot Systems
职业:人机系统的安全且有影响力的交互
  • 批准号:
    1941722
  • 财政年份:
    2020
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Continuing Grant

相似国自然基金

跨膜蛋白LRP5胞外域调控膜受体TβRI促钛表面BMSCs归巢、分化的研究
  • 批准号:
    82301120
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于“免疫-神经”网络探讨眼针活化CI/RI大鼠MC靶向H3R调节“免疫监视”的抗炎机制
  • 批准号:
    82374375
  • 批准年份:
    2023
  • 资助金额:
    51 万元
  • 项目类别:
    面上项目
Dectin-2通过促进FcεRI聚集和肥大细胞活化加剧哮喘发作的机制研究
  • 批准号:
    82300022
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
MRGPRX2激活“皮肤-神经轴”在非FcεRI介导慢性自发性荨麻疹中的作用及分子机制
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
抗体介导的PRRSV感染通过FcγRI抑制I型干扰素产生的分子机制
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

CRII: RI: Sub-mm 3D Scanning of Real-World Scenes with Active Multi-View Event Sensing
CRII:RI:通过主动多视图事件传感对现实世界场景进行亚毫米 3D 扫描
  • 批准号:
    2153516
  • 财政年份:
    2022
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
CRII: RI: Sub-mm 3D Scanning of Real-World Scenes with Active Multi-View Event Sensing
CRII:RI:通过主动多视图事件传感对现实世界场景进行亚毫米 3D 扫描
  • 批准号:
    2328619
  • 财政年份:
    2022
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
CRII: RI: Sub-mm 3D Scanning of Real-World Scenes with Active Multi-View Event Sensing
CRII:RI:通过主动多视图事件传感对现实世界场景进行亚毫米 3D 扫描
  • 批准号:
    2328619
  • 财政年份:
    2022
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
CRII: RI: Learning with Low-Quality Visual Data: Handling Both Passive and Active Degradations
CRII:RI:使用低质量视觉数据学习:处理被动和主动退化
  • 批准号:
    2053269
  • 财政年份:
    2020
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
CRII: RI: Learning with Low-Quality Visual Data: Handling Both Passive and Active Degradations
CRII:RI:使用低质量视觉数据学习:处理被动和主动退化
  • 批准号:
    1755701
  • 财政年份:
    2018
  • 资助金额:
    $ 17.5万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了