Collaborative Research: HCC: Medium: Aligning Robot Representations with Humans

合作研究:HCC:媒介:使机器人表示与人类保持一致

基本信息

  • 批准号:
    2310759
  • 负责人:
  • 金额:
    $ 30.55万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2023
  • 资助国家:
    美国
  • 起止时间:
    2023-08-15 至 2026-07-31
  • 项目状态:
    未结题

项目摘要

This project seeks to make robots more robust and aligned with human preferences and values. Traditionally, robot behaviors and objectives were trained to include a set of hand-crafted features (i.e., variables represented in the data) that reflect task-relevant aspects of the environment. Using well-chosen features is very data-efficient, but it is unrealistic for human engineers to identify and write code ahead of time for all the features that could matter. Training modern high-capacity models from a lot of data is a great alternative, as long as we do not probe the learned models on novel (out-of-distribution) inputs. The reason these models fail to generalize to out-of-distribution inputs is that they will generally fail to learn the correct representation, comprising the features that matter, and instead pick up on spurious patterns in the data. The central goal of this project is to enable robots to arrive at the underlying correct representation for objectives (and, hence, behaviors). And since learning the objective function---what the human user wants---is fundamentally about humans, this work proposes that only the human can determine what actually matters vs. what is spurious. The research will introduce the problem of aligning robot representations to humans. The key observation behind the project is that traditional input used in learning, such as demonstrations or comparisons, which is designed to teach the robot the full task, is not ideal for aligning the robot’s representation. With representation alignment defined as a problem, there is the opportunity to design new types of human feedback that help the robot explicitly isolate the right representation. The project will develop new types of human feedback and algorithms for efficiently learning from them to arrive at an aligned representation. Preliminary work leveraged this observation to introduce feature traces---a novel type of human input through which users can teach the robot about specific features they care about. The project will pursue four objectives that together tackle the aspects of aligning robot representations with humans: (1) Teaching one feature at a time, beyond feature traces: It will investigate new input types for aligning robot representations with users, contribute active learning algorithms that help the human teacher provide the most informative input, and build transparency tools that enable robots to teach back to the user their current understanding of the representation. (2) Extracting features all at once from new, representation-specific human input: It will investigate new human input types that teach the full representation all at once by combining self-supervised representation learning methods with human-centric representation learning. (3) Using a correct representation in the right way: Given a new task, the robot needs to learn which features matter and in which contexts. (4) Extending earlier work to policy learning: It will extend new tools to the policy learning setting and use the lens of human-aligned representations to enable better policy generalization to new users and to improve goal mis-generalization in reinforcement learning.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
该项目旨在使机器人更加强大并符合人类的偏好和价值观。传统上,机器人的行为和目标经过训练,包括一组反映任务相关方面的手工特征(即数据中表示的变量)。使用精心选择的特征非常具有数据效率,但对于人类工程师来说,提前识别所有可能重要的特征并编写代码是不现实的,从大量数据中训练现代高容量模型是一件好事。替代方案,只要因为我们没有在新的(分布外)输入上探索学习模型,这些模型无法推广到分布外输入的原因是它们通常无法学习正确的表示,包括重要的特征。 ,而不是发现数据中的虚假模式,该项目的中心目标是使机器人能够获得目标(以及今后的行为)的基本正确表示。人类用户想要的——从根本上讲是关于人类的,这项工作提出只有人类才能确定什么是真正重要的,什么是虚假的。该研究将引入将机器人表示与人类对齐的问题。该项目背后的关键观察是学习中使用的传统输入,例如演示或比较。旨在教导机器人完成完整的任务,对于对齐机器人的表示来说并不理想,由于表示对齐被定义为一个问题,因此有机会设计新类型的人类反馈来帮助机器人明确地隔离正确的表示。将开发新型人类反馈和算法为了有效地向他们学习以获得一致的表示,初步工作利用了这种观察来引入特征痕迹——一种新型的人类输入,用户可以通过这种方式向机器人传授他们关心的特定特征。该项目将追求四个目标。共同解决将机器人表示与人类对齐的各个方面:(1)一次教授一个特征,超越特征轨迹:它将研究用于将机器人表示与用户对齐的新输入类型,贡献主动学习算法,帮助人类教师提供最丰富的信息输入,并构建透明度工具,使(2)从新的、特定于表示的人类输入中一次性提取特征:它将研究新的人类输入类型,通过结合自学习一次性教授完整的表示。 (3)以正确的方式使用正确的表示学习方法:给定一个新任务,机器人需要学习哪些特征重要以及在哪些上下文中。(4)将早期的工作扩展到策略学习。 :它将把新工具扩展到政策学习环境和使用人性化表示的视角,为新用户提供更好的政策概括,并改善强化学习中的目标错误概括。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力价值和更广泛的影响进行评估,被认为值得支持审查标准。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Daniel Brown其他文献

Iatrogenic Dissociative Identity Disorder—An Evaluation of the Scientific Evidence
医源性分离性身份障碍——科学证据的评估
  • DOI:
    10.1177/009318539902700308
  • 发表时间:
    1999-09-01
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Daniel Brown;E. Frischholz;A. Scheflin
  • 通讯作者:
    A. Scheflin
RADIATION‐INDUCED TUMOR AFTER STEREOTACTIC RADIOSURGERY FOR AN ARTERIOVENOUS MALFORMATION: CASE REPORT
动静脉畸形立体定向放射外科手术后放射诱发的肿瘤:病例报告
  • DOI:
    10.1227/01.neu.0000303207.92617.4e
  • 发表时间:
    2007-11-01
  • 期刊:
  • 影响因子:
    4.8
  • 作者:
    E. L. Berman;T. Eade;Daniel Brown;Michael Weaver;J. Glass;G. Zorman;S. Feigenberg
  • 通讯作者:
    S. Feigenberg
Crowd Score: A Method for the Evaluation of Jokes using Large Language Model AI Voters as Judges
人群评分:一种利用大语言模型AI投票者作为评委的笑话评价方法
  • DOI:
    10.48550/arxiv.2212.11214
  • 发表时间:
    2022-12-21
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Fabrício Góes;Zisen Zhou;Piotr Sawicki;M. Grzes;Daniel Brown
  • 通讯作者:
    Daniel Brown
Hydrodynamic effects on the energy transfer from dipoles to metal slab.
流体动力学对从偶极子到金属板的能量传递的影响。
  • DOI:
    10.1063/5.0062708
  • 发表时间:
    2021-05-22
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Daniel Brown;H. Deng
  • 通讯作者:
    H. Deng
Unbiased Efficient Feature Counts for Inverse RL
无偏有效特征对逆强化学习很重要
  • DOI:
  • 发表时间:
    2024-09-14
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Gerard Donahue;Brendan Crowe;Dr. Marek Petrik;Daniel Brown;Soheil Gharatappeh
  • 通讯作者:
    Soheil Gharatappeh

Daniel Brown的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Daniel Brown', 18)}}的其他基金

Consolidated Solar Research at UCLan
中央兰开夏大学综合太阳能研究中心
  • 批准号:
    ST/M00760X/1
  • 财政年份:
    2015
  • 资助金额:
    $ 30.55万
  • 项目类别:
    Research Grant
Supporting Dark Sky Communities in the Park
支持公园内的黑暗天空社区
  • 批准号:
    ST/K002112/1
  • 财政年份:
    2012
  • 资助金额:
    $ 30.55万
  • 项目类别:
    Research Grant
Astronomy in the Park - Landscape and Skyscape
公园里的天文 - 景观和天空景观
  • 批准号:
    ST/J500057/1
  • 财政年份:
    2011
  • 资助金额:
    $ 30.55万
  • 项目类别:
    Research Grant
Graduate Research Fellowship Program
研究生研究奖学金计划
  • 批准号:
    0635901
  • 财政年份:
    2006
  • 资助金额:
    $ 30.55万
  • 项目类别:
    Fellowship Award
GRADUATE RESEARCH FELLOWSHIP PROGRAM
研究生研究奖学金计划
  • 批准号:
    9255641
  • 财政年份:
    1992
  • 资助金额:
    $ 30.55万
  • 项目类别:
    Fellowship Award
Graduate Research Fellowship Program
研究生研究奖学金计划
  • 批准号:
    9154562
  • 财政年份:
    1991
  • 资助金额:
    $ 30.55万
  • 项目类别:
    Fellowship Award
Graduate Research Fellowship Program
研究生研究奖学金计划
  • 批准号:
    9054707
  • 财政年份:
    1990
  • 资助金额:
    $ 30.55万
  • 项目类别:
    Fellowship Award

相似国自然基金

基于内质网信号肽耦连多肽文库筛选TAP缺陷诱导肝癌免疫逃逸机制及mRNA疫苗逆转策略的研究
  • 批准号:
    82372798
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
脂相关巨噬细胞CA12介导铁死亡在脂肪肝相关肝癌的作用机制研究
  • 批准号:
    82302583
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
肝癌干细胞外泌体靶向诱导CD8+T细胞组蛋白去乳酸化修饰参与免疫治疗耐药的机制与标志物研究
  • 批准号:
    82372332
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
维甲酸X受体靶向药物研究及对肝癌干性基因调控的机制探索
  • 批准号:
    82373719
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
肝癌外周血测序数据中循环肿瘤DNA占比的精确解耦方法研究
  • 批准号:
    62303271
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Collaborative Research: HCC: Medium: Connecting Practitioners to Design: Methods and Tools for Live Participatory Design Fiction
合作研究:HCC:媒介:将从业者与设计联系起来:现场参与式设计小说的方法和工具
  • 批准号:
    2425383
  • 财政年份:
    2023
  • 资助金额:
    $ 30.55万
  • 项目类别:
    Standard Grant
Collaborative Research: HCC: Small: RUI: Drawing from Life in Extended Reality: Advancing and Teaching Cross-Reality User Interfaces for Observational 3D Sketching
合作研究:HCC:小型:RUI:从扩展现实中的生活中汲取灵感:推进和教授用于观察 3D 草图绘制的跨现实用户界面
  • 批准号:
    2326999
  • 财政年份:
    2023
  • 资助金额:
    $ 30.55万
  • 项目类别:
    Standard Grant
Collaborative Research: HCC: Small: RUI: Drawing from Life in Extended Reality: Advancing and Teaching Cross-Reality User Interfaces for Observational 3D Sketching
合作研究:HCC:小型:RUI:从扩展现实中的生活中汲取灵感:推进和教授用于观察 3D 草图绘制的跨现实用户界面
  • 批准号:
    2326998
  • 财政年份:
    2023
  • 资助金额:
    $ 30.55万
  • 项目类别:
    Standard Grant
Collaborative Research: HCC: Small: End-User Guided Search and Optimization for Accessible Product Customization and Design
协作研究:HCC:小型:最终用户引导的搜索和优化,以实现无障碍产品定制和设计
  • 批准号:
    2327137
  • 财政年份:
    2023
  • 资助金额:
    $ 30.55万
  • 项目类别:
    Standard Grant
Collaborative Research: HCC: Small: Supporting Flexible and Safe Disability Representation in Social Virtual Reality
合作研究:HCC:小型:支持社交虚拟现实中灵活、安全的残疾表征
  • 批准号:
    2328182
  • 财政年份:
    2023
  • 资助金额:
    $ 30.55万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了