RI: Small: Model-Based Deep Reinforcement Learning for Domain Transfer

RI:小型:用于域迁移的基于模型的深度强化学习

基本信息

  • 批准号:
    1614653
  • 负责人:
  • 金额:
    $ 47.93万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2016
  • 资助国家:
    美国
  • 起止时间:
    2016-09-01 至 2016-11-30
  • 项目状态:
    已结题

项目摘要

The goal of this project is to develop machine learning algorithms that can enable automated decision making and control in applications that require autonomous agents to interact with the real world. In particular, the project will examine two application areas: autonomous robots and educational agents that interact with human students to facilitate learning. The principal technical development investigated in this project will center around applications of deep neural networks (deep learning) to efficiently learn predictive models of the world, such as the physical environment of the robot or the behavior of a human student using an interactive educational agent. Deep learning has enabled impressive advances in passive perception domains such as computer vision and speech recognition, but typically requires very large amounts of data to succeed. This is often a major challenge in interactive settings, where a robot cannot interact with its environment for weeks or months just to learn a single behavior. To address this challenge, this project will investigate how predictive models can be transferred from prior tasks into a new task. The technologies developed as part of this project could enable substantially more sophisticated autonomous systems that can adapt quickly to new situations through transfer. Economic impact could include new consumer robotics products and improved education through intelligent automation.Reinforcement learning holds the promise of automating complex decision making and control in the presence of uncertainty. For a wide range of real-world problems, from robotic control and autonomous vehicles to interactive educational tools, this would provide dramatic improvements in capability and reduction in engineering cost. However, applying reinforcement learning to complex, unstructured environments and real-world problems with raw inputs, such as images and sounds, remains tremendously difficult. Deep learning has shown a great deal of promise for tackling complex learning problems, especially ones that require parsing high-dimensional, raw sensory signals, but the most successful applications of deep learning use very large amounts of labeled data. This is at odds with the demands of reinforcement learning, where the goal is typically to learn an effective policy using the minimal amount of interaction. This projects aims to address this challenge by developing algorithms for model-based deep reinforcement learning, where a generalizable model is learned from past experience on related but different tasks, and then transferred to a new task to learn it very quickly, directly using raw sensory inputs.
该项目的目的是开发机器学习算法,该算法可以在需要自主代理与现实世界互动的应用程序中实现自动决策和控制。特别是,该项目将检查两个应用领域:与人类学生互动以促进学习的自主机器人和教育代理商。该项目中调查的主要技术发展将围绕深度神经网络(深度学习)的应用,以有效地学习世界的预测模型,例如机器人的物理环境或使用互动教育代理人的人类学生的行为。深度学习使被动感知域(例如计算机视觉和语音识别)的令人印象深刻的进步,但通常需要大量数据才能成功。这通常是互动环境中的主要挑战,在互动环境中,机器人几周或几个月就无法与环境互动,只是为了学习一种行为。为了应对这一挑战,该项目将调查如何将预测模型从先前的任务传输到新任务。作为该项目的一部分开发的技术可以实现基本更复杂的自主系统,这些系统可以通过转移迅速适应新情况。经济影响可能包括新的消费者机器人产品和通过智能自动化改善教育。强化学习有望在不确定性的情况下自动化复杂的决策和控制。对于各种现实世界中的问题,从机器人控制和自动驾驶汽车到交互式教育工具,这将为工程成本的能力和降低提供巨大的改善。但是,将加固学习应用于复杂的,非结构化的环境和原始输入(例如图像和声音)的现实问题仍然非常困难。深度学习对解决复杂的学习问题有很大的希望,尤其是那些需要解析高维,原始感官信号的问题,但是深度学习的最成功应用程序使用了大量标记的数据。这与强化学习的需求不一致,在这种需求中,通常是使用最少的互动来学习有效政策的目标。该项目旨在通过为基于模型的深入增强学习算法开发算法来应对这一挑战,在这些算法中,从相关但不同的任务的过去经验中学到了可推广的模型,然后转移到新任务中,直接使用原始感官直接学习它输入。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Sergey Levine其他文献

Goal-oriented Vision-and-Dialog Navigation through Reinforcement Learning
通过强化学习实现目标导向的视觉和对话导航
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Peter Anderson;Qi Wu;Damien Teney;Jake Bruce;Mark Johnson;Niko Sünderhauf;Ian D. Reid;F. Bonin;Alberto Ortiz;Angel X. Chang;Angela Dai;T. Funkhouser;Ma;Matthias Niebner;M. Savva;David Chen;Raymond Mooney. 2011;Learning;Howard Chen;Alane Suhr;Dipendra Kumar Misra;T. Kollar;Nicholas Roy;Trajectory;Satwik Kottur;José M. F. Moura;Dhruv Devi Parikh;Sergey Levine;Chelsea Finn;Trevor Darrell;Jianfeng Li;Gao Yun;Chen;Ziming Li;Sungjin Lee;Baolin Peng;Jinchao Li;Julia Kiseleva;M. D. Rijke;Shahin Shayandeh;Weixin Liang;Youzhi Tian;Cheng;Yitao Liang;Marlos C. Machado;Erik Talvitie;Chih;Jiasen Lu;Zuxuan Wu;G. Al
  • 通讯作者:
    G. Al
Is Value Learning Really the Main Bottleneck in Offline RL?
价值学习真的是离线强化学习的主要瓶颈吗?
  • DOI:
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Seohong Park;Kevin Frans;Sergey Levine;Aviral Kumar
  • 通讯作者:
    Aviral Kumar
Grow Your Limits: Continuous Improvement with Real-World RL for Robotic Locomotion
拓展你的极限:通过现实世界的强化学习来持续改进机器人运动
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Laura M. Smith;Yunhao Cao;Sergey Levine
  • 通讯作者:
    Sergey Levine
Functional Graphical Models: Structure Enables Offline Data-Driven Optimization
功能图形模型:结构支持离线数据驱动优化
REBOOT: Reuse Data for Bootstrapping Efficient Real-World Dexterous Manipulation
REBOOT:重用数据引导高效的现实世界灵巧操作
  • DOI:
    10.48550/arxiv.2309.03322
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Zheyuan Hu;Aaron Rovinsky;Jianlan Luo;Vikash Kumar;Abhishek Gupta;Sergey Levine
  • 通讯作者:
    Sergey Levine

Sergey Levine的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Sergey Levine', 18)}}的其他基金

RI: Small: Extracting Knowledge from Language Models for Decision Making
RI:小型:从语言模型中提取知识以进行决策
  • 批准号:
    2246811
  • 财政年份:
    2023
  • 资助金额:
    $ 47.93万
  • 项目类别:
    Standard Grant
Robotic Learning with Reusable Datasets
使用可重复使用的数据集进行机器人学习
  • 批准号:
    2150826
  • 财政年份:
    2022
  • 资助金额:
    $ 47.93万
  • 项目类别:
    Standard Grant
CAREER: Deep Robotic Learning with Large Datasets: Toward Simple and Reliable Lifelong Learning Frameworks
职业:大数据集的深度机器人学习:迈向简单可靠的终身学习框架
  • 批准号:
    1651843
  • 财政年份:
    2017
  • 资助金额:
    $ 47.93万
  • 项目类别:
    Continuing Grant
NRI: Collaborative Research: Learning Deep Sensorimotor Policies for Shared Autonomy
NRI:协作研究:学习共享自主权的深度感觉运动策略
  • 批准号:
    1637443
  • 财政年份:
    2016
  • 资助金额:
    $ 47.93万
  • 项目类别:
    Standard Grant
RI: Small: Model-Based Deep Reinforcement Learning for Domain Transfer
RI:小型:用于域迁移的基于模型的深度强化学习
  • 批准号:
    1700697
  • 财政年份:
    2016
  • 资助金额:
    $ 47.93万
  • 项目类别:
    Standard Grant
NRI: Collaborative Research: Learning Deep Sensorimotor Policies for Shared Autonomy
NRI:协作研究:学习共享自主权的深度感觉运动策略
  • 批准号:
    1700696
  • 财政年份:
    2016
  • 资助金额:
    $ 47.93万
  • 项目类别:
    Standard Grant

相似国自然基金

复杂场景下模型—数据联合驱动的红外小目标检测研究
  • 批准号:
    62303165
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于PBPK/PD模型的非小细胞肺癌患者中利伐沙班与ALK抑制剂的药物相互作用研究
  • 批准号:
    82304620
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
解析小分子诱导型血管内皮细胞的分化机制并利用AMI猪模型研究其移植治疗效果
  • 批准号:
    32370854
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
光强调控蜡质合成机制的研究--以小灌木蜡叶越橘为模型
  • 批准号:
    32371831
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
基于新型定量模型的荧光纳米探针用于复杂体系小分子检测及成像研究
  • 批准号:
    22367004
  • 批准年份:
    2023
  • 资助金额:
    32 万元
  • 项目类别:
    地区科学基金项目

相似海外基金

RI:Small:Exploring Efficient Bayesian Model-Augmentation Techniques for Decomposible Contrastive Representation Learning
RI:Small:探索可分解对比表示学习的高效贝叶斯模型增强技术
  • 批准号:
    2223292
  • 财政年份:
    2022
  • 资助金额:
    $ 47.93万
  • 项目类别:
    Standard Grant
RI: Small: Robust Model-Based Identification, Navigation, and Control of Underactuated Underwater Vehicles
RI:小型:基于鲁棒模型的欠驱动水下航行器识别、导航和控制
  • 批准号:
    1909182
  • 财政年份:
    2019
  • 资助金额:
    $ 47.93万
  • 项目类别:
    Standard Grant
RI: Small: A Unified Compositional Model for Explainable Video-based Human Activity Parsing
RI:小型:用于可解释的基于视频的人类活动解析的统一组合模型
  • 批准号:
    1815561
  • 财政年份:
    2018
  • 资助金额:
    $ 47.93万
  • 项目类别:
    Standard Grant
RI: SMALL: Fast Prediction and Model Compression for Large-Scale Machine Learning
RI:SMALL:大规模机器学习的快速预测和模型压缩
  • 批准号:
    1901527
  • 财政年份:
    2018
  • 资助金额:
    $ 47.93万
  • 项目类别:
    Standard Grant
RI: SMALL: Fast Prediction and Model Compression for Large-Scale Machine Learning
RI:SMALL:大规模机器学习的快速预测和模型压缩
  • 批准号:
    1719097
  • 财政年份:
    2017
  • 资助金额:
    $ 47.93万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了