RI: Collaborative Research: Feature Discovery and Benchmarks for Exportable Reinforcement Learning

RI:协作研究:可导出强化学习的特征发现和基准

基本信息

  • 批准号:
    0713148
  • 负责人:
  • 金额:
    $ 22.5万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2007
  • 资助国家:
    美国
  • 起止时间:
    2007-10-01 至 2012-05-31
  • 项目状态:
    已结题

项目摘要

Collaborative Proposal pair: 0713435 (Lead) & 0713148"Collaborative: RI: Feature Discovery and Benchmarks for exportable Reinforcement Learning"PI: Ronald Parr, Duke UniversityPI: Michael L. Littman, Rutgers UniversityABSTRACTThis project focuses on several aspects of automated feature discovery in the context of reinforcement learning. Badly chosen features cause reinforcement-learning algorithms to fail and, as such, only individuals skilled in feature construction can create successful reinforcement-learning systems for novel tasks. This issue underscores two shortcomings in existing research. First, most existing reinforcement-learning methods cannot generate or discover features automatically and robustly. Second, existing benchmark problems and paradigms for benchmarking do not distinguish adequately between clever algorithm design and clever feature engineering.This project addresses these challenges in two-pronged approach. The first prong aims to advance a technical agenda leading to a new approach to feature discovery and model representation. The second prong is the development of a benchmark methodology and repository with a different focus and structure from existing endeavors. The goal for the benchmarking effort will be to produce a set of fair and reproducible experiments that will help elucidate the strengths and weaknesses of existing approaches, while simultaneously introducing challenges to motivate the development of new approaches.
Collaborative Proposal pair: 0713435 (Lead) & 0713148"Collaborative: RI: Feature Discovery and Benchmarks for exportable Reinforcement Learning"PI: Ronald Parr, Duke UniversityPI: Michael L. Littman, Rutgers UniversityABSTRACTThis project focuses on several aspects of automated feature discovery in the context of reinforcement learning.不良选择的功能会导致加强学习算法失败,因此,只有熟练的特征构造的个人才能为新任务创建成功的加强学习系统。这个问题强调了现有研究中的两个缺点。首先,大多数现有的增强学习方法无法自动,稳健地生成或发现功能。其次,现有的基准问题和基准测试范例不能在聪明的算法设计和聪明的功能工程之间充分区分。该项目以两种挑剔的方法解决了这些挑战。第一个插脚旨在推进技术议程,从而提出一种新的发现和模型表示的方法。第二阶段是开发基准方法和存储库,其重点和结构与现有努力不同。基准努力的目标是制作一套公平且可重复的实验,以帮助阐明现有方法的优势和劣势,同时引入挑战以激发新方法的发展。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Michael Littman其他文献

Model-based reasoning
基于模型的推理
  • DOI:
    10.1016/j.compedu.2012.11.014
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Michael Jackson;Janusz Wojtusiak;Dayne Freitag;Eugene Subbotsky;Hans M. Nordahl;Jens C. Thimm;John Burgoyne;Roberto Poli;Thomas R. Guskey;Michael Davison;J. Magnotti;Adam M. Goodman;Jeffrey S. Katz;L. Verschaffel;W. Dooren;B. Smedt;Sean A. Fulop;Melva R. Grant;Leonid I. Perlovsky;B. De Smedt;P. Ghesquière;Dariusz Plewczynski;Leily Ziglari;P. Birjandi;Scott Rick;Roberto Weber;N. Seel;Maike Luhmann;Michael Eid;A. Antonietti;Barbara Colombo;Hamish Coates;Ali Radloff;P. Pirnay;Dirk Ifenthaler;Edward Swing;Craig A Anderson;David Tzuriel;Norman M. Weinberger;David C. Riccio;Patrick K. Cullen;J. Tallet;Megan L. Hoffman;David A. Washburn;Iván Izquierdo;Jorge H. Medina;M. Cammarota;A. Podolskiy;Joke Torbeyns;J. Kranzler;P. A. Kirschner;F. Kirschner;Kenn Apel;Julie A. Wolter;J. Masterson;JungMi Lee;Stefan N Groesser;Sabine Al;Philip Barker;Paul Schaik;I. Cutica;Monica Bucciarelli;K. Pata;Anna Strasser;A. Guillot;N. Hoyek;Christian Collet;Maria Opfermann;Roger Azevedo;Detlev Leutner;Thomas C. Toppino;Alice Y. Kolb;David A. Kolb;P. Brazdil;Ricardo Vilalta;Carlos Soares;C. Giraud;Jeffrey W. Bloom;Tyler Volk;Marwan A. Dwairy;Richard A. Swanson;Johanna Pöysä;K. Luwel;Theo Hug;Angélique Martin;Nicolas Guéguen;Craig Hassed;Fabio Alivernini;Michael Herczeg;M. Mastropieri;T. Scruggs;Angelika Rieder;S. Castillo;Gerardo Ayala;R. Low;R. Babuška;Barbara C. Buckley;Henry Markovits;Sungho Kim;In;Michael J. Spector;A. Towse;Charlie N. Lewis;Brian Francis;David N. Rapp;Pratim Sengupta;Sidney D’Mello;Serge Brand;J. Patry;Cees Klaassen;Sieglinde Weyringer;Alfred Weinberger;Marilla D. Svinicki;Jane S. Vogler;Andrew J. Martin;John M. Keller;ChanMin Kim;Gabriele Wulf;Lynne E. Parker;Michael Wunder;Michael Littman;Lisa J. Lehmberg;C. Victor Fung;Hannele Niemi;Steven Reiss;Piet Desmet;F. Cornillie;Helmut M. Niegemann;Steffi Heidig;Dominic W. Massaro;Charles Fadel;Cheryl Lemke;R. Grabner;Michael D. Basil;Daniel R. Little;Stephan Lewandowsky;Parmjit Singh;Zheng Liu;Marcelo H. Ang;W. Seah;Jack Heller;C. Randles;Kenneth S. Aigen
  • 通讯作者:
    Kenneth S. Aigen
Computably Continuous Reinforcement-Learning Objectives are PAC-learnable
可计算连续强化学习目标是 PAC 可学习的
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Cambridge Yang;Michael Littman;Michael Carbin
  • 通讯作者:
    Michael Carbin

Michael Littman的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Michael Littman', 18)}}的其他基金

EAGER: Training A Mobile Robot from Human Feedback via Income Learning
EAGER:通过收入学习根据人类反馈训练移动机器人
  • 批准号:
    1643413
  • 财政年份:
    2016
  • 资助金额:
    $ 22.5万
  • 项目类别:
    Standard Grant
Collaborative Research: American Innovations in an Age of Discovery: Teaching Science and Engineering through 3D-printed Historical Reconstructions
合作研究:发现时代的美国创新:通过 3D 打印历史重建教授科学与工程
  • 批准号:
    1508319
  • 财政年份:
    2015
  • 资助金额:
    $ 22.5万
  • 项目类别:
    Continuing Grant
RI: Medium: Collaborative Research: Teaching Computers to Follow Verbal Instructions
RI:媒介:协作研究:教计算机遵循口头指令
  • 批准号:
    1414931
  • 财政年份:
    2013
  • 资助金额:
    $ 22.5万
  • 项目类别:
    Standard Grant
RI: Small: Understanding Value-based Multiagent Learning and Its Applications
RI:小:了解基于价值的多智能体学习及其应用
  • 批准号:
    1414935
  • 财政年份:
    2013
  • 资助金额:
    $ 22.5万
  • 项目类别:
    Standard Grant
RI: Small: Collaborative Research: Speeding Up Learning through Modeling the Pragmatics of Training
RI:小型:协作研究:通过培训语用建模加速学习
  • 批准号:
    1319618
  • 财政年份:
    2013
  • 资助金额:
    $ 22.5万
  • 项目类别:
    Continuing Grant
RI: Medium: Collaborative Research: Teaching Computers to Follow Verbal Instructions
RI:媒介:协作研究:教计算机遵循口头指令
  • 批准号:
    1065195
  • 财政年份:
    2011
  • 资助金额:
    $ 22.5万
  • 项目类别:
    Standard Grant
RI: Small: Understanding Value-based Multiagent Learning and Its Applications
RI:小:了解基于价值的多智能体学习及其应用
  • 批准号:
    1018152
  • 财政年份:
    2010
  • 资助金额:
    $ 22.5万
  • 项目类别:
    Standard Grant
Collaborative Research: Pilot Research on Language-Based Strategies for Creative Problem Solving
协作研究:基于语言的创造性问题解决策略的试点研究
  • 批准号:
    0757490
  • 财政年份:
    2008
  • 资助金额:
    $ 22.5万
  • 项目类别:
    Standard Grant
HSD-DRU: The Role of Communication in the Dynamics of Effective Decision Making
HSD-DRU:沟通在有效决策动态中的作用
  • 批准号:
    0624191
  • 财政年份:
    2007
  • 资助金额:
    $ 22.5万
  • 项目类别:
    Standard Grant
Evaluating Next Generation Probabilistic Planners
评估下一代概率规划器
  • 批准号:
    0329153
  • 财政年份:
    2003
  • 资助金额:
    $ 22.5万
  • 项目类别:
    Continuing Grant

相似国自然基金

临时团队协作历史对协作主动行为的影响研究:基于社会网络视角
  • 批准号:
    72302101
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
在线医疗团队协作模式与绩效提升策略研究
  • 批准号:
    72371111
  • 批准年份:
    2023
  • 资助金额:
    41 万元
  • 项目类别:
    面上项目
数智背景下的团队人力资本层级结构类型、团队协作过程与团队效能结果之间关系的研究
  • 批准号:
    72372084
  • 批准年份:
    2023
  • 资助金额:
    40 万元
  • 项目类别:
    面上项目
A-型结晶抗性淀粉调控肠道细菌协作产丁酸机制研究
  • 批准号:
    32302064
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
面向人机接触式协同作业的协作机器人交互控制方法研究
  • 批准号:
    62373044
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目

相似海外基金

Collaborative Research: RI: Medium: Principles for Optimization, Generalization, and Transferability via Deep Neural Collapse
合作研究:RI:中:通过深度神经崩溃实现优化、泛化和可迁移性的原理
  • 批准号:
    2312841
  • 财政年份:
    2023
  • 资助金额:
    $ 22.5万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Medium: Principles for Optimization, Generalization, and Transferability via Deep Neural Collapse
合作研究:RI:中:通过深度神经崩溃实现优化、泛化和可迁移性的原理
  • 批准号:
    2312842
  • 财政年份:
    2023
  • 资助金额:
    $ 22.5万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: Foundations of Few-Round Active Learning
协作研究:RI:小型:少轮主动学习的基础
  • 批准号:
    2313131
  • 财政年份:
    2023
  • 资助金额:
    $ 22.5万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Medium: Lie group representation learning for vision
协作研究:RI:中:视觉的李群表示学习
  • 批准号:
    2313151
  • 财政年份:
    2023
  • 资助金额:
    $ 22.5万
  • 项目类别:
    Continuing Grant
Collaborative Research: RI: Small: Motion Fields Understanding for Enhanced Long-Range Imaging
合作研究:RI:小型:增强远程成像的运动场理解
  • 批准号:
    2232298
  • 财政年份:
    2023
  • 资助金额:
    $ 22.5万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了