RI: Small: Collaborative Research: Speeding Up Learning through Modeling the Pragmatics of Training

RI:小型:协作研究:通过培训语用建模加速学习

基本信息

  • 批准号:
    1319618
  • 负责人:
  • 金额:
    $ 14.8万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2013
  • 资助国家:
    美国
  • 起止时间:
    2013-10-01 至 2016-09-30
  • 项目状态:
    已结题

项目摘要

Years of effort to develop algorithms capable of learning from reward signals have resulted in a plethora of techniques that can leverage numerical signals that vary in value based on performance. Recent efforts to use these techniques to learn from humans providing rewards have been slower to progress, in part, because humans give feedback discretely rather than numerically. This project contributes new learning algorithms designed specifically to leverage the information contained in the choices humans make to provide such discrete feedbacks. The algorithms are inspired by the human-canine partnership, and the incredible things that humans are able to teach dogs using only discrete feedback and carefully constructed sequences of tasks. The Bayesian learning framework being developed in this project will leverage the pragmatic implicatures contained in the feedbacks and tasks sequences to learn more quickly from human feedback. The ultimate goal of this work is to provide a more natural paradigm for humans to tell computers what they would like for them to do. To that end, project efforts will result in a teaching module for Brown University?s Learning Exchange (LE). The LE involves undergraduates working with underserved minority middle school students to engage them in STEM. They are a perfect audience to demonstrate the broader impacts of this work. LE participants learn to instruct computers using a combination of programming with the Scratch environment and the feedback paradigm, which shows how powerful the algorithms are.
开发能够从奖励信号中学习的算法的多年努力导致了许多技术,可以利用根据性能根据性能而变化的数值信号。使用这些技术向人类学习的最新努力是进步的速度较慢,因为人类离散地而不是数字地提供反馈。该项目贡献了专门设计的新学习算法,旨在利用人类提供此类离散反馈的选择中包含的信息。这些算法的灵感来自人类典型的伙伴关系,以及人类只能使用离散反馈和精心构造的任务序列来教狗的令人难以置信的事情。该项目中开发的贝叶斯学习框架将利用反馈和任务序列中包含的实用含义,以从人类反馈中更快地学习。这项工作的最终目标是为人类告诉计算机他们想要做什么。为此,项目努力将为布朗大学的学习交流(LE)提供教学模块。 LE涉及与服务不足的少数族裔中学生合作的大学生,以使他们参与STEM。他们是展示这项工作的更广泛影响的理想受众。 LE参与者学会使用编程与刮擦环境和反馈范式的组合来指导计算机,这显示了算法的功能。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Michael Littman其他文献

Model-based reasoning
基于模型的推理
  • DOI:
    10.1016/j.compedu.2012.11.014
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Michael Jackson;Janusz Wojtusiak;Dayne Freitag;Eugene Subbotsky;Hans M. Nordahl;Jens C. Thimm;John Burgoyne;Roberto Poli;Thomas R. Guskey;Michael Davison;J. Magnotti;Adam M. Goodman;Jeffrey S. Katz;L. Verschaffel;W. Dooren;B. Smedt;Sean A. Fulop;Melva R. Grant;Leonid I. Perlovsky;B. De Smedt;P. Ghesquière;Dariusz Plewczynski;Leily Ziglari;P. Birjandi;Scott Rick;Roberto Weber;N. Seel;Maike Luhmann;Michael Eid;A. Antonietti;Barbara Colombo;Hamish Coates;Ali Radloff;P. Pirnay;Dirk Ifenthaler;Edward Swing;Craig A Anderson;David Tzuriel;Norman M. Weinberger;David C. Riccio;Patrick K. Cullen;J. Tallet;Megan L. Hoffman;David A. Washburn;Iván Izquierdo;Jorge H. Medina;M. Cammarota;A. Podolskiy;Joke Torbeyns;J. Kranzler;P. A. Kirschner;F. Kirschner;Kenn Apel;Julie A. Wolter;J. Masterson;JungMi Lee;Stefan N Groesser;Sabine Al;Philip Barker;Paul Schaik;I. Cutica;Monica Bucciarelli;K. Pata;Anna Strasser;A. Guillot;N. Hoyek;Christian Collet;Maria Opfermann;Roger Azevedo;Detlev Leutner;Thomas C. Toppino;Alice Y. Kolb;David A. Kolb;P. Brazdil;Ricardo Vilalta;Carlos Soares;C. Giraud;Jeffrey W. Bloom;Tyler Volk;Marwan A. Dwairy;Richard A. Swanson;Johanna Pöysä;K. Luwel;Theo Hug;Angélique Martin;Nicolas Guéguen;Craig Hassed;Fabio Alivernini;Michael Herczeg;M. Mastropieri;T. Scruggs;Angelika Rieder;S. Castillo;Gerardo Ayala;R. Low;R. Babuška;Barbara C. Buckley;Henry Markovits;Sungho Kim;In;Michael J. Spector;A. Towse;Charlie N. Lewis;Brian Francis;David N. Rapp;Pratim Sengupta;Sidney D’Mello;Serge Brand;J. Patry;Cees Klaassen;Sieglinde Weyringer;Alfred Weinberger;Marilla D. Svinicki;Jane S. Vogler;Andrew J. Martin;John M. Keller;ChanMin Kim;Gabriele Wulf;Lynne E. Parker;Michael Wunder;Michael Littman;Lisa J. Lehmberg;C. Victor Fung;Hannele Niemi;Steven Reiss;Piet Desmet;F. Cornillie;Helmut M. Niegemann;Steffi Heidig;Dominic W. Massaro;Charles Fadel;Cheryl Lemke;R. Grabner;Michael D. Basil;Daniel R. Little;Stephan Lewandowsky;Parmjit Singh;Zheng Liu;Marcelo H. Ang;W. Seah;Jack Heller;C. Randles;Kenneth S. Aigen
  • 通讯作者:
    Kenneth S. Aigen
Computably Continuous Reinforcement-Learning Objectives are PAC-learnable
可计算连续强化学习目标是 PAC 可学习的
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Cambridge Yang;Michael Littman;Michael Carbin
  • 通讯作者:
    Michael Carbin

Michael Littman的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Michael Littman', 18)}}的其他基金

EAGER: Training A Mobile Robot from Human Feedback via Income Learning
EAGER:通过收入学习根据人类反馈训练移动机器人
  • 批准号:
    1643413
  • 财政年份:
    2016
  • 资助金额:
    $ 14.8万
  • 项目类别:
    Standard Grant
Collaborative Research: American Innovations in an Age of Discovery: Teaching Science and Engineering through 3D-printed Historical Reconstructions
合作研究:发现时代的美国创新:通过 3D 打印历史重建教授科学与工程
  • 批准号:
    1508319
  • 财政年份:
    2015
  • 资助金额:
    $ 14.8万
  • 项目类别:
    Continuing Grant
RI: Medium: Collaborative Research: Teaching Computers to Follow Verbal Instructions
RI:媒介:协作研究:教计算机遵循口头指令
  • 批准号:
    1414931
  • 财政年份:
    2013
  • 资助金额:
    $ 14.8万
  • 项目类别:
    Standard Grant
RI: Small: Understanding Value-based Multiagent Learning and Its Applications
RI:小:了解基于价值的多智能体学习及其应用
  • 批准号:
    1414935
  • 财政年份:
    2013
  • 资助金额:
    $ 14.8万
  • 项目类别:
    Standard Grant
RI: Medium: Collaborative Research: Teaching Computers to Follow Verbal Instructions
RI:媒介:协作研究:教计算机遵循口头指令
  • 批准号:
    1065195
  • 财政年份:
    2011
  • 资助金额:
    $ 14.8万
  • 项目类别:
    Standard Grant
RI: Small: Understanding Value-based Multiagent Learning and Its Applications
RI:小:了解基于价值的多智能体学习及其应用
  • 批准号:
    1018152
  • 财政年份:
    2010
  • 资助金额:
    $ 14.8万
  • 项目类别:
    Standard Grant
Collaborative Research: Pilot Research on Language-Based Strategies for Creative Problem Solving
协作研究:基于语言的创造性问题解决策略的试点研究
  • 批准号:
    0757490
  • 财政年份:
    2008
  • 资助金额:
    $ 14.8万
  • 项目类别:
    Standard Grant
RI: Collaborative Research: Feature Discovery and Benchmarks for Exportable Reinforcement Learning
RI:协作研究:可导出强化学习的特征发现和基准
  • 批准号:
    0713148
  • 财政年份:
    2007
  • 资助金额:
    $ 14.8万
  • 项目类别:
    Standard Grant
HSD-DRU: The Role of Communication in the Dynamics of Effective Decision Making
HSD-DRU:沟通在有效决策动态中的作用
  • 批准号:
    0624191
  • 财政年份:
    2007
  • 资助金额:
    $ 14.8万
  • 项目类别:
    Standard Grant
Evaluating Next Generation Probabilistic Planners
评估下一代概率规划器
  • 批准号:
    0329153
  • 财政年份:
    2003
  • 资助金额:
    $ 14.8万
  • 项目类别:
    Continuing Grant

相似国自然基金

基于超宽频技术的小微型无人系统集群协作关键技术研究与应用
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    57 万元
  • 项目类别:
    面上项目
异构云小蜂窝网络中基于协作预编码的干扰协调技术研究
  • 批准号:
    61661005
  • 批准年份:
    2016
  • 资助金额:
    30.0 万元
  • 项目类别:
    地区科学基金项目
密集小基站系统中的新型接入理论与技术研究
  • 批准号:
    61301143
  • 批准年份:
    2013
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
ScFVCD3-9R负载Bcl-6靶向小干扰RNA治疗EAMG的试验研究
  • 批准号:
    81072465
  • 批准年份:
    2010
  • 资助金额:
    31.0 万元
  • 项目类别:
    面上项目
基于小世界网络的传感器网络研究
  • 批准号:
    60472059
  • 批准年份:
    2004
  • 资助金额:
    21.0 万元
  • 项目类别:
    面上项目

相似海外基金

Collaborative Research: RI: Small: Foundations of Few-Round Active Learning
协作研究:RI:小型:少轮主动学习的基础
  • 批准号:
    2313131
  • 财政年份:
    2023
  • 资助金额:
    $ 14.8万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: Motion Fields Understanding for Enhanced Long-Range Imaging
合作研究:RI:小型:增强远程成像的运动场理解
  • 批准号:
    2232298
  • 财政年份:
    2023
  • 资助金额:
    $ 14.8万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: Deep Constrained Learning for Power Systems
合作研究:RI:小型:电力系统的深度约束学习
  • 批准号:
    2345528
  • 财政年份:
    2023
  • 资助金额:
    $ 14.8万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: End-to-end Learning of Fair and Explainable Schedules for Court Systems
合作研究:RI:小型:法院系统公平且可解释的时间表的端到端学习
  • 批准号:
    2232055
  • 财政年份:
    2023
  • 资助金额:
    $ 14.8万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: End-to-end Learning of Fair and Explainable Schedules for Court Systems
合作研究:RI:小型:法院系统公平且可解释的时间表的端到端学习
  • 批准号:
    2232054
  • 财政年份:
    2023
  • 资助金额:
    $ 14.8万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了