RI: Small: Speedup Learning for Online Planning Under Uncertainty

RI:小:加速不确定性下在线规划的学习

基本信息

  • 批准号:
    1619433
  • 负责人:
  • 金额:
    $ 45万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2016
  • 资助国家:
    美国
  • 起止时间:
    2016-09-01 至 2021-08-31
  • 项目状态:
    已结题

项目摘要

Many complex stochastic planning domains such as logistics,emergency response, resilient power grids, and robotics require theability to make high-quality decisions under tight timeconstraints. This project addresses the need for high-quality, butcomputationally efficient, decision making via new theory andalgorithms for speedup learning, which will enable planners tolearn to speedup their performance based on prior planningexperience. This speedup-learning approach is loosely inspired bythe fact that humans routinely learn to speedup their reasoningprocesses with experience, without sacrificing decision quality.Similarly, through speedup learning, an inefficient planner thatproduces high-quality decisions will be transformed into a muchfaster planner with little loss in decision quality.The project involves advancing speedup learning for online planningunder uncertainty on four fronts. First, the speedup-learningproblem is formalized by introducing the canonical problem ofPrimitive Speedup Learning (PSL) and studying how PSL can be usedto solve various speedup objectives. Second, a novel onlineplanning framework, which subsumes many existing frameworks andenables many potential speedup opportunities, is being designed anddeveloped. Third, the project is producing new speedup learningalgorithms for the new framework, which learn various types ofknowledge and that can exploit deep neural network (DNN)techniques. Finally, the research is producing extensive empiricalevaluations including applications to the important problems ofpower grid control, municipal emergency response, and benchmarkplanning domains. The project has the potential for significant broader impact onapplications where time-sensitive decisions must be made withinstochastic environments. It will directly contribute to advances intwo applications in particular: remedial action control inelectrical grids to minimize cascading power outages, and planningfor municipal emergencies such as fire and rescue operations incities. The project will also serve to advance graduate educationthrough research assistantships and undergraduate education throughsummer and academic term research experiences for undergraduates. Aspecial topics graduate course will be taught on the area ofplanning and learning at Oregon State University and all coursematerials will be open access.
许多复杂的随机规划域,例如物流,应急响应,弹性电网和机器人技术,都需要打招呼,以在紧缩的时间表下做出高质量的决策。该项目满足了通过新理论和加速学习的高质量,但有效的决策的需求,这将使计划者能够根据先前的Plansexperience加速其绩效。这种加速学习的方法受到这样一个事实的启发,即人类通常会学会通过经验来加快推理程序,而不会牺牲决策质量。通过加速学习,一种效率低下的计划师可以将高质量的决策效率地转化为在质量上损失的损失,从而涉及质量的损失。首先,通过引入规范的加速学习(PSL)的规范问题并研究如何使用PSL来解决各种加速目标,从而形式化了加速学习问题。其次,一个新颖的在线规划框架涵盖了许多现有的框架,并且正在设计和开发许多潜在的加速机会。第三,该项目正在为新框架生成新的加速学习学位,这些框架学习了各种类型的知识,并且可以利用深层神经网络(DNN)技术。最后,这项研究正在产生广泛的经验评估,包括对电网控制,市政应急响应和基准标准域的重要问题的应用。该项目有可能在必须在整体环境中做出时间敏感的决策来实现更广泛的影响攻击。它将直接促进INTWO申请的进步:补救措施控制无电网电网以最大程度地减少级联停电,以及对诸如消防和救援行动的诸如诸如消防和救援行动的紧急情况的计划。该项目还将有助于通过研究助手来提高研究生教育,并通过夏季和学术术语研究经验。 Aspecial主题研究生课程将在俄勒冈州立大学的规划和学习领域进行教授,所有Coursemestrials将是开放的。

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
The Choice Function Framework for Online Policy Improvement
在线政策改进的选择函数框架
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Alan Fern其他文献

Learning and transferring roles in multi-agent MDPs
多智能体 MDP 中的学习和角色转移
Active Imitation Learning via State Queries
通过状态查询进行主动模仿学习
  • DOI:
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kshitij Judah;Alan Fern
  • 通讯作者:
    Alan Fern
The Origins of Common Sense in Humans and Machines
人类和机器常识的起源
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kevin A. Smith;Eliza Kosoy;A. Gopnik;Deepak Pathak;Alan Fern;J. Tenenbaum;T. Ullman
  • 通讯作者:
    T. Ullman
Special report: The AgAID AI institute for transforming workforce and decision support in agriculture
  • DOI:
    10.1016/j.compag.2022.106944
  • 发表时间:
    2022-06-01
  • 期刊:
  • 影响因子:
  • 作者:
    Ananth Kalyanaraman;Margaret Burnett;Alan Fern;Lav Khot;Joshua Viers
  • 通讯作者:
    Joshua Viers
Robust Learning for Adaptive Programs by Leveraging Program Structure
利用程序结构实现自适应程序的稳健学习

Alan Fern的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Alan Fern', 18)}}的其他基金

Collaborative Research: CISE: Large: Executing Natural Instructions in Realistic Uncertain Worlds
合作研究:CISE:大型:在现实的不确定世界中执行自然指令
  • 批准号:
    2321851
  • 财政年份:
    2023
  • 资助金额:
    $ 45万
  • 项目类别:
    Continuing Grant
Student Support for the 2020 International Conference on Automated Planning and Scheduling
2020 年自动规划与调度国际会议的学生支持
  • 批准号:
    2017913
  • 财政年份:
    2020
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
S&AS:INT:Learning and Planning for Dynamic Locomotion
S
  • 批准号:
    1849343
  • 财政年份:
    2019
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
II-EN: Software Tools for Monte-Carlo Optimization
II-EN:蒙特卡罗优化软件工具
  • 批准号:
    1406049
  • 财政年份:
    2014
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
RI: Small: Automated Planning of Experiments for Design Optimization
RI:小型:自动规划实验以优化设计
  • 批准号:
    1320943
  • 财政年份:
    2013
  • 资助金额:
    $ 45万
  • 项目类别:
    Continuing Grant
Student Poster Program and Travel Scholarships for International Conference on Machine Learning (ICML) 2010; Haifa, Israel
2010 年国际机器学习会议 (ICML) 学生海报计划和旅行奖学金;
  • 批准号:
    1031917
  • 财政年份:
    2010
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
RI: Medium: Collaborative Research: Solving Stochastic Planning Problems Through Principled Determinization
RI:媒介:协作研究:通过原则确定解决随机规划问题
  • 批准号:
    0905678
  • 财政年份:
    2009
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
Adaptation-Based Programming
基于适应的编程
  • 批准号:
    0820286
  • 财政年份:
    2008
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
CAREER: Penalty Logic for Structured Machine Learning
职业:结构化机器学习的惩罚逻辑
  • 批准号:
    0546867
  • 财政年份:
    2006
  • 资助金额:
    $ 45万
  • 项目类别:
    Continuing Grant

相似国自然基金

小分子多肽跨膜输运序列选择性及其物理机制的理论研究
  • 批准号:
    11804151
  • 批准年份:
    2018
  • 资助金额:
    27.0 万元
  • 项目类别:
    青年科学基金项目
基于深度学习的小物体检测及其异构计算技术研究
  • 批准号:
    61872200
  • 批准年份:
    2018
  • 资助金额:
    64.0 万元
  • 项目类别:
    面上项目
内皮抗衰老蛋白SIRT1调控组织因子在巨细胞病毒隐性感染协同高脂血症加速脑小血管血栓形成中的作用
  • 批准号:
    81801384
  • 批准年份:
    2018
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
磁层和近地太阳风里小尺度磁结构的观测研究
  • 批准号:
    41774153
  • 批准年份:
    2017
  • 资助金额:
    70.0 万元
  • 项目类别:
    面上项目

相似海外基金

疾走速度変化からみた小学生における疾走能力の経年変化に関する縦断的検討
从跑步速度变化看小学生跑步能力长期变化的纵向研究
  • 批准号:
    23K10691
  • 财政年份:
    2023
  • 资助金额:
    $ 45万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Development of evaluation technology for digital output type triaxial accelerometer by measuring small displacement
数字输出式三轴加速度计小位移测量评估技术开发
  • 批准号:
    21K04100
  • 财政年份:
    2021
  • 资助金额:
    $ 45万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
モーメント準ニュートン法と確率的分散縮小法の融合による強非線形ビックデータの学習
矩拟牛顿法与随机方差约简法相结合的强非线性大数据学习
  • 批准号:
    20K11979
  • 财政年份:
    2020
  • 资助金额:
    $ 45万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Numerical simulations of asteroid deformation due to rapid rotation and implication for internal properties of asteroids
快速自转引起的小行星变形的数值模拟及其对小行星内部特性的影响
  • 批准号:
    20K14536
  • 财政年份:
    2020
  • 资助金额:
    $ 45万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Studies on electron acceleration and multiplication in lightning by a ground-based array of small dosimeters
地基小型剂量计阵列对闪电中电子加速和倍增的研究
  • 批准号:
    20K22354
  • 财政年份:
    2020
  • 资助金额:
    $ 45万
  • 项目类别:
    Grant-in-Aid for Research Activity Start-up
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了