RI: Small: Learning Strategic Behavior in Sequential Decision Tasks

RI:小:学习顺序决策任务中的策略行为

基本信息

  • 批准号:
    0915038
  • 负责人:
  • 金额:
    $ 45.5万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2009
  • 资助国家:
    美国
  • 起止时间:
    2009-09-01 至 2014-08-31
  • 项目状态:
    已结题

项目摘要

Many routine, real-world tasks can be seen as sequential decision tasks. For instance, navigating a robot through a complex environment, driving a car in congested traffic, and routing packets in a computer network requires making a sequence of decisions that together minimize time and resources used. It would be desirable to automate these tasks, yet it is difficult because the optimal decisions are generally not known. Many existing learning methods lead to reactive behaviors that perform well in short term, but do not amount to intelligent high-level behavior in the long term. This project is developing methods for learning strategic high-level behavior. Strategic methods need to (1) retain information from past states, (2) learn multimodal behavior, (3) choose between the different behaviors based on crucial detail, and (4) implement a sequential high-level strategy based on those behaviors. The neuroevolution methods developed in prior work solve the first problem by evolving (through genetic algorithms) recurrent neural networks to represent the behavior. To solve the remaining problems, these methods are being extended in the proposed work with multi-objective optimization, local nodes with cascaded structure, and with evolution of modules and their combinations. Preliminary results indicate that this approach is indeed feasible. In the long term, developed technology will make it possible to build robust sequential decision systems for real-world tasks. It leads to safer and more efficient vehicle, traffic, and robot control, improved process and manufacturing optimization, and more efficient computer and communication systems. It will also make the next generation of video games possible, with characters that exhibit realistic, strategic behaviors: Such technology should lead to more effective educational and training games in the future. The OpenNERO open source software platform developed in this work will be made available to the research community.
许多常规的现实任务可以看作是顺序决策任务。例如,在复杂的环境中导航机器人,在交通拥堵的流量中驾驶汽车以及计算机网络中的路由数据包需要做出一系列决策,以最大程度地减少所使用的时间和资源。希望自动执行这些任务是可取的,但是很困难,因为最佳决策通常不知道。许多现有的学习方法会导致反应性行为在短期内表现良好,但从长远来看并不等于智能的高级行为。该项目正在开发学习战略高级行为的方法。战略方法需要(1)保留过去状态的信息,(2)学习多模式行为,(3)基于关键细节的不同行为,以及(4)基于这些行为实施顺序的高级策略。在先前工作中开发的神经进化方法通过(通过遗传算法)复发性神经网络来代表行为来解决第一个问题。为了解决剩余的问题,这些方法在拟议的工作中扩展了多目标优化,具有级联结构的局部节点以及模块及其组合的演变。初步结果表明这种方法确实是可行的。 从长远来看,开发的技术将使为实际任务构建强大的顺序决策系统成为可能。它导致更安全,更高效的车辆,交通和机器人控制,改进的过程和制造优化以及更有效的计算机和通信系统。这也将使下一代视频游戏成为可能,具有表现出现实的战略行为的角色:这种技术应在未来带来更有效的教育和培训游戏。这项工作中开发的开放式开源软件平台将提供给研究社区。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Risto Miikkulainen其他文献

Holdout Evaluation
坚持评估
  • DOI:
    10.1007/978-0-387-30164-8_369
  • 发表时间:
    2010
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Antal van den Bosch;B. Hengst;J. Lloyd;Risto Miikkulainen;Hendrik Blockeel
  • 通讯作者:
    Hendrik Blockeel
Evolutionary Supervised Machine Learning
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Risto Miikkulainen
  • 通讯作者:
    Risto Miikkulainen
MARLEDA: Effective distribution estimation through Markov random fields
  • DOI:
    10.1016/j.tcs.2015.07.049
  • 发表时间:
    2016-06-20
  • 期刊:
  • 影响因子:
  • 作者:
    Matthew Alden;Risto Miikkulainen
  • 通讯作者:
    Risto Miikkulainen
Evolving neural networks
进化的神经网络
Tutorial III: Evolving neural networks
教程 III:进化神经网络

Risto Miikkulainen的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Risto Miikkulainen', 18)}}的其他基金

Collaborative Research: MOD and TLS: A Predictive Simulation Model of Competitive Dynamics in Innovation
合作研究:MOD 和 TLS:创新竞争动态的预测模拟模型
  • 批准号:
    0914796
  • 财政年份:
    2009
  • 资助金额:
    $ 45.5万
  • 项目类别:
    Standard Grant
Pilot: Leveraging Human Creativity with Machine Discovery
试点:通过机器发现利用人类创造力
  • 批准号:
    0757479
  • 财政年份:
    2008
  • 资助金额:
    $ 45.5万
  • 项目类别:
    Standard Grant
RI: Mastodon: A Large-Memory, High-Throughput Simulation Infrastructure
RI:Mastodon:大内存、高吞吐量的模拟基础设施
  • 批准号:
    0303609
  • 财政年份:
    2003
  • 资助金额:
    $ 45.5万
  • 项目类别:
    Continuing Grant
Cooperative Coevolution of Neural Networks in Sequential Decision Tasks
顺序决策任务中神经网络的协同协同进化
  • 批准号:
    0083776
  • 财政年份:
    2000
  • 资助金额:
    $ 45.5万
  • 项目类别:
    Continuing Grant
Modeling Development and Perceptual Phenomena in the Visual Cortex
视觉皮层的建模发展和感知现象
  • 批准号:
    9811478
  • 财政年份:
    1998
  • 资助金额:
    $ 45.5万
  • 项目类别:
    Standard Grant
Symbiotic Evolution of Neural Networks in Sequential Decision Tasks
神经网络在顺序决策任务中的共生进化
  • 批准号:
    9504317
  • 财政年份:
    1995
  • 资助金额:
    $ 45.5万
  • 项目类别:
    Continuing Grant
RIA: A Self-Organizing Neural Network Model of The PrimaryVisual cortex
RIA:初级视觉皮层的自组织神经网络模型
  • 批准号:
    9309273
  • 财政年份:
    1993
  • 资助金额:
    $ 45.5万
  • 项目类别:
    Standard Grant

相似国自然基金

基于深度学习的小样本侧扫声纳小目标探测
  • 批准号:
    42374050
  • 批准年份:
    2023
  • 资助金额:
    53 万元
  • 项目类别:
    面上项目
基于图表示深度学习的全新小分子先导化合物筛选方法研究
  • 批准号:
    62372375
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
不平衡数据下基于多源域迁移学习的小微企业信用风险评估研究
  • 批准号:
    72301093
  • 批准年份:
    2023
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目
基于多时序多模态分子影像Delta深度融合学习预测非小细胞肺癌免疫治疗疗效的研究
  • 批准号:
    82371994
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
基于无监督深度学习的复材小尺寸缺陷热成像表征方法研究
  • 批准号:
    62301507
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

AF:RI:Small: Fairness in allocation and machine learning problems: algorithms and solution concepts
AF:RI:Small:分配公平性和机器学习问题:算法和解决方案概念
  • 批准号:
    2334461
  • 财政年份:
    2024
  • 资助金额:
    $ 45.5万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: Foundations of Few-Round Active Learning
协作研究:RI:小型:少轮主动学习的基础
  • 批准号:
    2313131
  • 财政年份:
    2023
  • 资助金额:
    $ 45.5万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: Deep Constrained Learning for Power Systems
合作研究:RI:小型:电力系统的深度约束学习
  • 批准号:
    2345528
  • 财政年份:
    2023
  • 资助金额:
    $ 45.5万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: End-to-end Learning of Fair and Explainable Schedules for Court Systems
合作研究:RI:小型:法院系统公平且可解释的时间表的端到端学习
  • 批准号:
    2232055
  • 财政年份:
    2023
  • 资助金额:
    $ 45.5万
  • 项目类别:
    Standard Grant
CISE-ANR: RI: Small: Numerically efficient reinforcement learning for constrained systems with super-linear convergence (NERL)
CISE-ANR:RI:小:具有超线性收敛 (NERL) 的约束系统的数值高效强化学习
  • 批准号:
    2315396
  • 财政年份:
    2023
  • 资助金额:
    $ 45.5万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了