Realtime Search for Learning Autonomous Agents

实时搜索学习自主代理

基本信息

  • 批准号:
    06452402
  • 负责人:
  • 金额:
    $ 4.86万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
  • 财政年份:
    1994
  • 资助国家:
    日本
  • 起止时间:
    1994 至 1996
  • 项目状态:
    已结题

项目摘要

Existing search algorithms can be divided into two classes : offline search such as A^<**>, and realtime search such as Real-Time-A^<**> (RTA^<**>) and Learning Real-Time-A^<**> (LRTA^<**>). Offline search completely examines every possible path to the goal state before executing that path, while realtime search makes each decision in a constant time, and commits its decision to the physical world. The problem solver eventually reaches the goal by repeating the cycle of planning and execution. Realtime search cannot guarantee to find an optimal solution, but can interleave planning and execution.This research focuses on extending realtime search algorithms for autonomous agents and for a multiagent world. Though realtime search provides an attractive framework for resource-bounded problem solving, the behavior of the problem solver is not rational enough for autonomous agents : the problem solver tends to perform superfluous actions before attaining the goal ; and the problem solver cannot utilize and improve previous experiments. Other problems are that though the algorithms interleave planning and execution, they cannot be directly applied to a multiagent world ; the problem solver cannot adapt to the dynamically changing goals ; and the problem solver cannot cooperatively solve problems with other problem solvers. We developed a series of new algorithms including Weighted Realtime Search, Realtime Search with Upper Bounds, Moving Target Search and Realtime Bidirectional Search to overcome the above problems.
现有的搜索算法可以分为两个类:离线搜索,例如a^<**>,以及实时搜索,例如实时a^<**>(rta^<**>),并学习实时 - A^<**>(lrta^<**>)。离线搜索在执行该路径之前彻底检查了通往目标状态的每一个可能的路径,而实时搜索则在恒定时间内使每个决策都做出了决策,并将其决定对物理世界提出。问题解决者最终通过重复计划和执行的周期来实现目标。实时搜索不能保证找到一个最佳解决方案,而可以交织计划和执行。这项研究重点是扩展实时搜索算法的自主代理和多种世界。尽管实时搜索为解决资源结合的问题解决提供了一个有吸引力的框架,但问题解决者的行为对于自主代理来说还不够理性:问题求解器倾向于在达到目标之前执行多余的动作;问题解决者无法利用并改善以前的实验。其他问题是,尽管算法交织计划和执行,但它们不能直接应用于多种世界。问题解决者无法适应动态变化的目标;问题解决者无法合作解决其他问题解决者的问题。我们开发了一系列新的算法,包括加权实时搜索,具有上限的实时搜索,移​​动目标搜索和实时双向搜索以克服上述问题。

项目成果

期刊论文数量(23)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
石田亨: "エージェントを考える" 人工知能学会誌. Vol.10,No.5. 663-667 (1996)
Toru Ishida:“对代理的思考”,人工智能学会杂志,第 10 卷,第 663-667 期(1996 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Toru Ishida: "A Moving Target Search : A Real-Time Search for Changing Goals" IEEE Trans. on Pattern Analysis and Machine Intelligence. Vol. 17, No. 6. 609-619 (1995)
Toru Ishida:“移动目标搜索:实时搜索不断变化的目标”IEEE Trans。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
石田亨: "実時間探索による経路学習" 人工知能学会誌. Vol.11,No.2. 411-419 (1996)
Toru Ishida:“使用实时搜索进行路线学习”,人工智能学会杂志,第 11 卷,第 411-419 期(1996 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Toru Ishida, Richard E. Korf: "Moving-Target Search : A Real-Time Search for Changing Goals" IEEE Transactions on Pattern Analysis and Machine Intelligence. 17. 609-619 (1995)
Toru Ishida、Richard E. Korf:“移动目标搜索:对不断变化的目标的实时搜索”IEEE 模式分析和机器智能汇刊。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
石田亨: "「実時間探索の学習特性の評価」" 人工知能学会誌 Vol.10 No.2. 142-313 (1995)
石田彻:“实时搜索的学习特性评估”人工智能学会杂志第 10 卷第 142-313 期(1995 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

ISHIDA Toru其他文献

Privacy-Aware Best-Balanced Multilingual Communication
注重隐私的最佳平衡多语言沟通

ISHIDA Toru的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('ISHIDA Toru', 18)}}的其他基金

Basic research of "Yakkan-shi (Joseon's diplomatic mission to Tsushima)" between Japan and Korea in the early modern period
近代初期日韩“药监使”的基础研究
  • 批准号:
    15K02837
  • 财政年份:
    2015
  • 资助金额:
    $ 4.86万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Mental health and parenting style in parents of adolescents with high-functioning pervasive developmental disorders
高功能广泛性发育障碍青少年家长的心理健康和教养方式
  • 批准号:
    25870199
  • 财政年份:
    2013
  • 资助金额:
    $ 4.86万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
Comparative Politics on Renationalization:The Dilemma of Democracy in Europe
重新民族化的比较政治:欧洲民主的困境
  • 批准号:
    24330049
  • 财政年份:
    2012
  • 资助金额:
    $ 4.86万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Research on Collective Intelligence Based on Services Computing
基于服务计算的集体智慧研究
  • 批准号:
    21240014
  • 财政年份:
    2009
  • 资助金额:
    $ 4.86万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
Research on participatory design using massively multi-agent systems
大规模多智能体系统的参与式设计研究
  • 批准号:
    18200009
  • 财政年份:
    2006
  • 资助金额:
    $ 4.86万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
Human-Centered Semantic Web
以人为中心的语义网
  • 批准号:
    15200012
  • 财政年份:
    2003
  • 资助金额:
    $ 4.86万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
Comparative institutional analysis of the Japanese type of welfare pluralism - the importance of social welfare reforms singe 1980s in Japan -
日本型福利多元化的制度比较分析——20世纪80年代以来日本社会福利改革的重要性——
  • 批准号:
    11620092
  • 财政年份:
    1999
  • 资助金额:
    $ 4.86万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Building Digital Cities as a Social Information Infrastructure
建设数字城市作为社会信息基础设施
  • 批准号:
    11792025
  • 财政年份:
    1999
  • 资助金额:
    $ 4.86万
  • 项目类别:
    Grant-in-Aid for University and Society Collaboration
Resource Allocation for Wide-Area Networks Based on Economic Models
基于经济模型的广域网资源分配
  • 批准号:
    10480071
  • 财政年份:
    1998
  • 资助金额:
    $ 4.86万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B).
Development of a Multiagent Platform on Hetrogeneous golbal Networks
异构全球网络多智能体平台的开发
  • 批准号:
    06558046
  • 财政年份:
    1994
  • 资助金额:
    $ 4.86万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)

相似国自然基金

基于多Agent深度元强化学习的航班延误恢复协同决策研究
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    24 万元
  • 项目类别:
    青年科学基金项目
面向网络协作学习的多Agent自适应决策模型研究
  • 批准号:
    61807008
  • 批准年份:
    2018
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
关于几个带数据分析成本的金融数学问题以及深度学习数值方法
  • 批准号:
    11871364
  • 批准年份:
    2018
  • 资助金额:
    52.0 万元
  • 项目类别:
    面上项目
基于社会学习的移动多智能体演化博弈行为研究
  • 批准号:
    61702076
  • 批准年份:
    2017
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
基于值等价的交互式动态影响图的求解方法研究与应用
  • 批准号:
    61772442
  • 批准年份:
    2017
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目

相似海外基金

Collaborative Research: CDS&E: Generalizable RANS Turbulence Models through Scientific Multi-Agent Reinforcement Learning
合作研究:CDS
  • 批准号:
    2347423
  • 财政年份:
    2024
  • 资助金额:
    $ 4.86万
  • 项目类别:
    Standard Grant
CAREER: Strategic Interactions, Learning, and Dynamics in Large-Scale Multi-Agent Systems: Achieving Tractability via Graph Limits
职业:大规模多智能体系统中的战略交互、学习和动态:通过图限制实现可处理性
  • 批准号:
    2340289
  • 财政年份:
    2024
  • 资助金额:
    $ 4.86万
  • 项目类别:
    Continuing Grant
Optimizing Intelligent Vehicular Routing with Edge Computing through Multi-Agent Reinforcement Learning
通过多智能体强化学习利用边缘计算优化智能车辆路由
  • 批准号:
    24K14913
  • 财政年份:
    2024
  • 资助金额:
    $ 4.86万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Collaborative Research: CDS&E: Generalizable RANS Turbulence Models through Scientific Multi-Agent Reinforcement Learning
合作研究:CDS
  • 批准号:
    2347422
  • 财政年份:
    2024
  • 资助金额:
    $ 4.86万
  • 项目类别:
    Standard Grant
CAREER: Structure Exploiting Multi-Agent Reinforcement Learning for Large Scale Networked Systems: Locality and Beyond
职业:为大规模网络系统利用多智能体强化学习的结构:局部性及其他
  • 批准号:
    2339112
  • 财政年份:
    2024
  • 资助金额:
    $ 4.86万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了