共進化的環境創造による自律移動ロボットのメタレベル行動学習

通过共同进化环境创建自主移动机器人的元级行为学习

基本信息

  • 批准号:
    14750362
  • 负责人:
  • 金额:
    $ 2.11万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
  • 财政年份:
    2002
  • 资助国家:
    日本
  • 起止时间:
    2002 至 2003
  • 项目状态:
    已结题

项目摘要

本研究では,高次元・連続な状態入出力を有する制御対象として自律移動ロボットをとりあげ,その感覚・行動間写像の同定に強化学習法を適用する際に問題となる,計算資源の割当て問題を解決するための一手法として,NGnetで実装したActor-Critic強化学習に学習器の構造パラメータを同時に探索する進化的recruitment戦略を導入する手法を提案した.昨年度までに検証した提案アルゴリズムの有効性と実ロボットによる実証実験は,計測自動制御学会論文集ならびにJournal of Robotics and Autonomous Systemsに掲載された.また,本年度は学習器の構造最適化に加えて,「いかにして複雑な学習課題を効率よく学習するか?」という,学習のスケジューリングに関する研究にも同時並行して取り組んだ.発達心理学におけるpiagetの先駆的研究を参考に,人間の身体と神経系の共進化的発達と,近年,盛んに研究が行われ始めている認知発達ロボティクスの関連に着目した.すなわち,多自由度な感覚運動連関を有する移動ロボットの制御器を強化学習で学習する際に,過去の学習事例から「学習のコツ」となる拘束条件を抽出して記憶しておき,これを未学習課題の習得に拘束条件として用いることで,無駄な試行錯誤数を削減し,その結果として強化学習を高速化することができる,「拘束条件抽出型強化学習法」を提案した.
在本研究中,我们以自主移动机器人作为具有高维、连续状态输入和输出的受控对象,解决计算资源分配问题,这是应用强化学习方法识别感觉和动作之间的映射时遇到的问题Actor-C在NGnet中实现作为解决该问题的方法。我们提出了一种引入进化招募策略的方法,该策略同时搜索学习设备的结构参数到临界强化学习中。该算法的有效性已于去年得到验证,并使用真实机器人进行了演示实验,发表在《Proceedings of the Society of the Society》上。仪器与控制工程师和期刊机器人与自主除了优化学习设备的结构外,今年我们还致力于学习调度的研究,以如何高效地学习复杂的学习任务为基础,基于皮亚杰在发展心理学方面的开创性研究,我们将探讨其中的关系。人体和神经系统的共同进化发展与认知发展机器人之间的关系,最近开始被积极研究。换句话说,当使用强化学习来学习具有多个自由度的感觉运动连接的移动机器人的控制器时,我们从过去的学习示例中提取并记忆作为“学习技巧”的约束。学习未学习任务的限制,我们可以减少不必要的尝试和错误的数量,从而加快强化学习的速度。

项目成果

期刊论文数量(10)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
近藤敏之, 伊藤宏司: "環境共創による適応的行動学習 -実移動ロボットによる押し動作獲得"計測自動制御学会システム・情報部門学術講演会2002講演論文集(優秀論文賞受賞). 423-428 (2002)
Toshiyuki Kondo、Hiroshi Ito:“通过环境共创进行自适应行为学习 - 通过真实移动机器人获取推力运动”仪器与控制工程师学会系统与信息分会学术会议 2002 年论文集(最佳论文奖获得者) 423-428(2002)
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
近藤敏之, 伊藤宏司: "共進化環境創造による実移動ロボットのPeg押し動作学習"日本ロボット学会創立20周年記念学術講演会. (CD-ROM). 3H32 (2002)
Toshiyuki Kondo、Hiroshi Ito:“通过创建共同进化环境来学习真实移动机器人的推动运动”日本机器人学会 20 周年学术讲座(CD-ROM)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Toshiyuki Kondo, Koji Ito: "A Study on Designing Robot Controllers by Using Reinforcement Learning with Evolutionary State Recruitment Strategy"Proceedings of the First International Workshop on Biologically Inspired Approaches to Advanced Information Tec
Toshiyuki Kondo、Koji Ito:“利用强化学习和进化状态招募策略设计机器人控制器的研究”第一届高级信息技术仿生方法国际研讨会论文集
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Toshiyuki Kondo, Koji Ito: "A Study on Designing Controller for Peg-pushing Robot by Using Reinforcement Learning with Adaptive State Recruitment Strategy"Proceedings of SICE Annual Conference 2003. (CD-ROM). MPI-17-2 (2003)
Toshiyuki Kondo、Koji Ito:“A Study on Designing Controller for Peg-pushing Robot by Use Reinforcement Learning with Adaptive State Recruitment Strategy”SICE 2003年年会论文集。(CD-ROM)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
近藤敏之, 伊藤紀彦, 伊藤宏司: "拘束ルール抽出機構を用いた自律移動ロボットの段階的行動学習"計測自動制御学会論文集. 40・3(掲載決定). (2004)
Toshiyuki Kondo、Norihiko Ito、Hiroshi Ito:“使用约束规则提取机制的自主移动机器人的逐步行为学习”,仪器与控制工程师协会会议记录,40, 3(决定出版)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

近藤 敏之其他文献

把持運動の維持における運動負荷と視覚フィードバックの違いが事象関連脱同期に及ぼす影響
运动负载和视觉反馈差异对维持抓取运动期间事件相关去同步的影响
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中屋敷 弘晟;戸敷 創;林 叔克;須藤 珠水;矢野 史朗;近藤 敏之
  • 通讯作者:
    近藤 敏之
Model-based Rehabilitation from Sense of Agency
基于代理意识的基于模型的康复
Estimation of Dynamic Structure underlying Brain Activities and its Constructive Modeling
大脑活动的动态结构估计及其构建模型

近藤 敏之的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('近藤 敏之', 18)}}的其他基金

拘束条件の漸進的獲得と動的環境認知によるロボットの未知環境適応
机器人通过约束条件的逐步获取和动态环境识别来适应未知环境
  • 批准号:
    18700195
  • 财政年份:
    2006
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
拘束条件の自己形成・実時間選択による感覚運動情報統合モデルと移動ロボットへの応用
基于自形成和实时选择约束的感觉运动信息集成模型及其在移动机器人中的应用
  • 批准号:
    16760337
  • 财政年份:
    2004
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
生体内免疫系を参考にした創発・適応機構の構築に関する研究
参考体内免疫系统构建应急和适应机制的研究
  • 批准号:
    97J01638
  • 财政年份:
    1998
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows

相似海外基金

意思決定支援のための大規模並列多目的進化計算システムの開発
开发用于决策支持的大规模并行多目标进化计算系统
  • 批准号:
    24K15119
  • 财政年份:
    2024
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
計算と計測のデータ同化による効率的乱流促進方法の探索
通过同化计算和测量数据寻找有效的湍流促进方法
  • 批准号:
    23K26316
  • 财政年份:
    2024
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
多目的進化計算を用いたエージェント群の戦略的意思決定を実現する強化学習
使用多目标进化计算实现一组智能体的战略决策的强化学习
  • 批准号:
    24K03001
  • 财政年份:
    2024
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
解集合アグリゲーションによる多目的進化計算
使用解集聚合的多目标进化计算
  • 批准号:
    23K24916
  • 财政年份:
    2024
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
多目的進化計算を用いた点と面を巡る複数ドローンの制約を考慮した飛行経路計画
利用多目标进化计算考虑多架无人机围绕点和面的约束的飞行路径规划
  • 批准号:
    24K15133
  • 财政年份:
    2024
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了