共進化的環境創造による自律移動ロボットのメタレベル行動学習
通过共同进化环境创建自主移动机器人的元级行为学习
基本信息
- 批准号:14750362
- 负责人:
- 金额:$ 2.11万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Young Scientists (B)
- 财政年份:2002
- 资助国家:日本
- 起止时间:2002 至 2003
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究では,高次元・連続な状態入出力を有する制御対象として自律移動ロボットをとりあげ,その感覚・行動間写像の同定に強化学習法を適用する際に問題となる,計算資源の割当て問題を解決するための一手法として,NGnetで実装したActor-Critic強化学習に学習器の構造パラメータを同時に探索する進化的recruitment戦略を導入する手法を提案した.昨年度までに検証した提案アルゴリズムの有効性と実ロボットによる実証実験は,計測自動制御学会論文集ならびにJournal of Robotics and Autonomous Systemsに掲載された.また,本年度は学習器の構造最適化に加えて,「いかにして複雑な学習課題を効率よく学習するか?」という,学習のスケジューリングに関する研究にも同時並行して取り組んだ.発達心理学におけるpiagetの先駆的研究を参考に,人間の身体と神経系の共進化的発達と,近年,盛んに研究が行われ始めている認知発達ロボティクスの関連に着目した.すなわち,多自由度な感覚運動連関を有する移動ロボットの制御器を強化学習で学習する際に,過去の学習事例から「学習のコツ」となる拘束条件を抽出して記憶しておき,これを未学習課題の習得に拘束条件として用いることで,無駄な試行錯誤数を削減し,その結果として強化学習を高速化することができる,「拘束条件抽出型強化学習法」を提案した.
在这项研究中,我们提出了一种介绍一种进化招聘策略的方法,该方法同时搜索了在NGNET上实施的参与者批判性的增强学习中学习者的结构参数,作为解决计算资源分配问题的一种方法,这是应用强化学习方法来识别感官和行为映射的问题。直到去年验证的拟议算法的有效性以及使用实际机器人进行的示范实验是收集了测量和自治学会的论文,以及《机器人和自治》杂志。今年,除了学习者的结构优化外,我们还研究了学习安排学习的“如何有效地学习复杂的学习任务?”。基于伯爵(Piaget)在发育心理学方面的开创性研究,我们重点介绍了人体的共同发展与神经系统和认知发展机器人技术之间的关系,近年来已经对此进行了积极研究。换句话说,当使用强化学习的多度感觉运动连接的移动机器人学习控制器时,我们提取并记住了从过去的学习案例中“学习的秘诀”的约束条件,并将其用作约束条件,以获取未经学习的任务,从而减少了不必要的试验数量,并减少了不必要的试验和加速增强学习,从而加速了学习。
项目成果
期刊论文数量(10)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
近藤敏之, 伊藤宏司: "環境共創による適応的行動学習 -実移動ロボットによる押し動作獲得"計測自動制御学会システム・情報部門学術講演会2002講演論文集(優秀論文賞受賞). 423-428 (2002)
Toshiyuki Kondo、Hiroshi Ito:“通过环境共创进行自适应行为学习 - 通过真实移动机器人获取推力运动”仪器与控制工程师学会系统与信息分会学术会议 2002 年论文集(最佳论文奖获得者) 423-428(2002)
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
近藤敏之, 伊藤宏司: "共進化環境創造による実移動ロボットのPeg押し動作学習"日本ロボット学会創立20周年記念学術講演会. (CD-ROM). 3H32 (2002)
Toshiyuki Kondo、Hiroshi Ito:“通过创建共同进化环境来学习真实移动机器人的推动运动”日本机器人学会 20 周年学术讲座(CD-ROM)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Toshiyuki Kondo, Koji Ito: "A Study on Designing Robot Controllers by Using Reinforcement Learning with Evolutionary State Recruitment Strategy"Proceedings of the First International Workshop on Biologically Inspired Approaches to Advanced Information Tec
Toshiyuki Kondo、Koji Ito:“利用强化学习和进化状态招募策略设计机器人控制器的研究”第一届高级信息技术仿生方法国际研讨会论文集
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Toshiyuki Kondo, Koji Ito: "A Study on Designing Controller for Peg-pushing Robot by Using Reinforcement Learning with Adaptive State Recruitment Strategy"Proceedings of SICE Annual Conference 2003. (CD-ROM). MPI-17-2 (2003)
Toshiyuki Kondo、Koji Ito:“A Study on Designing Controller for Peg-pushing Robot by Use Reinforcement Learning with Adaptive State Recruitment Strategy”SICE 2003年年会论文集。(CD-ROM)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
近藤敏之, 伊藤紀彦, 伊藤宏司: "拘束ルール抽出機構を用いた自律移動ロボットの段階的行動学習"計測自動制御学会論文集. 40・3(掲載決定). (2004)
Toshiyuki Kondo、Norihiko Ito、Hiroshi Ito:“使用约束规则提取机制的自主移动机器人的逐步行为学习”,仪器与控制工程师协会会议记录,40, 3(决定出版)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
近藤 敏之其他文献
把持運動の維持における運動負荷と視覚フィードバックの違いが事象関連脱同期に及ぼす影響
运动负载和视觉反馈差异对维持抓取运动期间事件相关去同步的影响
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
中屋敷 弘晟;戸敷 創;林 叔克;須藤 珠水;矢野 史朗;近藤 敏之 - 通讯作者:
近藤 敏之
Model-based Rehabilitation from Sense of Agency
基于代理意识的基于模型的康复
- DOI:
10.7210/jrsj.35.512 - 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
矢野 史朗;近藤 敏之;前田 貴記 - 通讯作者:
前田 貴記
Estimation of Dynamic Structure underlying Brain Activities and its Constructive Modeling
大脑活动的动态结构估计及其构建模型
- DOI:
10.11499/sicejl.61.276 - 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
土方亘;藤原立樹;大内克洋.;村山友太,中田敏是,劉浩;近藤 敏之 - 通讯作者:
近藤 敏之
近藤 敏之的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('近藤 敏之', 18)}}的其他基金
拘束条件の漸進的獲得と動的環境認知によるロボットの未知環境適応
机器人通过约束条件的逐步获取和动态环境识别来适应未知环境
- 批准号:
18700195 - 财政年份:2006
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
拘束条件の自己形成・実時間選択による感覚運動情報統合モデルと移動ロボットへの応用
基于自形成和实时选择约束的感觉运动信息集成模型及其在移动机器人中的应用
- 批准号:
16760337 - 财政年份:2004
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
生体内免疫系を参考にした創発・適応機構の構築に関する研究
参考体内免疫系统构建应急和适应机制的研究
- 批准号:
97J01638 - 财政年份:1998
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for JSPS Fellows
相似海外基金
意思決定支援のための大規模並列多目的進化計算システムの開発
开发用于决策支持的大规模并行多目标进化计算系统
- 批准号:
24K15119 - 财政年份:2024
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
計算と計測のデータ同化による効率的乱流促進方法の探索
通过同化计算和测量数据寻找有效的湍流促进方法
- 批准号:
23K26316 - 财政年份:2024
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
多目的進化計算を用いたエージェント群の戦略的意思決定を実現する強化学習
使用多目标进化计算实现一组智能体的战略决策的强化学习
- 批准号:
24K03001 - 财政年份:2024
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
解集合アグリゲーションによる多目的進化計算
使用解集聚合的多目标进化计算
- 批准号:
23K24916 - 财政年份:2024
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
進化計算と強化学習による適応的な群れの創発モデル
使用进化计算和强化学习的自适应群体涌现模型
- 批准号:
24KJ0753 - 财政年份:2024
- 资助金额:
$ 2.11万 - 项目类别:
Grant-in-Aid for JSPS Fellows