基于合作策略自学习的多机器人系统智能协作模型
项目介绍
AI项目解读
基本信息
- 批准号:61074058
- 项目类别:面上项目
- 资助金额:36.0万
- 负责人:
- 依托单位:
- 学科分类:F0301.控制理论与技术
- 结题年份:2013
- 批准年份:2010
- 项目状态:已结题
- 起止时间:2011-01-01 至2013-12-31
- 项目参与者:王春生; 戴朝晖; 聂卓赟; 袁姣红; 陈刚;
- 关键词:
项目摘要
针对多机器人系统智能协作存在的连续状态空间环境下合作策略自学习,以及合作策略自学习过程与多机器人协调控制的综合建模问题,研究基于新型泛化函数模型的多机器人系统合作策略自适应模型和智能协作模型。通过研究连续状态-动作空间的状态转移过程建模,建立包含状态转移估计和值函数逼近的泛化函数模型;进而研究基于泛化函数模型的合作策略优化算法和强化学习算法,构建多机器人系统合作策略自适应模型。通过分析合作策略自适应模型的时变策略对多机器人协调控制性能的影响,研究描述多机器人系统智能行为演化和空间运动过程的多机器人系统智能协作建模技术。通过建立多机器人实验系统,探讨合作策略自学习机制在多机器人系统中的实现方式和有效性。本项目的研究将为解决多机器人系统策略学习机制的泛化问题和同时学习问题提供有效的解决方案,也为多机器人系统智能协作机制的设计提供有效的理论分析和实现手段,具有重要的理论价值和应用前景。
结项摘要
本项目针对连续空间多机器人系统的合作行为优化存在环境模型未知、策略优化收敛难以保证、工程实现中计算复杂度高等问题,以多智能体强化学习为理论基础,基于分时跟踪的强化学习和高斯回归建模方法,建立了一种新的合作策略自学习框架。基于所提的学习框架,通过提出具有较强泛化能力、保证同时学习收敛性的多智能体学习算法,构建了多机器人系统合作策略自适应模型。首先,通过高斯回归建立环境状态转移模型,提出了面向降维的联合状态独立动作空间基于非直接策略估计的跟踪学习算法,建立了基于高斯回归的连续多智能体最佳响应策略学习模型,为实现多机器人分布式合作策略学习以及连续空间策略泛化提供了基础算法。其次,通过分析多智能体强化学习在协作环境中的存在的动态性,研究强化学习的收敛条件、跟踪学习的运行特点,以及策略优化的需求,提出了合作式多智能体分时跟踪学习框架。结合实际应用环境建立多智能体跟踪学习切换原则,实现了一种宏观同时学习,以面向离散空间环境下建立多机器人协作策略优化方法。在以上方法的基础上,研究了影响多机器人系统协作建模的行为特点、环境反馈以及采样特点,对值函数及个体行为采用高斯回归对其进行逼近建模,将分时跟踪框架扩展到连续空间多智能体系统,建立了连续空间基于高斯回归的泛化模型的多智能体跟踪学习算法,完成连续空间多机器人系统合作策略自适应优化的目标。通过实物实验、RoboCup救援机器人仿真比赛取得的成绩,验证了所提方法的可行性和高效性。此外,还研究了多智能体同时学习中的预测、适应性等问题,并将所提的两阶段适应学习算法应用多机器人三连杆系统,也为模型未知的高维控制系统设计提供了新思路。本项目所提分时跟踪框架及基于高斯回归建模的学习方法可以实现离散/连续空间多智能体降维学习以及泛化,在保证策略优化收敛性的同时,又易于工程实现。通过本项目的研究在解决多智能体降维和同时学习问题的同时,有力促进了多智能体强化学习方法在连续空间多机器人系统的融合,为实现智能多机器人系统提供了自适应策略优化的实现方案,具有重要的理论意义和应用价值。
项目成果
期刊论文数量(9)
专著数量(0)
科研奖励数量(2)
会议论文数量(6)
专利数量(3)
基于点的POMDPs在线值迭代算法
- DOI:--
- 发表时间:2013
- 期刊:软件学报
- 影响因子:--
- 作者:仵博;吴敏;佘锦华
- 通讯作者:佘锦华
Optimal tracking agent: a new framework of reinforcement learning for multiagent systems
最优跟踪代理:多代理系统强化学习的新框架
- DOI:10.1002/cpe.2870
- 发表时间:2013-09
- 期刊:Concurrency and Computation-Practice & Experience
- 影响因子:--
- 作者:Weihua Cao;Gang Gang;Xin Chen;Min Wu
- 通讯作者:Min Wu
基于高斯回归的连续空间多智能体跟踪学习
- DOI:--
- 发表时间:--
- 期刊:自动化学报
- 影响因子:--
- 作者:陈鑫;魏海军;吴敏;曹卫华
- 通讯作者:曹卫华
Cooperative learning with joint state value approximation for multi-agent systems
多智能体系统联合状态值近似的合作学习
- DOI:10.1007/s11768-013-1141-z
- 发表时间:2013-05
- 期刊:Journal of Control Theory and Applications
- 影响因子:--
- 作者:Xin Chen;Gang Chen;Weihua Cao;Min Wu
- 通讯作者:Min Wu
Time-Tracking Framework for Decentralized Reinforcement Learning in Fully-Cooperative Multi-Agent System
完全合作多智能体系统中去中心化强化学习的时间跟踪框架
- DOI:--
- 发表时间:--
- 期刊:Acta Automatica Sinica
- 影响因子:--
- 作者:Xin Chen;Bo Fu;Yong He;Min Wu
- 通讯作者:Min Wu
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
冈底斯复合造山带铜钼金多金属成矿作用与成矿系列
- DOI:10.3799/dqkx.2020.392
- 发表时间:2021
- 期刊:地球科学
- 影响因子:--
- 作者:郑有业;吴松;次琼;陈鑫;高顺宝;刘晓峰;姜笑文;郑顺利;李淼;姜晓佳
- 通讯作者:姜晓佳
两个单核苷酸多态位点与北方中国人前列腺癌的关联研究
- DOI:--
- 发表时间:--
- 期刊:中国癌症杂志
- 影响因子:--
- 作者:蒲连美;张耀光;王鑫;陈鑫;王建业;魏东;刘铭;杨一歌;周林;黄金;史晓红;周昌虎;杨泽
- 通讯作者:杨泽
氧化锌/葵花籽油超疏水表面的制备及性能研究
- DOI:--
- 发表时间:2020
- 期刊:南昌航空大学学报(自然科学版)
- 影响因子:--
- 作者:朱文辉;欧军飞;陈鑫;肖宇杰;谢婵;薛名山
- 通讯作者:薛名山
NF-KB非经典信号通路在糖尿病患者桡动脉中的表达及定位
- DOI:--
- 发表时间:2016
- 期刊:中国胸心血管外科杂志
- 影响因子:--
- 作者:黄雷;陈文;朱一帆;汪黎明;陈鑫
- 通讯作者:陈鑫
Skin damage in a patient with lipid storage myopathy with a novel ETFDH mutation responsive to riboflavin
患有对核黄素有反应的新型 ETFDH 突变的脂质沉积性肌病患者的皮肤损伤
- DOI:10.1080/00207454.2020.1730831
- 发表时间:2020-02
- 期刊:The International journal of neuroscience
- 影响因子:--
- 作者:徐洪亮;陈鑫;连亚军;王书亚;冀拓;张璐;李爽
- 通讯作者:李爽
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}