基于量子随机博弈论的三维未知环境下多机器人合作与竞争问题研究
项目介绍
AI项目解读
基本信息
- 批准号:61075076
- 项目类别:面上项目
- 资助金额:32.0万
- 负责人:
- 依托单位:
- 学科分类:F0306.自动化检测技术与装置
- 结题年份:2013
- 批准年份:2010
- 项目状态:已结题
- 起止时间:2011-01-01 至2013-12-31
- 项目参与者:洪炳镕; 厉茂海; 苑全德; 柯文德; 祝丁丁; 潘庆和;
- 关键词:
项目摘要
追逃问题本质上研究多机器人系统中机器人之间竞争与合作的典型平台。本项目将三维未知环境下多机器人追捕多猎物问题看成是有限理性的多局中人的随机博弈问题。首先对移动机器人的运动学、动力学等关键技术进行研究,并集成建立三维虚拟仿真平台。其次,利用隐式马尔科夫拓扑地图实现不同度量地图之间的拼接,研究多机器人系统中三维同时定位与地图创建和协作同时定位与地图创建技术,对未知环境进行探索,创建混合环境地图,搜索猎物。其次,在发现猎物后,采用量子拍卖和量子协作强化学习方法分配追捕任务,建立动态联盟并分配角色,将复杂的多局中人量子随机博弈问题分解成一系列易于解决的二局中人量子博弈问题。然后,根据追捕者角色,建立追捕者的策略集和猎物的策略集,根据各自的收益函数,选择最优均衡解。最后通过三维仿真平台和实际多机器人系统考察方法的实用性和有效性。该项目为多机器人系统的发展提供自主知识产权的相关技术,具有重要实际意义。
结项摘要
多机器人追捕目标问题作为多机器人合作与竞争问题研究中的一类典型问题,它研究的是一群机器人如何通过合作去有效地捕获另一群逃跑的机器人。.本文在国家自然科学基金项目“基于量子随机博弈论的三维未知环境下多机器人合作与竞争问题研究”(61075076)的资助下,对多机器人竞争与合作领域的追逃问题进行了系统深入的研究。主要包括如下几个方面:.第一,基于概率框架,研究了三维未知环境下多机器人协作SLAM和目标搜索问题。为了有效地规划路径并搜索目标,本文通过综合考虑混合地图中单个节点的相似度和不同节点间的空间关系,建立优化过程中的目标函数,利用隐马尔可夫模型提高节点识别的准确率,从而把不同局部地图的拼接问题简化为特征匹配问题。.第二,针对追逃问题,通过机器人间的能力分类和新型量子拍卖机制来实现追捕任务的动态分配和动态组盟,实现了一种允许动态联盟的多机器人合作追捕多目标问题第三,首先提出一种量子强化学习算法,将追捕联盟中n个追捕者追捕m个猎物的学习问题转化成许多共享一个量子位纠缠对的两个局中人之间小范围的学习问题,进而分解成多个二人追逃量子随机博弈问题,同时提出基于快速推进的多机器人分层追捕算法,引入活跃区域机制,在任务分配阶段由主追捕机器人使用量子拍卖方法构造机器人追捕动态联盟,从而利用快速推进法实现对逃跑者的压迫。.第四,通过分析多个带有自利因素的机器人在对一个猎物的追捕过程中的策略选择对最终结果的影响,对最终收益分配机制进行调整,让机器人从另一个角度衡量自身利益,从而带来多个可供选择的博弈策略,并引入量子最小化博弈的方法,将经典策略空间扩展到量子策略空间的范围,在保证机器人仍存在追求个人利益最大化的同时,消除随机性和盲目性,提高追捕的整体效益。.第五,在有障碍物存在情况下,扩展了基于运动图方法,增加了多种机器人行为,实现基于行为的多机器人追捕。针对连续状态下机器人追捕问题,提出基于量子强化学习和遗传算法的模糊逻辑控制学习算法,利用量子强化学习获得先验经验,利用模糊逻辑实现对连续状态的覆盖,利用遗传算法实现对模糊逻辑控制器相关参数的调整优化。.第六,搭建多机器人追捕实物平台和仿真实验平台完成关键技术的验证
项目成果
期刊论文数量(23)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
参数化优化的仿人机器人相似性前向倒地研究
- DOI:--
- 发表时间:--
- 期刊:自动化学报
- 影响因子:--
- 作者:柯文德;崔刚;洪炳镕;蔡则苏;朴松昊;钟秋波
- 通讯作者:钟秋波
基于运动相似性的仿人机器人双足步行研究
- DOI:--
- 发表时间:--
- 期刊:机器人
- 影响因子:--
- 作者:柯文德;崔刚;洪炳镕
- 通讯作者:洪炳镕
参数优化的仿人机器人相似性前向倒地研究
- DOI:--
- 发表时间:2011
- 期刊:自动化学报
- 影响因子:--
- 作者:柯文德;蔡则苏
- 通讯作者:蔡则苏
基于PCA特征提取和距离哈希K近邻分类的人脸表情识别
- DOI:--
- 发表时间:2012
- 期刊:智能计算机与应用
- 影响因子:--
- 作者:蔡则苏;祝丁丁;何健
- 通讯作者:何健
多追捕者-单-逃跑者追逃问题实现成功捕获的约束条件
- DOI:--
- 发表时间:2012
- 期刊:机器人
- 影响因子:--
- 作者:方宝富;潘启树;洪炳镕;丁磊;蔡则苏
- 通讯作者:蔡则苏
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
一种新的移动机器人全局定位算法
- DOI:--
- 发表时间:--
- 期刊:电子学报,2006,34(3):553-558
- 影响因子:--
- 作者:厉茂海*;洪炳镕;蔡则苏
- 通讯作者:蔡则苏
机器人同时定位与地图构建技术研究
- DOI:--
- 发表时间:--
- 期刊:计算机应用研究
- 影响因子:--
- 作者:柯文德;蔡则苏
- 通讯作者:蔡则苏
一种混合路径规划方法在轮式机器人中的应用
- DOI:--
- 发表时间:--
- 期刊:计算机应用研究
- 影响因子:--
- 作者:柯文德;蔡则苏
- 通讯作者:蔡则苏
基于演算的足球机器人协作Q学习方法
- DOI:--
- 发表时间:2011
- 期刊:计算机应用
- 影响因子:--
- 作者:柯文德;朴松昊;彭志平;蔡则苏;苑全德
- 通讯作者:苑全德
基于粒子群优化的移动机器人全局
- DOI:--
- 发表时间:--
- 期刊:吉林大学学报(工学版), 2007.6(37): 1402-1408
- 影响因子:--
- 作者:杨晶东*;洪炳镕;蔡则苏;鞠玉
- 通讯作者:鞠玉
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}