基于双时间尺度优化的多机器人策略自适应与一致性

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61473316
  • 项目类别:
    面上项目
  • 资助金额:
    82.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0301.控制理论与技术
  • 结题年份:
    2018
  • 批准年份:
    2014
  • 项目状态:
    已结题
  • 起止时间:
    2015-01-01 至2018-12-31

项目摘要

The abilities of searching unknown environments and learning cooperative policies on line are viewed as the keys to realize "intelligent" multi-robot systems. However, the decentralized implementation and the complex dynamics of individuals induce high computation complexity, difficult generalization, and poor applicability in practice. Aiming at these problems, the project studies double-time-scale cooperative optimization framework based on Similar-POMDP, in which the multi-robot behavior optimization is reached by the coordination between the cooperative strategy optimization and the consensus optimization control under time-varying topologies. Thus the space complexity of policy learning is reduced significantly. To make the cooperative policies feasible during persistent policy optimization, the distributed consensus protocol using guaranteed cost control is studied in order to ensure topology connected. Then based on the evaluation method for the performance of consensus and the approximate dynamic programming (ADP) for general optimization index, the cooperative policy optimization algorithm with non-parametric critic module is developed, in order to realize efficient generalization and adaptive optimization for cooperative policy under the unknown and unmodeled environments. Using the directed graph decomposition and the multi-agent coordinated learning, the project investigates the decentralized way to realize such cooperative policy optimization, in order to improve feasibility in practice. The project will finally achieve the mechanism of simultaneous cooperative strategy optimization and consensus control. It will serve as the solution to reach intelligence of multiple robot systems under complex environment. The research is of great theoretical significance and application prospects.
具有探索未知环境和自学习合作行为的能力是实现智能多机器人系统的关键之一,但系统分布式特点和个体的动力学特性使合作行为自学习存在计算复杂度高、泛化困难和工程适用性差等问题。本项目针对这些问题研究基于Similar-POMDP的双时间尺度多机器人优化架构,将多机器人行为优化分解为互为依赖的时变拓扑下一致性最优控制和合作策略优化,从而降低策略学习的空间复杂度;研究保证拓扑连通的分布式多机器人保性能一致性控制方法,保证策略的可实现性;结合一致性性能评价和面向一般指标的逼近动态规划优化方法,设计基于非参数评价器的合作策略优化算法,实现非建模条件下多机器人合作策略的有效泛化和自适应优化;结合图分解和多智能体协同学习,研究合作策略的分布式优化方法,提高模型的工程适用性。项目将从机制上实现分布式策略优化与一致性控制的协同工作,为智能多机器人系统的实现提供解决方案,具有重要理论意义和应用价值。

结项摘要

本项目针对协作式多机器人系统合作自学习存在环境模型未知、计算复杂度高、泛化困难和工程适用性差等问题,通过综合一致性控制,多智能体合作策略学习,自适应动态规划等理论方法,构建了融合有限时间一致性控制时间尺度和合作策略优化学习时间尺度的双时间尺度优化架构,将多机器人合作行为优化分解为时变策略下有限时间一致性控制和多智能体合作策略学习。首先,针对多机器人系统合作策略优化引起的机器人间交互拓扑时变的问题,提出了时变有向拓扑条件下的二阶多智能体系统分布式有限时间一致性控制方法。同时,提出了一种基于状态反馈的有限时间一致性协议以加快有限时间一致性算法的收敛速度,从而保证合作策略学习的高效实现。其次,提出了一种基于高斯过程回归的双阶段值迭代评价网络设计方法,同时进行值函数逼近和高斯超参数优化,以实现环境模型未知情况下多机器人系统合作策略自学习与泛化。基于高斯过程回归,通过分析多智能体强化学习在协作环境中的动态性以及合作策略优化的需求,结合实际应用环境建立多智能体跟踪学习切换原则,提出了基于分时跟踪框架和高斯过程回归的多智能体协同学习方法;通过分析多智能体强化学习存在的同时学习问题与协作问题,提出了分布式同时学习与合作策略搜索算法,以缓解多机器人系统存在高维输入导致的维度灾,减小计算复杂度,完成多机器人系统合作策略自适应优化的目标。此外,研究了模型无关的多智能体系统最优一致性控制算法,以提高一致性控制算法的工程适用性。通过搭建针对多机器人系统的仿真系统及实际系统实验平台,验证了所提方法的可行性和高效性。本项目的研究为复杂未知环境下的多机器人系统提供了一种切实可行的协作行为自适应优化与控制方法,有力促进了协作式多机器人系统在复杂任务与未知环境下的应用,具有重要的理论意义和工程应用价值。

项目成果

期刊论文数量(9)
专著数量(0)
科研奖励数量(0)
会议论文数量(16)
专利数量(7)
Finite‐time consensus problem for second‐order multi‐agent systems under switching topologies
切换拓扑下二阶多智能体系统的有限时间一致性问题
  • DOI:
    --
  • 发表时间:
    2017
  • 期刊:
    Asian Journal of Control
  • 影响因子:
    2.4
  • 作者:
    王芳;陈鑫;何勇;吴敏
  • 通讯作者:
    吴敏
Model-free optimal containment control of multi-agent systems based on actor-critic framework
基于actor-critic框架的多智能体系统无模型最优遏制控制
  • DOI:
    10.1016/j.neucom.2018.06.011
  • 发表时间:
    2018
  • 期刊:
    Neurocomputing
  • 影响因子:
    6
  • 作者:
    王巍;陈鑫
  • 通讯作者:
    陈鑫
Gaussian-kernel-based adaptive critic design using two-phase value iteration
使用两阶段值迭代的基于高斯核的自适应批评设计
  • DOI:
    10.1016/j.ins.2018.12.019
  • 发表时间:
    2019
  • 期刊:
    Information Sciences
  • 影响因子:
    8.1
  • 作者:
    陈鑫;王巍;曹卫华;吴敏
  • 通讯作者:
    吴敏
Adaptive critic design with local Gaussian process models
使用局部高斯过程模型的自适应批评家设计
  • DOI:
    --
  • 发表时间:
    2016
  • 期刊:
    Journal of Advanced Computational Intelligence and Intelligent Informatics
  • 影响因子:
    0.7
  • 作者:
    王巍;陈鑫;何建新
  • 通讯作者:
    何建新
Finite-time consensus of double-integrator multi-agent systems with time-varying directed topologies
时变有向拓扑双积分多智能体系统的有限时间共识
  • DOI:
    10.20965/jaciii.2016.p0254
  • 发表时间:
    2016
  • 期刊:
    Journal of Advanced Computational Intelligence and Intelligent Informatics
  • 影响因子:
    0.7
  • 作者:
    王芳;陈鑫;何勇
  • 通讯作者:
    何勇

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

Multilayer Feedforward Neural Network based Efficient Spectrum Occupancy Prediction Scheme for Cognitive Radio System
基于多层前馈神经网络的认知无线电系统高效频谱占用预测方案
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    Journal of Computational Information Systems, 2014/01
  • 影响因子:
    --
  • 作者:
    李皇玉;许晓东;吴宝学;陈鑫
  • 通讯作者:
    陈鑫
锗纳米管催化的氧还原反应:催化性能和机理研究
  • DOI:
    --
  • 发表时间:
    2017
  • 期刊:
    Acta Chimica Sinica
  • 影响因子:
    2.5
  • 作者:
    陈鑫;鄢慧君;夏定国
  • 通讯作者:
    夏定国
M1型巨噬细胞在风湿性二尖瓣病变中的表达及相关作用机制研究
  • DOI:
    --
  • 发表时间:
    2012
  • 期刊:
    中华外科杂志
  • 影响因子:
    --
  • 作者:
    陈鑫
  • 通讯作者:
    陈鑫
面向问句复述识别的语义正交化匹配方法研究
  • DOI:
    10.1101/2021.03.30.21254540
  • 发表时间:
    --
  • 期刊:
    中文信息学报
  • 影响因子:
    --
  • 作者:
    朱朦朦;陈鑫;武恺莉;洪宇;张民
  • 通讯作者:
    张民
干细胞疗法在创面愈合中的研究进展
  • DOI:
    10.3760/cma.j.issn.1671-0290.2014.04.025
  • 发表时间:
    2014
  • 期刊:
    中华医学美学美容杂志
  • 影响因子:
    --
  • 作者:
    陈鑫;张一鸣;樊东力
  • 通讯作者:
    樊东力

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

陈鑫的其他基金

西藏冈底斯西段北姆朗斑岩铜矿床中硼的富集机制及其对铜成矿作用的制约
  • 批准号:
    42372092
  • 批准年份:
    2023
  • 资助金额:
    53 万元
  • 项目类别:
    面上项目
深俯冲陆壳折返过程中高场强元素在熔/流体中的活动性探究–以柴北缘超高压带鱼卡和绿梁山地区为例
  • 批准号:
    42102058
  • 批准年份:
    2021
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于虚拟个体行为逼近的多机器人自学习决策与协调控制一体化
  • 批准号:
    61873248
  • 批准年份:
    2018
  • 资助金额:
    63.0 万元
  • 项目类别:
    面上项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码