基于虚拟个体行为逼近的多机器人自学习决策与协调控制一体化

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61873248
  • 项目类别:
    面上项目
  • 资助金额:
    63.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0309.机器人学与智能系统
  • 结题年份:
    2022
  • 批准年份:
    2018
  • 项目状态:
    已结题
  • 起止时间:
    2019-01-01 至2022-12-31

项目摘要

To tackle the complex conditions in flexible task, such as uncertain environment, variable load, and unpredictable disturbance, the project mainly investigates the integration of dynamic decision-making and coordination control among multiple robots. A multi-layer distributed decision-making–control architecture for multiple agents will be developed, in which a virtual agent is designed to regulate individual behavior, so that based on it, the iterative cooperative strategy learning and the finite-time consensus control work together smoothly. To meet the requirements of cooperative decision when a flexible task is being executed, a knowledge transfer-based continuous space distributed learning will be studied to ensure efficient self-learning decision-making of multi-robot under an unknown environment. With the conditions of unknown dynamics characteristics resulting from variable load, and unpredictable disturbance taken into account, a robust adaptive dynamic programming-based model reference adaptive control method will be studied, which makes an individual robot enable to approximate a predetermined reference behavior model adaptively, even whose dynamic model is unknown in priori. Then this reference behavior model serves as a dynamic model of a virtual agent, based on which a finite-time consensus protocol will be designed. Finally, a simulation system and a multiple manipulators experimental system will be constructed, in order to test the integration of self-learning decision-making and coordinate control, from the aspects of effectiveness and engineering applicability. The project has important theoretical significance and application prospect for providing a new solution to design intelligent decision-making and control system for multi-robot systems, which are applied for the flexible tasks of intelligent manufacturing.
针对柔性任务具有的未知环境、变负载和未知扰动等复杂情况,本项目主要解决多机器人动态决策与多个体协调控制相融合的问题。研究构建多个体的分层分布式决策—控制架构,建立规范个体行为的虚拟个体,并基于其实现迭代合作策略学习和有限连续时间一致性控制的融合。对执行柔性任务时多机器人协同决策需求,研究结合知识迁移的连续空间分布式策略学习方法,保证在未知环境下多机器人高效自学习决策;考虑机器人变负载导致动态特征未知及未知扰动情况,研究基于鲁棒自适应动态规划的模型参考自适应控制方法,实现未知动态个体对理想参考行为模型的自适应逼近;以参考行为模型为虚拟个体的动态模型,设计有限时间一致性协议,实现与迭代策略学习的结合。最后,建立多机械臂仿真实验平台,验证自学习决策与协调控制一体化方法的有效性与工程适用性。本项目将为智能制造领域面向柔性任务的多机器人系统提供新的智能决策和控制设计方案,具有重要理论意义和应用前景。

结项摘要

本项目为实现多机器人在变负载和未知扰动环境下的策略实时优化与协调控制,构建了一种结合合作策略优化与一致性控制的优化模型,以虚拟个体的参考行为模型为桥梁,形成由合作策略学习、一致性控制、MRAC构成的分层决策-控制架构。首先,针对连续空间中多机器人系统的合作策略学习问题,提出基于连续空间合作策略搜索的分布式同时学习方法;同时,研究基于高斯核函数的双阶段值迭代算法,解决连续空间合作策略学习的泛化问题;针对多机器人系统从头学习效率低的问题,将一种知识迁移机制用于多机器人系统的智能决策和自学习控制中。其次,为实现个体动态未知和随机环境下异构多智能体系统的一致性控制,构造确定性参考行为模型,提出基于自适应动态规划的模型参考自适应控制方法,实现智能体行为对参考行为模型的逼近;针对鲁棒控制对精确数学模型依赖性的问题,提出了一种鲁棒ADP方法,实现了在变负载、未知扰动条件下的高品质高精度MRAC。此外,考虑到离散时间分布式策略学习与多机器人期望内模式跟踪控制的配合,需要实现有限时间内一致性控制才能保证合作策略学习的有效进行,首先针对具有随机扰动的未知环境下的线性系统的最优跟踪控制问题,研究了基于值迭代的最优跟踪控制方法;然后针对异构非线性多智能体系统,提出了基于参考模型的分布式一致性控制方法。通过搭建针对多机器人系统的仿真系统及实际系统实验平台,验证了所提方法的可行性和高效性。本项目的研究为复杂未知环境下的多机器人系统提供了一种切实可行的合作策略优化与一致性控制方法,有力促进了协作式多机器人系统在复杂任务与未知环境下的应用,具有重要的理论意义和工程应用价值。

项目成果

期刊论文数量(16)
专著数量(0)
科研奖励数量(0)
会议论文数量(19)
专利数量(7)
Data-driven adaptive dynamic programming for partially observable nonzero sum games via Q-learning method
通过 Q 学习方法实现部分可观察非零和博弈的数据驱动自适应动态规划
  • DOI:
    10.1080/00207721.2019.1599463
  • 发表时间:
    2019
  • 期刊:
    International Journal of Systems Science
  • 影响因子:
    4.3
  • 作者:
    Wei Wang(博士生);Xin Chen;Hao Fu;Min Wu
  • 通讯作者:
    Min Wu
Model-free output consensus control for partially observable heterogeneous multivehicle systems
部分可观测异构多车辆系统的无模型输出一致性控制
  • DOI:
    10.1109/jiot.2020.2981654
  • 发表时间:
    2020
  • 期刊:
    IEEE Internet of Things Journal
  • 影响因子:
    10.6
  • 作者:
    Yipu Sun(博士生);Xin Chen;Wei Wang;Hao Fu;Min Wu
  • 通讯作者:
    Min Wu
H∞ consensus for stochastic Markov jump multi-agent systems with imperfect time-varying transition probabilities and multiplicative noise
具有不完美时变转移概率和乘性噪声的随机马尔可夫跳跃多智能体系统的 H 共识
  • DOI:
    10.1016/j.amc.2022.127504
  • 发表时间:
    2023-01
  • 期刊:
    Applied Mathematics and Computation
  • 影响因子:
    4
  • 作者:
    Jie Wang(博士生);Xin Chen
  • 通讯作者:
    Xin Chen
Neural-network-based stochastic linear quadratic optimal tracking control scheme for unknown discrete-time systems using adaptive dynamic programming
基于神经网络的自适应动态规划未知离散时间系统随机线性二次最优跟踪控制方案
  • DOI:
    10.1007/s11768-021-00046-y
  • 发表时间:
    2021-06
  • 期刊:
    Control Theory and Technology
  • 影响因子:
    1.4
  • 作者:
    Xin Chen;Fang Wang
  • 通讯作者:
    Fang Wang
Observer-based adaptive synchronization control of unknown discrete-time nonlinear heterogeneous systems
未知离散时间非线性异构系统基于观测器的自适应同步控制
  • DOI:
    10.1109/tnnls.2020.3028569
  • 发表时间:
    2022
  • 期刊:
    IEEE Transactions on Neural Networks and Learning Systems
  • 影响因子:
    10.4
  • 作者:
    Hao Fu(博士生);Xin Chen;Wei Wang;Min Wu
  • 通讯作者:
    Min Wu

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

冈底斯复合造山带铜钼金多金属成矿作用与成矿系列
  • DOI:
    10.3799/dqkx.2020.392
  • 发表时间:
    2021
  • 期刊:
    地球科学
  • 影响因子:
    --
  • 作者:
    郑有业;吴松;次琼;陈鑫;高顺宝;刘晓峰;姜笑文;郑顺利;李淼;姜晓佳
  • 通讯作者:
    姜晓佳
两个单核苷酸多态位点与北方中国人前列腺癌的关联研究
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    中国癌症杂志
  • 影响因子:
    --
  • 作者:
    蒲连美;张耀光;王鑫;陈鑫;王建业;魏东;刘铭;杨一歌;周林;黄金;史晓红;周昌虎;杨泽
  • 通讯作者:
    杨泽
氧化锌/葵花籽油超疏水表面的制备及性能研究
  • DOI:
    --
  • 发表时间:
    2020
  • 期刊:
    南昌航空大学学报(自然科学版)
  • 影响因子:
    --
  • 作者:
    朱文辉;欧军飞;陈鑫;肖宇杰;谢婵;薛名山
  • 通讯作者:
    薛名山
NF-KB非经典信号通路在糖尿病患者桡动脉中的表达及定位
  • DOI:
    --
  • 发表时间:
    2016
  • 期刊:
    中国胸心血管外科杂志
  • 影响因子:
    --
  • 作者:
    黄雷;陈文;朱一帆;汪黎明;陈鑫
  • 通讯作者:
    陈鑫
Skin damage in a patient with lipid storage myopathy with a novel ETFDH mutation responsive to riboflavin
患有对核黄素有反应的新型 ETFDH 突变的脂质沉积性肌病患者的皮肤损伤
  • DOI:
    10.1080/00207454.2020.1730831
  • 发表时间:
    2020-02
  • 期刊:
    The International journal of neuroscience
  • 影响因子:
    --
  • 作者:
    徐洪亮;陈鑫;连亚军;王书亚;冀拓;张璐;李爽
  • 通讯作者:
    李爽

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

陈鑫的其他基金

西藏冈底斯西段北姆朗斑岩铜矿床中硼的富集机制及其对铜成矿作用的制约
  • 批准号:
    42372092
  • 批准年份:
    2023
  • 资助金额:
    53 万元
  • 项目类别:
    面上项目
深俯冲陆壳折返过程中高场强元素在熔/流体中的活动性探究–以柴北缘超高压带鱼卡和绿梁山地区为例
  • 批准号:
    42102058
  • 批准年份:
    2021
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于双时间尺度优化的多机器人策略自适应与一致性
  • 批准号:
    61473316
  • 批准年份:
    2014
  • 资助金额:
    82.0 万元
  • 项目类别:
    面上项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码