基于多智能体强化学习的大规模协作关键技术研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61906027
  • 项目类别:
    青年科学基金项目
  • 资助金额:
    25.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0603.机器学习
  • 结题年份:
    2022
  • 批准年份:
    2019
  • 项目状态:
    已结题
  • 起止时间:
    2020-01-01 至2022-12-31

项目摘要

The emergence of technologies such as Unmanned Aircraft System, Algorithm Trading and Large Online Shared Car Platforms has brought more complex functional requirements to intelligent control systems, making traditional centralized control models increasingly difficult to compete. The cooperative multiagent reinforcement learning came into being. One of the main challenges of cooperative multiagent reinforcement learning is to extend multiagent reinforcement learning to large-scale collaboration systems, that is, how to use a unified reinforcement learning framework to describe the learning process and let a huge number of agents learn to work together and to cooperate with each other. To solve this problem, this project summarizes the shortcomings of the existing cooperative multiagent reinforcement learning technologies and theories and then proposes improved algorithms and methods from the following three perspectives: the self-organization of interaction network, the classification of active-passive learning agent, and agent individual action learning. By proposing a low-cost cooperative reinforcement learning algorithm and mechanism that can be applied to large-scale agent environments, it can promote internal coordination and order of multi-agent groups and maximize the overall utility of the system. The research results of this project are of great significance for further developing and improving multiagent system learning theory, and providing theoretical guidance for distributed intelligent control and design, as well as enhancing China's international competitiveness in this field.
自主无人机,自动交易算法和大型在线乘车共享平台等技术的出现,对相关控制系统的需求愈发复杂,这使得传统的集中式控制模式逐渐难以胜任,协作式多智能体强化学习应运而生。协作式多智能体强化学习研究的一个主要挑战是将多智能体强化学习扩展到大型协作系统,即如何利用一套统一的强化学习框架去描述这个学习过程,让海量的智能体学会一起完成同一个任务,学会彼此合作。致力于解决该问题,本项目总结现有协作式多智能体强化学习技术理论的不足,提出新的研究思路和方法,从多智能体交互网络自组织、主被动智能体分类和智能体个体学习三个角度优化模型和改进算法,研究设计可适用于大规模智能体环境的低开销的协作式强化学习算法和机制,促进多智能体群体内部协调有序的状态,实现系统整体效用最大化。本项目的研究成果对进一步发展与完善多智能体群体学习理论,为分布式智能控制与设计提供理论指导,提升我国在该领域的国际竞争力都具有重要意义。

结项摘要

针对大规模多智能体场景中的如何降低智能体间的交互成本和如何针对智能体差异性设计不同功能需求的学习策略两个科学问题,本项目从多智能体交互网络自组织、主被动智能体分类和智能体个体学习三个角度优化模型和改进算法,研究设计可适用于大规模智能体环境的低开销的协作式强化学习算法和机制,促进多智能体群体内部协调有序的状态,实现系统整体效用最大化。依托该项目,本人及团队在IEEE T-ITS、IEEE TVT、IEEE TNSE等学术期刊和AAAI、DAI等国际会议上发表9篇学术论文。本项目将研究的算法在多个多智能体领域应用场景中做了测试和分析,包括城市交通信号灯自动控制、广告推荐算法设计和社交网络中舆论演变分析等场景, 以支持产学结合,为智能城市建设和网络舆论引导等社会需求赋能。

项目成果

期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(3)
专利数量(3)
Opinion Dynamics in Gossiper-Media Networks Based on Multiagent Reinforcement Learning
基于多智能体强化学习的八卦媒体网络中的观点动态
  • DOI:
    10.1109/tnse.2022.3229770
  • 发表时间:
    2023-03
  • 期刊:
    IEEE Transactions on Network Science and Engineering
  • 影响因子:
    6.6
  • 作者:
    Chengwei Zhang;Dina Fang;S;ip Sen;Xiaohong Li;Zhiyong Feng;Wanli Xue;Dou An;Xintian Zhao;Rong Chen
  • 通讯作者:
    Rong Chen
Advertising Impression Resource Allocation Strategy with Multi-Level Budget Constraint DQN in Real-Time Bidding
实时竞价中多级预算约束DQN的广告展示资源分配策略
  • DOI:
    10.1016/j.neucom.2021.11.072
  • 发表时间:
    2021-12
  • 期刊:
    Neurocomputing
  • 影响因子:
    6
  • 作者:
    Chengwei Zhang;Kangjie Zheng;Yu Tian;Wanli Xue;Tianpei Yang;Dou An;Yongqi Pi;Rong Chen
  • 通讯作者:
    Rong Chen
Dynamic pricing inproft‑driven task assignment: adomain‑of‑infuence based approach
利润驱动的任务分配中的动态定价:基于影响力的方法的领域
  • DOI:
    --
  • 发表时间:
    2020
  • 期刊:
    International Journal of Machine Learning and Cybernetics
  • 影响因子:
    5.6
  • 作者:
    Zhifeng Zhou;Rong Chen;Can Wang;Chengwei Zhang
  • 通讯作者:
    Chengwei Zhang
SCC-rFMQ: a multiagent reinforcement learning method in cooperative Markov games with continuous actions
SCC-rFMQ:连续动作合作马尔可夫博弈中的多智能体强化学习方法
  • DOI:
    10.1007/s13042-021-01497-0
  • 发表时间:
    2022
  • 期刊:
    International Journal of Machine Learning and Cybernetics
  • 影响因子:
    5.6
  • 作者:
    Chengwei Zhang;Zhuobing Han;Bingfu Liu;Wanli Xue;Jianye Hao;Xiaohong Li;Dou An;Rong Chen
  • 通讯作者:
    Rong Chen
Neighborhood Cooperative Multiagent Reinforcement Learning for Adaptive Traffic Signal Control in Epidemic Regions
流行地区自适应交通信号控制的邻里合作多智能体强化学习
  • DOI:
    10.1109/tits.2022.3173490
  • 发表时间:
    2022
  • 期刊:
    IEEE TRANSACTIONS ON INTELLIGENT TRANSPORTATION SYSTEMS
  • 影响因子:
    8.5
  • 作者:
    chengwei zhang;Yu Tian;Zhibin Zhang;Wanli Xue;Xiaofei Xie;Tianpei Yang;Xin Ge;Rong Chen
  • 通讯作者:
    Rong Chen

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

张程伟的其他基金

聚焦交通信号控制决策智能落地难点的深度强化学习关键技术研究
  • 批准号:
    62376048
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码