RI: Small: Coordinating Multi-Agent Learning through Emergent Distributed Supervisory Control
RI:小型:通过紧急分布式监督控制协调多智能体学习
基本信息
- 批准号:1116078
- 负责人:
- 金额:$ 45万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2011
- 资助国家:美国
- 起止时间:2011-09-01 至 2014-08-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
The project is focused on developing coordination policies for large-scale multi-agent systems operating in uncertain environments through the use of multi-agent reinforcement learning (MARL). Existing MARL techniques do not scale well. This research addresses the scaling issue by using coordination technology to "coordinate" the individual agent learning so as to speed up convergence and lead to learned policies that better reflect overall system objectives. This novel idea is being implemented using an emergent supervisory organization with low overhead that exploits non-local information to dynamically coordinate and shape the learning processes of individual agents while still allowing agents to react autonomously to local feedback. A key question is how to automate the development of the supervisory control process (including supervisory information generation and organization formation). One approach to automation is using a formal model of interactions among agents that also includes a model of global system objectives and policy space of agents to derive the information necessary for appropriate supervisory control. Another approach is the formulation of the supervision problem as a distributed constraint optimization problem. The results of this work provide a necessary component for the development of a wide variety of next-generation adaptive applications, such as smart power grids, cloud computing, and large-scale sensor networks. The broader impact stems from the wide applicability of the resulting learning technology for distributed control, undergraduate and graduate educational activities at UMass, dissemination efforts that make the experimental domain and algorithms publically available, and the development of international collaborations.
该项目的重点是通过使用多智能体强化学习(MARL)为在不确定环境中运行的大规模多智能体系统制定协调策略。现有的 MARL 技术不能很好地扩展。这项研究通过使用协调技术来“协调”个体代理的学习来解决扩展问题,从而加速收敛并产生更好地反映整体系统目标的学习策略。这一新颖的想法正在使用一个低开销的新兴监督组织来实现,该组织利用非本地信息来动态协调和塑造各个代理的学习过程,同时仍然允许代理对本地反馈做出自主反应。一个关键问题是如何自动化开发监管控制流程(包括监管信息生成和组织形成)。自动化的一种方法是使用代理之间交互的正式模型,该模型还包括代理的全局系统目标和策略空间模型,以获取适当监督控制所需的信息。另一种方法是将监督问题表述为分布式约束优化问题。这项工作的结果为开发各种下一代自适应应用程序(例如智能电网、云计算和大规模传感器网络)提供了必要的组件。更广泛的影响源于由此产生的学习技术对分布式控制的广泛适用性、麻省大学本科生和研究生的教育活动、公开实验领域和算法的传播工作以及国际合作的发展。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Victor Lesser其他文献
Distributed Sensor Networks: A Multiagent Perspective
分布式传感器网络:多代理视角
- DOI:
10.1016/j.jhazmat.2014.11.023 - 发表时间:
2003-05-01 - 期刊:
- 影响因子:13.6
- 作者:
Victor Lesser;M. Tambe;Charles L. Ortiz - 通讯作者:
Charles L. Ortiz
Victor Lesser的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Victor Lesser', 18)}}的其他基金
RI: Medium: Collaborative Research: Creating Organizationally Adept Software Agents and their Organizations
RI:媒介:协作研究:创建组织熟练的软件代理及其组织
- 批准号:
0964590 - 财政年份:2010
- 资助金额:
$ 45万 - 项目类别:
Continuing Grant
EAGER: Subsequent Similar Cases to Unexpected, Exceptional Cases
EAGER:后续的类似案例和意外的特殊案例
- 批准号:
0938504 - 财政年份:2009
- 资助金额:
$ 45万 - 项目类别:
Standard Grant
Collaborative Research: Distributed Interpretation in a Communication-Limited Environment
协作研究:通信有限环境中的分布式解释
- 批准号:
0414711 - 财政年份:2005
- 资助金额:
$ 45万 - 项目类别:
Continuing Grant
NSF-CNPq Collaborative Research: Combining Cognitive & Utilitarian Coordination in a Layered Agent Architecture
NSF-CNPq 合作研究:结合认知
- 批准号:
9988784 - 财政年份:2000
- 资助金额:
$ 45万 - 项目类别:
Continuing Grant
Formalizing Distributed Search in Cooperative Distributed Problem-Solving Systems
协作分布式问题解决系统中分布式搜索的形式化
- 批准号:
0004112 - 财政年份:2000
- 资助金额:
$ 45万 - 项目类别:
Continuing Grant
Enhancing Robustness of Information through Distributed Adaptive Coordination
通过分布式自适应协调增强信息的鲁棒性
- 批准号:
9812755 - 财政年份:1998
- 资助金额:
$ 45万 - 项目类别:
Continuing Grant
Towards an Architecture and Theory for Agent Coordination
智能体协调的架构和理论
- 批准号:
9523419 - 财政年份:1995
- 资助金额:
$ 45万 - 项目类别:
Continuing Grant
Control Issues in Asynchronous Parallel Knowledge-Based AI Programs
异步并行基于知识的人工智能程序中的控制问题
- 批准号:
9321324 - 财政年份:1994
- 资助金额:
$ 45万 - 项目类别:
Continuing Grant
A Research Facility for Cooperative Distributed Computing
协作分布式计算的研究设施
- 批准号:
8500332 - 财政年份:1985
- 资助金额:
$ 45万 - 项目类别:
Cooperative Agreement
Computer Research: Coordination in Cooperative Distributed Problem Solving Systems
计算机研究:协作分布式问题解决系统中的协调
- 批准号:
8300239 - 财政年份:1983
- 资助金额:
$ 45万 - 项目类别:
Continuing Grant
相似国自然基金
水稻小RNA通过AGO2协调稻瘟病抗性和水稻产量的机制研究
- 批准号:32372556
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
基于复杂情境小微物流企业联合运输收益分享合作策略的研究
- 批准号:71761022
- 批准年份:2017
- 资助金额:28.0 万元
- 项目类别:地区科学基金项目
API经济下面向小微创业社群成长环节的利益共享协调信息侧机制研究
- 批准号:61662021
- 批准年份:2016
- 资助金额:34.0 万元
- 项目类别:地区科学基金项目
异构云小蜂窝网络中基于协作预编码的干扰协调技术研究
- 批准号:61661005
- 批准年份:2016
- 资助金额:30.0 万元
- 项目类别:地区科学基金项目
密集小基站系统中的新型接入理论与技术研究
- 批准号:61301143
- 批准年份:2013
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
相似海外基金
Investigating and targeting apolipoprotein E4 in Down syndrome-associated Alzheimer's disease
研究和靶向唐氏综合症相关阿尔茨海默病中的载脂蛋白 E4
- 批准号:
10658660 - 财政年份:2023
- 资助金额:
$ 45万 - 项目类别:
Children's Oncology Group Statistics and Data Center
儿童肿瘤学组统计和数据中心
- 批准号:
10799432 - 财政年份:2023
- 资助金额:
$ 45万 - 项目类别:
Coordinating center for the NCI small cell lung cancer research consortium
NCI 小细胞肺癌研究联盟协调中心
- 批准号:
10653236 - 财政年份:2022
- 资助金额:
$ 45万 - 项目类别:
The Jackson Laboratory Senescence Tissue Mapping Center (JAX-Sen TMC) - Data Analysis Core
杰克逊实验室衰老组织绘图中心 (JAX-Sen TMC) - 数据分析核心
- 批准号:
10552968 - 财政年份:2022
- 资助金额:
$ 45万 - 项目类别: