喵ID:R9iqEa免责声明

Minimax-Optimal Multi-Agent RL in Zero-Sum Markov Games With a Generative Model

具有生成模型的零和马尔可夫博弈中的极小最大最优多智能体强化学习

基本信息

DOI:
10.48550/arxiv.2208.10458
发表时间:
2022
期刊:
ArXiv
影响因子:
--
通讯作者:
Yuxin Chen
中科院分区:
文献类型:
--
作者: Gen Li;Yuejie Chi;Yuting Wei;Yuxin Chen研究方向: -- MeSH主题词: --
关键词: --
来源链接:pubmed详情页地址

文献摘要

逗号;停顿;间歇(此处仅为对英文逗号的解释,如果是在特定语境下可能有其他含义) 如果这是一个错误输入,你可以给我完整的需要翻译的内容。
,
参考文献(19)
被引文献(5)
The complexity of computing a Nash equilibrium
DOI:
10.1145/1132516.1132527
发表时间:
2006-01-01
期刊:
STOC'06. Proceedings of the 38th Annual ACM Symposium on Theory of Computing
影响因子:
0
作者:
Daskalakis, C.;Goldberg, P. W.;Papadimitriou, C. H.
通讯作者:
Papadimitriou, C. H.
Independent Policy Gradient Methods for Competitive Reinforcement Learning
DOI:
发表时间:
2021-01
期刊:
ArXiv
影响因子:
0
作者:
C. Daskalakis;Dylan J. Foster;Noah Golowich
通讯作者:
C. Daskalakis;Dylan J. Foster;Noah Golowich
Sample Efficient Stochastic Policy Extragradient Algorithm for Zero-Sum Markov Game
DOI:
发表时间:
2022
期刊:
影响因子:
0
作者:
Ziyi Chen;Shaocong Ma;Yi Zhou
通讯作者:
Ziyi Chen;Shaocong Ma;Yi Zhou
Breaking the Sample Size Barrier in Model-Based Reinforcement Learning with a Generative Model
DOI:
10.1287/opre.2023.2451
发表时间:
2020-05
期刊:
Oper. Res.
影响因子:
0
作者:
Gen Li;Yuting Wei;Yuejie Chi;Yuantao Gu;Yuxin Chen
通讯作者:
Gen Li;Yuting Wei;Yuejie Chi;Yuantao Gu;Yuxin Chen
Is Q-Learning Minimax Optimal? A Tight Sample Complexity Analysis
DOI:
10.1287/opre.2023.2450
发表时间:
2021-02
期刊:
Operations Research
影响因子:
2.7
作者:
Gen Li;Ee;Changxiao Cai;Yuting Wei
通讯作者:
Gen Li;Ee;Changxiao Cai;Yuting Wei

数据更新时间:{{ references.updateTime }}

Yuxin Chen
通讯地址:
--
所属机构:
--
电子邮件地址:
--
免责声明免责声明
1、猫眼课题宝专注于为科研工作者提供省时、高效的文献资源检索和预览服务;
2、网站中的文献信息均来自公开、合规、透明的互联网文献查询网站,可以通过页面中的“来源链接”跳转数据网站。
3、在猫眼课题宝点击“求助全文”按钮,发布文献应助需求时求助者需要支付50喵币作为应助成功后的答谢给应助者,发送到用助者账户中。若文献求助失败支付的50喵币将退还至求助者账户中。所支付的喵币仅作为答谢,而不是作为文献的“购买”费用,平台也不从中收取任何费用,
4、特别提醒用户通过求助获得的文献原文仅用户个人学习使用,不得用于商业用途,否则一切风险由用户本人承担;
5、本平台尊重知识产权,如果权利所有者认为平台内容侵犯了其合法权益,可以通过本平台提供的版权投诉渠道提出投诉。一经核实,我们将立即采取措施删除/下架/断链等措施。
我已知晓