喵ID:nUUoKw免责声明

Gaussian-kernel-based adaptive critic design using two-phase value iteration

使用两阶段值迭代的基于高斯核的自适应批评设计

基本信息

DOI:
10.1016/j.ins.2018.12.019
发表时间:
2019-05
影响因子:
8.1
通讯作者:
吴敏
中科院分区:
计算机科学1区
文献类型:
--
作者: 陈鑫;王巍;曹卫华;吴敏研究方向: -- MeSH主题词: --
关键词: --
来源链接:pubmed详情页地址

文献摘要

参考文献(36)
被引文献(7)
Finite-Approximation-Error-Based Discrete-Time Iterative Adaptive Dynamic Programming
基于有限逼近误差的离散时间迭代自适应动态规划
DOI:
10.1109/tcyb.2014.2354377
发表时间:
2014-09
期刊:
IEEE Transactions on Cybernetics
影响因子:
11.8
作者:
Wei, Qinglai;Wang, Fei-Yue;Liu, Derong;Yang, Xiong
通讯作者:
Yang, Xiong
Generalized Two-Hop Relay for Flexible Delay Control in MANETs
DOI:
10.1109/tnet.2012.2187923
发表时间:
2012-12
期刊:
IEEE/ACM Transactions on Networking
影响因子:
0
作者:
Jiajia Liu;Xiaohong Jiang;Hiroki Nishiyama;N. Kato
通讯作者:
Jiajia Liu;Xiaohong Jiang;Hiroki Nishiyama;N. Kato
Geodesic Gaussian kernels for value function approximation
DOI:
10.1007/s10514-008-9095-6
发表时间:
2008-10
期刊:
Autonomous Robots
影响因子:
3.5
作者:
Masashi Sugiyama;Hirotaka Hachiya;C. Towell;S. Vijayakumar
通讯作者:
Masashi Sugiyama;Hirotaka Hachiya;C. Towell;S. Vijayakumar
On-line Reinforcement Learning Using Incremental Kernel-Based Stochastic Factorization
DOI:
发表时间:
2012-12
期刊:
影响因子:
0
作者:
André Barreto;Doina Precup;Joelle Pineau
通讯作者:
André Barreto;Doina Precup;Joelle Pineau
Reinforcement Learning: An Introduction
DOI:
10.1109/tnn.1998.712192
发表时间:
1998
期刊:
IEEE Trans. Neural Networks
影响因子:
0
作者:
R. S. Sutton;A. Barto
通讯作者:
R. S. Sutton;A. Barto

数据更新时间:{{ references.updateTime }}

关联基金

基于双时间尺度优化的多机器人策略自适应与一致性
批准号:
61473316
批准年份:
2014
资助金额:
82.0
项目类别:
面上项目
吴敏
通讯地址:
--
所属机构:
--
电子邮件地址:
--
免责声明免责声明
1、猫眼课题宝专注于为科研工作者提供省时、高效的文献资源检索和预览服务;
2、网站中的文献信息均来自公开、合规、透明的互联网文献查询网站,可以通过页面中的“来源链接”跳转数据网站。
3、在猫眼课题宝点击“求助全文”按钮,发布文献应助需求时求助者需要支付50喵币作为应助成功后的答谢给应助者,发送到用助者账户中。若文献求助失败支付的50喵币将退还至求助者账户中。所支付的喵币仅作为答谢,而不是作为文献的“购买”费用,平台也不从中收取任何费用,
4、特别提醒用户通过求助获得的文献原文仅用户个人学习使用,不得用于商业用途,否则一切风险由用户本人承担;
5、本平台尊重知识产权,如果权利所有者认为平台内容侵犯了其合法权益,可以通过本平台提供的版权投诉渠道提出投诉。一经核实,我们将立即采取措施删除/下架/断链等措施。
我已知晓