调研领喵币

免费领喵币

- 关注「猫眼课题说」公众号 -

2025国自然解读

标书指导

课题干货

扫码关注，立赚100喵币！

点击去任务中心，免费领更多喵币～

会员中心

开通猫会员

联系客服

使用教程

版本更新

ID: {{ userInfo.uid }}

复制

会员有效期至{{dayjs(userInfo?.membership_time * 1000).format('YYYY.MM.DD')}}

开通会员尊享 16+ 权益

智能选题

智能标书

加赠喵币

更多特权

剩余喵币

充值

{{userInfo.over_mew_coin || 0}}喵币将在本周失效

专属邀请码

复制

邀好友注册得200喵币/人任务中心

任务中心

个人中心

退出账号

刷新

登录即代表您同意并遵守《隐私协议》

为了保证账户安全，请在
微信「猫眼课题宝」内点击授权

重新扫码

刷新

登录即代表您同意并遵守《隐私协议》

立即刷新

二维码已失效

登录即代表您同意并遵守《隐私协议》

为保证账户安全，请在
微信「猫眼课题宝」内点击授权

账号注册

您好~为了给您提供更精准的分析体验，需完善基础信息！所有信息100%保密，请放心填写！
24H内注册成功得【300喵币】，用于功能体验可用于智能选题、智能标书、文献分析等功能解锁。

立即使用

切换微信登录

*注：建议或bug反馈被采纳后获得{{feedback_mew_coin}}喵币奖励，请关注公众号模版消息通知

取消

提交

已收到您的反馈，我们会尽快处理。若内容被采纳你将获得{{feedback_mew_coin}}喵币奖励。请关注《猫眼课题宝》消息通知。

喵币已到账！

*喵币用于产品体验解锁使用，有效期 30 天

在猫眼课题宝您可以：

立即体验

微信扫码添加小助理，回复“调研”
领取调研问卷

首次添加还可额外获得
{{customer_mew_coin}}喵币奖励哦！

完成问卷填写，立得{{question_mew_coin}}喵币奖励

永久回看权已生效！

直播主题

《{{latestCourse?.name}}》

立即去查看

7天猫会员

有效期至：{{dayjs(userInfo.membership_time * 1000).format('YYYY-MM-DD HH:mm')}}

已送您“7天会员体验卡+500喵币”

次数升级

享智能标书等多功能月解锁次数1次

10次

优享折扣

获会员期内充值喵币 8折等3大折扣

开心收下

永久回看权已生效！

课程

《{{giftRes?.img}}》

立即去查看

永久回看权已生效！

课程

《{{receiveTrainingCourseInfo?.name}}》

立即去查看

猫会员

（全方位提升课题决策能力）

喵币充值

会员专属

升级猫会员：购买喵币享 8 折优惠

免费领最高 6W 喵币

请先阅读
服务协议并同意

扫码添加「专属客服」
了解团购优惠方案

客服在线时间：工作日9:00-18:00

￥

{{isVip ? '已省' : '立省'}}{{currentInfo?.discount_price}}元

支持：

支付宝/

微信

请阅读并同意《猫眼课题宝服务协议》

*购买后不支持退

开具发票

常见问题

会员权益说明

升级会员

尊享16+权益

HOT

智能选题

HOT

智能标书

基金检索

PDF

结题报告下载

立项课题分析

学科趋势分析

NEW

文献分析

科研课程

·查看权益对比·

返回开通

会员权益对比

权益分类

功能权益

普通用户

{{item.name}}会员

- 微信扫一扫 -

请添加您的「专属会员管家」
提供专属会员服务

喵ID：nUUoKw免责声明

Gaussian-kernel-based adaptive critic design using two-phase value iteration

使用两阶段值迭代的基于高斯核的自适应批评设计

基本信息

DOI：

10.1016/j.ins.2018.12.019

发表时间：

2019-05

期刊：

Information Sciences

影响因子：

8.1

通讯作者：

吴敏

中科院分区：

计算机科学1区

文献类型：

作者：陈鑫;王巍;曹卫华;吴敏

研究方向： --

MeSH主题词： --

关键词： --

来源链接：pubmed详情页地址

文献摘要

参考文献（36）

被引文献（7）

Finite-Approximation-Error-Based Discrete-Time Iterative Adaptive Dynamic Programming

基于有限逼近误差的离散时间迭代自适应动态规划

DOI：

10.1109/tcyb.2014.2354377

发表时间：

2014-09

期刊：

IEEE Transactions on Cybernetics

影响因子：

11.8

作者：

Wei, Qinglai;Wang, Fei-Yue;Liu, Derong;Yang, Xiong

通讯作者：

Yang, Xiong

Generalized Two-Hop Relay for Flexible Delay Control in MANETs

DOI：

10.1109/tnet.2012.2187923

发表时间：

2012-12

期刊：

IEEE/ACM Transactions on Networking

影响因子：

作者：

Jiajia Liu;Xiaohong Jiang;Hiroki Nishiyama;N. Kato

通讯作者：

Jiajia Liu;Xiaohong Jiang;Hiroki Nishiyama;N. Kato

Geodesic Gaussian kernels for value function approximation

DOI：

10.1007/s10514-008-9095-6

发表时间：

2008-10

期刊：

Autonomous Robots

影响因子：

3.5

作者：

Masashi Sugiyama;Hirotaka Hachiya;C. Towell;S. Vijayakumar

通讯作者：

Masashi Sugiyama;Hirotaka Hachiya;C. Towell;S. Vijayakumar

On-line Reinforcement Learning Using Incremental Kernel-Based Stochastic Factorization

DOI：

发表时间：

2012-12

期刊：

影响因子：

作者：

André Barreto;Doina Precup;Joelle Pineau

通讯作者：

André Barreto;Doina Precup;Joelle Pineau

Reinforcement Learning: An Introduction

DOI：

10.1109/tnn.1998.712192

发表时间：

1998

期刊：

IEEE Trans. Neural Networks

影响因子：

作者：

R. S. Sutton;A. Barto

通讯作者：

R. S. Sutton;A. Barto

数据更新时间：{{ references.updateTime }}

关联基金

基于双时间尺度优化的多机器人策略自适应与一致性

批准号：

61473316

批准年份：

2014

资助金额：

82.0

项目类别：

面上项目

吴敏

通讯地址:

所属机构:

电子邮件地址：

免责声明

1、猫眼课题宝专注于为科研工作者提供省时、高效的文献资源检索和预览服务；

2、网站中的文献信息均来自公开、合规、透明的互联网文献查询网站，可以通过页面中的“来源链接”跳转数据网站。

3、在猫眼课题宝点击“求助全文”按钮，发布文献应助需求时求助者需要支付50喵币作为应助成功后的答谢给应助者，发送到用助者账户中。若文献求助失败支付的50喵币将退还至求助者账户中。所支付的喵币仅作为答谢，而不是作为文献的“购买”费用，平台也不从中收取任何费用，

4、特别提醒用户通过求助获得的文献原文仅用户个人学习使用，不得用于商业用途，否则一切风险由用户本人承担；

5、本平台尊重知识产权，如果权利所有者认为平台内容侵犯了其合法权益，可以通过本平台提供的版权投诉渠道提出投诉。一经核实，我们将立即采取措施删除/下架/断链等措施。

我已知晓

会员权益说明：

Gaussian-kernel-based adaptive critic design using two-phase value iteration

使用两阶段值迭代的基于高斯核的自适应批评设计

基本信息

文献摘要

关联基金

求助须知：