Integration of Kullback-Leibler control and intrinsic rewards for reinforcement learning

Kullback-Leibler 控制和强化学习内在奖励的集成

基本信息

批准号：
16K12504
负责人：
UCHIBE Eiji
金额：
$ 2.16万
依托单位：
Advanced Telecommunications Research Institute International
依托单位国家：
日本
项目类别：
Grant-in-Aid for Challenging Exploratory Research
财政年份：
2016
资助国家：
日本
起止时间：
2016-04-01 至 2019-03-31
项目状态：
已结题

项目摘要

项目成果

期刊论文数量（12）

专著数量（0）

科研奖励数量（0）

会议论文数量（0）

专利数量（0）

Deterministic Policy Search Method for Real Robot Control

DOI：
10.3902/jnns.24.195
发表时间：
2017
期刊：
The Brain & Neural Networks
影响因子：
0
作者：
E. Uchibe;Jiexin Wang
通讯作者：
E. Uchibe;Jiexin Wang

Deep reinforcement learning by parallelizing reward and punishment using MaxPain architecture

使用 MaxPain 架构并行奖励和惩罚进行深度强化学习

DOI：
发表时间：
2018
期刊：
影响因子：
0
作者：
Jiexin Wang;Stefan Elfwing;and Eiji Uchibe
通讯作者：
and Eiji Uchibe

Cooperative and competitive reinforcement and imitation learning

合作和竞争强化和模仿学习

DOI：
发表时间：
2018
期刊：
影响因子：
0
作者：
Jiexin Wang;Eiji Uchibe;Kenji Doya;Eiji Uchibe;Eiji Uchibe
通讯作者：
Eiji Uchibe

Imitation learning under entropy regularization

熵正则化下的模仿学习

DOI：
发表时间：
2019
期刊：
影响因子：
0
作者：
Jiexin Wang;Eiji Uchibe;Kenji Doya;Eiji Uchibe
通讯作者：
Eiji Uchibe

方策探査法のための多重重点サンプリングを用いた経験再利用

使用多重重要性采样进行策略探索方法的经验重用

DOI：
发表时间：
2018
期刊：
影响因子：
0
作者：
Jiexin Wang;Stefan Elfwing;and Eiji Uchibe;Eiji Uchibe;内部英治
通讯作者：
内部英治

DOI：
{{ item.doi }}
发表时间：
{{ item.publish_year }}
期刊：
{{ item.journal_name }}
影响因子：
{{ item.factor }}
作者：
{{ item.authors }}
通讯作者：
{{ item.author }}

数据更新时间：{{ journalArticles.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ monograph.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ sciAawards.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ conferencePapers.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ patent.updateTime }}

UCHIBE Eiji其他文献

UCHIBE Eiji的其他文献

DOI：
{{ item.doi }}
发表时间：
{{ item.publish_year }}
期刊：
{{ item.journal_name }}
影响因子：
{{ item.factor }}
作者：
{{ item.authors }}
通讯作者：
{{ item.author }}

{{ truncateString('UCHIBE Eiji', 18)}}的其他基金

Information theoretic optimization of intrinsic rewards for reinforcement learning

强化学习内在奖励的信息论优化

批准号：
24500249
财政年份：
2012
资助金额：
$ 2.16万
项目类别：
Grant-in-Aid for Scientific Research (C)

相似海外基金

Development of statistical inference of extended Hawkes processes including missing data problem

扩展霍克斯过程的统计推断的发展，包括缺失数据问题

批准号：
23H03358
财政年份：
2023
资助金额：
$ 2.16万
项目类别：
Grant-in-Aid for Scientific Research (B)

Speed-up of computation of the bootstrap method for incomplete data

不完全数据引导法计算的加速

批准号：
21K11800
财政年份：
2021
资助金额：
$ 2.16万
项目类别：
Grant-in-Aid for Scientific Research (C)

Development of statistical methodology and its applications for directional data utilizing international joint research

利用国际联合研究开发定向数据统计方法及其应用

批准号：
19KK0287
财政年份：
2020
资助金额：
$ 2.16万
项目类别：
Fund for the Promotion of Joint International Research (Fostering Joint International Research (A))

Realizing Proof-of-Work through arbitrary computation for a sustainable society

通过任意计算实现工作量证明以实现可持续发展的社会

批准号：
20K21795
财政年份：
2020
资助金额：
$ 2.16万
项目类别：
Grant-in-Aid for Challenging Research (Exploratory)

計量経済学と心理統計学のコラボレーション：パネルVAR分析の視点から

计量经济学与心理统计学的合作：从面板VAR分析的角度

批准号：
20K20760
财政年份：
2020
资助金额：
$ 2.16万
项目类别：
Grant-in-Aid for Challenging Research (Exploratory)

会员权益说明：