Integration of Kullback-Leibler control and intrinsic rewards for reinforcement learning
Kullback-Leibler 控制和强化学习内在奖励的集成
基本信息
- 批准号:16K12504
- 负责人:
- 金额:$ 2.16万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Challenging Exploratory Research
- 财政年份:2016
- 资助国家:日本
- 起止时间:2016-04-01 至 2019-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
项目成果
期刊论文数量(12)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Deterministic Policy Search Method for Real Robot Control
- DOI:10.3902/jnns.24.195
- 发表时间:2017
- 期刊:
- 影响因子:0
- 作者:E. Uchibe;Jiexin Wang
- 通讯作者:E. Uchibe;Jiexin Wang
Deep reinforcement learning by parallelizing reward and punishment using MaxPain architecture
使用 MaxPain 架构并行奖励和惩罚进行深度强化学习
- DOI:
- 发表时间:2018
- 期刊:
- 影响因子:0
- 作者:Jiexin Wang;Stefan Elfwing;and Eiji Uchibe
- 通讯作者:and Eiji Uchibe
Cooperative and competitive reinforcement and imitation learning
合作和竞争强化和模仿学习
- DOI:
- 发表时间:2018
- 期刊:
- 影响因子:0
- 作者:Jiexin Wang;Eiji Uchibe;Kenji Doya;Eiji Uchibe;Eiji Uchibe
- 通讯作者:Eiji Uchibe
Imitation learning under entropy regularization
熵正则化下的模仿学习
- DOI:
- 发表时间:2019
- 期刊:
- 影响因子:0
- 作者:Jiexin Wang;Eiji Uchibe;Kenji Doya;Eiji Uchibe
- 通讯作者:Eiji Uchibe
方策探査法のための多重重点サンプリングを用いた経験再利用
使用多重重要性采样进行策略探索方法的经验重用
- DOI:
- 发表时间:2018
- 期刊:
- 影响因子:0
- 作者:Jiexin Wang;Stefan Elfwing;and Eiji Uchibe;Eiji Uchibe;内部英治
- 通讯作者:内部英治
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
UCHIBE Eiji其他文献
UCHIBE Eiji的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('UCHIBE Eiji', 18)}}的其他基金
Information theoretic optimization of intrinsic rewards for reinforcement learning
强化学习内在奖励的信息论优化
- 批准号:
24500249 - 财政年份:2012
- 资助金额:
$ 2.16万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
相似海外基金
Development of statistical inference of extended Hawkes processes including missing data problem
扩展霍克斯过程的统计推断的发展,包括缺失数据问题
- 批准号:
23H03358 - 财政年份:2023
- 资助金额:
$ 2.16万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Speed-up of computation of the bootstrap method for incomplete data
不完全数据引导法计算的加速
- 批准号:
21K11800 - 财政年份:2021
- 资助金额:
$ 2.16万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Development of statistical methodology and its applications for directional data utilizing international joint research
利用国际联合研究开发定向数据统计方法及其应用
- 批准号:
19KK0287 - 财政年份:2020
- 资助金额:
$ 2.16万 - 项目类别:
Fund for the Promotion of Joint International Research (Fostering Joint International Research (A))
Realizing Proof-of-Work through arbitrary computation for a sustainable society
通过任意计算实现工作量证明以实现可持续发展的社会
- 批准号:
20K21795 - 财政年份:2020
- 资助金额:
$ 2.16万 - 项目类别:
Grant-in-Aid for Challenging Research (Exploratory)
計量経済学と心理統計学のコラボレーション:パネルVAR分析の視点から
计量经济学与心理统计学的合作:从面板VAR分析的角度
- 批准号:
20K20760 - 财政年份:2020
- 资助金额:
$ 2.16万 - 项目类别:
Grant-in-Aid for Challenging Research (Exploratory)