Analysis of reward appraisal evolution processes of reinforcement learning agents in a multiagent environment
多智能体环境下强化学习智能体奖励评价演化过程分析
基本信息
- 批准号:16K00302
- 负责人:
- 金额:$ 2.91万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:2016
- 资助国家:日本
- 起止时间:2016-04-01 至 2019-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
GPGPUを用いた強化学習エージェントの並列進化シミュレーション
使用 GPGPU 的强化学习智能体并行进化模拟
- DOI:
- 发表时间:2018
- 期刊:
- 影响因子:0
- 作者:千賀喜貴;森山甲一;武藤敦子;松井藤五郎;犬塚信博
- 通讯作者:犬塚信博
Evolution Direction of Reward Appraisal in Reinforcement Learning Agents
强化学习智能体奖励评估的演进方向
- DOI:10.1007/978-3-319-92031-3_2
- 发表时间:2018
- 期刊:
- 影响因子:0
- 作者:Masaya Miyawaki;Koichi Moriyama;Atsuko Mutoh;Tohgoroh Matsui;and Nobuhiro Inuzuka
- 通讯作者:and Nobuhiro Inuzuka
The Resilience of Cooperation in a Dilemma Game Played by Reinforcement Learning Agents
强化学习代理在困境博弈中的合作弹性
- DOI:10.1109/agents.2017.8015297
- 发表时间:2017
- 期刊:
- 影响因子:0
- 作者:Koichi Moriyama;Kaori Nakase;Atsuko Mutoh;and Nobuhiro Inuzuka
- 通讯作者:and Nobuhiro Inuzuka
Accelerating Deep Q Network by Weighting Experiences
通过加权经验加速 Deep Q 网络
- DOI:10.1007/978-3-030-04167-0_19
- 发表时间:2018
- 期刊:
- 影响因子:0
- 作者:Kazuhiro Murakami;Koichi Moriyama;Atsuko Mutoh;Tohgoroh Matsui;and
- 通讯作者:and
マルチエージェント強化学習における主観的効用の進化過程に関する分析
多智能体强化学习中主观效用演化过程分析
- DOI:
- 发表时间:2017
- 期刊:
- 影响因子:0
- 作者:宮脇昌哉;森山甲一;武藤敦子;松井藤五郎;犬塚信博
- 通讯作者:犬塚信博
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Moriyama Koichi其他文献
Moriyama Koichi的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似海外基金
Reward Design for Safe Reinforcement Learning
安全强化学习的奖励设计
- 批准号:
2872672 - 财政年份:2023
- 资助金额:
$ 2.91万 - 项目类别:
Studentship
Identifying the neural mechanisms of goal-directed decision-making in Parkinson's disease using closed-loop deep brain stimulation
使用闭环深部脑刺激识别帕金森病目标导向决策的神经机制
- 批准号:
10608842 - 财政年份:2023
- 资助金额:
$ 2.91万 - 项目类别:
Neuroimaging Studies of Reward Processing in Depression
抑郁症奖励处理的神经影像学研究
- 批准号:
10307643 - 财政年份:2022
- 资助金额:
$ 2.91万 - 项目类别:
Pinpointing the Cerebellum's Contribution to Social Reward Processing
确定小脑对社会奖励处理的贡献
- 批准号:
10541308 - 财政年份:2022
- 资助金额:
$ 2.91万 - 项目类别:
Neuroimaging Studies of Reward Processing in Depression
抑郁症奖励处理的神经影像学研究
- 批准号:
10674674 - 财政年份:2022
- 资助金额:
$ 2.91万 - 项目类别: