Efficient Actor-Critic and Policy-Gradient Methods for Reinforcement Learning

用于强化学习的高效 Actor-Critic 和策略梯度方法

基本信息

  • 批准号:
    405275-2011
  • 负责人:
  • 金额:
    $ 2.91万
  • 依托单位:
  • 依托单位国家:
    加拿大
  • 项目类别:
    Postdoctoral Fellowships
  • 财政年份:
    2012
  • 资助国家:
    加拿大
  • 起止时间:
    2012-01-01 至 2013-12-31
  • 项目状态:
    已结题

项目摘要

No summary - Aucun sommaire
没有总结 - Aucun sommaire

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Maei, Hamid其他文献

Maei, Hamid的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Maei, Hamid', 18)}}的其他基金

Efficient Actor-Critic and Policy-Gradient Methods for Reinforcement Learning
用于强化学习的高效 Actor-Critic 和策略梯度方法
  • 批准号:
    405275-2011
  • 财政年份:
    2013
  • 资助金额:
    $ 2.91万
  • 项目类别:
    Postdoctoral Fellowships
Efficient Actor-Critic and Policy-Gradient Methods for Reinforcement Learning
用于强化学习的高效 Actor-Critic 和策略梯度方法
  • 批准号:
    405275-2011
  • 财政年份:
    2011
  • 资助金额:
    $ 2.91万
  • 项目类别:
    Postdoctoral Fellowships

相似国自然基金

连续动作空间深度Actor-Critic算法研究
  • 批准号:
    61762032
  • 批准年份:
    2017
  • 资助金额:
    36.0 万元
  • 项目类别:
    地区科学基金项目
配音演员的声音对广告效果的影响--基于机器学习的声音广告研究
  • 批准号:
    71472192
  • 批准年份:
    2014
  • 资助金额:
    62.0 万元
  • 项目类别:
    面上项目
云计算中资源共享的分层博弈联盟形成与定价机制研究
  • 批准号:
    61379111
  • 批准年份:
    2013
  • 资助金额:
    73.0 万元
  • 项目类别:
    面上项目
基于实时交互规约的分布嵌入式软件可确定调度方法研究
  • 批准号:
    60863004
  • 批准年份:
    2008
  • 资助金额:
    23.0 万元
  • 项目类别:
    地区科学基金项目

相似海外基金

CRII: CPS: Cooperative Neuro-Inspired Actor Critic Model for Anomaly Detection in Connected Vehicles
CRII:CPS:用于联网车辆异常检测的协作神经启发演员评论家模型
  • 批准号:
    2153510
  • 财政年份:
    2022
  • 资助金额:
    $ 2.91万
  • 项目类别:
    Standard Grant
CRII: CPS: Cooperative Neuro-Inspired Actor Critic Model for Anomaly Detection in Connected Vehicles
CRII:CPS:用于联网车辆异常检测的协作神经启发演员评论家模型
  • 批准号:
    2313351
  • 财政年份:
    2022
  • 资助金额:
    $ 2.91万
  • 项目类别:
    Standard Grant
Cotask-Aware Offloading and Scheduling in Mobile-Edge Computing Systems
移动边缘计算系统中的协同任务感知卸载和调度
  • 批准号:
    19K21539
  • 财政年份:
    2018
  • 资助金额:
    $ 2.91万
  • 项目类别:
    Grant-in-Aid for Research Activity Start-up
Actor-Critic-Like Stochastic Adaptive Search Algorithms for Simulation Optimization
用于仿真优化的类似 Actor-Critic 的随机自适应搜索算法
  • 批准号:
    1634627
  • 财政年份:
    2016
  • 资助金额:
    $ 2.91万
  • 项目类别:
    Standard Grant
Collaboration technique of human and machine-learning for speed up of problem solving and its application for smart grid operations
加速问题解决的人机学习协作技术及其在智能电网运营中的应用
  • 批准号:
    15K00321
  • 财政年份:
    2015
  • 资助金额:
    $ 2.91万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了