Robust Actor-Critic Algorithms for Reinforcement Learning.

用于强化学习的稳健的 Actor-Critic 算法。

基本信息

  • 批准号:
    443153-2013
  • 负责人:
  • 金额:
    $ 1.27万
  • 依托单位:
  • 依托单位国家:
    加拿大
  • 项目类别:
    Alexander Graham Bell Canada Graduate Scholarships - Master's
  • 财政年份:
    2013
  • 资助国家:
    加拿大
  • 起止时间:
    2013-01-01 至 2014-12-31
  • 项目状态:
    已结题

项目摘要

No summary - Aucun sommaire
没有总结 - Aucun sommaire

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Dick, Travis其他文献

Dispersion for Data-Driven Algorithm Design, Online Learning, and Private Optimization
Learning to Link
学习链接
Confidence-ranked reconstruction of census microdata from published statistics.
Reply to Sanchéz et al.: Multiplicity does not protect privacy.
Semi-bandit Optimization in the Dispersed Setting
分散环境中的半老虎优化

Dick, Travis的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Dick, Travis', 18)}}的其他基金

Pattern learning for monte-carlo tree search
蒙特卡罗树搜索的模式学习
  • 批准号:
    382881-2009
  • 财政年份:
    2009
  • 资助金额:
    $ 1.27万
  • 项目类别:
    University Undergraduate Student Research Awards

相似国自然基金

连续动作空间深度Actor-Critic算法研究
  • 批准号:
    61762032
  • 批准年份:
    2017
  • 资助金额:
    36.0 万元
  • 项目类别:
    地区科学基金项目
配音演员的声音对广告效果的影响--基于机器学习的声音广告研究
  • 批准号:
    71472192
  • 批准年份:
    2014
  • 资助金额:
    62.0 万元
  • 项目类别:
    面上项目
云计算中资源共享的分层博弈联盟形成与定价机制研究
  • 批准号:
    61379111
  • 批准年份:
    2013
  • 资助金额:
    73.0 万元
  • 项目类别:
    面上项目
基于实时交互规约的分布嵌入式软件可确定调度方法研究
  • 批准号:
    60863004
  • 批准年份:
    2008
  • 资助金额:
    23.0 万元
  • 项目类别:
    地区科学基金项目

相似海外基金

CRII: CPS: Cooperative Neuro-Inspired Actor Critic Model for Anomaly Detection in Connected Vehicles
CRII:CPS:用于联网车辆异常检测的协作神经启发演员评论家模型
  • 批准号:
    2153510
  • 财政年份:
    2022
  • 资助金额:
    $ 1.27万
  • 项目类别:
    Standard Grant
CRII: CPS: Cooperative Neuro-Inspired Actor Critic Model for Anomaly Detection in Connected Vehicles
CRII:CPS:用于联网车辆异常检测的协作神经启发演员评论家模型
  • 批准号:
    2313351
  • 财政年份:
    2022
  • 资助金额:
    $ 1.27万
  • 项目类别:
    Standard Grant
Cotask-Aware Offloading and Scheduling in Mobile-Edge Computing Systems
移动边缘计算系统中的协同任务感知卸载和调度
  • 批准号:
    19K21539
  • 财政年份:
    2018
  • 资助金额:
    $ 1.27万
  • 项目类别:
    Grant-in-Aid for Research Activity Start-up
Actor-Critic-Like Stochastic Adaptive Search Algorithms for Simulation Optimization
用于仿真优化的类似 Actor-Critic 的随机自适应搜索算法
  • 批准号:
    1634627
  • 财政年份:
    2016
  • 资助金额:
    $ 1.27万
  • 项目类别:
    Standard Grant
Collaboration technique of human and machine-learning for speed up of problem solving and its application for smart grid operations
加速问题解决的人机学习协作技术及其在智能电网运营中的应用
  • 批准号:
    15K00321
  • 财政年份:
    2015
  • 资助金额:
    $ 1.27万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了