Robust Actor-Critic Algorithms for Reinforcement Learning.
用于强化学习的稳健的 Actor-Critic 算法。
基本信息
- 批准号:443153-2013
- 负责人:
- 金额:$ 1.27万
- 依托单位:
- 依托单位国家:加拿大
- 项目类别:Alexander Graham Bell Canada Graduate Scholarships - Master's
- 财政年份:2013
- 资助国家:加拿大
- 起止时间:2013-01-01 至 2014-12-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
No summary - Aucun sommaire
没有总结 - Aucun sommaire
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Dick, Travis其他文献
Dispersion for Data-Driven Algorithm Design, Online Learning, and Private Optimization
- DOI:
10.1109/focs.2018.00064 - 发表时间:
2018-01-01 - 期刊:
- 影响因子:0
- 作者:
Balcan, Maria-Florina;Dick, Travis;Vitercik, Ellen - 通讯作者:
Vitercik, Ellen
Learning to Link
学习链接
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
Balcan, Maria-Florina;Dick, Travis;Lang, Manuel - 通讯作者:
Lang, Manuel
Confidence-ranked reconstruction of census microdata from published statistics.
- DOI:
10.1073/pnas.2218605120 - 发表时间:
2023-02-21 - 期刊:
- 影响因子:11.1
- 作者:
Dick, Travis;Dwork, Cynthia;Kearns, Michael;Liu, Terrance;Roth, Aaron;Vietri, Giuseppe;Wu, Zhiwei Steven - 通讯作者:
Wu, Zhiwei Steven
Reply to Sanchéz et al.: Multiplicity does not protect privacy.
- DOI:
10.1073/pnas.2304263120 - 发表时间:
2023-05-02 - 期刊:
- 影响因子:11.1
- 作者:
Dick, Travis;Dwork, Cynthia;Kearns, Michael;Liu, Terrance;Roth, Aaron;Vietri, Giuseppe;Wu, Zhiwei Steven - 通讯作者:
Wu, Zhiwei Steven
Semi-bandit Optimization in the Dispersed Setting
分散环境中的半老虎优化
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
Balcan, Maria-Florina;Dick, Travis;Pegden, Wesley - 通讯作者:
Pegden, Wesley
Dick, Travis的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Dick, Travis', 18)}}的其他基金
Pattern learning for monte-carlo tree search
蒙特卡罗树搜索的模式学习
- 批准号:
382881-2009 - 财政年份:2009
- 资助金额:
$ 1.27万 - 项目类别:
University Undergraduate Student Research Awards
相似国自然基金
连续动作空间深度Actor-Critic算法研究
- 批准号:61762032
- 批准年份:2017
- 资助金额:36.0 万元
- 项目类别:地区科学基金项目
配音演员的声音对广告效果的影响--基于机器学习的声音广告研究
- 批准号:71472192
- 批准年份:2014
- 资助金额:62.0 万元
- 项目类别:面上项目
云计算中资源共享的分层博弈联盟形成与定价机制研究
- 批准号:61379111
- 批准年份:2013
- 资助金额:73.0 万元
- 项目类别:面上项目
基于实时交互规约的分布嵌入式软件可确定调度方法研究
- 批准号:60863004
- 批准年份:2008
- 资助金额:23.0 万元
- 项目类别:地区科学基金项目
相似海外基金
CRII: CPS: Cooperative Neuro-Inspired Actor Critic Model for Anomaly Detection in Connected Vehicles
CRII:CPS:用于联网车辆异常检测的协作神经启发演员评论家模型
- 批准号:
2153510 - 财政年份:2022
- 资助金额:
$ 1.27万 - 项目类别:
Standard Grant
CRII: CPS: Cooperative Neuro-Inspired Actor Critic Model for Anomaly Detection in Connected Vehicles
CRII:CPS:用于联网车辆异常检测的协作神经启发演员评论家模型
- 批准号:
2313351 - 财政年份:2022
- 资助金额:
$ 1.27万 - 项目类别:
Standard Grant
Cotask-Aware Offloading and Scheduling in Mobile-Edge Computing Systems
移动边缘计算系统中的协同任务感知卸载和调度
- 批准号:
19K21539 - 财政年份:2018
- 资助金额:
$ 1.27万 - 项目类别:
Grant-in-Aid for Research Activity Start-up
Actor-Critic-Like Stochastic Adaptive Search Algorithms for Simulation Optimization
用于仿真优化的类似 Actor-Critic 的随机自适应搜索算法
- 批准号:
1634627 - 财政年份:2016
- 资助金额:
$ 1.27万 - 项目类别:
Standard Grant
Collaboration technique of human and machine-learning for speed up of problem solving and its application for smart grid operations
加速问题解决的人机学习协作技术及其在智能电网运营中的应用
- 批准号:
15K00321 - 财政年份:2015
- 资助金额:
$ 1.27万 - 项目类别:
Grant-in-Aid for Scientific Research (C)