Theory and Application of Statistical Reinforcement Learning
统计强化学习理论与应用
基本信息
- 批准号:17H00757
- 负责人:
- 金额:$ 28.79万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (A)
- 财政年份:2017
- 资助国家:日本
- 起止时间:2017-04-01 至 2022-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
项目成果
期刊论文数量(40)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
A unified view of likelihood ratio and reparameterization gradients
- DOI:
- 发表时间:2021-05
- 期刊:
- 影响因子:0
- 作者:Paavo Parmas;Masashi Sugiyama
- 通讯作者:Paavo Parmas;Masashi Sugiyama
Machine Learning from Weak Supervision: An Empirical Risk Minimization Approach
弱监督下的机器学习:一种经验性风险最小化方法
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:Masashi Sugiyama;Han Bao;Takashi Ishida;Nan Lu;Tomoya Sakai;and Gang Niu
- 通讯作者:and Gang Niu
Good arm identification via bandit feedback
- DOI:10.1007/s10994-019-05784-4
- 发表时间:2017-10
- 期刊:
- 影响因子:7.5
- 作者:H. Kano;J. Honda;Kentaro Sakamaki;Kentaro Matsuura;Atsuyoshi Nakamura;Masashi Sugiyama
- 通讯作者:H. Kano;J. Honda;Kentaro Sakamaki;Kentaro Matsuura;Atsuyoshi Nakamura;Masashi Sugiyama
Expectation Propagation for t-Exponential Family Using q-Algebra
- DOI:
- 发表时间:2017-05
- 期刊:
- 影响因子:0
- 作者:Futoshi Futami;Issei Sato;Masashi Sugiyama
- 通讯作者:Futoshi Futami;Issei Sato;Masashi Sugiyama
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Sugiyama Masashi其他文献
An Online Policy Gradient Algorithm for Markov Decision Processes with Continuous States and Actions
具有连续状态和动作的马尔可夫决策过程的在线策略梯度算法
- DOI:
10.1162/neco_a_00808 - 发表时间:
2014-09 - 期刊:
- 影响因子:2.9
- 作者:
Ma Yao;Zhao Tingting;Hatano Kohei;Sugiyama Masashi - 通讯作者:
Sugiyama Masashi
Reconstruction of dynamical systems based on machine learning technique
基于机器学习技术的动力系统重构
- DOI:
- 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
Tanimoto Akira;Yamada So;Takenouchi Takashi;Sugiyama Masashi;Kashima Hisashi;Naoto Nakano - 通讯作者:
Naoto Nakano
海洋地球研究船「みらい」による北極海観測と砕氷船への期待
海洋地球科考船“未来”号北冰洋观测及对破冰船的期望
- DOI:
- 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
Liu Song;Suzuki Taiji;Relator Raissa;Sese Jun;Sugiyama Masashi;Fukumizu Kenji;西野茂人 - 通讯作者:
西野茂人
ブッシュマンの道具を言語学的に見る
从语言学角度审视布须曼人的工具
- DOI:
- 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
Ohnishi Motoya;Notomista Gennaro;Sugiyama Masashi;Egerstedt Magnus;中川裕 - 通讯作者:
中川裕
Trial and Error Using Previous Experiences as Simulation Models in Humanoid Motor Learning
使用以前的经验作为人形运动学习中的模拟模型的尝试和错误
- DOI:
10.1109/mra.2015.2511681 - 发表时间:
2016 - 期刊:
- 影响因子:5.7
- 作者:
Sugimoto Norikazu;Tangkaratt Voot;Sugiyama Masashi;Wensveen Thijs;Zhao Tingting;Morimoto Jun;Sugimoto N - 通讯作者:
Sugimoto N
Sugiyama Masashi的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Sugiyama Masashi', 18)}}的其他基金
Theory and Application of Information-Based Machine Learning
基于信息的机器学习理论与应用
- 批准号:
25700022 - 财政年份:2013
- 资助金额:
$ 28.79万 - 项目类别:
Grant-in-Aid for Young Scientists (A)
相似海外基金
Development of efficient multi-armed bandit algorithm for good arm identification and its application
高效多臂老虎机良好手臂识别算法的开发及其应用
- 批准号:
18K18099 - 财政年份:2018
- 资助金额:
$ 28.79万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Development on molecular data science for biomolecule dynamical systems
生物分子动力系统分子数据科学的发展
- 批准号:
17H02940 - 财政年份:2017
- 资助金额:
$ 28.79万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Autonomous Distributed Cooperation Mechanism for Wireless Networks with an Explosive Number of Wireless Nodes
无线节点爆炸性无线网络的自治分布式协作机制
- 批准号:
15H04008 - 财政年份:2015
- 资助金额:
$ 28.79万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
多腕バンディット問題における最適戦略の構成と発展
多臂老虎机问题最优策略的构建和发展
- 批准号:
25880006 - 财政年份:2013
- 资助金额:
$ 28.79万 - 项目类别:
Grant-in-Aid for Research Activity Start-up