Theory and Application of Statistical Reinforcement Learning

统计强化学习理论与应用

基本信息

  • 批准号:
    17H00757
  • 负责人:
  • 金额:
    $ 28.79万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
  • 财政年份:
    2017
  • 资助国家:
    日本
  • 起止时间:
    2017-04-01 至 2022-03-31
  • 项目状态:
    已结题

项目摘要

项目成果

期刊论文数量(40)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
A unified view of likelihood ratio and reparameterization gradients
  • DOI:
  • 发表时间:
    2021-05
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Paavo Parmas;Masashi Sugiyama
  • 通讯作者:
    Paavo Parmas;Masashi Sugiyama
杉山将のウェブページ
杉山雅史的网页
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Machine Learning from Weak Supervision: An Empirical Risk Minimization Approach
弱监督下的机器学习:一种经验性风险最小化方法
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Masashi Sugiyama;Han Bao;Takashi Ishida;Nan Lu;Tomoya Sakai;and Gang Niu
  • 通讯作者:
    and Gang Niu
Good arm identification via bandit feedback
  • DOI:
    10.1007/s10994-019-05784-4
  • 发表时间:
    2017-10
  • 期刊:
  • 影响因子:
    7.5
  • 作者:
    H. Kano;J. Honda;Kentaro Sakamaki;Kentaro Matsuura;Atsuyoshi Nakamura;Masashi Sugiyama
  • 通讯作者:
    H. Kano;J. Honda;Kentaro Sakamaki;Kentaro Matsuura;Atsuyoshi Nakamura;Masashi Sugiyama
Expectation Propagation for t-Exponential Family Using q-Algebra
  • DOI:
  • 发表时间:
    2017-05
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Futoshi Futami;Issei Sato;Masashi Sugiyama
  • 通讯作者:
    Futoshi Futami;Issei Sato;Masashi Sugiyama
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Sugiyama Masashi其他文献

An Online Policy Gradient Algorithm for Markov Decision Processes with Continuous States and Actions
具有连续状态和动作的马尔可夫决策过程的在线策略梯度算法
  • DOI:
    10.1162/neco_a_00808
  • 发表时间:
    2014-09
  • 期刊:
  • 影响因子:
    2.9
  • 作者:
    Ma Yao;Zhao Tingting;Hatano Kohei;Sugiyama Masashi
  • 通讯作者:
    Sugiyama Masashi
Reconstruction of dynamical systems based on machine learning technique
基于机器学习技术的动力系统重构
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Tanimoto Akira;Yamada So;Takenouchi Takashi;Sugiyama Masashi;Kashima Hisashi;Naoto Nakano
  • 通讯作者:
    Naoto Nakano
海洋地球研究船「みらい」による北極海観測と砕氷船への期待
海洋地球科考船“未来”号北冰洋观测及对破冰船的期望
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Liu Song;Suzuki Taiji;Relator Raissa;Sese Jun;Sugiyama Masashi;Fukumizu Kenji;西野茂人
  • 通讯作者:
    西野茂人
ブッシュマンの道具を言語学的に見る
从语言学角度审视布须曼人的工具
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Ohnishi Motoya;Notomista Gennaro;Sugiyama Masashi;Egerstedt Magnus;中川裕
  • 通讯作者:
    中川裕
Trial and Error Using Previous Experiences as Simulation Models in Humanoid Motor Learning
使用以前的经验作为人形运动学习中的模拟模型的尝试和错误
  • DOI:
    10.1109/mra.2015.2511681
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    5.7
  • 作者:
    Sugimoto Norikazu;Tangkaratt Voot;Sugiyama Masashi;Wensveen Thijs;Zhao Tingting;Morimoto Jun;Sugimoto N
  • 通讯作者:
    Sugimoto N

Sugiyama Masashi的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Sugiyama Masashi', 18)}}的其他基金

Theory and Application of Information-Based Machine Learning
基于信息的机器学习理论与应用
  • 批准号:
    25700022
  • 财政年份:
    2013
  • 资助金额:
    $ 28.79万
  • 项目类别:
    Grant-in-Aid for Young Scientists (A)

相似海外基金

Development of efficient multi-armed bandit algorithm for good arm identification and its application
高效多臂老虎机良好手臂识别算法的开发及其应用
  • 批准号:
    18K18099
  • 财政年份:
    2018
  • 资助金额:
    $ 28.79万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Development on molecular data science for biomolecule dynamical systems
生物分子动力系统分子数据科学的发展
  • 批准号:
    17H02940
  • 财政年份:
    2017
  • 资助金额:
    $ 28.79万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
離散構造のオンライン予測に関する研究
离散结构在线预测研究
  • 批准号:
    16J04621
  • 财政年份:
    2016
  • 资助金额:
    $ 28.79万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
Autonomous Distributed Cooperation Mechanism for Wireless Networks with an Explosive Number of Wireless Nodes
无线节点爆炸性无线网络的自治分布式协作机制
  • 批准号:
    15H04008
  • 财政年份:
    2015
  • 资助金额:
    $ 28.79万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
多腕バンディット問題における最適戦略の構成と発展
多臂老虎机问题最优策略的构建和发展
  • 批准号:
    25880006
  • 财政年份:
    2013
  • 资助金额:
    $ 28.79万
  • 项目类别:
    Grant-in-Aid for Research Activity Start-up
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了