登录/注册

调研领{{question_mew_coin}}喵币啦！

待领取

免费领取喵币

开通猫会员

联系客服

客服二维码

用户头像

{{ userInfo.nickname }}

个人中心

ID: {{ userInfo.uid }}

复制

会员有效期至{{dayjs(userInfo?.membership_time * 1000).format('YYYY.MM.DD')}}

开通会员尊享 16+ 权益

{{isVip ? '立即续费' : '立即开通'}}

智能选题

智能选题

课程8折

智能标书

加赠喵币

加赠喵币

更多特权

更多特权

剩余喵币

充值

{{userInfo.mew_coin_count}}

{{userInfo.over_mew_coin || 0}}喵币将在本周失效

专属邀请码

复制

{{userInfo.share?.code}}

邀好友注册得200喵币/人任务中心

任务中心

退出账号

欢迎来到猫眼课题宝

- 微信扫码完成激活与登录 -

登录二维码

刷新登录二维码

刷新

登录即代表您同意并遵守《隐私协议》

为了保证账户安全，请在
微信「猫眼课题宝」内点击授权

重新扫码

刷新登录二维码

刷新

登录即代表您同意并遵守《隐私协议》

使用权限激活

完善信息

您好~为了给您带来更精准的创新选题分析，需要基于您的科研数据进行相关联匹配！信息100%保密，请放心填写！激活成功赠送 300喵币，自动到账，可用于选题分析、学科分析、报告下载等功能。

立即激活登录

切换微信登录

*注：建议或bug反馈被采纳后获得{{feedback_mew_coin}}喵币奖励，请关注公众号模版消息通知

取消

提交

已收到您的反馈，我们会尽快处理。若内容被采纳你将获得{{feedback_mew_coin}}喵币奖励。请关注《猫眼课题宝》消息通知。

{{ChannelMewCoin}}

喵币已到账！

*喵币用于产品体验解锁使用，有效期 30 天

在猫眼课题宝您可以：

{{item.title}}

{{item.desc}}

微信扫码添加小助理，回复“调研”
领取调研问卷

首次添加还可额外获得
{{customer_mew_coin}}喵币奖励哦！

完成问卷填写，立得{{question_mew_coin}}喵币奖励

永久回看权已生效！

直播主题

《{{latestCourse?.name}}》

立即去查看

7天猫会员

有效期至：{{dayjs(userInfo.membership_time * 1000).format('YYYY-MM-DD HH:mm')}}

已送您“7天会员体验卡+500喵币”

次数升级

享智能标书等多功能月解锁次数1次

10次

优享折扣

获会员期内充值喵币 8折等3大折扣

开心收下

永久回看权已生效！

课程

《{{giftRes?.image}}》

立即去查看

{{userInfo?.nickname}}

{{vipStr}}

hot

猫会员

（全方位提升课题决策能力）

喵币充值

会员专属

升级猫会员：购买喵币享 8 折优惠

免费领最高 6W 喵币

二维码

{{qrCodeError}}

请先阅读
服务协议并同意

扫码添加「专属客服」
了解团购优惠方案

客服在线时间：工作日9:00-18:00

￥

{{currentInfo?.price}}

{{isVip ? '已省' : '立省'}}{{currentInfo?.discount_price}}元

支持：

支付宝/

微信

请阅读并同意《猫眼课题宝服务协议》

*购买后不支持退

会员权益说明

升级会员

尊享16+权益

HOT

智能选题

智能选题

HOT

智能标书

智能标书

基金检索

基金检索

PDF

结题报告下载

结题报告下载

立项课题分析

立项课题分析

学科趋势分析

学科趋势分析

NEW

文献分析

文献分析

科研课程

科研课程

·查看权益对比·

返回开通

会员权益对比

权益分类

功能权益

普通用户

hot

{{item.name}}会员

- 微信扫一扫 -

请添加您的「专属会员管家」
提供专属会员服务

Theory and Application of Statistical Reinforcement Learning

统计强化学习理论与应用

基本信息

批准号：
17H00757
负责人：
Sugiyama Masashi
金额：
$ 28.79万
依托单位：
The University of Tokyo
依托单位国家：
日本
项目类别：
Grant-in-Aid for Scientific Research (A)
财政年份：
2017
资助国家：
日本
起止时间：
2017-04-01 至 2022-03-31
项目状态：
已结题

项目摘要

项目成果

期刊论文数量（40）

专著数量（0）

科研奖励数量（0）

会议论文数量（0）

专利数量（0）

A unified view of likelihood ratio and reparameterization gradients

DOI：
发表时间：
2021-05
期刊：
ArXiv
影响因子：
0
作者：
Paavo Parmas;Masashi Sugiyama
通讯作者：
Paavo Parmas;Masashi Sugiyama

杉山将のウェブページ

杉山雅史的网页

DOI：
发表时间：
期刊：
影响因子：
0
作者：
通讯作者：

Machine Learning from Weak Supervision: An Empirical Risk Minimization Approach

弱监督下的机器学习：一种经验性风险最小化方法

DOI：
发表时间：
2022
期刊：
影响因子：
0
作者：
Masashi Sugiyama;Han Bao;Takashi Ishida;Nan Lu;Tomoya Sakai;and Gang Niu
通讯作者：
and Gang Niu

Good arm identification via bandit feedback

DOI：
10.1007/s10994-019-05784-4
发表时间：
2017-10
期刊：
Machine Learning
影响因子：
7.5
作者：
H. Kano;J. Honda;Kentaro Sakamaki;Kentaro Matsuura;Atsuyoshi Nakamura;Masashi Sugiyama
通讯作者：
H. Kano;J. Honda;Kentaro Sakamaki;Kentaro Matsuura;Atsuyoshi Nakamura;Masashi Sugiyama

Expectation Propagation for t-Exponential Family Using q-Algebra

DOI：
发表时间：
2017-05
期刊：
影响因子：
0
作者：
Futoshi Futami;Issei Sato;Masashi Sugiyama
通讯作者：
Futoshi Futami;Issei Sato;Masashi Sugiyama

{{ item.title }}

{{ item.translation_title }}

DOI：
{{ item.doi }}
发表时间：
{{ item.publish_year }}
期刊：
{{ item.journal_name }}
影响因子：
{{ item.factor }}
作者：
{{ item.authors }}
通讯作者：
{{ item.author }}

数据更新时间：{{ journalArticles.updateTime }}

{{ item.title }}

作者：
{{ item.author }}

数据更新时间：{{ monograph.updateTime }}

{{ item.title }}

作者：
{{ item.author }}

数据更新时间：{{ sciAawards.updateTime }}

{{ item.title }}

作者：
{{ item.author }}

数据更新时间：{{ conferencePapers.updateTime }}

{{ item.title }}

作者：
{{ item.author }}

数据更新时间：{{ patent.updateTime }}

Sugiyama Masashi其他文献

An Online Policy Gradient Algorithm for Markov Decision Processes with Continuous States and Actions

具有连续状态和动作的马尔可夫决策过程的在线策略梯度算法

DOI：
10.1162/neco_a_00808
发表时间：
2014-09
期刊：
Neural Computation
影响因子：
2.9
作者：
Ma Yao;Zhao Tingting;Hatano Kohei;Sugiyama Masashi
通讯作者：
Sugiyama Masashi

Reconstruction of dynamical systems based on machine learning technique

基于机器学习技术的动力系统重构

DOI：
发表时间：
2022
期刊：
影响因子：
0
作者：
Tanimoto Akira;Yamada So;Takenouchi Takashi;Sugiyama Masashi;Kashima Hisashi;Naoto Nakano
通讯作者：
Naoto Nakano

海洋地球研究船「みらい」による北極海観測と砕氷船への期待

海洋地球科考船“未来”号北冰洋观测及对破冰船的期望

DOI：
发表时间：
2018
期刊：
影响因子：
0
作者：
Liu Song;Suzuki Taiji;Relator Raissa;Sese Jun;Sugiyama Masashi;Fukumizu Kenji;西野茂人
通讯作者：
西野茂人

ブッシュマンの道具を言語学的に見る

从语言学角度审视布须曼人的工具

DOI：
发表时间：
2017
期刊：
影响因子：
0
作者：
Ohnishi Motoya;Notomista Gennaro;Sugiyama Masashi;Egerstedt Magnus;中川裕
通讯作者：
中川裕

Trial and Error Using Previous Experiences as Simulation Models in Humanoid Motor Learning

使用以前的经验作为人形运动学习中的模拟模型的尝试和错误

DOI：
10.1109/mra.2015.2511681
发表时间：
2016
期刊：
IEEE Robotics and Automation Magazine
影响因子：
5.7
作者：
Sugimoto Norikazu;Tangkaratt Voot;Sugiyama Masashi;Wensveen Thijs;Zhao Tingting;Morimoto Jun;Sugimoto N
通讯作者：
Sugimoto N

Sugiyama Masashi的其他文献

{{ item.title }}

{{ item.translation_title }}

DOI：
{{ item.doi }}
发表时间：
{{ item.publish_year }}
期刊：
{{ item.journal_name }}
影响因子：
{{ item.factor }}
作者：
{{ item.authors }}
通讯作者：
{{ item.author }}

{{ truncateString('Sugiyama Masashi', 18)}}的其他基金

Theory and Application of Information-Based Machine Learning

基于信息的机器学习理论与应用

批准号：
25700022
财政年份：
2013
资助金额：
$ 28.79万
项目类别：
Grant-in-Aid for Young Scientists (A)

相似海外基金

Development of efficient multi-armed bandit algorithm for good arm identification and its application

高效多臂老虎机良好手臂识别算法的开发及其应用

批准号：
18K18099
财政年份：
2018
资助金额：
$ 28.79万
项目类别：
Grant-in-Aid for Early-Career Scientists

Development on molecular data science for biomolecule dynamical systems

生物分子动力系统分子数据科学的发展

批准号：
17H02940
财政年份：
2017
资助金额：
$ 28.79万
项目类别：
Grant-in-Aid for Scientific Research (B)

離散構造のオンライン予測に関する研究

离散结构在线预测研究

批准号：
16J04621
财政年份：
2016
资助金额：
$ 28.79万
项目类别：
Grant-in-Aid for JSPS Fellows

Autonomous Distributed Cooperation Mechanism for Wireless Networks with an Explosive Number of Wireless Nodes

无线节点爆炸性无线网络的自治分布式协作机制

批准号：
15H04008
财政年份：
2015
资助金额：
$ 28.79万
项目类别：
Grant-in-Aid for Scientific Research (B)

多腕バンディット問題における最適戦略の構成と発展

多臂老虎机问题最优策略的构建和发展

批准号：
25880006
财政年份：
2013
资助金额：
$ 28.79万
项目类别：
Grant-in-Aid for Research Activity Start-up

{{ showInfoDetail.title }}

成果类型：
{{ showInfoTypeEnum[showInfoType] }}

学术检索：
百度学术

作者：{{ showInfoDetail.author }}

知道了