多臂Bandit process中的Bayes非参数方法

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    71771089
  • 项目类别:
    面上项目
  • 资助金额:
    48.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    G0102.运筹与管理
  • 结题年份:
    2021
  • 批准年份:
    2017
  • 项目状态:
    已结题
  • 起止时间:
    2018-01-01 至2021-12-31

项目摘要

Multi-armed bandit process models lie in the domain of stochastic dynamic optimization or stochastic dynamic programming and have been extensively applied in personalized medicine, clinical trails, internet techniques, artificial intellegence and so on. An MAB consist of a collection of controllable stochastic processes, of which each allows for two options: selected and frozen and, once selected, gives rise to a flow of rewards. The objective of an MAB model is to decide the allocation of time to every member process so as to optimize certain objective functions of the overall reward flow... Bayesian nonparametrics aim at how to efficiently construct prior distributions for nonparametric statistical models so that one can make effecient statistical inference by means of Bayesian methodologies...This project intends to systematically introduce the ideas and methdologies of Bayesian nonparametrics into the research of MAB models so as to derive the policies that are optimal or asymptotically optimal in certain sense. It can enrich theoretically the content of MAB investigation, provide Bayesian analysis for the various nonparametric MAB models in the perspective of real-world applications and may give rise to new methods and insights from the point of view of methodologies.
多臂Bandit过程(MAB)模型属于动态随机最优化/随机动态规划的范畴,广泛应用于精准医疗、临床试验、互联网技术,人工智能等。MAB由一组平行的可控随机过程组成,每个随机过程可以有两个选项:选择和不选择,一旦被选择,该过程就给出一个报酬流,MAB的目的是确定各个随机过程被选择和不选择的策略(时间分配),从而使得基于报酬流的一定的目标函数达到最优化。..Bayes非参数方法研究的是如何有效地对非参数统计学模型构造先验分布并进而使用使用Bayes方法进行统计学的推断。..本项目拟将非参数Bayes方法系统地引入MAB问题的研究,得到相应的最优或者一定意义上渐进最优的策略。这从理论上可以丰富MAB的研究内容次,从应用上可以为各种非参数MAB模型提供其相应的Bayes方法,从方法论的角度有可能会带来MAB决策问题的新方法和思考。

结项摘要

多臂Bandit过程(MultiArmed Bandit processes)模型属于动态随机最优化/随机动态规划的范畴,广泛应用于精准 医疗、临床试验、互联网技术,人工智能等。MAB由一组平行的可控随机过程组成,每个随机过程可以有两个选项:选择和不选择,一旦被选择,该过程就给出一个报酬流,MAB的目的是确定各个随机过程被选择和不选择的策略(时间分配),从而使得基于报酬流的一定的目标函数达到最优。 Bayes非参数方法研究的是如何有效地对非参数统计学模型构造先验分布并进而使用B ayes方法进行统计推断。 本项目拟研究(1)Bayes非参数方法及其各种应用,(2)MAB问题的的相关研究,以及(3)Bayes非参数方法与MAB问题的结合。这从理论上可以丰富Bayes非参数方法及MAB的研究内容,从应用上可以为各种非参数MAB模型提供其相应的Bayes方法,从方法论的角度可以带来MAB决策问题的新方法和思考。..本项目的目标是从理论上研究Bayes非参数方法与MAB问题的结合。经过四年的努力,项目研究目标基本完成,得到了一些重要的关于MAB问题的结果,并对相关的问题如变量选择问题,对Bayes非参数方法的应用问题也进行了一定程度的研究,还尝试性地研究了经验Gittins indices以及强化学习(reinforcement learning,是对MAB进行扩展的一个领域)中Off-policy优化问题进行了研究。作为一项副产品,本项目的研究将项目组引入更具有吸引力和颇具时代特色的强化学习领域。

项目成果

期刊论文数量(8)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
On Hodges’ superefficiency and merits of oracle property in model selection
论Hodges的模型选择中的超效率和预言性质的优点
  • DOI:
    10.1007/s10463-018-0670-0
  • 发表时间:
    2019
  • 期刊:
    Annals of the Institute of Statistical Mathematics
  • 影响因子:
    1
  • 作者:
    Wu X.;Zhou X.
  • 通讯作者:
    Zhou X.
Bayesian ratemaking with common effects modeled by mixture of Polya tree processes
通过混合 Polya 树过程建模的具有共同效应的贝叶斯速率制定
  • DOI:
    10.1016/j.insmatheco.2018.06.007
  • 发表时间:
    2018
  • 期刊:
    Insurance: Mathematics and Economics
  • 影响因子:
    --
  • 作者:
    Zhang Jianjun;Qiu Chunjuan;Wu Xianyi
  • 通讯作者:
    Wu Xianyi
Separating variables to accelerate non-convex regularized optimization
分离变量以加速非凸正则化优化
  • DOI:
    10.1016/j.csda.2020.106943
  • 发表时间:
    2020
  • 期刊:
    Computational Statistics & Data Analysis
  • 影响因子:
    1.8
  • 作者:
    Liu Wenchen;Tang Yincai;Wu Xianyi
  • 通讯作者:
    Wu Xianyi
基于核估计下概率密度函数的信度模型
  • DOI:
    10.13299/j.cnki.amjcu.002106
  • 发表时间:
    2020
  • 期刊:
    高校应用数学学报A辑(中文版)
  • 影响因子:
    --
  • 作者:
    章溢;熊佳;温利民;吴贤毅;周宪
  • 通讯作者:
    周宪
A General Theory of MultiArmed Bandit Processes with Constrained Arm Switches
约束臂开关多臂强盗过程的一般理论
  • DOI:
    --
  • 发表时间:
    2021
  • 期刊:
    SIAM Journal on Control and Optimization
  • 影响因子:
    --
  • 作者:
    WENQING BAO;XIAOQIANG CAI;XIANYI WU
  • 通讯作者:
    XIANYI WU

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

Multiple Comparisons Controlling Expected Number of False Discoveries
多重比较控制错误发现的预期数量
  • DOI:
    10.1080/03610926.2012.679764
  • 发表时间:
    2014
  • 期刊:
    Communications in Statistics - Theory and Methods
  • 影响因子:
    --
  • 作者:
    吴贤毅
  • 通讯作者:
    吴贤毅
X Cai, L Wen, X Wu, X Zhou. Credibility Estimation of Distribution Functions with Applications to Experience Rating in General Insurance
X蔡,L文,X吴,X周。
  • DOI:
    --
  • 发表时间:
    2015
  • 期刊:
    North American Actuarial Journal
  • 影响因子:
    1.4
  • 作者:
    Cai X.;Wen L.;吴贤毅;Zhou X.
  • 通讯作者:
    Zhou X.
RBNS的线性预测模型
  • DOI:
    --
  • 发表时间:
    2011
  • 期刊:
    应用概率统计
  • 影响因子:
    --
  • 作者:
    俞雪梨;吴贤毅
  • 通讯作者:
    吴贤毅
Local linear regression in proportional hazards model with censored data
具有删失数据的比例风险模型中的局部线性回归
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    Communications in Statistics-Theory and Methods
  • 影响因子:
    0.8
  • 作者:
    吴贤毅
  • 通讯作者:
    吴贤毅
A New Class of Credibility Estimators Under the Generalized Weighted Premium Principle
广义加权溢价原理下的一类新的可信度估计器
  • DOI:
    10.1080/03610926.2011.582565
  • 发表时间:
    2013
  • 期刊:
    Communications in Statistics - Theory and Methods
  • 影响因子:
    --
  • 作者:
    温利民;王江峰;吴贤毅
  • 通讯作者:
    吴贤毅

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

吴贤毅的其他基金

可信离线强化学习的置信下限方法:算法与理论
  • 批准号:
    72371103
  • 批准年份:
    2023
  • 资助金额:
    41 万元
  • 项目类别:
    面上项目
受限制策略下多臂Bandit过程的理论与应用研究
  • 批准号:
    71371074
  • 批准年份:
    2013
  • 资助金额:
    57.0 万元
  • 项目类别:
    面上项目
非标准随机调度模型的最优动态策略
  • 批准号:
    71071056
  • 批准年份:
    2010
  • 资助金额:
    28.0 万元
  • 项目类别:
    面上项目
机器具有中断条件下的随机调度问题
  • 批准号:
    70671043
  • 批准年份:
    2006
  • 资助金额:
    19.0 万元
  • 项目类别:
    面上项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码