连续时间马氏决策过程若干新准则的研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    11601166
  • 项目类别:
    青年科学基金项目
  • 资助金额:
    19.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    A0209.马氏过程与统计物理
  • 结题年份:
    2019
  • 批准年份:
    2016
  • 项目状态:
    已结题
  • 起止时间:
    2017-01-01 至2019-12-31

项目摘要

Markov decision processes have been widely applied in many areas, such as finance, insurance, risk management, communication network, inventory management and queueing systems. The expected utility theory and cumulative prospect theory are applied to continuous-time Markov decision processes and a research will be carried out from the two viewpoints of the risk and the behaviors of the decision-makers. We will study the following problems in this project. . (1) The utility functions are used to describe the decision-makers’ risk attitude and we will consider the expected utility function criterion under the unbounded transition rates and the general convex or concave utility functions. . (2) We will make an attempt to study the dynamic risk measures of continuous-time Markov decision processes and their relative properties. Moreover, we will consider the mean-risk criterion under a class of risk measures with the property of law invariance. More precisely, the optimality criterion to be considered is to find a policy which maximizes the expected payoffs over the set of all feasible policies satisfying the constraint that the risk of the payoffs does not exceed a given constant. . (3) The probability distortion functions are used to describe the behavior that the decision-makers enlarge a small probability or diminish a large probability, and we will study the semi-variance minimization criterion under the probability distortion. . We will investigate the existence of optimal policies and give the effective methods of the approximate computations of the optimal policies for the above new criteria. The research of this project is of important significance on both theoretical and applied sides. It not only enriches the decision theory of the stochastic dynamic systems, but also provides a theoretical basis for the applied research, such as Markov decision models with applications to risk management.
马氏决策过程已在金融保险、风险管理、通信网络、库存管理、排队系统等众多领域有广泛的应用。本项目将期望效用函数理论和累积前景理论应用到连续时间马氏决策过程,从风险和决策者的行为这两个视角研究以下问题:(1) 利用效用函数刻画决策者的风险态度,考虑转移率无界且效用函数为一般的凸函数或凹函数的期望效用函数准则;(2) 探索连续时间马氏决策过程的动态风险度量及其相关性质,并对满足分布不变性的一类风险度量,考虑均值-风险准则,即在效益的风险不超过给定常数的策略类中寻找使得效益的均值最大的策略;(3) 通过概率扭曲函数刻画决策者人为地放大小概率事件或缩小大概率事件的行为,考虑加入概率扭曲函数的半方差准则。我们将研究上述新的准则最优策略的存在性及其有效的近似计算方法。本项目的研究在理论上和应用上都具有重要意义,不仅能丰富随机动态系统的决策理论,而且为马氏决策模型在风险管理等方面的应用研究提供理论依据。

结项摘要

本项目主要研究受控连续时间跳过程的期望效用函数准则和均值-半方差准则等若干新准则,具体如下:. (1)由正则效用函数诱导的平均费用准则(简称U-平均费用准则)最优策略的存在性及其计算方法。关于该准则,给出了最优策略的存在性条件,证明了最优值函数关于风险灵敏性系数的连续性,建立了U-平均费用准则与风险灵敏性平均费用准则、期望平均费用准则之间的联系,得到了U-平均最优平稳策略的存在性和计算最优策略的方法。.(2)由指数效用函数诱导的风险灵敏性平均费用准则最优策略的存在性。关于该准则,建立了风险灵敏性平均最优不等式解的存在性,证明了最优策略的存在性,给出了simultaneous Doeblin假设可验证的充分条件和风险灵敏性平均最优不等式严格成立的例子。.(3)均值-半方差准则最优策略的存在性及其计算方法。关于该准则,证明了折扣总费用半方差问题的最优值函数是均值-半方差准则最优方程的解,得到了最优策略的存在性,给出了近似计算最优值函数和最优策略的值迭代算法并分析了该算法的收敛性。.(4)风险灵敏性有限阶段准则零和博弈和非零和博弈问题均衡点的存在性、无约束期望平均准则和受约束期望平均准则非零和博弈问题纳什均衡点的存在性。关于这些博弈问题,给出了均衡点的存在性条件并证明了其存在性。. 本项目关于U-平均费用准则和均值-半方差准则等若干新准则所取得的理论结果为受控连续时间跳过程的应用研究奠定了理论基础。

项目成果

期刊论文数量(9)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Mean–semivariance optimality for continuous-time Markov decision processes
连续时间马尔可夫决策过程的均值半方差最优性
  • DOI:
    --
  • 发表时间:
    2019
  • 期刊:
    Systems & Control Letters
  • 影响因子:
    2.6
  • 作者:
    Qingda Wei
  • 通讯作者:
    Qingda Wei
Risk sensitive average continuous time Markov decision processes with unbounded rates
具有无界速率的风险敏感平均连续时间马尔可夫决策过程
  • DOI:
    --
  • 发表时间:
    2019
  • 期刊:
    Optimization
  • 影响因子:
    2.2
  • 作者:
    Qingda Wei;Xian Chen
  • 通讯作者:
    Xian Chen
Nonzero-sum expected average discrete-time stochastic games: the case of uncountable spaces
非零和期望平均离散时间随机博弈:不可数空间的情况
  • DOI:
    10.1093/jxb/erx083
  • 发表时间:
    2019
  • 期刊:
    SIAM Journal on Control and Optimization
  • 影响因子:
    2.2
  • 作者:
    Qingda Wei;Xian Chen
  • 通讯作者:
    Xian Chen
Zero-sum games for continuous-time Markov jump processes with risk-sensitive finite-horizon cost criterion
具有风险敏感有限范围成本准则的连续时间马尔可夫跳跃过程的零和博弈
  • DOI:
    10.1016/j.orl.2017.11.008
  • 发表时间:
    2018
  • 期刊:
    Operations Research Letters
  • 影响因子:
    1.1
  • 作者:
    Qingda Wei
  • 通讯作者:
    Qingda Wei
Nonzero-sum games for continuous-time jump processes under the expected average payoff criterion
预期平均收益准则下连续时间跳跃过程的非零和博弈
  • DOI:
    10.1007/s00245-019-09572-3
  • 发表时间:
    --
  • 期刊:
    Applied Mathematics & Optimization
  • 影响因子:
    1.8
  • 作者:
    Qingda Wei;Xian Chen
  • 通讯作者:
    Xian Chen

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

Constrained Markov decision processes with first passage criteria
具有首次通过标准的约束马尔可夫决策过程
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    Ann. Oper. Res.
  • 影响因子:
    --
  • 作者:
    黄永辉;魏清达;郭先平
  • 通讯作者:
    郭先平

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

魏清达的其他基金

决策阶段不确定且折扣函数非指数的随机博弈模型研究
  • 批准号:
    12171170
  • 批准年份:
    2021
  • 资助金额:
    51 万元
  • 项目类别:
    面上项目
连续时间马氏决策过程受约束问题的研究
  • 批准号:
    11526092
  • 批准年份:
    2015
  • 资助金额:
    3.0 万元
  • 项目类别:
    数学天元基金项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码