Collaborative Research: High-Dimensional Decision Making and Inference with Applications for Personalized Medicine
合作研究:高维决策和推理及其在个性化医疗中的应用
基本信息
- 批准号:2015568
- 负责人:
- 金额:$ 10万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2020
- 资助国家:美国
- 起止时间:2020-06-15 至 2023-05-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
With the advent of data collection and storage technology, researchers can obtain large-scale and high-dimensional datasets at a low price. Such datasets offer exciting opportunities to make better decisions and reveal new discoveries to improve decision making in various applications, and meanwhile, also raise statistical challenges. Over the past decades, regularization methods such as Lasso, SCAD, and MCP have been proposed to conduct model estimation in the presence of high dimensional covariates. Various numerical algorithms have been developed for these methods, and their theoretical properties are well studied. However, questions of how to efficiently and effectively utilize high-dimensional data to make optimal decisions and conduct inference are relatively less studied, although such problems are of vital practical importance. This project will develop new methods and theories for making optimal decisions and conducting valid inference under high-dimensional settings. The methods have wide applications, for instance, in personalized medicine where the goal is to determine the optimal treatments for a patient based on predictor information, including several thousand genetic markers. The principal investigators will develop and distribute user-friendly open-source software to practitioners and provide training opportunities to students at different levels. The project has three research aims. The first aim is to study the high-dimensional contextual bandit problem with binary actions, which is an online decision-making problem that finds applications in personalized healthcare and precision medicine. In this problem, the player sequentially chooses one action and observes a reward, where the goal is to maximize the reward. The principal investigators will develop a new algorithm to provide an optimal decision rule, which achieves the minimax optimal regret. The second aim is to study general inference problems that arise from high-dimensional stochastic convex optimization, where the goal is to quantify the uncertainties of the optimal objective value. The third goal is to consider the general stochastic linear bandit problem with a finite and random action space. The principal investigators will develop a new algorithm by using a best-subset-selection type estimator, and the approach achieves a "dimension-free" regret and meets existing lower-bound under the low-dimensional setting.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
随着数据采集和存储技术的出现,研究人员可以以低廉的价格获得大规模、高维的数据集。此类数据集提供了令人兴奋的机会来做出更好的决策并揭示新发现以改进各种应用中的决策,同时也提出了统计挑战。在过去的几十年里,Lasso、SCAD 和 MCP 等正则化方法被提出来在存在高维协变量的情况下进行模型估计。人们已经为这些方法开发了各种数值算法,并且对它们的理论特性进行了深入研究。然而,如何高效、有效地利用高维数据进行最优决策和推理的问题却相对较少,尽管此类问题具有至关重要的实际意义。该项目将开发新的方法和理论,以在高维设置下做出最优决策并进行有效推理。这些方法具有广泛的应用,例如,在个性化医疗中,其目标是根据预测信息(包括数千个遗传标记)确定患者的最佳治疗方法。主要研究人员将开发并向从业者分发用户友好的开源软件,并为不同级别的学生提供培训机会。该项目有三个研究目标。第一个目标是研究具有二元动作的高维上下文强盗问题,这是一个在线决策问题,可在个性化医疗和精准医疗中找到应用。在这个问题中,玩家依次选择一个动作并观察奖励,其目标是最大化奖励。主要研究人员将开发一种新算法来提供最优决策规则,从而实现最小最大最优后悔。第二个目标是研究高维随机凸优化产生的一般推理问题,其目标是量化最优目标值的不确定性。第三个目标是考虑具有有限和随机动作空间的一般随机线性老虎机问题。主要研究人员将通过使用最佳子集选择类型估计器开发一种新算法,该方法实现了“无维”遗憾并满足低维设置下的现有下限。该奖项反映了 NSF 的法定使命和通过使用基金会的智力价值和更广泛的影响审查标准进行评估,该项目被认为值得支持。
项目成果
期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Online Bootstrap Inference For Policy Evaluation In Reinforcement Learning
强化学习中策略评估的在线引导推理
- DOI:10.1080/01621459.2022.2096620
- 发表时间:2021-08-08
- 期刊:
- 影响因子:3.7
- 作者:Pratik Ramprasad;Yuantong Li;Zhuoran Yang;Zhaoran Wang;W. Sun;Guang Cheng
- 通讯作者:Guang Cheng
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Zhaoran Wang其他文献
An Efficient Trajectory Planning Approach for Autonomous Ground Vehicles Using Improved Artificial Potential Field
使用改进的人工势场的自主地面车辆的高效轨迹规划方法
- DOI:
10.3390/sym16010106 - 发表时间:
2024-01-15 - 期刊:
- 影响因子:0
- 作者:
Xianjian Jin;Zhiwei Li;Nonsly Valerienne Opinat Ikiela;Xiongkui He;Zhaoran Wang;Yinchen Tao;Huaizhen Lv - 通讯作者:
Huaizhen Lv
Optimistic Exploration with Learned Features Provably Solves Markov Decision Processes with Neural Dynamics
利用学习到的特征进行乐观探索可证明利用神经动力学解决马尔可夫决策过程
- DOI:
- 发表时间:
2024-09-14 - 期刊:
- 影响因子:0
- 作者:
Sirui Zheng;Lingxiao Wang;Shuang Qiu;Zuyue Fu;Zhuoran Yang;Csaba Szepesvari;Zhaoran Wang - 通讯作者:
Zhaoran Wang
Gap-Dependent Bounds for Two-Player Markov Games
两人马尔可夫博弈的间隙相关界限
- DOI:
- 发表时间:
2021-07-01 - 期刊:
- 影响因子:0
- 作者:
Zehao Dou;Zhuoran Yang;Zhaoran Wang;S. Du - 通讯作者:
S. Du
Research on Task Scheduling Optimi-Zation of Data Center Under Double Carbon Target
双碳目标下数据中心任务调度优化研究
- DOI:
10.1109/iiotbdsc57192.2022.00061 - 发表时间:
2022-09-01 - 期刊:
- 影响因子:0
- 作者:
Zhu Mei;Chun;Wenqing Yang;Zhaoran Wang;Yunfei Yang - 通讯作者:
Yunfei Yang
Pessimistic Minimax Value Iteration: Provably Efficient Equilibrium Learning from Offline Datasets
悲观极小极大值迭代:从离线数据集中可证明有效的均衡学习
- DOI:
- 发表时间:
2022-02-15 - 期刊:
- 影响因子:0
- 作者:
Han Zhong;Wei Xiong;Jiyuan Tan;Liwei Wang;Tong Zhang;Zhaoran Wang;Zhuoran Yang - 通讯作者:
Zhuoran Yang
Zhaoran Wang的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Zhaoran Wang', 18)}}的其他基金
Collaborative Research: CIF: Medium: Learning to Control from Data: from Theory to Practice
合作研究:CIF:媒介:从数据中学习控制:从理论到实践
- 批准号:
2211210 - 财政年份:2022
- 资助金额:
$ 10万 - 项目类别:
Standard Grant
CAREER: Principled Deep Reinforcement Learning for Societal Systems
职业:社会系统的有原则的深度强化学习
- 批准号:
2048075 - 财政年份:2021
- 资助金额:
$ 10万 - 项目类别:
Continuing Grant
Collaborative Research: CIF: Small: A Unified Framework of Distributional Optimization via Variational Transport
合作研究:CIF:小型:通过变分传输的分布式优化的统一框架
- 批准号:
2008827 - 财政年份:2020
- 资助金额:
$ 10万 - 项目类别:
Standard Grant
相似国自然基金
基于纳米孔多维度数据的恶性胶质瘤基因组结构变异异质性及调控网络研究
- 批准号:32300522
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
多维度不确定性驱动的弱目标分割方法研究
- 批准号:62376189
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
多维度高次谐波谱中的多电子动力学研究
- 批准号:12304304
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于飞秒激光多维度制造的红外复眼集成微光学系统制备研究
- 批准号:62375174
- 批准年份:2023
- 资助金额:48 万元
- 项目类别:面上项目
基于多维度方法的大型CORC高温超导线圈交流损耗机理研究
- 批准号:52307033
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
相似海外基金
Collaborative Research: Manipulating the Thermal Properties of Two-Dimensional Materials Through Interface Structure and Chemistry
合作研究:通过界面结构和化学控制二维材料的热性能
- 批准号:
2400352 - 财政年份:2024
- 资助金额:
$ 10万 - 项目类别:
Standard Grant
Collaborative Research: Manipulating the Thermal Properties of Two-Dimensional Materials Through Interface Structure and Chemistry
合作研究:通过界面结构和化学控制二维材料的热性能
- 批准号:
2400353 - 财政年份:2024
- 资助金额:
$ 10万 - 项目类别:
Standard Grant
Collaborative Research: Four-Dimensional (4D) Investigation of Tropical Waves Using High-Resolution GNSS Radio Occultation from Strateole2 Balloons
合作研究:利用 Strateole2 气球的高分辨率 GNSS 无线电掩星对热带波进行四维 (4D) 研究
- 批准号:
2402728 - 财政年份:2024
- 资助金额:
$ 10万 - 项目类别:
Continuing Grant
Collaborative Research: Four-Dimensional (4D) Investigation of Tropical Waves Using High-Resolution GNSS Radio Occultation from Strateole2 Balloons
合作研究:利用 Strateole2 气球的高分辨率 GNSS 无线电掩星对热带波进行四维 (4D) 研究
- 批准号:
2402729 - 财政年份:2024
- 资助金额:
$ 10万 - 项目类别:
Continuing Grant
Collaborative Research: Learning and forecasting high-dimensional extremes: sparsity, causality, privacy
协作研究:学习和预测高维极端情况:稀疏性、因果关系、隐私
- 批准号:
2310974 - 财政年份:2023
- 资助金额:
$ 10万 - 项目类别:
Standard Grant