Collaborative Research: CIF: Medium: Learning to Control from Data: from Theory to Practice
合作研究:CIF:媒介:从数据中学习控制:从理论到实践
基本信息
- 批准号:2211210
- 负责人:
- 金额:$ 39.89万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2022
- 资助国家:美国
- 起止时间:2022-10-01 至 2026-09-30
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
Data-driven decision-making is playing an increasingly critical role in today's world with examples ranging from epidemic response to ridesharing optimization. However, learning an optimal control policy from data faces challenges in both the offline and online settings: (a) (Offline) It is unclear how to most efficiently utilize the available dataset which was collected a priori, especially when it does not cover all possible scenarios of interest. (b) (Online) It is unclear how to collect a dataset through minimal interactions with the environment in situations where it may be costly and unsafe to do so. Driven by the need to address these two challenges, this project aims to improve the sample efficiency of reinforcement learning (RL) in both settings. In addition, the project plans to incorporate adaptivity and trustworthiness that are required in practice. Activities complementary to these research thrusts include the training of future leaders of academia, industry, and government by equipping them with fundamental skills in data-driven decision making.The goal of this project is to develop the theory and algorithms for a new generation of data-driven decision rules in order to address critical challenges in modern RL. Specifically, the research agenda aims (i) to design sample-efficient and computationally-efficient algorithms for online and offline RL with function approximation, and (ii) to enhance the adaptivity and trustworthiness of existing RL paradigms. To achieve the first goal, we propose to incorporate optimistic exploration for online RL and pessimistic exploitation for offline RL into existing approaches with the help of faithful uncertainty quantification for neural networks. To achieve the second goal, we propose to incorporate model selection into existing approaches with the help of tight sample complexity characterizations.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
数据驱动的决策在当今世界发挥着越来越重要的作用,从流行病应对到拼车优化等例子不一而足。然而,从数据中学习最优控制策略在离线和在线设置中都面临挑战:(a)(离线)目前尚不清楚如何最有效地利用先验收集的可用数据集,特别是当它没有涵盖所有可能的情况时感兴趣的场景。 (b)(在线)尚不清楚如何在成本高昂且不安全的情况下通过与环境的最小交互来收集数据集。在解决这两个挑战的需求的推动下,该项目旨在提高这两种环境下强化学习 (RL) 的样本效率。此外,该项目计划纳入实践所需的适应性和可信度。与这些研究重点相辅相成的活动包括培训学术界、工业界和政府的未来领导者,让他们具备数据驱动决策的基本技能。该项目的目标是开发新一代数据的理论和算法驱动的决策规则,以解决现代强化学习中的关键挑战。具体来说,研究议程的目标是(i)通过函数逼近为在线和离线强化学习设计样本高效和计算高效的算法,以及(ii)增强现有强化学习范式的适应性和可信度。为了实现第一个目标,我们建议借助神经网络的忠实不确定性量化,将在线 RL 的乐观探索和离线 RL 的悲观开发纳入现有方法中。为了实现第二个目标,我们建议借助严格的样本复杂性特征将模型选择纳入现有方法中。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力价值和更广泛的影响审查标准进行评估,被认为值得支持。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Zhaoran Wang其他文献
Convergent Reinforcement Learning with Function Approximation: A Bilevel Optimization Perspective
具有函数逼近的收敛强化学习:双层优化视角
- DOI:
- 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
Zhuoran Yang;Zuyue Fu;K. Zhang;Zhaoran Wang - 通讯作者:
Zhaoran Wang
A Robust Gaussian Process-Based LiDAR Ground Segmentation Algorithm for Autonomous Driving
一种基于鲁棒高斯过程的自动驾驶 LiDAR 地面分割算法
- DOI:
10.3390/machines10070507 - 发表时间:
2022-06 - 期刊:
- 影响因子:2.6
- 作者:
Xianjian Jin;Hang Yang;Xin Liao;Zeyuan Yan;Qikang Wang;Zhiwei Li;Zhaoran Wang - 通讯作者:
Zhaoran Wang
Study on Association of Coomassie Brilliant Blue G250 and CTAB at Different Temperatures
考马斯亮蓝G250与CTAB在不同温度下缔合的研究
- DOI:
- 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
Juan Guo;Jilei Jing;Zhaoran Wang;Hong Lin;Nong Wang - 通讯作者:
Nong Wang
Offline Reinforcement Learning with Instrumental Variables in Confounded Markov Decision Processes
混杂马尔可夫决策过程中使用工具变量的离线强化学习
- DOI:
- 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
Zuyue Fu;Zhengling Qi;Zhaoran Wang;Zhuoran Yang;Yanxun Xu;Michael R. Kosorok - 通讯作者:
Michael R. Kosorok
Fairness-Oriented Learning for Optimal Individualized Treatment Rules
以公平为导向的学习以实现最佳个体化治疗规则
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:3.7
- 作者:
Ethan X. Fang;Zhaoran Wang;Lan Wang - 通讯作者:
Lan Wang
Zhaoran Wang的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Zhaoran Wang', 18)}}的其他基金
CAREER: Principled Deep Reinforcement Learning for Societal Systems
职业:社会系统的有原则的深度强化学习
- 批准号:
2048075 - 财政年份:2021
- 资助金额:
$ 39.89万 - 项目类别:
Continuing Grant
Collaborative Research: CIF: Small: A Unified Framework of Distributional Optimization via Variational Transport
合作研究:CIF:小型:通过变分传输的分布式优化的统一框架
- 批准号:
2008827 - 财政年份:2020
- 资助金额:
$ 39.89万 - 项目类别:
Standard Grant
Collaborative Research: High-Dimensional Decision Making and Inference with Applications for Personalized Medicine
合作研究:高维决策和推理及其在个性化医疗中的应用
- 批准号:
2015568 - 财政年份:2020
- 资助金额:
$ 39.89万 - 项目类别:
Continuing Grant
相似国自然基金
离子型稀土渗流-应力-化学耦合作用机理与溶浸开采优化研究
- 批准号:52364012
- 批准年份:2023
- 资助金额:32 万元
- 项目类别:地区科学基金项目
亲环蛋白调控作物与蚜虫互作分子机制的研究
- 批准号:32301770
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于金属-多酚网络衍生多相吸波体的界面调控及电磁响应机制研究
- 批准号:52302362
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
职场网络闲逛行为的作用结果及其反馈效应——基于行为者和观察者视角的整合研究
- 批准号:72302108
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
EIF6负调控Dicer活性促进EV71复制的分子机制研究
- 批准号:32300133
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
相似海外基金
Collaborative Research: CIF: Medium: Snapshot Computational Imaging with Metaoptics
合作研究:CIF:Medium:Metaoptics 快照计算成像
- 批准号:
2403122 - 财政年份:2024
- 资助金额:
$ 39.89万 - 项目类别:
Standard Grant
Collaborative Research: CIF-Medium: Privacy-preserving Machine Learning on Graphs
合作研究:CIF-Medium:图上的隐私保护机器学习
- 批准号:
2402815 - 财政年份:2024
- 资助金额:
$ 39.89万 - 项目类别:
Standard Grant
Collaborative Research: CIF: Small: Mathematical and Algorithmic Foundations of Multi-Task Learning
协作研究:CIF:小型:多任务学习的数学和算法基础
- 批准号:
2343599 - 财政年份:2024
- 资助金额:
$ 39.89万 - 项目类别:
Standard Grant
Collaborative Research: CIF: Small: Mathematical and Algorithmic Foundations of Multi-Task Learning
协作研究:CIF:小型:多任务学习的数学和算法基础
- 批准号:
2343600 - 财政年份:2024
- 资助金额:
$ 39.89万 - 项目类别:
Standard Grant
Collaborative Research:CIF:Small:Acoustic-Optic Vision - Combining Ultrasonic Sonars with Visible Sensors for Robust Machine Perception
合作研究:CIF:Small:声光视觉 - 将超声波声纳与可见传感器相结合,实现强大的机器感知
- 批准号:
2326905 - 财政年份:2024
- 资助金额:
$ 39.89万 - 项目类别:
Standard Grant