Collaborative Research: CIF: Small: Mathematical and Algorithmic Foundations of Multi-Task Learning

协作研究:CIF:小型:多任务学习的数学和算法基础

基本信息

  • 批准号:
    2343600
  • 负责人:
  • 金额:
    $ 30万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2024
  • 资助国家:
    美国
  • 起止时间:
    2024-04-01 至 2027-03-31
  • 项目状态:
    未结题

项目摘要

Reinforcement learning has emerged as one of the predominant frameworks for real-time decision making and control. It has been the driving force behind several recent high-profile successes of artificial intelligence, enjoying success in areas as diverse as robotic control, wireless communications, and protein structure prediction. While reinforcement learning provides a powerful and flexible framework for learning, data efficiency is a fundamental challenge: this framework is known to require significant computational resources and vast amount of data. This challenge limits the applicability of reinforcement learning and keeps it from being applied in problems where training data and computational power are limited, including important applications such as wildfire monitoring and the search-and-rescue of lost people using unmanned aerial vehicles. This project addresses this challenge by developing new mathematical foundations of multi-task reinforcement learning and novel learning algorithms that require less data in the aggregate when multiple tasks are jointly learned. The project integrates the research findings with rigorous educational and outreach activities, course development, and student training. This project focuses on answering two fundamental questions: (1) Under what conditions does it take less data and computation to learn multiple tasks jointly than it would to learn each task individually? and (2) Can reinforcement learning algorithms learn something meaningful with only a limited amount of data and computation? Our approach to answering these questions draws on techniques from online learning, compressed sensing, and stochastic modeling. In particular, this project covers both offline settings, where the similarity structure between tasks is learned from a given data set, and online settings, where this learned structure is used to efficiently adapt to a new task “on the fly”. The project also addresses the fundamental problem of catastrophic forgetting in multi-task learning, where the learned policy loses the ability to perform a previous task after training for a new task. Over the course of this project, the proposed research activities will be evaluated systematically through a series of simulations of multi-robot navigation.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
强化学习已成为实时决策和控制的主要框架之一,它是人工智能最近取得的几项引人注目的成功的驱动力,在机器人控制、无线通信和人工智能等领域取得了成功。蛋白质结构预测。虽然强化学习提供了强大且灵活的学习框架,但数据效率是一个基本挑战:众所周知,该框架需要大量的计算资源和大量数据,这一挑战限制了强化学习的适用性并使其无法发挥作用。应用于训练数据和计算的问题电力有限,包括野火监测和使用无人机搜救失踪人员等重要应用,该项目通过开发多任务强化学习的新数学基础和需要较少数据的新颖学习算法来解决这一挑战。该项目将研究结果与严格的教育和推广活动、课程开发和学生培训相结合。该项目重点回答两个基本问题:(1)在什么条件下需要更少的数据。和计算来学习多个任务联合学习而不是单独学习每个任务?(2)强化学习算法是否可以仅使用有限的数据和计算来学习有意义的东西?我们回答这些问题的方法借鉴了在线学习、压缩感知和随机建模的技术。特别是,该项目涵盖离线设置和在线设置,其中任务之间的相似性结构是从给定的数据集中学习的,而在线设置则使用这种学习的结构来有效地适应“即时”的新任务。灾难性遗忘的根本问题在多任务学习中,学习的策略在接受新任务训练后失去了执行先前任务的能力。在该项目的过程中,将通过一系列多机器人导航模拟来系统地评估所提出的研究活动。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Justin Romberg其他文献

Confidence-Based Curriculum Learning for Multi-Agent Path Finding
基于置信度的多智能体路径查找课程学习
  • DOI:
    10.48550/arxiv.2401.05860
  • 发表时间:
    2024-01-11
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Thomy Phan;Joseph Driscoll;Justin Romberg;Sven Koenig
  • 通讯作者:
    Sven Koenig
Natural Policy Gradient and Actor Critic Methods for Constrained Multi-Task Reinforcement Learning
约束多任务强化学习的自然策略梯度和演员批评方法
  • DOI:
    10.23919/acc45564.2020.9147428
  • 发表时间:
    2024-05-03
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Sihan Zeng;Thinh T. Doan;Justin Romberg
  • 通讯作者:
    Justin Romberg
Slepian Beamforming: Broadband Beamforming using Streaming Least Squares
Slepian 波束成形:使用流式最小二乘法的宽带波束成形
Subspace Tracking with Dynamical Models on the Grassmannian
格拉斯曼动力学模型的子空间跟踪
  • DOI:
  • 发表时间:
    2024-02-15
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Alex Saad;Brighton Ancelin;Justin Romberg
  • 通讯作者:
    Justin Romberg
Precise asymptotics of reweighted least-squares algorithms for linear diagonal networks
线性对角网络的重加权最小二乘算法的精确渐近
  • DOI:
    10.48550/arxiv.2304.02229
  • 发表时间:
    2024-06-04
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Chiraag Kaushik;Justin Romberg;Vidya Muthukumar
  • 通讯作者:
    Vidya Muthukumar

Justin Romberg的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Justin Romberg', 18)}}的其他基金

CIF:Small:Model-Based Blind Demixing for Signal Processing and Machine Learning
CIF:Small:用于信号处理和机器学习的基于模型的盲解混
  • 批准号:
    1718771
  • 财政年份:
    2017
  • 资助金额:
    $ 30万
  • 项目类别:
    Standard Grant
CIF: Small: Blind Channel Estimation and Solving Bilinear Equations by Lifting and Factoring
CIF:小:盲通道估计并通过提升和因式分解求解双线性方程
  • 批准号:
    1422540
  • 财政年份:
    2014
  • 资助金额:
    $ 30万
  • 项目类别:
    Standard Grant

相似国自然基金

基于肿瘤病理图片的靶向药物敏感生物标志物识别及统计算法的研究
  • 批准号:
    82304250
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
肠道普拉梭菌代谢物丁酸抑制心室肌铁死亡改善老龄性心功能不全的机制研究
  • 批准号:
    82300430
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
社会网络关系对公司现金持有决策影响——基于共御风险的作用机制研究
  • 批准号:
    72302067
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
面向图像目标检测的新型弱监督学习方法研究
  • 批准号:
    62371157
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
面向开放域对话系统信息获取的准确性研究
  • 批准号:
    62376067
  • 批准年份:
    2023
  • 资助金额:
    51 万元
  • 项目类别:
    面上项目

相似海外基金

Collaborative Research: NSF-AoF: CIF: Small: AI-assisted Waveform and Beamforming Design for Integrated Sensing and Communication
合作研究:NSF-AoF:CIF:小型:用于集成传感和通信的人工智能辅助波形和波束成形设计
  • 批准号:
    2326622
  • 财政年份:
    2024
  • 资助金额:
    $ 30万
  • 项目类别:
    Standard Grant
Collaborative Research: NSF-AoF: CIF: Small: AI-assisted Waveform and Beamforming Design for Integrated Sensing and Communication
合作研究:NSF-AoF:CIF:小型:用于集成传感和通信的人工智能辅助波形和波束成形设计
  • 批准号:
    2326621
  • 财政年份:
    2024
  • 资助金额:
    $ 30万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Medium: Snapshot Computational Imaging with Metaoptics
合作研究:CIF:Medium:Metaoptics 快照计算成像
  • 批准号:
    2403123
  • 财政年份:
    2024
  • 资助金额:
    $ 30万
  • 项目类别:
    Standard Grant
Collaborative Research: NSF-AoF: CIF: Small: AI-assisted Waveform and Beamforming Design for Integrated Sensing and Communication
合作研究:NSF-AoF:CIF:小型:用于集成传感和通信的人工智能辅助波形和波束成形设计
  • 批准号:
    2326622
  • 财政年份:
    2024
  • 资助金额:
    $ 30万
  • 项目类别:
    Standard Grant
Collaborative Research:CIF:Small: Acoustic-Optic Vision - Combining Ultrasonic Sonars with Visible Sensors for Robust Machine Perception
合作研究:CIF:Small:声光视觉 - 将超声波声纳与可见传感器相结合,实现强大的机器感知
  • 批准号:
    2326904
  • 财政年份:
    2024
  • 资助金额:
    $ 30万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了