Circuit mechanisms of arbitration between distinct reinforcement learning systems

不同强化学习系统之间的仲裁电路机制

基本信息

  • 批准号:
    10608739
  • 负责人:
  • 金额:
    $ 7.41万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2023
  • 资助国家:
    美国
  • 起止时间:
    2023-03-01 至 2026-02-28
  • 项目状态:
    未结题

项目摘要

PROJECT SUMMARY Animals can exhibit goal-directed behaviors in novel environments, despite limited experience with them. How does the brain make and use inferences about the underlying statistics and generative structure of environments to guide behavior? The field of reinforcement learning refers to this capacity as “model-based” reasoning, meaning that it relies on an internal model of the structure of the world. Critically, this internal model can be used to flexibly estimate the best actions by mental simulation or planning, without direct experience. In contrast, in “model-free” reinforcement learning, an agent chooses the best action based on direct experience, without explicit knowledge of the underlying sequential transition structure of a task or environment. Model-based and model-free mechanisms coexist in the brain and are mediated by distinct circuits, although the neural circuit mechanisms by which the brain arbitrates between these decision systems remains unknown. Theoretical and behavioral studies suggest that human brains use the system that yields value estimates with the lowest uncertainty. The lateral orbitofrontal cortex (lOFC) is a compelling candidate to perform arbitration because while it is implicated in model-based reasoning, for instance by enabling inferences about hidden task states, it lies upstream of the dorsal striatum, which is critical for both model-based and model- free decision making. Intriguingly, we have found that lOFC neurons project exclusively to the dorsolateral striatum (DLS), a region critical for model-free behavior, and not the dorsomedial striatum (DMS), which is critical for model-based behavior. We hypothesize that projection specific neural circuits in lOFC arbitrate between these systems by suppressing the model-free system. I will use state-of-the-art viral, electrophysiological, and computational methods to determine whether DLS-projecting lOFC neurons mediate uncertainty-based arbitration between decision-making systems (Aim 1) and characterize the underlying circuit logic that supports arbitration (Aim 2). By optogenetically tagging DLS-projecting lOFC neurons I will selectively characterize and perturb their activity while monitoring the behavioral strategy rats use in a task with latent structure. To determine how arbitration is instantiated in the dorsal striatum I will optogenetically activate OFC→DLS neurons while recording from different genetic cell types in the striatum, in vivo and in vitro. We predict that OFC→DLS neurons enable model-based behavior by activating inhibitory interneurons to suppress the DLS and the model-free system.
项目概要 尽管经验有限,动物仍可以在新环境中表现出目标导向的行为 大脑如何对基础统计数据做出并使用推论? 强化学习领域指的是环境的生成结构? 将这种能力称为“基于模型”的推理,这意味着它依赖于事物的内部模型 至关重要的是,这个内部模型可以用来灵活地估计最佳结果。 相比之下,在“无模型”中,可以通过心理模拟或计划来采取行动,而无需直接经验。 强化学习,代理根据直接经验选择最佳动作,无需 任务或环境的底层顺序转换结构的显式知识。 基于模型和无模型的机制在大脑中共存,并由不同的介导 电路,尽管大脑在这些电路之间进行仲裁的神经电路机制 理论和行为研究表明人类的决策系统仍然未知。 大脑使用的系统可以产生不确定性最低的价值估计。 眶额皮层 (lOFC) 是执行仲裁的有力候选者,因为虽然它 涉及基于模型的推理,例如通过启用有关隐藏任务的推理 指出,它位于背侧纹状体的上游,这对于基于模型和基于模型的模型都至关重要 有趣的是,我们发现 lOFC 神经元只投射到 背外侧纹状体(DLS),一个对无模型行为至关重要的区域,而不是背内侧 纹状体(DMS),对于基于模型的行为至关重要。 lOFC 中的特定神经回路通过抑制无模型模型在这些系统之间进行仲裁 系统。 我将使用最先进的病毒、电生理学和计算方法来 确定 DLS 投射的 lOFC 神经元是否介导基于不确定性的仲裁 决策系统(目标 1)并表征支持的底层电路逻辑 通过光遗传学标记 DLS 投射的 lOFC 神经元,我将有选择地进行仲裁(目标 2)。 描述和扰乱它们的活动,同时监测大鼠在任务中使用的行为策略 为了确定仲裁如何在背侧纹状体中实例化,我将 光遗传学激活 OFC→DLS 神经元,同时记录不同遗传细胞类型 我们预测 OFC→DLS 神经元能够实现基于模型的纹状体。 通过激活抑制性中间神经元来抑制 DLS 和无模型系统来控制行为。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Margaret Louise DeMaegd其他文献

Margaret Louise DeMaegd的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似国自然基金

儿童脊柱区腧穴针刺安全性的发育解剖学及三维数字化研究
  • 批准号:
    82360892
  • 批准年份:
    2023
  • 资助金额:
    32 万元
  • 项目类别:
    地区科学基金项目
寰枢椎脱位后路钉棒内固定系统复位能力优化的相关解剖学及生物力学研究
  • 批准号:
    82272582
  • 批准年份:
    2022
  • 资助金额:
    52 万元
  • 项目类别:
    面上项目
亚热带典型阔叶树种径向生长的解剖学特征及其碳分配调控机制
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于次生乳管网络结构发育比较解剖学和转录组学的橡胶树产胶机制研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    54 万元
  • 项目类别:
    面上项目
基于垂体腺瘤海绵窦侵袭模式的相关膜性解剖学及影像学研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

The Structure and Function of Ipsilateral Corticospinal Projections
同侧皮质脊髓投射的结构和功能
  • 批准号:
    10678301
  • 财政年份:
    2023
  • 资助金额:
    $ 7.41万
  • 项目类别:
Unlocking whole brain, layer-specific functional connectivity with 3D VAPER fMRI
通过 3D VAPER fMRI 解锁全脑、特定层的功能连接
  • 批准号:
    10643636
  • 财政年份:
    2023
  • 资助金额:
    $ 7.41万
  • 项目类别:
Neuroprotective Potential of Vaccination Against SARS-CoV-2 in Nonhuman Primates
SARS-CoV-2 疫苗对非人灵长类动物的神经保护潜力
  • 批准号:
    10646617
  • 财政年份:
    2023
  • 资助金额:
    $ 7.41万
  • 项目类别:
Cross-modal plasticity after the loss of vision at two early developmental ages in the posterior parietal cortex: Adult connections, cortical function and behavior.
后顶叶皮质两个早期发育年龄视力丧失后的跨模式可塑性:成人连接、皮质功能和行为。
  • 批准号:
    10751658
  • 财政年份:
    2023
  • 资助金额:
    $ 7.41万
  • 项目类别:
Integrative Analysis of Adaptive Information Processing and Learning-Dependent Circuit Reorganization in the Auditory System
听觉系统中自适应信息处理和学习依赖电路重组的综合分析
  • 批准号:
    10715925
  • 财政年份:
    2023
  • 资助金额:
    $ 7.41万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了