情報源に依存したマッチング行動

匹配行为取决于信息源

基本信息

  • 批准号:
    20020027
  • 负责人:
  • 金额:
    $ 1.28万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
  • 财政年份:
    2008
  • 资助国家:
    日本
  • 起止时间:
    2008 至 2009
  • 项目状态:
    已结题

项目摘要

人や動物は,実験室で人工的に設定された確率ルールで得られる報酬が決まるような環境では,しばしば,得られる報酬を最大化することに失敗し,非合理な行動を示す.このとき,しばしばマッチング則と呼ばれる行動上の法則を満たすことが知られている.本研究課題では,これまで,このようなマッチング行動に至る学習アルゴリズムに共通の原理を明らかにし,その学習戦略がもっと広い枠組の中では報酬最大化という合理性をもつことを証明した.さらにこのマッチング学習戦略を実現するようなシナプス可塑性の特性に必要な条件を明らかにしてきた.今年度は,マッチング学習戦略を実現するシナプス変化則の1例として,「強化メタ学習則」という学習則を提案し,その学習則がもつ様々な能力について検証した.Bi & Poo(1998)は,可塑性を起こす前のシナプス強度によってその後に起こる可塑性の程度が変わり,しかもその依存性がシナプス増強と抑圧で非対称となり,ある強度付近以外では,増強と抑圧が極めて不均衡であることを示している.これは,予め決まっている学習則の特性によって,ある強度に強制的に集まってくるような力を常に受けている,と解釈できる.ニューロンが入力に対する選択性を獲得するためには,同じような入力を受けているシナプスの中から特定のシナプスだけ選ばれて,その強度が強くなり,他のシナプスの強度が弱くなる必要があり,小さな差異を強調して広げていく仕組みが必要である.予め大きな力を受けている学習則では,このようなことは不可能である.本研究では提案した「強化メタ学習則」がこの問題を解決すると共に,ニューロン活動と行動上の実報酬との時間遅延をどの様にシナプス学習に反映させるか,という遅延報酬問題も解決することを示した.
在实验室中人为设定的概率规则确定奖励的环境中,人类和动物常常无法最大化他们所获得的奖励并表现出非理性行为。众所周知,通常被称为匹配法则的行为法则得到了满足。 ,我们阐明了导致这种匹配行为的学习算法的共同原理。我们证明了这种学习策略具有在更广泛的框架内最大化奖励的合理性。此外,我们还阐明了突触可塑性特征使这种匹配学习策略成为现实的必要条件,提出了一种称为“强化元”的学习规则。以“学习规则”为例实现了匹配学习策略的突触变化规则,并验证了该学习规则的各种能力。 & Poo(1998)指出,随后发生的可塑性程度取决于可塑性发生之前的突触强度,并且这种依赖性在突触增强和抑制之间是不对称的,并且增强和抑制在一定强度之外是极其不平衡的。可以解释为,由于预定学习规则的特征,神经元不断地受到被迫以一定强度聚集的力。神经元获得关于输入的选择性。需要从系统中的突触中选择一个特定的突触并增强其强度,同时削弱其他突触的强度,并且需要一种机制来强调和扩大微小的差异,这对于我们收到的学习规则来说是不可能的。在这项研究中,我们提出了一种“强化元学习规则”来解决这个问题,并确定如何减少神经元活动和真实行为奖励之间的时间延迟,我们还证明了延迟奖励可以反映在突触学习中。以类似的方式。

项目成果

期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
When does reward maximization lead to matching law?
  • DOI:
    10.1371/journal.pone.0003795
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    3.7
  • 作者:
    Sakai Y;Fukai T
  • 通讯作者:
    Fukai T
STDPの初期強度依存性問題-強化メタ学習則による解決
STDP初始强度依赖问题——通过强化元学习规则解决
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Nakamura;K.;Matsumoto;M. Hikosaka;O.;Y. Sakai;Y. Sakai;荒木尚二郎
  • 通讯作者:
    荒木尚二郎
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

酒井 裕其他文献

Working memory-based and -free reward prediction in dual dopamine system of the basal ganglia
基底神经节双多巴胺系统中基于工作记忆的无奖励预测
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    吉澤 知彦;宮村 裕人;越智 祐太;平 理一郎;舩橋 誠;酒井 裕;崔 翼龍;礒村 宜和
  • 通讯作者:
    礒村 宜和
大脳基底核の二重ドーパミン系による作業記憶依存性・非依存性の報酬予測
基底神经节双多巴胺系统的工作记忆依赖性和独立奖励预测
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    吉澤 知彦;宮村 裕人;越智 祐太;平 理一郎;舩橋 誠;酒井 裕;崔 翼龍;礒村 宜和
  • 通讯作者:
    礒村 宜和
非明示的な課題ルールに基づいた報酬予測を実現するための神経基盤
基于隐式任务规则的奖励预测的神经基础
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    吉澤 知彦;宮村 裕人;越智 祐太;平 理一郎;舩橋 誠;酒井 裕;崔 翼龍;礒村 宜和
  • 通讯作者:
    礒村 宜和
腹側被蓋野の神経活動に対する交互報酬の影響
交替奖励对腹侧被盖区神经活动的影响
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    吉澤 知彦;野々村 聡;Alain Rios;川端 政則;坂入 朋美;酒井 裕;礒村 宜和
  • 通讯作者:
    礒村 宜和

酒井 裕的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('酒井 裕', 18)}}的其他基金

微生物由来の特異的細胞致死タンパク質の作用機構解明と新しい細胞検出法の開発
阐明源自微生物的特定细胞杀伤蛋白的作用机制并开发新的细胞检测方法
  • 批准号:
    07F07449
  • 财政年份:
    2007
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
マルチニューロンデータのスパイク高次相関の解析
多神经元数据中的高阶尖峰相关性分析
  • 批准号:
    18019034
  • 财政年份:
    2006
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
神経細胞集団のスパイク高次相関の解析と回路特性としての解釈
神经元群中高阶尖峰相关性的分析和电路特征的解释
  • 批准号:
    17021038
  • 财政年份:
    2005
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
発火時刻依存学習則により形成される神経回路構造とその集団発火統計
激发时间相关学习规则形成的神经回路结构及其集体激发统计
  • 批准号:
    16015223
  • 财政年份:
    2004
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
神経細胞集団の回路構造とその集団発火統計
神经元群的回路结构及其集体放电统计
  • 批准号:
    15016022
  • 财政年份:
    2003
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
神径細胞集団の連鎖を伝播する集団発火活動と情報表現
传播神径细胞群链的集体发射活动和信息表达
  • 批准号:
    14017016
  • 财政年份:
    2002
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
スパイクの独立性の維持機構に関する研究
尖峰独立性维持机制研究
  • 批准号:
    13210025
  • 财政年份:
    2001
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas (C)
殺虫性蛋白質遺伝子を応用した環境インパクトの小さい害虫防除システムの開発
利用杀虫蛋白基因开发对环境影响较小的害虫防治系统
  • 批准号:
    07263232
  • 财政年份:
    1995
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
生態系への悪影響が小さい害虫防除システムの開発
开发对生态系统负面影响较小的害虫防治系统
  • 批准号:
    06271235
  • 财政年份:
    1994
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
大腸菌の染色体DNA上に分布する一本鎖上DNA合成開始シグナルの探索
寻找分布在大肠杆菌染色体DNA上的单链DNA合成起始信号
  • 批准号:
    01655502
  • 财政年份:
    1989
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas

相似海外基金

Transformation of perception, decision, and memory by prior information
先验信息改变感知、决策和记忆
  • 批准号:
    22H01104
  • 财政年份:
    2022
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Generative adversarial brain: a comprehensive study of multi-agent learning by natural and artificial intelligence
生成对抗性大脑:自然智能和人工智能多智能体学习的综合研究
  • 批准号:
    22H04998
  • 财政年份:
    2022
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research (S)
Neural mechanism of context-dependent action selection in innate escape behavior
先天性逃避行为中情境依赖动作选择的神经机制
  • 批准号:
    21K06259
  • 财政年份:
    2021
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
An experimental study on political decision-making based on brain neuroscience
基于脑神经科学的政治决策实验研究
  • 批准号:
    21K01330
  • 财政年份:
    2021
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
「恋心」の適切な制御を支える脳情報処理過程の包括的検討
全面研究支持适当控制“爱”的大脑信息处理过程
  • 批准号:
    20K20157
  • 财政年份:
    2020
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了