部分観測可能マルコフ決定過程を用いた不確実な観測下での繰り返しゲーム理論の再構築

使用部分可观测马尔可夫决策过程重建不确定观测下的迭代博弈论

基本信息

  • 批准号:
    13J04426
  • 负责人:
  • 金额:
    $ 2.3万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2013
  • 资助国家:
    日本
  • 起止时间:
    2013-04-01 至 2016-03-31
  • 项目状态:
    已结题

项目摘要

観測にノイズが含まれる私的観測構造において利己的なエージェントが長期間の関係において協力関係を維持可能にするゲームの均衡解析プログラムの開発、及びその開発したプログラムを用いた様々なゲームにおける均衡解析を行った。解析の対象となったゲームは、多くのゲームの中でも利己的なエージェントが協力関係を築くことが難しいケースである。今年度は(i)典型的な二人ゲームである囚人のジレンマにおけるk期相互処罰戦略の解析、(ii) 囚人のジレンマゲームの拡張 (3人以上のプレイヤが存在する場合、協力と裏切りの間の中間的な行動の導入など)、(iii) 複数の市場において影響力を持つエージェント間のゲーム (多市場接触) の解析などを行った。(i)に関しては、k期相互処罰戦略が均衡を構成するノイズレベルの範囲を理論的に示すことができた。また、(ii)に関しては、2人、2行動の場合と同様に、k期相互処罰戦略が均衡となることを確認した。また、(iii) に関しては、個々の市場が独立であったとしても、複数の市場の結果を統合することにより、エージェントがより強固な協力関係を構成可能であることを示した。その結果、未だ不明なところは多くあるけれど、その手がかりを示唆するいくつかの要素を見つけることが出来た。
我们制定了一个游戏均衡分析计划,该计划允许自私的代理在私人观察结构中保持长期关系中的合作,其中观察结果包含噪声,并使用开发的各种程序中的各种游戏中的平衡分析。在许多游戏中,被分析的游戏对于自私的代理商很难建立合作关系。今年,我们在典型的两场囚犯困境中分析了K期时相互惩罚策略,(ii)扩大了囚犯的困境游戏(例如,在有三个以上的玩家时进行合作和背叛之间的中间行动),(iii)分析了游戏(多人市场接触),并在多个市场中进行了影响。关于(i),K期时相互惩罚策略理论上可以表明构成平衡的噪声水平范围。此外,关于(ii),我们证实了K-期限相互惩罚策略是平衡的,例如两人和两项案件。同样,关于(iii),我们证明了代理可以通过整合多个市场的结果,即使各个市场是独立的,也可以通过整合多个市场的成果来配置更强大的协作。结果,尽管仍然有许多未知数,但我们能够找到一些暗示线索的因素。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

JOE YONGJOON (2015)其他文献

JOE YONGJOON (2015)的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似海外基金

Sequential Decision Making with Imperfect Information: Machine Learning and Information Theory
不完美信息的顺序决策:机器学习和信息论
  • 批准号:
    23K17547
  • 财政年份:
    2023
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
Predicting firearm suicide in military veterans outside the VA health system using linked civilian electronic health record data
使用链接的民用电子健康记录数据预测退伍军人管理局卫生系统外退伍军人的枪支自杀
  • 批准号:
    10655968
  • 财政年份:
    2023
  • 资助金额:
    $ 2.3万
  • 项目类别:
Role of Data Streams In Informing Infection Dynamics in Africa- INFORM Africa
数据流在非洲感染动态通报中的作用 - INFORM Africa
  • 批准号:
    10490316
  • 财政年份:
    2021
  • 资助金额:
    $ 2.3万
  • 项目类别:
Role of Data Streams In Informing Infection Dynamics in Africa- INFORM Africa
数据流在非洲感染动态通报中的作用 - INFORM Africa
  • 批准号:
    10669758
  • 财政年份:
    2021
  • 资助金额:
    $ 2.3万
  • 项目类别:
FASEB's The Ion Channel Regulation Conference
FASEB 离子通道调节会议
  • 批准号:
    10231849
  • 财政年份:
    2021
  • 资助金额:
    $ 2.3万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了