Development a general-purpose imperfect information game AI that surpasses humans

开发超越人类的通用不完美信息游戏AI

基本信息

  • 批准号:
    22K12339
  • 负责人:
  • 金额:
    $ 2.58万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2022
  • 资助国家:
    日本
  • 起止时间:
    2022-04-01 至 2027-03-31
  • 项目状态:
    未结题

项目摘要

不完全情報ゲーム研究の題材として、ガイスターを中心に開発を行った。まず、モンテカルロ木探索の代表的な手法であるUCT探索の実装と研究を行った。完全情報ゲームの探索方法を不完全情報ゲームに用いると戦略融合の影響を受ける。既存手法では戦略融合の悪影響を受けやすいが、他の方法はこれまで検討されていない。そこで、探索内部で不完全情報を扱う仕組みを新たにいくつか提案し、対戦実験によりその性能を明らかにした。また、近年ガイスター研究で成果を上げた、方策勾配法を用いた評価方法を探索に用いる手法が開発されていないので、UCT探索に方策勾配法で求まる行動確率を用いる手法をいくつか提案し、対戦実験によってそれらの性能を評価した。実験結果から、優勝したAI を上回る強さが確認できた。ガイスター以外の不完全情報ゲーム研究では、AlphaZeroを不完全情報ゲームのChinese dark chess(CDC)とEinStein Wurfelt Nicht!(EWN)に適用し、パラメータ設定が学習に与える影響を調べた。具体的には局面を全列挙するlookup tableを用いたAlphaZeroに、完全解析された2×4 CDCと3×3 EWNと3×4 EWNを学習させ、その結果を理論勝率と最適戦略と比較した。実験の結果から、最善手を学習できるパラメータ設定の範囲が広いことがわかった。2×4 CDCの結果に基づき、通常のサイズの4×8 CDCの学習を試した。この手法を用いたAIが2022年7月に開催されたComputer Olympiad CDC大会で優勝した。また、人間を超えることを考えると、人間がどうプレイするかを調べることも重要であると考え、多腕バンディット問題と格闘ゲームとポケモン対戦において、認知バイアスと読み合いに関連する研究も行った。
我们主要开发Geister作为不完全信息博弈研究的课题。首先,我们实现并研究了UCT搜索,这是蒙特卡罗树搜索的典型方法。当完美信息博弈的搜索方法应用于不完全信息博弈时,会受到策略融合的影响。现有方法容易受到策略融合的负面影响,但目前尚未考虑其他方法。因此,我们提出了几种处理搜索中不完整信息的新机制,并通过竞争性实验阐明了它们的性能。此外,由于还没有开发出使用近年来在 Geister 研究中取得成果的策略梯度法的评估方法进行搜索,因此我们提出了几种使用策略梯度法确定的动作概率进行搜索的方法。 UCT 搜索通过竞争性实验评估了他们的表现。实验结果证实它比获胜的AI更强。在Geister以外的不完全信息博弈研究中,将AlphaZero应用于不完全信息博弈中国黑棋(CDC)和EinStein Wurfelt Nicht!(EWN)来考察参数设置对学习的影响。具体来说,我们训练了 AlphaZero,它使用枚举所有位置的查找表来学习充分分析的 2×4 CDC、3×3 EWN 和 3×4 EWN,并将结果与​​理论胜率和最优策略进行比较。实验结果表明,有多种参数设置可以学习最佳动作。基于2×4 CDC的结果,我们尝试学习常规尺寸的4×8 CDC。使用这种方法的人工智能赢得了 2022 年 7 月举行的计算机奥林匹克 CDC 竞赛。此外,考虑到它比人类更好,我们认为研究人类如何玩很重要,因此我们在多臂强盗问题、格斗游戏和神奇宝贝战斗中进行了与认知偏差和互读相关的研究。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
UCTを用いたガイスターAIの研究
使用 UCT 进行 Geister 人工智能研究
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    錦織 光司 ; 青木 蓮樹 ; 橋本 剛
  • 通讯作者:
    橋本 剛
不完全情報同時手番ゲームにおいて人間のような読み合いを演出するAIプレイヤ
一种在不完全信息的同步移动游戏中产生类似人类阅读理解能力的人工智能玩家
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    小西 健太郎;池田 心;シュエ ジュウシュエン
  • 通讯作者:
    シュエ ジュウシュエン
Analyses of Tabular AlphaZero on Strongly-Solved Stochastic Games
强解随机博弈的表格 AlphaZero 分析
  • DOI:
    10.1109/access.2023.3246638
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    3.9
  • 作者:
    Hsueh Chu;Ikeda Kokolo;Wu I;Chen Jr;Hsu Tsan
  • 通讯作者:
    Hsu Tsan
格闘ゲーム初心者のための読み合い理解支援システム
格斗游戏初学者的相互阅读理解支持系统
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    酒見 真;シュエ ジュウシュエン;池田 心
  • 通讯作者:
    池田 心
CLAP_CDC wins Chinese dark chess tournament
CLAP_CDC夺得中国暗棋锦标赛冠军
  • DOI:
    10.3233/icg-230220
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0.4
  • 作者:
    Hsueh Chu;Chen Jr
  • 通讯作者:
    Chen Jr
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

橋本 剛其他文献

ストレスと対人関係
压力和人际关系
  • DOI:
  • 发表时间:
    2005
  • 期刊:
  • 影响因子:
    0
  • 作者:
    橋本 剛
  • 通讯作者:
    橋本 剛
看護師の対人ストレッサーとバーンアウトの関連
护士人际压力源与职业倦怠的关系
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    橋本 剛
  • 通讯作者:
    橋本 剛
オセロ求解へ向けた取り組み
努力解决奥赛罗
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    橋本 剛; 上田 徹; 橋本 隼一
  • 通讯作者:
    橋本 隼一
Field measurements of the indoor thermal environment in living room formed by a wood stove
木炉形成的客厅室内热环境的现场测量
  • DOI:
    10.11227/seikisho.56.145
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    栗原 広佑;橋本 剛
  • 通讯作者:
    橋本 剛
糖質コルチコイド受容体拮抗薬ミフェプリストン単独の脂肪細胞分化促進作用
糖皮质激素受体拮抗剂米非司酮单用促进脂肪细胞分化的作用
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    橋本 剛;平野 勝也
  • 通讯作者:
    平野 勝也

橋本 剛的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('橋本 剛', 18)}}的其他基金

Help-seeking styles as availability of social resources
求助方式作为社会资源的可用性
  • 批准号:
    22K03020
  • 财政年份:
    2022
  • 资助金额:
    $ 2.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
伝統的な民家・集落に学ぶ暑熱環境適応策としての屋外・半屋外空間デザイン手法の構築
借鉴传统民居和村落,构建适应炎热环境的户外/半户外空间设计方法
  • 批准号:
    21H03756
  • 财政年份:
    2021
  • 资助金额:
    $ 2.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
The dark side of help-seeking
寻求帮助的阴暗面
  • 批准号:
    19K03190
  • 财政年份:
    2019
  • 资助金额:
    $ 2.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
伝統集落における緑化デザインの環境調節効果と景観特性
传统村落绿化设计的环境控制效果及景观特征
  • 批准号:
    18860016
  • 财政年份:
    2006
  • 资助金额:
    $ 2.58万
  • 项目类别:
    Grant-in-Aid for Young Scientists (Start-up)
名人に勝つコンピュータ将棋の開発
开发打败高手的电脑将棋
  • 批准号:
    18800017
  • 财政年份:
    2006
  • 资助金额:
    $ 2.58万
  • 项目类别:
    Grant-in-Aid for Young Scientists (Start-up)
ルテニウム錯体を反応場とするニトリルとケトンの新規反応に関する研究
以钌配合物为反应位点的腈与酮新反应研究
  • 批准号:
    15750056
  • 财政年份:
    2003
  • 资助金额:
    $ 2.58万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
名人レベルのコンピュータ将棋の開発および進化のゲーム理論への応用
大师级计算机将棋的开发以及进化论在博弈论中的应用
  • 批准号:
    02J02267
  • 财政年份:
    2002
  • 资助金额:
    $ 2.58万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
精神的健康に影響を及ぼす対人関係の否定的側面の規定因および媒介因の検討
检查影响心理健康的人际关系消极方面的决定因素和中介因素
  • 批准号:
    98J03310
  • 财政年份:
    1998
  • 资助金额:
    $ 2.58万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows

相似海外基金

Progress support programs that respect game players' intentions and values
尊重游戏玩家意图和价值观的进步支持计划
  • 批准号:
    20K12121
  • 财政年份:
    2020
  • 资助金额:
    $ 2.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Progress support programs that respect game players' intentions and values
尊重游戏玩家意图和价值观的进步支持计划
  • 批准号:
    20K12121
  • 财政年份:
    2020
  • 资助金额:
    $ 2.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Development of a general purpose game AI that improves humanly
开发可提高人类素质的通用游戏人工智能
  • 批准号:
    17K00514
  • 财政年份:
    2017
  • 资助金额:
    $ 2.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
How to Coach Human Players using Computer Go Program
如何使用计算机围棋程序指导人类棋手
  • 批准号:
    17K00506
  • 财政年份:
    2017
  • 资助金额:
    $ 2.58万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了