EAGER: Decision-Theoretic and Scalable Algorithms for Computing Finite State Equilibrium
EAGER:用于计算有限状态平衡的决策理论和可扩展算法
基本信息
- 批准号:1346942
- 负责人:
- 金额:$ 15.02万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2013
- 资助国家:美国
- 起止时间:2013-08-01 至 2016-07-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
This project is exploring algorithms for computing multiagent strategies that are in exact and approximate equilibrium. The context involves economic games that are played repeatedly by agents each of whom privately observes noisy signals about other players' actions. A complete characterization of equilibria for such games, missing until recently, introduces the concept of a finite state equilibrium in which each player's strategy is represented as a finite state automaton. Players' strategies are verified to be in equilibrium by solving a partially observable Markov decision process. The research is building on this surprising and deep application of decision theory toward equilibrium analysis in a pragmatic class of games, which provides a bold and innovative bridge between decision and game theories. It is designing novel algorithms that utilize approximate and error-bounded solutions of partially observable Markov decision processes for computing approximate finite state equilibrium in games with increasing dimensions.This research is contributing insights for broader classes of games such as stochastic games with noisy signals. The interdisciplinary outcomes of this research are being integrated into courses and conference tutorials on multiagent decision making for dissemination. New international research collaborations with eminent multiagent researchers in Japan are being established.This research is bringing together the disciplines of decision and game theories with mutual benefit. Key outcomes include scalable algorithms for solving highly complex games thereby contributing to the understanding of sophisticated interactions under uncertainty. Applications include analyzing auctions without release of public information, covert price wars between firms, and managing resource congestion.
该项目正在探索计算处于精确和近似平衡状态的多智能体策略的算法。背景涉及由代理人重复进行的经济游戏,每个代理人私下观察有关其他参与者行为的噪音信号。此类博弈的均衡的完整表征直到最近才出现,引入了有限状态均衡的概念,其中每个玩家的策略都表示为有限状态自动机。通过解决部分可观察的马尔可夫决策过程来验证玩家的策略是否处于均衡状态。这项研究建立在决策理论对实用博弈类均衡分析的令人惊讶和深入的应用之上,它在决策和博弈论之间提供了一座大胆而创新的桥梁。它正在设计新颖的算法,利用部分可观察马尔可夫决策过程的近似和误差有界解来计算维度增加的游戏中的近似有限状态平衡。这项研究为更广泛的游戏类别(例如带有噪声信号的随机游戏)提供了见解。这项研究的跨学科成果正在被纳入多主体决策的课程和会议教程中进行传播。正在与日本著名的多智能体研究人员建立新的国际研究合作。这项研究将决策和博弈论学科结合在一起,互惠互利。主要成果包括用于解决高度复杂游戏的可扩展算法,从而有助于理解不确定性下的复杂交互。应用包括在不发布公共信息的情况下分析拍卖、公司之间的秘密价格战以及管理资源拥堵。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Prashant Doshi其他文献
SEMEF : A Taxonomy-Based Discovery of Experts , Expertise and Collaboration Networks
SEMEF:基于分类的专家、专业知识和协作网络发现
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
H. Cameron;I. Arpinar;Delroy Cameron;Major Advisor;Prashant Doshi;R. Woods;Maureen Grasso;Boanerges Aleman;Sheron L. Decker - 通讯作者:
Sheron L. Decker
Toward Estimating Others' Transition Models Under Occlusion for Multi-Robot IRL
估计其他人在多机器人 IRL 遮挡下的转换模型
- DOI:
10.1007/s40747-021-00601-9 - 发表时间:
2015-07-25 - 期刊:
- 影响因子:5.8
- 作者:
K. Bogert;Prashant Doshi - 通讯作者:
Prashant Doshi
Extending Semantic Matching for Application in Business Process Integration
扩展语义匹配在业务流程集成中的应用
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
Prashant Doshi;R. Goodwin;R. Akkiraju;Sascha Roeder - 通讯作者:
Sascha Roeder
Scaling Expectation-Maximization for Inverse Reinforcement Learning to Multiple Robots under Occlusion
将反向强化学习的期望最大化扩展到遮挡下的多个机器人
- DOI:
10.1609/aaai.v33i01.33013951 - 发表时间:
2017-05-08 - 期刊:
- 影响因子:4.6
- 作者:
K. Bogert;Prashant Doshi - 通讯作者:
Prashant Doshi
Approximating behavioral equivalence of models using top-k policy paths
使用 top-k 策略路径近似模型的行为等效性
- DOI:
- 发表时间:
2011-05-02 - 期刊:
- 影响因子:0
- 作者:
Yi;Yingke Chen;Prashant Doshi - 通讯作者:
Prashant Doshi
Prashant Doshi的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Prashant Doshi', 18)}}的其他基金
Collaborative Research: RI: Medium: RUI: Automated Decision Making for Open Multiagent Systems
协作研究:RI:中:RUI:开放多智能体系统的自动决策
- 批准号:
2312657 - 财政年份:2023
- 资助金额:
$ 15.02万 - 项目类别:
Standard Grant
RI:Small:Collaborative Research:Scalable Decentralized Planning for Open Multiagent Environments
RI:小型:协作研究:开放多代理环境的可扩展去中心化规划
- 批准号:
1910037 - 财政年份:2019
- 资助金额:
$ 15.02万 - 项目类别:
Standard Grant
RI:Small:Tractable Decision-Theoretic Planning Driven by Data
RI:小:数据驱动的易于处理的决策理论规划
- 批准号:
1815598 - 财政年份:2018
- 资助金额:
$ 15.02万 - 项目类别:
Standard Grant
NRI: FND: Robust Inverse Learning for Human-Robot Collaboration
NRI:FND:人机协作的鲁棒逆向学习
- 批准号:
1830421 - 财政年份:2018
- 资助金额:
$ 15.02万 - 项目类别:
Standard Grant
RAPID: Evacuate or Not? Modeling the Decision Making of Individuals in Impending Disaster Areas
RAPID:疏散还是不疏散?
- 批准号:
1761549 - 财政年份:2017
- 资助金额:
$ 15.02万 - 项目类别:
Standard Grant
CNIC: U.S.-Netherlands Planning Visit for Cooperative Research on Intelligent Methods Under Uncertainty for Renewable Energy Driven Smart Grids
CNIC:美国-荷兰计划访问可再生能源驱动智能电网不确定性下的智能方法合作研究
- 批准号:
1444182 - 财政年份:2015
- 资助金额:
$ 15.02万 - 项目类别:
Standard Grant
CAREER: Scalable Algorithms for Individual Decision Making in Multiagent Settings
职业:多智能体环境中个人决策的可扩展算法
- 批准号:
0845036 - 财政年份:2009
- 资助金额:
$ 15.02万 - 项目类别:
Standard Grant
相似国自然基金
问题性手机使用的人工智能干预研究——基于自我决定理论和压力应对理论的双轨机制
- 批准号:82304258
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
用凸分析理论与零乘决定Banach代数探讨保持问题
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
数字产品创新过程中企业的用户敏捷性的负面影响与对策:自我决定理论视角
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
服务场景中人工智能如何影响消费者幸福感:基于社会认知理论和自我决定理论双重视角
- 批准号:72262016
- 批准年份:2022
- 资助金额:26 万元
- 项目类别:地区科学基金项目
基于自我决定理论的基层医生服务动机内化对基本医疗服务质量的作用机制研究
- 批准号:
- 批准年份:2021
- 资助金额:30 万元
- 项目类别:青年科学基金项目
相似海外基金
Information-Theoretic Surprise-Driven Approach to Enhance Decision Making in Healthcare
信息论惊喜驱动方法增强医疗保健决策
- 批准号:
10575550 - 财政年份:2023
- 资助金额:
$ 15.02万 - 项目类别:
Impact of decision theoretic models in information elicitation
决策理论模型对信息获取的影响
- 批准号:
RGPIN-2018-04005 - 财政年份:2022
- 资助金额:
$ 15.02万 - 项目类别:
Discovery Grants Program - Individual
Unifying Recent Advances in Deep Learning with Decision-theoretic Planning for Learned MDPs and POMDPs
将深度学习的最新进展与学习 MDP 和 POMDP 的决策理论规划相结合
- 批准号:
RGPIN-2022-04377 - 财政年份:2022
- 资助金额:
$ 15.02万 - 项目类别:
Discovery Grants Program - Individual
Impact of decision theoretic models in information elicitation
决策理论模型对信息获取的影响
- 批准号:
RGPIN-2018-04005 - 财政年份:2022
- 资助金额:
$ 15.02万 - 项目类别:
Discovery Grants Program - Individual
Unifying Recent Advances in Deep Learning with Decision-theoretic Planning for Learned MDPs and POMDPs
将深度学习的最新进展与学习 MDP 和 POMDP 的决策理论规划相结合
- 批准号:
RGPIN-2022-04377 - 财政年份:2022
- 资助金额:
$ 15.02万 - 项目类别:
Discovery Grants Program - Individual