基于值等价的交互式动态影响图的求解方法研究与应用
项目介绍
AI项目解读
基本信息
- 批准号:61772442
- 项目类别:面上项目
- 资助金额:58.0万
- 负责人:
- 依托单位:
- 学科分类:F06.人工智能
- 结题年份:2021
- 批准年份:2017
- 项目状态:已结题
- 起止时间:2018-01-01 至2021-12-31
- 项目参与者:罗晔; 陈碧连; 曹浪财; 马碧阳; 孙婷; 王鹏鹏; 余深宝; 沈杲阳;
- 关键词:
项目摘要
Multiagent system is one of the most important areas in the development of artificial intelligence research, and plays a significant role in many applications. Interactive dynamic influence diagram (I-DID) is well recognized as a general technique for solving multiagent sequential decision making problems under uncertainty. Based on a large amount of I-DID research in the past years, this project aims to complement the I-DID solutions by proposing a new type of solutions that is developed from the principle of value equivalence. The new solutions, which are different from the previous I-DID solutions that are entirely based on behavioral equivalence, can significantly reduce the solution complexity. More importantly, they can provide a theoretical guarantee to the quality of agents’ optimal policies, which will therefore improve the reliability of applying I-DID in a practical setting. This project will develop the solutions by employing new advances of artificial intelligence techniques including sub-modular function optimization, Monte Carlo tree search, active learning, generative adversarial networks and so on. It aims to guarantee correctness of new I-DID solutions in a theoretical way and ensure their effectiveness in practice. The research outcomes will benefit the further development of artificial intelligence research and applications in a new horizon.
多智能体系统是人工智能技术研究的一个重要发展领域,在众多应用领域起到了不可估量的作用。交互式动态影响图是求解在不确定环境下多智能体序贯决策问题的一个普遍适用技术,在多智能体系统研究领域得到了高度的认可。基于前期大量的交互式动态影响图研究工作基础上,本项目继续完善交互式动态影响图的求解方法,提出一个基于值等价的求解体系。有别于传统的基于行为等价准则的交互式动态影响图求解方法,该崭新的求解技术不仅能够极大地降低模型求解的复杂度,而且更为重要的是能够在理论上对智能体的最优决策质量给出一个严格的保证。这将提高交互式动态影响图在实际应用中的可靠性。本项目将采用子模函数优化方法、蒙特卡洛树搜索方法、主动学习方法、生成对抗网络等人工智能最新发展技术,开发一套理论上正确、实际有效的交互式动态影响图求解算法。项目的研究成果将对人工智能技术的进一步发展和可靠应用有一定的借鉴作用。
结项摘要
多智能体系统是人工智能技术研究的一个重要发展领域,在众多应用领域起到了不可估量的作用。交互式动态影响图是求解在不确定环境下多智能体序贯决策问题的一个普遍适用技术,在多智能体系统研究领域得到了高度的认可。基于前期大量的交互式动态影响图研究工作基础上,本项目继续完善交互式动态影响图的求解方法,提出了一个基于值等价的求解体系。有别于传统的基于行为等价准则的交互式动态影响图求解方法,该崭新的求解技术不仅极大地降低模型求解的复杂度,而且能够在理论上对智能体的最优决策质量给出一个严格的保证,提高了交互式动态影响图在实际应用中的可靠性。本项目采用了子模函数优化方法、蒙特卡洛树搜索方法、生成对抗网络等人工智能最新发展技术,开发了一套理论上正确、实际有效的交互式动态影响图求解算法。
项目成果
期刊论文数量(15)
专著数量(0)
科研奖励数量(0)
会议论文数量(9)
专利数量(2)
Community detection based on modularity and k-plexes
基于模块化和k-plexes的社区检测
- DOI:10.1016/j.ins.2019.10.076
- 发表时间:2020
- 期刊:Information Sciences
- 影响因子:8.1
- 作者:Jinrong Zhu;Bilian Chen;Yifeng Zeng
- 通讯作者:Yifeng Zeng
On the tensor spectral p-norm and its dual norm via partitions
关于张量谱 p 范数及其对偶范数的划分
- DOI:10.1007/s10589-020-00177-z
- 发表时间:2020-02
- 期刊:Computational Optimization and Applications
- 影响因子:2.2
- 作者:Bilian Chen;Zhening Li
- 通讯作者:Zhening Li
Nonnegative tensor completion via low-rank Tucker decomposition: model and algorithm
通过低阶 Tucker 分解的非负张量补全:模型和算法
- DOI:10.1109/access.2019.2929189
- 发表时间:2019
- 期刊:IEEE Access
- 影响因子:3.9
- 作者:Bilian Chen;Ting Sun;Zhehao Zhou;Yifeng Zeng;Langcai Cao
- 通讯作者:Langcai Cao
Behavioral model summarisation for other agents under uncertainty
不确定性下其他智能体的行为模型总结
- DOI:10.1016/j.ins.2021.09.039
- 发表时间:2022-01
- 期刊:Information Sciences
- 影响因子:8.1
- 作者:Yinghui Pan;Biyang Ma;Jing Tang;Yifeng Zeng
- 通讯作者:Yifeng Zeng
Team recommendation using order-based fuzzy integral and NSGA-II in StarCraft
在《星际争霸》中使用基于顺序的模糊积分和 NSGA-II 进行团队推荐
- DOI:10.1109/access.2020.2982647
- 发表时间:2020
- 期刊:IEEE Access
- 影响因子:3.9
- 作者:Lin Wang;Yifeng Zeng;Bilian Chen;Yinghui Pan;Langcai Cao
- 通讯作者:Langcai Cao
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
多Agent交互式动态影响图的建模方法
- DOI:--
- 发表时间:--
- 期刊:厦门大学学报(自然科学版)
- 影响因子:--
- 作者:潘颖慧;罗键;曾一锋;PAN Ying-hui,LUO Jian,ZENG Yi-feng(School of Infor
- 通讯作者:PAN Ying-hui,LUO Jian,ZENG Yi-feng(School of Infor
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
曾一锋的其他基金
针对未知的未知竞争对手的多智能体规划模型研究
- 批准号:62176225
- 批准年份:2021
- 资助金额:57 万元
- 项目类别:面上项目
基于交互式动态影响图的未知对手模型学习
- 批准号:61375070
- 批准年份:2013
- 资助金额:76.0 万元
- 项目类别:面上项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}