面向tableau模型的逻辑强化学习理论及方法研究
项目介绍
AI项目解读
基本信息
- 批准号:61070223
- 项目类别:面上项目
- 资助金额:35.0万
- 负责人:
- 依托单位:
- 学科分类:F0201.计算机科学的基础理论
- 结题年份:2013
- 批准年份:2010
- 项目状态:已结题
- 起止时间:2011-01-01 至2013-12-31
- 项目参与者:孙涌; 陈冬火; 鲜学丰; 张广铭; 傅启明; 闫其粹; 张乐;
- 关键词:
项目摘要
典型的强化学习算法采用状态- - 活动对来表示行为策略,因而不可避免地出现学习参数个数随着状态变量维数呈指数级增长的现象,即"维数灾",这一问题严重制约着强化学习在实际中的应用。本项目拟针对强化学习中存在"维数灾"的问题,提出面向tableau模型的逻辑强化学习方法,并应用于Deep Web信息搜索中。主要思想是将强化学习与归纳逻辑程序设计相结合,采用逻辑语言表示状态和活动等方面的知识,使用tableau模型简化状态空间,达到更大程度地提高强化学习算法收敛速度的目的。因此面向tableau模型的逻辑强化学习的研究,可以有效地解决强化学习中的"维数灾"的问题,对于强化学习在大规模网络信息搜索中的应用,既具有一定的理论价值,又有广阔的应用前景。
结项摘要
本项目针对强化学习中存在“维数灾”的问题,提出基于tableau模型的逻辑强化学习方法,并应用于Deep Web信息搜索中。主要完成了以下五方面内容:.⑴ 将强化学习与归纳逻辑程序设计相结合,对强化学习算法中的状态、活动用逻辑表达式进行抽象。充分利用归纳逻辑程序设计语言的谓词、表、截断等的优势,建立起强化学习状态之间的逻辑关系,简化活动策略的选择,提高强化学习的收敛速度。.⑵ 采用tableau推理模型对逻辑状态和逻辑活动进行建模,研究一种新的函数估计模型,使其一方面能够以任何精度逼近理论的强化学习值函数,另一方面在增量环境中保证收敛性。.⑶ 将布尔剪枝、IP-tableau等方法与逻辑强化学习相结合,对逻辑状态空间模型进行相应的等价转换,采用解线性方程组的方式来简化状态空间,降低状态空间维数,解决大规模、连续的MDP问题。在tetris问题中,试验所设计的强化学习框架和算法,并对比收敛速度。.⑷ 结合我们所研究的模型和算法,研究一种面向Deep Web搜索引擎的自适应爬虫搜索算法。在模型不确定的情况下,寻找满足搜索算法的优化目标的最优策略,达到爬虫总搜索路径最短、搜索无关页面最低等,并在性能上对比目前常用的几种爬虫调度算法。.⑸ 设计实现上述理论、优化算法的系统原型,并应用于Deep Web搜索引擎中,实现对Deep Web搜索的策略优化。
项目成果
期刊论文数量(24)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(2)
双精英协同进化遗传算法
- DOI:--
- 发表时间:2012
- 期刊:软件学报
- 影响因子:--
- 作者:刘全;王晓燕;傅启明;张永刚;章晓芳
- 通讯作者:章晓芳
一种基于资格迹的并行强化学习算法
- DOI:--
- 发表时间:2012
- 期刊:苏州大学学报(自然科学版)
- 影响因子:--
- 作者:杨旭东;刘全;李瑾
- 通讯作者:李瑾
A sarsa algorithm based on double-layer fuzzy reasoning
一种基于双层模糊推理的sarsa算法
- DOI:--
- 发表时间:2013
- 期刊:Mathematical Problems in Engineering
- 影响因子:--
- 作者:刘全
- 通讯作者:刘全
利用移动内点来修复传感器网络空洞的算法
- DOI:--
- 发表时间:2012
- 期刊:通信学报
- 影响因子:--
- 作者:杨凯;刘全;张书奎;李瑾;翁东良
- 通讯作者:翁东良
A Scalable Parallel Reinforcement Learning Method Based on Divide-and-Conquer Strategy
一种基于分而治之策略的可扩展并行强化学习方法
- DOI:--
- 发表时间:2013
- 期刊:Chinese Journal of Electronics
- 影响因子:1.2
- 作者:Liu Quan;Yang Xudong
- 通讯作者:Yang Xudong
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
补体调节蛋白与IgA肾病
- DOI:10.3760/cma.j.issn.1674-4756.2013.12.059
- 发表时间:2013-06
- 期刊:中国实用医刊
- 影响因子:--
- 作者:刘全;邢国兰
- 通讯作者:邢国兰
犬贾第虫病毒(长春株)全基因组
- DOI:--
- 发表时间:--
- 期刊:畜牧兽医学报,2006,37(4):408-411
- 影响因子:--
- 作者:陈丽凤;李建华;张西臣*;刘全
- 通讯作者:刘全
基于重要性采样的优势估计器
- DOI:--
- 发表时间:2019
- 期刊:通信学报
- 影响因子:--
- 作者:刘全;姜玉斌;胡智慧
- 通讯作者:胡智慧
高瓦斯煤层高位钻孔瓦斯抽采技术试验研究
- DOI:--
- 发表时间:2012
- 期刊:煤炭技术
- 影响因子:--
- 作者:赵杰;刘健;王新颖;刘全
- 通讯作者:刘全
长直腹式钢板桩平吊吊具设计研究
- DOI:--
- 发表时间:2015
- 期刊:水电与新能源
- 影响因子:--
- 作者:卢政佐;朱兆银;刘全
- 通讯作者:刘全
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
刘全的其他基金
面向大规模强化学习任务的预测控制理论与方法研究
- 批准号:62376179
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
基于部分感知模型的贝叶斯强化学习理论及方法
- 批准号:61772355
- 批准年份:2017
- 资助金额:65.0 万元
- 项目类别:面上项目
基于模糊逻辑的大规模强化学习理论及方法
- 批准号:61472262
- 批准年份:2014
- 资助金额:82.0 万元
- 项目类别:面上项目
基于贝叶斯推理的模糊逻辑强化学习模型研究
- 批准号:61272005
- 批准年份:2012
- 资助金额:61.0 万元
- 项目类别:面上项目
近红外波段堆垛结构三维光子晶体的制备和研究
- 批准号:60907017
- 批准年份:2009
- 资助金额:22.0 万元
- 项目类别:青年科学基金项目
基于tableau的非经典逻辑经典化的自动定理证明研究
- 批准号:60873116
- 批准年份:2008
- 资助金额:35.0 万元
- 项目类别:面上项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}