基于支持向量机的复杂连续系统强化学习控制研究
项目介绍
AI项目解读
基本信息
- 批准号:60804022
- 项目类别:青年科学基金项目
- 资助金额:18.0万
- 负责人:
- 依托单位:
- 学科分类:F0303.系统建模理论与仿真技术
- 结题年份:2011
- 批准年份:2008
- 项目状态:已结题
- 起止时间:2009-01-01 至2011-12-31
- 项目参与者:程玉虎; 赵峻; 朱美强; 郝名林; 张政; 谷阳阳;
- 关键词:
项目摘要
针对复杂连续系统的学习控制问题,设计一类有效的基于支持向量机的强化学习控制方法。内容包括:强化学习系统知识的表达和利用、基于概率型支持向量分类机的强化学习、支持向量机时间滚动式优化学习算法、基于在线聚类分析的个体支持向量机建立、基于多目标优化的个体支持向量机输出结论的选择性集成。通过研究,为提高系统的学习收敛速度,通过给系统融入恰当的实时、动态知识,拟提出基于支持向量回归/分类机的强化学习;为提高系统的学习精度和泛化性能,拟提出基于集成支持向量机的强化学习;通过在倒立摆平衡控制和移动机器人自主导航问题中的应用,验证上述强化学习控制方法的可行性和有效性。研究成果将深化和丰富现有的强化学习理论,进一步扩大强化学习方法的应用范围,增强其解决实际问题的能力。本项目是自动化、机器学习、统计学习与人工智能有机结合的新颖交叉研究方向,具有广阔的研究前景。
结项摘要
项目成果
期刊论文数量(21)
专著数量(1)
科研奖励数量(1)
会议论文数量(3)
专利数量(0)
基于随机子空间-正交局部保持投影的支持向量机
- DOI:--
- 发表时间:2011
- 期刊:电子学报
- 影响因子:--
- 作者:王雪松;高阳;程玉虎
- 通讯作者:程玉虎
一种基于谱聚类的聚类核半监督支持向量机
- DOI:--
- 发表时间:2010
- 期刊:中国矿业大学学报
- 影响因子:--
- 作者:王雪松;张晓丽;程玉虎;李立晶
- 通讯作者:李立晶
Actor-critic algorithm based on incremental least-squares temporal difference with eligibility trace
基于增量最小二乘时间差和资格迹的演员批评算法
- DOI:--
- 发表时间:--
- 期刊:Lecture Notes in Artificial Intelligence, Springer-Verlag
- 影响因子:--
- 作者:Feng Huanting;Cheng Yuhu;Wang Xuesong
- 通讯作者:Wang Xuesong
一种多样性保持的分布估计算法
- DOI:--
- 发表时间:--
- 期刊:电子学报
- 影响因子:--
- 作者:郝名林;王雪松;程玉虎
- 通讯作者:程玉虎
基于测地高斯基函数的递归最小二乘策略迭代
- DOI:--
- 发表时间:--
- 期刊:信息与控制
- 影响因子:--
- 作者:张依阳;王雪松;张政;程玉虎
- 通讯作者:程玉虎
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
基于图正则自适应联合协同表示的高光谱图像分类
- DOI:10.13195/j.kzyjc.2018.1159
- 发表时间:2020
- 期刊:控制与决策
- 影响因子:--
- 作者:李冬青;程玉虎;王雪松
- 通讯作者:王雪松
电磁空间信息资源的认知与利用
- DOI:--
- 发表时间:2021
- 期刊:中国科学基金
- 影响因子:--
- 作者:王雪松;李健兵;徐丰;李刚;程强
- 通讯作者:程强
基于STK的侦察卫星预警系统设计与仿真
- DOI:--
- 发表时间:--
- 期刊:计算机仿真
- 影响因子:--
- 作者:王雪松;代明鑫;张文明
- 通讯作者:张文明
基于并发事务逻辑的语义Web服务组合
- DOI:--
- 发表时间:2012
- 期刊:计算机科学
- 影响因子:--
- 作者:王雪松;钱俊彦;赵岭忠;高荣亮;WANG Xue-song1 QIAN Jun-yan2 ZHAO Ling-zhong2 GAO
- 通讯作者:WANG Xue-song1 QIAN Jun-yan2 ZHAO Ling-zhong2 GAO
复合编码同时极化测量方法研究
- DOI:--
- 发表时间:--
- 期刊:信号处理
- 影响因子:--
- 作者:肖顺平;施龙飞;王雪松
- 通讯作者:王雪松
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}

内容获取失败,请点击重试

查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图

请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
王雪松的其他基金
基于扩散模型的离线强化学习方法研究
- 批准号:62373364
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
基于宽度神经网络的强化学习方法研究
- 批准号:61976215
- 批准年份:2019
- 资助金额:63 万元
- 项目类别:面上项目
基于知识迁移的有限样本模式分类研究
- 批准号:61472424
- 批准年份:2014
- 资助金额:82.0 万元
- 项目类别:面上项目
基于主动半监督学习的遥感影像分类
- 批准号:61072094
- 批准年份:2010
- 资助金额:34.0 万元
- 项目类别:面上项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}