基于模糊粗糙集的概率数据挖掘方法研究
项目介绍
AI项目解读
基本信息
- 批准号:61202114
- 项目类别:青年科学基金项目
- 资助金额:24.0万
- 负责人:
- 依托单位:
- 学科分类:F0202.系统软件、数据库与工业软件
- 结题年份:2015
- 批准年份:2012
- 项目状态:已结题
- 起止时间:2013-01-01 至2015-12-31
- 项目参与者:裴斌; 李英龙; 王敏峰; 陈伟; 赵婷婷; 郑涛; 刘虹;
- 关键词:
项目摘要
In the real applications, probabilistic databases contain not only randomness,but also fuzziness and roughness. The traditional approaches of data mining,in which all data are assumed certainly, can not effectively handle probabilistic databases. The recently proposed mining approaches on probabilistic data treat the uncertainty as randomness, whereas fuzziness hidden in feature values and the indiscernibility arisen from incomplete information are missed. Now, it is promising to propose a theoretical framework and mining approach to handle several kinds of uncertainties in probabilistic databases..Replacing the 'Possible Worlds' model, which is often used in probabilistic data managing, this proposal attempts to propose a new framework named generalized statistical rough model.In this framework the fuzzy rough techniques is developed to represent and measure weak information hidden in probabilistic databases. And then the approaches of feature selection and classifier building from probabilistic databases are proposed. .This proposal generalizes the rough set theory to a more general model. And it is first time to propose such an uncertain data mining model which integrate randomness, fuzziness and roughness together.
随机性是概率数据的本质特征,但并非唯一的不确定性特征。概率数据不仅具有不同表现形式的随机性,还具有特征值的语义模糊性和信息不完备引起的粗糙不可分辨性等。经典的数据挖掘方法没有考虑数据的不确定性。现有的概率数据挖掘方法仅考虑了数据某一表现形式的随机性,忽略了其他类型和表现形式的不确定性,应用于概率数据挖掘时存在一系列的问题。. 本研究尝试突破当前不确定数据管理领域以'可能世界模型'为基础的概率数据表示模型,系统分析随机性、语义模糊性和粗糙不可分辨性等不确定性,建立以概率数据库为研究对象,以模糊粗糙集为研究工具,以特征选取和规则分类为目标的数据挖掘模型。由此得到基于广义随机粗糙集的数据挖掘的理论模型和算法框架。. 本研究吸收了模糊粗糙集模型的粗糙近似算子的构造成果,具有良好的研究基础。本研究将拓宽粗糙集的实用性,也为其它挖掘算法拓展到概率数据库提供理论参考。
结项摘要
弱可用信息之‘弱’的一大表现即是噪音数据的存在,三年来重点关注了带噪音数据的知识发现方法。现有的带噪音数据的知识发现方法多是通过设定阈值来控制噪音。因而阈值的选择对知识发现的结果有影响显著。如何设定一个最佳阈值是大多数鲁棒知识发现方法不得不面对的难题。我们的研究从一个全新的角度来处理这一难题:我们拚弃了寻找一个最佳阈值的方法,着力发现全部可能阈值上的知识,把鲁棒知识发现的结果全局呈现出来。这是我们近期研究在思路上的主要创新。基于这一思路,我们以粗糙集理论与模糊集理论为基点,以拓扑结构分析为方法,研究了基于嵌套结构的含噪音数据的降维与分类方法。研究成果是可以分为以下三个方面:.首先,我们从全局的角度研究了基于参数粗糙集的属性约简的拓扑结构。当前关于鲁棒特征选取的研究主要集中于如何设定一个全局次优或是局部最优的属性约简算法。很少有文章从拓扑结构的角度出发研究参数对属性约简结果的影响。本文首次讨论了属性约简与参数之间的关系,发现了不同参数上的属性约简存在‘嵌套’的拓扑结构。并利用严谨的数学定理指出嵌套结构存在的必要条件。该论文成果被信息科学领域国际权威期刊Information Sciences录用为长文。.然后,我们用嵌套约简的方法提出一种鲁棒的降维方法。该方法可以找到所有可能阈值上的降维结果。该方法完全不同于现有的鲁棒降维算法,其具体表现在三个方面:概念,工具以及算法。首先,降维的结果采用模糊集呈现,而现有的降维算法结果均为清晰集合。其次,每个特征的抗噪程度被设计为每个特征的度量工具。最后,一个可以找到所有可能阈值上的降维结果的算法被提出。该成果被国际顶级期刊IEEE Transactions on Fuzzy Systems录用为长文。.最后,我们用嵌套约简的方法提出了一种嵌套分类器。该方法可以找到所有可能阈值上的分类结果。该方法提出了一系列鲁棒的约简与覆盖概念,这些概念在不同阈值上是相互嵌套的。因为,他们为嵌套分类器的构造提供了理论依据。然后,我们基于嵌套结构,设计了一些鲁棒约简与规则覆盖算法。这些算法为嵌套分类器的构造提供了可行性技术。该成果被国际期刊IEEE Transactions on Fuzzy Systems录用为长文。
项目成果
期刊论文数量(11)
专著数量(0)
科研奖励数量(0)
会议论文数量(5)
专利数量(0)
浅议线性代数教学中的几何直观
- DOI:--
- 发表时间:2013
- 期刊:科技创新导报
- 影响因子:--
- 作者:赵素云
- 通讯作者:赵素云
k-近邻模糊粗糙集的快速约简算法研究??
- DOI:--
- 发表时间:2015
- 期刊:计算机科学与探索
- 影响因子:--
- 作者:赵素云;陈红;李翠平;孙辉
- 通讯作者:孙辉
FARP: Mining Fuzzy Association Rules from Probabilistic Quantitative Database
FARP:从概率定量数据库中挖掘模糊关联规则
- DOI:--
- 发表时间:2013
- 期刊:Information Sciences
- 影响因子:8.1
- 作者:Bin Pei, Suyun Zhao, Hong Chen, Xuan Zhou, Dingji
- 通讯作者:Bin Pei, Suyun Zhao, Hong Chen, Xuan Zhou, Dingji
Nested reduction in flexible rough set models
灵活粗糙集模型的嵌套约简
- DOI:--
- 发表时间:2013
- 期刊:Information Sciences
- 影响因子:8.1
- 作者:Suyun Zhao, Xizhao Wang, Degang Chen, Eric C.C. T
- 通讯作者:Suyun Zhao, Xizhao Wang, Degang Chen, Eric C.C. T
Big data challenge: a data management perspective
大数据挑战:数据管理视角
- DOI:10.1007/s11704-013-3903-7
- 发表时间:2013-04-01
- 期刊:FRONTIERS OF COMPUTER SCIENCE
- 影响因子:4.2
- 作者:Chen, Jinchuan;Chen, Yueguo;Zhou, Xuan
- 通讯作者:Zhou, Xuan
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
动态模糊粗糙特征选取算法
- DOI:--
- 发表时间:2020
- 期刊:计算机科学与探索
- 影响因子:--
- 作者:倪鹏;刘阳明;赵素云;陈红;李翠平
- 通讯作者:李翠平
一种基于时空相关性的差分隐私轨迹保护机制
- DOI:--
- 发表时间:2018
- 期刊:计算机学报
- 影响因子:--
- 作者:吴云乘;陈红;赵素云;梁文娟;吴垚;李翠平;张晓莹
- 通讯作者:张晓莹
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
赵素云的其他基金
面向动态开放环境的模糊粗糙集关键技术研究
- 批准号:
- 批准年份:2022
- 资助金额:53 万元
- 项目类别:面上项目
基于抽样的统计粗糙集模型及应用
- 批准号:61772536
- 批准年份:2017
- 资助金额:59.0 万元
- 项目类别:面上项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}