基于缺失属性值区间型描述的不完备数据聚类方法及应用研究
项目介绍
AI项目解读
基本信息
- 批准号:61305034
- 项目类别:青年科学基金项目
- 资助金额:25.0万
- 负责人:
- 依托单位:
- 学科分类:F0605.模式识别与数据挖掘
- 结题年份:2016
- 批准年份:2013
- 项目状态:已结题
- 起止时间:2014-01-01 至2016-12-31
- 项目参与者:仲崇权; 冯毅; 金海波; 林瑶瑶; 王世强; 宋阳;
- 关键词:
项目摘要
In many areas, including natural sciences and engineering technology, many databases are plaugued by the unavoidable problem of data incompleteness due to the imperfect data acquisition, incorrect data comprehension, and other factors.And the missing attribute values make it difficult for analysts to realize data analysis, and would hinder the decision analysis, process control. As a result, the problem of clustering incomplete datasets has become one of the research focuses in the field of pattern recognition. Aiming at this problem, we plan to investigate the following questions: 1) Propose three interval represionation of missing attribute values by using the information of incomplete datasets sufficiently, thus, the analysis and imputation of missing attribute values can be limited to appropriate ranges, and the accuracy can be enhanced; 2) Take the interval representation of missing attribute values as an additional clustering factor, investigate the effective approaches for clustering incomplete data; 3) Apply the proposed approaches to segmentation of gray images with corrupted blocks, and cimbine with the image inpainting approaches such as total variation model, realize the segmentation of images with corrupted blocks by considering both clustering analysis and image inpaiting. The research of the project will have a positive influnce on the cognition and comprehension of incomplete data in the field of pattern recognition, and will enhance its application in segmentation of images with corrupted blocks. Therefore, the research of the project has some theoretical and practical significance.
在自然科学和工程技术的很多领域中,由于获取数据的限制及对数据的理解等因素,信息的不完整问题普遍存在,影响了在此基础上进行的数据分析及理解,为后续的决策分析、过程控制等造成阻碍。因此,不完备数据模糊聚类问题已成为模式识别领域的研究热点之一。针对这一问题,本项目拟围绕如下内容进行研究:(1)充分利用不完备数据集信息,给出缺失属性值的三种区间型描述,将其分析及处理限定在属性空间的合理范围内,以提高其估计的准确度;(2)将缺失属性值的区间型描述也作为聚类因素,研究不完备数据模糊聚类更为有效的求解方案;(3)将所提算法应用于缺损灰度图像的分割问题,并将整体变分模型等图像修复方法融入聚类,实现缺损图像在聚类及图像修复双重优化准则下的分割。本项目的完成将对模式识别领域的不完备数据认知及理解产生积极影响,同时有助于该理论在缺损图像分割等领域的实际应用,具有理论和应用的双重价值。
结项摘要
数据不完备问题广泛存在于自然科学及工程等诸多领域,如何有效利用不完备信息,从中发现并分析数据隐含的知识及规律用于决策、过程控制及信息管理等方面,已成为模式识别领域的一个热点研究课题。从缺失属性值的不确定性角度出发,项目以缺失属性值的区间型描述为基础,对不完备数据的聚类分析及应用展开研究。取得的研究成果包括:(1)充分利用不完备数据集蕴含的聚类中心邻域信息、样本近邻信息及近邻样本属性值分布信息,给出了缺失属性值的中心邻域描述、伪近邻区间描述及最近邻区间内的概率取值模型,将缺失属性值的分析及处理限定在属性空间的合理范围内,为提高其估算准确度提供基础;(2)针对不完备数据集特点,研究了伪近邻、皮尔森相关系数等相似性度量并应用于不完备数据集聚类问题,提出了基于三角不等距离的不完备数据区间型距离度量方法,这一区间型距离更适于描述聚类问题中不完备数据与聚类中心间的不确定距离;(3)将所提多种缺失属性值的区间型描述也作为聚类因素,根据不同区间型描述方法特点,研究了基于梯度算法、遗传算法、属性加权、引入子类分散度、类边缘数据重新划分等不完备数据模糊聚类的有效求解方案,所提算法在聚类错分数、缺失属性值填补等方面能够取得满意的聚类结果;(4)研究了全变差模型及P-Laplace图像修复模型相结合的混合图像修复算法,为进一步将图像修复方法融入聚类,实现缺损图像在聚类及图像修复双重优化准则下的分割研究提供基础。通过本项目的研究,进一步提高了不完备数据处理中对缺失属性值估计的准确度及聚类精度,并把相关方法应用到缺损灰度图像分割等领域中。上述研究能够对模式识别领域的不完备数据认知及理解产生积极的促进作用,同时能够为该理论在缺损图像分割等领域的实际应用提供有益参考。
项目成果
期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(2)
专利数量(0)
A fuzzy c-means clustering algorithm based on pseudo-nearest-neighbor intervals for incomplete data
不完全数据的基于伪最近邻区间的模糊c均值聚类算法
- DOI:--
- 发表时间:2015
- 期刊:Journal of Computational Information Systems
- 影响因子:--
- 作者:Chen, Zujun;Li, Dan;Zhong, Chongquan;Xu, Xiaorui
- 通讯作者:Xu, Xiaorui
基于全变差和P-Laplace模型的混合图像修复算法
- DOI:--
- 发表时间:2014
- 期刊:大连理工大学学报
- 影响因子:--
- 作者:李丹;仲崇权;王世强;陈祖军
- 通讯作者:陈祖军
Fuzzy c-means algorithm based on nearest-prototype neighborhood for incomplete data
不完全数据的基于最近原型邻域的模糊c均值算法
- DOI:--
- 发表时间:2015
- 期刊:ICIC Express Letters
- 影响因子:--
- 作者:Li, Dan;Zhong, Chongquan;Chen, Zujun
- 通讯作者:Chen, Zujun
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
连续施用炭基肥对花生土壤性质和产量的影响
- DOI:--
- 发表时间:2015
- 期刊:中国土壤与肥料
- 影响因子:--
- 作者:杨劲峰;江彤;韩晓日;李丹;张春芳;王月;黄玉茜
- 通讯作者:黄玉茜
基于渠道偏好和运营成本的双渠道闭环供应链定价决策研究
- DOI:--
- 发表时间:2016
- 期刊:哈尔滨商业大学学报
- 影响因子:--
- 作者:肖亚倩;赵静;李丹
- 通讯作者:李丹
青春期性发育自评方法的有效性和适用性研究
- DOI:--
- 发表时间:--
- 期刊:中华预防医学会儿少卫生分会第九届学术交流会、中国教育学会体育与卫生分会第一届学校卫生学术交流会、中国健康促进与教育协会学校分会第三届学术交流会论文集
- 影响因子:--
- 作者:李丹;史慧静;张越;王文;张博林;王群
- 通讯作者:王群
滤泡辅助性T细胞及其相关因子在HIV疾病进展中的变化研究
- DOI:--
- 发表时间:2018
- 期刊:中华微生物学和免疫学杂志
- 影响因子:--
- 作者:李丹;李剑军;李亚锋;王硕;梁华;唐振柱;沈智勇;邓月琴;邵一鸣
- 通讯作者:邵一鸣
有机肥对镉污染土壤修复效应的影响
- DOI:--
- 发表时间:2015
- 期刊:新疆农垦科技
- 影响因子:--
- 作者:李丹;李俊华;蒙佩佩;何婷
- 通讯作者:何婷
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}