中国公共数据库数据质量控制的粒化方法研究
项目介绍
AI项目解读
基本信息
- 批准号:61573173
- 项目类别:面上项目
- 资助金额:64.0万
- 负责人:
- 依托单位:
- 学科分类:F0603.机器学习
- 结题年份:2019
- 批准年份:2015
- 项目状态:已结题
- 起止时间:2016-01-01 至2019-12-31
- 项目参与者:李金海; 赵宁; 范敏; 任悦; 张慧雯; 赵颖秀; 黄晨晨; 郑斌;
- 关键词:
项目摘要
By considering the characteristics of Chinese public database and the theoretical and technical problems in data quality control, some effective data processing models for Chinese public database with multi-source information are developed based on rough set, concept lattice and variable weight synthesis theory. In this study, multi-granulation rough set and concept lattice models, multi-granulation rough set model for entity identification, and test-cost-sensitive selecting approach of minimum data sets are developed to deal with multi-source information fusion of Chinese public database, which are further applied to databases of CCCQ, CPS and CSH. This research will obtain theoretical and technical innovations in multi-granularity of multi-source data, quick attribute reduction, multi-granularity for entity identification and multi-factors (technique cost, financial cost, privacy cost, policy risk, etc.) variable weight synthesis for test-cost-sensitive evaluation. Some important results in the above aspects are to be expected.
针对我国公共数据库的特点和数据质量控制中存在的理论及技术难题,在分析现有的某些公共数据库数据质量状况的基础上,建立和运用基于粗糙集、概念格和变权分析理论的公共数据库多源性公共数据处理(清洗)模型. 本项目研究中,重点发展公共数据库多源数据融合的多粒度粗糙集概念格模型、实体识别的多粒度粗糙集模型和最小数据集生成的多粒度代价敏感算法,并在国家企业质量信用数据库(CCCQ)、中国公安数据库(CPS)、国家学生健康数据库(CSH)等真实的公共数据库中进行实证分析. 本项目研究将在公共数据库数据融合的多粒度信息粒化、快速属性约简、多粒度化实体识别和多要素(技术成本、财务成本、隐私保护、政策风险等)变权综合代价敏感几个方面获得理论创新和技术创新,取得标志性理论成果和应用成果.
结项摘要
针对我国公共数据库的特点和数据质量控制中存在的理论及技术难题,在分析质量技术监督数据、气候环境数据、司法数据等公共数据库数据质量状况的基础上,运用复杂网络、演化博弈论、概念认知学习、相变理论、变权理论、分布式协同控制理论等,建立了较完整的公共数据库数据质量控制与数据分析的粒化理论基础,并提出若干公共数据粒化方法且应用与公共数据最小数据集、公共数据电子证据系统、气候和环境数据粒化及实证分析,取得良好效果。通过研究,我们在以下几个方面研究中取得重要结果:(A)复杂网络上的公共数据演化博弈与数据质量控制;(B)基于概念认知学习的公共数据粒化方法;(C)公共数据中电子证据的获取、粒化与区块链技术;(D)大气、环境与企业质量信用公共数据粒化方法及实证分析;(E)基于社区检测的数据粒相互依赖性研究。本项目研究成果表明:(1)公共数据库数据质量控制中,公共数据库网络上的数据演化博弈存在合作者,而合作者比率既依赖于公共数据监督部门的稽查力度和奖惩力度也依赖于数据粒度的大小和粒化方法;(2)公共数据库数据粒化的过程是复杂网络上一个概念认知学习的过程,粒化的过程是渐进的,最终形成与现实公共产品供给的对象相对应的相对稳定的概念,进而影响现实公共数据处理与分析的逻辑结论;(3)提出的理论与方法在处理气候、环境、电子证据和质量技术监督信用数据中应用效果好,有助于提升气候预报、大气污染防控、司法办案和产品质量安全领域公共数据治理水平和公共产品质量。这些成果覆盖了项目申请书和计划书的全部研究内容并达到了相应的预期研究目标、取得了预期成果。. 该项目研究取得了丰富的成果,其中标志性成果发表于国内外权威的学术期刊上,包括《中国科学》3篇、IEEE Transactions系列1篇,Omega 1篇,SCI检索论文10篇,大大超出项目申请书提出的成果发表指标。在项目期内,人才培养成效显著,具体为:课题组成员中1人晋升为教授,1人晋升为副教授,3人被聘为博士生导师;10人研究生毕业并获得硕士学位(其中5人考取博士研究生),另有3人在读研究生考取硕博连读博士研究生。项目期内,国际国内学术交流成效显著,具体为:国际学术交流9人次,来访7人次,派出2人次,接受2名留学生来课题组攻读博士学位(导师为刘文奇);举办国内学术会议3次,外出参加国内学术会议40多人次;举办“捞鱼河讲坛”24期。
项目成果
期刊论文数量(23)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
MapReduce框架下的粒概念认知学习系统研究
- DOI:--
- 发表时间:2018
- 期刊:电子学报
- 影响因子:--
- 作者:米允龙;李金海;刘文奇;林晶
- 通讯作者:林晶
Three-way concept learning based on cognitive operators: An information fusion viewpoint
基于认知算子的三向概念学习:信息融合观点
- DOI:10.1016/j.ijar.2017.01.009
- 发表时间:2017-04-01
- 期刊:INTERNATIONAL JOURNAL OF APPROXIMATE REASONING
- 影响因子:3.9
- 作者:Huang, Chenchen;Li, Jinhai;Wu, Wei-Zhi
- 通讯作者:Wu, Wei-Zhi
基于复杂网络的胃癌关键基因筛选与分析
- DOI:--
- 发表时间:2019
- 期刊:数据采集与处理
- 影响因子:--
- 作者:王晓曼;刘文奇
- 通讯作者:刘文奇
Correlation and scaling behaviors of fine particulate matter (PM 2.5 ) concentration in China
中国细颗粒物(PM 2.5 )浓度的相关性和尺度行为
- DOI:10.1209/0295-5075/122/58003
- 发表时间:2018
- 期刊:EPL
- 影响因子:1.8
- 作者:张永文;Dean Chen;Jingfang Fan;Shlomo Havlin;Xiaosong Chen
- 通讯作者:Xiaosong Chen
复杂网络上的公共数据演化博弈与数据质量控制.
- DOI:10.1360/n112016-00114
- 发表时间:2016
- 期刊:中国科学:信息科学
- 影响因子:--
- 作者:刘文奇
- 通讯作者:刘文奇
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
等待时间有限的串行生产系统的缓冲区优化
- DOI:--
- 发表时间:2018
- 期刊:控制与决策
- 影响因子:--
- 作者:李蕊;赵宁;刘文奇
- 通讯作者:刘文奇
基于区间粗糙直觉模糊数的多属性决策方法
- DOI:--
- 发表时间:2015
- 期刊:运筹与管理
- 影响因子:--
- 作者:余高锋;刘文奇
- 通讯作者:刘文奇
具有两类请求的云计算中心服务器数量的优化
- DOI:--
- 发表时间:2017
- 期刊:智能系统学报
- 影响因子:--
- 作者:张江强;赵宁;刘文奇
- 通讯作者:刘文奇
一种新的席夫碱镨配合物的合成、晶体结构和热力学性质研究
- DOI:--
- 发表时间:--
- 期刊:Thermochimica Acta
- 影响因子:3.5
- 作者:肖圣雄;刘文奇;谢金奇;李强国
- 通讯作者:李强国
基于折衷型变权向量的直觉语言决策方法
- DOI:--
- 发表时间:2015
- 期刊:控制与决策
- 影响因子:--
- 作者:余高锋;刘文奇;李登峰
- 通讯作者:李登峰
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}

内容获取失败,请点击重试

查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图

请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
刘文奇的其他基金
交互式概念认知学习系统及其应用研究
- 批准号:12371460
- 批准年份:2023
- 资助金额:44 万元
- 项目类别:面上项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}