数据质量管理中的完整性约束关键技术研究
项目介绍
AI项目解读
基本信息
- 批准号:61370101
- 项目类别:面上项目
- 资助金额:73.0万
- 负责人:
- 依托单位:
- 学科分类:F0202.系统软件、数据库与工业软件
- 结题年份:2017
- 批准年份:2013
- 项目状态:已结题
- 起止时间:2014-01-01 至2017-12-31
- 项目参与者:鲍钰; 毛宏燕; 于程程; 张俍; 周遥; 李春生; 陈杰; 康强强; 段小艺;
- 关键词:
项目摘要
As a critical component of big data quality management, integrity constraint has been widely used in many applications, such as health information management, enterprise information management, and so on. Nowadays, big data oriented integrity constraint management has been evolved from "evaluation before update" to "update independent of evaluation" phase, whose main challenge is how to manage holistic integrity constraints upon massive, distributed, increasing databases, inclusive of approximate unique constraint and (conditional) functional dependency. It's also challenging to detect and fix violations automatically. This proposal mainly focuses on four key aspects, including i)cluster-based parallel algorithms for high throughput, ii)novel synopsis data structures for distributed environments; iii) incremental method to avoid scanning the whole database; and iv)automatic repairing (or semi-automatic repairing) to significantly reduce manual operations. Analysis in theorem and thorough experimental tests will be conducted to evaluate the performance of the proposed methods. Such research work may provide new ideas for data quality management, make data much more useful, and therefore have great importance.
完整性约束管理是大数据质量管理的关键内容之一,在医疗卫生、企业信息管理等领域中意义重大。面向大数据的完整性约束管理模式已从"数据更新前检验约束条件"模式发展到"数据更新与约束检验相对独立"阶段,其难点在于如何在海量、分布、增量的数据库上高效管理近似唯一性约束、(条件)函数依赖等全局型(holistic)完整性约束,且支持自动检测与修复。本项目拟从四个方面进行探索,包括:1)设计面向集群的并行算法以提高系统的吞吐率;2)设计面向分布式网络环境的概要数据结构以降低网络传输开销;3)设计增量更新方法以避免每次监控时均要扫描全部数据集合;4)设计自动修复算法(或半自动修复算法)以避免过多采用人工干预。同时,采用理论分析、完整的实验测试来检验新方法与现有方法的差异性。相关研究成果预计将为大数据质量管理提供新的解决思路、显著提升数据的可用性,因而具有重要的理论与实践意义。
结项摘要
完整性约束管理是大数据质量管理的关键内容之一,在医疗卫生、企业信息管理等领域中意义重大。处理大数据场景之下的完整性约束问题所面临的主要难点是如何在海量、分布、增量的数据库上高效管理近似唯一性约束、(条件)函数依赖等全局型完整性约束,且支持自动检测与修复。本项目的研究内容包括:面向集群的并行算法设计、面向分布式网络环境的低网络传输开销算法设计、增量更新式的完整性约束检测方法设计、和低质数据自动修复算法设计,并采用理论分析、完整的实验测试来检验新方法与现有方法的差异性。课题组围绕预先制定的研究方案认真执行,取得了一批原创性的研究成果,具体包括:(1)共发表学术论文32篇,其中包括3篇CCF-A类论文和7篇CCF-B类论文,(2)在新加坡世界出版社出版英文专著1部;(3)获得授权专利1项;(4)设计完成四个原型系统,并且申请了四项软件著作权;(5)获得4项科研奖励;(6)培养了3名博士研究生和9名硕士研究生,其中多位同学获得国家奖学金。课题组严格按照基金委的要求使用经费。相关研究成果有助于位大数据质量管理提供新的解决思路,提升数据可用性,具有显著的理论意义和实践价值。
项目成果
期刊论文数量(21)
专著数量(1)
科研奖励数量(5)
会议论文数量(11)
专利数量(1)
面向海量低质手机轨迹数据的重要位置发现
- DOI:10.13328/j.cnki.jos.005035
- 发表时间:2016
- 期刊:软件学报
- 影响因子:--
- 作者:章志刚;金澈清;王晓玲;周傲英
- 通讯作者:周傲英
Crypt-JDBC模型:洋葱加密算法的优化改进
- DOI:--
- 发表时间:2017
- 期刊:计算机科学与探索
- 影响因子:--
- 作者:陈鹤;田秀霞;袁培森;金澈清
- 通讯作者:金澈清
Distributed Top-k Similarity Query on Big Trajectory Streams
大轨迹流上的分布式 Top-k 相似度查询
- DOI:--
- 发表时间:--
- 期刊:Frontiers of Computer Science
- 影响因子:4.2
- 作者:Zhigang Zhang;Xiaodong Qi;Yilin Wang;Cheqing Jin;Jiali Mao;Aoying Zhou
- 通讯作者:Aoying Zhou
如何客观评测内存数据库的性能
- DOI:--
- 发表时间:2014
- 期刊:华东师范大学学报(自然科学版)
- 影响因子:--
- 作者:康强强;金澈清;张召;胡华梁;周傲英
- 通讯作者:周傲英
基于正则表达式的限制性路径规划
- DOI:--
- 发表时间:2017
- 期刊:华东师范大学学报(自然科学版)
- 影响因子:--
- 作者:王婧;刘辉平;金澈清
- 通讯作者:金澈清
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
政府治理大数据的共享、集成与融合
- DOI:--
- 发表时间:2020
- 期刊:大数据
- 影响因子:--
- 作者:金澈清;陈晋川;刘威;张召
- 通讯作者:张召
MR-tree: an efficient index for MapReduce
MR-tree:MapReduce 的高效索引
- DOI:--
- 发表时间:--
- 期刊:International Journal of Communication Systems
- 影响因子:2.1
- 作者:李春生;陈杰;金澈清;张蓉;周傲英
- 通讯作者:周傲英
面向区块链的高效物化视图维护和可信查询
- DOI:10.13328/j.cnki.jos.005914
- 发表时间:2020
- 期刊:软件学报
- 影响因子:--
- 作者:蔡磊;朱燕超;郭庆兴;张召;金澈清
- 通讯作者:金澈清
基于Multi-Agent的分布式文本聚类模型
- DOI:--
- 发表时间:2018
- 期刊:计算机学报
- 影响因子:--
- 作者:乔少杰;韩楠;金澈清;高云君;李天瑞;唐常杰;康健
- 通讯作者:康健
面向区块链的数据管理中间件
- DOI:10.3969/j.issn.1000-5641.2021.05.006
- 发表时间:2021
- 期刊:华东师范大学学报(自然科学版)
- 影响因子:--
- 作者:邓思佳;佟兴;唐海波;张召;金澈清
- 通讯作者:金澈清
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
金澈清的其他基金
教育大数据的获取、管理与知识构建方法研究
- 批准号:U1811264
- 批准年份:2018
- 资助金额:507.0 万元
- 项目类别:联合基金项目
跨场景多定位系统环境下的移动对象数据管理
- 批准号:61070052
- 批准年份:2010
- 资助金额:32.0 万元
- 项目类别:面上项目
面向概率数据流的聚集查询处理技术
- 批准号:60803020
- 批准年份:2008
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}