数据仓库中行列混合存储引擎的优化模型
项目介绍
AI项目解读
基本信息
- 批准号:61070031
- 项目类别:面上项目
- 资助金额:32.0万
- 负责人:
- 依托单位:
- 学科分类:F0202.系统软件、数据库与工业软件
- 结题年份:2013
- 批准年份:2010
- 项目状态:已结题
- 起止时间:2011-01-01 至2013-12-31
- 项目参与者:夏小玲; 杜明; 丁祥武; 石秀金; 俞唯仁; 姜朔;
- 关键词:
项目摘要
针对现有数据仓库中单一(按行或列)存储架构不能对海量数据读与写同时优化的瓶颈问题,探索一种行列混合的存储引擎优化新方法,将模型分解为:读优化存储器 ROS、写优化存储器WOS、元组移动器TMS。为发挥混合架构"列读行写"双重优化效应,将大量、不易变的数据按列压缩存储在ROS中,而将少量、易变的数据按行非压缩存储在WOS中。本项目的难点与关键问题是:通过比较混合架构使用前后,数据元素与字段的表示、变长记录与地址的表示以及索引结构发生的变化,建立数据在混合架构中的存储模型;通过探索 TMS块迭代器中元组重组的优化过程并基于扩充关系代数理论,建立TMS物理操作符计算与优化模型,调控I/O与CPU执行代价参数,使 TMS总运行成本最小;通过运用"两阶段提交协议"和建立"分布式封锁算法代价模型",保持ROS与WOS间的数据一致性。本项目是国产大型通用数据库与数据仓库存储部件的基础研究,有广泛的应用。
结项摘要
本课题针对行列混合的存储引擎进行研制,突破以下关键技术 (1) 深入分析数据在ROS和WOS上的动态存储过程,确定了基于二元表结构的ROS架构并提出WOS写策略。(2)对数据元素与字段的表示、变长记录与地址的表示以及索引结构发生的变换进行了研究,提出了新的记录表示方式,在此基础上提出了一种列存储数据的树型索引结构---RB+树索引结构及适用于范围查询的列存储数据桶划分方法。(3) 建立数据在ROS和WOS上的存储引擎模型,提出了优化读性能的ROS存储引擎模型以及优化写性能的WOS存储引擎。(4)建立TMS块迭代器的元组重组模型,提出了元组重组优化策略以及TMS块迭代器中间结果重用模型。(5)研究ROS中谓词的新特性,提出了新的并行连接与串行连接操作符,扩充了传统的关系代数符。对传统常用关系代数符根据列存储的特点进行扩充和改造,在此基础上构造了TMS的基本动作定义表示法。(6)在扩充关系符的基础上,建立了新关系代数的一般优化准则。对操作符进行形式化描述,重点对基于索引的操作执行进行设计与优化。 建立了完善的物理操作符计算与优化模型,通过最小化I/O与CPU执行代价,使TMS运行总成本最小化。(7)设计行缓冲区中结构,支持快速的更新操作和事务管理,并保障ROS和WOS中数据的一致性。在完成了ROS与WOS存储、查询及一致性等关键技术突破的基础上,课题设计并开发实现了一个行列混合存储架构存储引擎的数据仓库原型系统。
项目成果
期刊论文数量(13)
专著数量(0)
科研奖励数量(0)
会议论文数量(5)
专利数量(0)
APWAH:一种自适应划分字对齐的混合位向量压缩技术
- DOI:--
- 发表时间:2012
- 期刊:计算机研究与发展
- 影响因子:--
- 作者:李清炳;丁祥武;王梅
- 通讯作者:王梅
列存储数据查询中的连接策略优化方法
- DOI:--
- 发表时间:--
- 期刊:计算机研究与发展
- 影响因子:--
- 作者:孙莉;李静;刘国华
- 通讯作者:刘国华
列存储数据仓库中基于概率的保序字符串压缩方法
- DOI:--
- 发表时间:2013
- 期刊:计算机研究与发展
- 影响因子:--
- 作者:夏小玲;李海燕;王梅
- 通讯作者:王梅
列存储数据仓库中哈希连接的优化算法研究
- DOI:--
- 发表时间:2012
- 期刊:计算机研究与发展
- 影响因子:--
- 作者:郝大腾;孙莉;王梅
- 通讯作者:王梅
列存储数据库中压缩位图索引技术
- DOI:--
- 发表时间:2012
- 期刊:计算机工程
- 影响因子:--
- 作者:王梅;杨思箫;乐嘉锦
- 通讯作者:乐嘉锦
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
基于R-Tree的高效异常轨迹检测算法
- DOI:--
- 发表时间:--
- 期刊:软件学报
- 影响因子:--
- 作者:刘良旭;乐嘉锦;刘宾;乔少杰;唐常杰
- 通讯作者:唐常杰
On-Demand数据广播环境下实时有序查询处理
- DOI:--
- 发表时间:--
- 期刊:计算机科学
- 影响因子:--
- 作者:王洪亚;刘晓强;何浩源;宋晖;肖迎元;乐嘉锦
- 通讯作者:乐嘉锦
span style=line-height:normal;font-family:Verdana, Arial, Helvetica, sans-serif;background-color:#EFEFEF;基于Hive的计算结果特征提取与重用策略/span
- DOI:--
- 发表时间:2015
- 期刊:计算机研究与发展
- 影响因子:--
- 作者:谢恒;王梅;乐嘉锦
- 通讯作者:乐嘉锦
Modeling and Implementation of Flexible Business Process
柔性业务流程建模与实现
- DOI:10.4156/jcit.vol7.issue22.28
- 发表时间:2012-12
- 期刊:Journal of Convergence Information Technology
- 影响因子:--
- 作者:姜久雷;乐嘉锦;王江静;何丰;保文星
- 通讯作者:保文星
面向热点话题时间序列的有效聚类算法研究
- DOI:--
- 发表时间:2012
- 期刊:计算机学报
- 影响因子:--
- 作者:陈妮;乐嘉锦;段大高;孙践知
- 通讯作者:孙践知
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}

内容获取失败,请点击重试

查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图

请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}