基于云计算的海量网络数据管理与搜索技术
项目介绍
AI项目解读
基本信息
- 批准号:61073189
- 项目类别:面上项目
- 资助金额:33.0万
- 负责人:
- 依托单位:
- 学科分类:F0207.计算机网络
- 结题年份:2013
- 批准年份:2010
- 项目状态:已结题
- 起止时间:2011-01-01 至2013-12-31
- 项目参与者:李玲娟; 陈可佳; 王传栋; 陈蕾;
- 关键词:
项目摘要
海量Web数据管理与搜索面临着计算、存储、实时性等多方面的问题。并行计算是解决这些问题的有效途径,然而传统的并行计算昂贵且难以扩展。基于云计算环境的Web数据管理与搜索可以按需获取计算力、存储空间,且即用即释,动态扩展,经济高效,为Web数据管理与搜索提供了新的平台。为此,本课题研究:1)构建海量Web数据的高效索引机制,使云计算系统能够在负载平衡和查询效率之间取得平衡,从而提高系统的总体性能;2)研究基于分布式文件系统的Web数据存储体系,确保Web数据存取的高吞吐量、高可靠性、可伸缩性;3)在云计算环境下,研究基于Mapreduce的并行化计算技术,拟采用的"客户端- - 任务调度与执行- - 数据存储层"三层架构的海量Web数据并行处理结构,将有效的提升云计算环境中的并行计算能力;4)研究在云计算平台上的并行Web数据自动采集机制。
结项摘要
首先建立一种云计算环境下管理海量Web 数据的索引框架,并给出数据存取机制和索引切分策略。考虑到云计算节点之间数据存储的协同要求,将索引分为上下两个层次,上层为全局索引,下层为局部索引。接着对在云计算环境下,基于Mapreduce 的并行化计算技术和高可靠、可伸缩的Web 数据存储体系进行研究,以确保Web 信息的高效处理。最后,研究在云计算平台上的并行Web 数据自动采集机制。 针对云计算环境下分布式存储系统的数据索引不支持复杂查询的问题,提出了一种多维数据索引机制M-Index,采用金字塔技术将数据的多维元数据描述成一维索引,在此基础上提出前缀二叉树的概念,通过提取一维索引和PBT有效节点的前缀作为数据在存储系统中的主键。数据根据主键和一致性Hash机制发布到存储节点组成的覆盖网络。设计了基于M-Index的数据查询算法,将复杂查询请求转换成一维查询键值,有效支持多维查询和区间查询等复杂查询模式。理论分析和实验表明,M-Index在复杂查询模式下具有良好的查询效率和负载均衡。 在MapReduce 模型的基础上,建立一种并发处理海量Web 数据的更通用、更可扩展的并行化计算环境。 首先,构建一个客户端--任务调度与执行层-- 数据存储层三层架构的海量Web 数据并发处理结构。在客户端,通过可配置的XML 文档提交用户任务。在进行任务调度与执行层设计时,将采用了几个关键的策略,如通用平台策略、负载均衡策略、中间结果处理策略和容错策略。接着,将采用主控节点--分派节点--服务节点的三点式架构。其中,主控节点负责收集与处理其他节点的各种信息;分派节点负责解析、分派任务,获取任务执行结果;服务节点负责任务的具体执行。三种节点互相配合,共同完成数据的并行处理。最后,在搭建的平台上,将进行若干测试系统性能的实验。通过单机与并发执行用户任务的对比实验,评价并行计算平台的效率;通过执行不同类型的任务,说明如何在集群规模一定的情况下,实现性能调优。
项目成果
期刊论文数量(14)
专著数量(0)
科研奖励数量(0)
会议论文数量(1)
专利数量(0)
Semantic Link Analysis for Finding Answer Experts
语义链接分析寻找答案专家
- DOI:10.6688/jise.2012.28.1.4
- 发表时间:2012
- 期刊:Journal of Information Science and Engineering
- 影响因子:1.1
- 作者:YAO LU;XINGLIANG NI;JINGSHENG LEI
- 通讯作者:JINGSHENG LEI
Building emotional dictionary for sentiment analysis of online news
构建情感词典进行网络新闻情感分析
- DOI:10.1007/s11280-013-0221-9
- 发表时间:2014-07-01
- 期刊:WORLD WIDE WEB-INTERNET AND WEB INFORMATION SYSTEMS
- 影响因子:3.7
- 作者:Rao, Yanghui;Lei, Jingsheng;Chen, Mingliang
- 通讯作者:Chen, Mingliang
Large-Scale Data Sets Clustering Based on MapReduce and Hadoop
基于MapReduce和Hadoop的大规模数据集集群
- DOI:--
- 发表时间:2011
- 期刊:Journal of Computational Information Systems
- 影响因子:--
- 作者:Ping ZHOU, Jingsheng LEI, Wenjun YE
- 通讯作者:Ping ZHOU, Jingsheng LEI, Wenjun YE
Improved Mutual Information-based Gene Selection with Fuzzy Rough Sets
模糊粗糙集改进的基于互信息的基因选择
- DOI:--
- 发表时间:2011
- 期刊:Journal of Computational Information Systems
- 影响因子:--
- 作者:Feifei XU, Jingsheng LEI, Lai WEI
- 通讯作者:Feifei XU, Jingsheng LEI, Lai WEI
Global Existence of Classical Solutions to Cauchy Problem for Quasilinear Hyperbolic System
拟线性双曲系统柯西问题经典解的整体存在性
- DOI:--
- 发表时间:2011
- 期刊:Journal of Computational Information Systems
- 影响因子:--
- 作者:Jingsheng LEI, Ping YAN, Teng LV
- 通讯作者:Jingsheng LEI, Ping YAN, Teng LV
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
基于Spark平台和并行随机森林回归算法的短期电力负荷预测
- DOI:--
- 发表时间:2017
- 期刊:电力建设
- 影响因子:--
- 作者:刘琪琛;雷景生;郝珈玮;黄燕刚;李强;罗海波
- 通讯作者:罗海波
在线更新的双模版表象模型视觉跟踪
- DOI:--
- 发表时间:2012
- 期刊:Journal of Information and Computational Science
- 影响因子:--
- 作者:仝明磊;陈曙东;雷景生
- 通讯作者:雷景生
一种针对基于SVM入侵检测系统的毒性攻击方法
- DOI:10.3969/j.issn.0372-2112.2019.01.008
- 发表时间:2019
- 期刊:电子学报
- 影响因子:--
- 作者:钱亚冠;卢红波;纪守领;周武杰;吴淑慧;雷景生;陶祥兴
- 通讯作者:陶祥兴
大数据环境下多决策表的区间值全局近似约简
- DOI:--
- 发表时间:2014
- 期刊:软件学报
- 影响因子:--
- 作者:雷景生;毕忠勤;苗夺谦;杜海舟
- 通讯作者:杜海舟
基于粒子群优化的对抗样本生成算法
- DOI:--
- 发表时间:2019
- 期刊:电子与信息学报
- 影响因子:--
- 作者:钱亚冠;卢红波;纪守领;周武杰;吴淑慧;云本胜;陶祥兴;雷景生
- 通讯作者:雷景生
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}

内容获取失败,请点击重试

查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图

请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
雷景生的其他基金
面向智能电网负荷预测的电力大数据关键技术
- 批准号:61472236
- 批准年份:2014
- 资助金额:85.0 万元
- 项目类别:面上项目
电力监测无线传感器网络中感知数据的容忍与查询
- 批准号:61272437
- 批准年份:2012
- 资助金额:82.0 万元
- 项目类别:面上项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}