Map/Reduce数据处理平台中内存级数据缓存技术研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61202075
  • 项目类别:
    青年科学基金项目
  • 资助金额:
    23.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0204.计算机系统结构与硬件技术
  • 结题年份:
    2015
  • 批准年份:
    2012
  • 项目状态:
    已结题
  • 起止时间:
    2013-01-01 至2015-12-31

项目摘要

Map/Reduce is on the cutting edge of the massive data processing framework in large-scale data centers. Reducing the I/O performance overhead in the massive data processing is essential to achieve the better execution efficiency of Map/Reduce applications, and hence, the higher quality of service of data centers. In-memory data caching is one of the popular technologies to improve data access rate via reducing the disk I/O in data centers. However, on applied to the Map/Reduce-styled framework, the existing in-memory data caching technology cannot accommodate to the framework's new features including that massive data distributed among computing nodes and computation followed with the data locality. Aiming on this issue, we focus on the research of the adaption and extension of the in-memory data caching technology to the Map/Reduce-styled framework, which is, to our best knowledge, the original work in the field of Map/Reduce framework research. The main research topics include the two-leveled data access characteristic analysis, the data perfecting and replacement, the recovery-cost-oriented data placement and the data caching-aware task scheduling, which constitute an integrated solution for the in-memory data caching in Map/Reduce framework. Along with the in-depth research, a prototype system of Map/Reduce data caching management will be developed and tested to verify and optimize the proposed strategies and mechanisms.
Map/Reduce数据处理平台是数据中心海量数据处理领域的最新技术进展。降低应用运行时海量数据读取开销,提高应用执行效率,是确保Map/Reduce平台服务质量的关键。内存级数据缓存技术是数据中心提升数据访问效率的一类典型技术。然而,既有的数据缓存研究成果难以适应Map/Reduce平台数据基于计算节点分布存储以及数据本地化处理的新特征,而针对Map/Reduce平台的数据缓存研究尚属空白。本项目拟发展面向Map/Reduce数据处理平台的内存级数据缓存技术;以提升应用执行效率为目标,针对Map/Reduce平台新的数据存储与处理模式,着重对数据访问特征分析方法、数据预取与替换、数据重放置以及缓存感知的Map/Reduce任务调度等关键技术展开研究,并通过原型系统对研究成果进行分析和验证,为在Map/Reduce平台引入内存级数据缓存提供切实可行的理论基础和技术方案。

结项摘要

本项目的研究目标是发展面向Map/Reduce型数据处理平台的内存级数据缓存技术。本项目对研究计划中确定的关键技术均开展了研究。针对Map/Reduce 平台新的数据存储与处理模式,本项目共取得四个有代表性的研究成果。. 本项目对大数据应用负载的数据访问和系统行为特征进行了系统的量化分析,通过分析发现了大数据负载普遍计算密度较低,是具有更多分支指令的数据移动为主的计算;通过量化分析软件栈对大数据系统行为的影响,发现基于Hadoop的Map/Reduce应用比传统计算负载具有更大的指令足迹,并得出大规模数据移动速度对于大数据应用性能具有重要影响的结论,从而验证了Map/Reduce平台引入内存级数据缓存的必要性。. 本项目提出综合考虑缓存数据本地化访问比例、数据所在节点的计算负载以及数据访问热度的缓存数据替换策略,在保证缓存命中的前提下,通过提升缓存数据的本地化处理几率,切实提升Map/Reduce平台应用的执行效率。该研究成果可将Map/Reduce作业平均周转时间最大减少19.4%。. 本项目提出Map/Reduce平台基于预测的动态内存管理技术,通过在线拟合的方法预测Map/Reduce任务内存使用量;并提出了基于任务运行时间、任务进度和作业进度比较的任务资源抢占策略,以保证运行任务的性能和资源再分配的公平性。该研究成果可将Map/Reduce作业平均周转时间最大减少57.1%。. 本项目提出Reduce任务可抢占式作业调度方法。该方法通过定义Reduce任务资源抢占-回收模型和抢占感知的任务调度策略,有效利用Reduce任务空闲等待期间占用的计算资源,提升作业执行效率。该研究成果可将作业平均周转时间最大减少49.85%。. 本项目共计发表EI/SCI索引学术论文6篇,申请国内发明专利4项,并培养1名博士和3名硕士,完成了项目的预期成果目标。其中,一篇论文在计算机体系结构领域CCF A类会议HPCA发表,相关成果已在知名大数据企业中进行应用推广。项目研究成果对于提升数据中心大数据服务质量具有较好的理论意义和实用价值。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

一种用于TOPS SAR-GMTI的空时自适应处理方法
  • DOI:
    --
  • 发表时间:
    2015
  • 期刊:
    西安电子科技大学学报
  • 影响因子:
    --
  • 作者:
    邵鹏;孙光才;梁毅;保铮
  • 通讯作者:
    保铮
CD40对烟草烟雾暴露小鼠肺组织Foxp3+Treg细胞的影响
  • DOI:
    --
  • 发表时间:
    2016
  • 期刊:
    中华医学杂志
  • 影响因子:
    --
  • 作者:
    梁毅;何志义;张建全;白晶
  • 通讯作者:
    白晶
果实采前套袋对龙眼果实品质和耐贮性的影响
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    农业工程学报
  • 影响因子:
    --
  • 作者:
    瓮红利;林河通;张居念;梁毅;林大才
  • 通讯作者:
    林大才
辛烯基琥珀酸淀粉酯/海藻酸钠复合薄膜的结构性质分析
  • DOI:
    10.13982/j.mfst.1673-9078.2020.3.022
  • 发表时间:
    2020
  • 期刊:
    现代食品科技
  • 影响因子:
    --
  • 作者:
    李晓玺;陆萍;钟怡平;陈玲;梁毅
  • 通讯作者:
    梁毅
大容量电池储能系统孤网运行控制策略
  • DOI:
    10.13582/j.cnki.1672-9102.2015.03.014
  • 发表时间:
    2015
  • 期刊:
    湖南科技大学学报(自然科学版)
  • 影响因子:
    --
  • 作者:
    程孟增;梁毅;宋颖巍;宋卓然;姚志垒;彭思敏
  • 通讯作者:
    彭思敏

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码