喵ID:QFeEpd免责声明

SciDP: Support HPC and Big Data Applications via Integrated Scientific Data Processing

基本信息

DOI:
10.1109/cluster.2018.00023
发表时间:
2018-09
期刊:
2018 IEEE International Conference on Cluster Computing (CLUSTER)
影响因子:
--
通讯作者:
Kun Feng;Xian-He Sun;Xi Yang;Shujia Zhou
中科院分区:
其他
文献类型:
--
作者: Kun Feng;Xian-He Sun;Xi Yang;Shujia Zhou研究方向: -- MeSH主题词: --
关键词: --
来源链接:pubmed详情页地址

文献摘要

Modern High Performance Computing (HPC) applications, such as Earth science simulations, produce large amounts of data due to the surging of computing power, while big data applications have become more compute-intensive due to increasingly sophisticated analysis algorithms. The needs of both HPC and big data technologies for advanced HPC and big data applications create a demand for integrated system support. In this study, we introduce Scientific Data Processing (SciDP) to support both HPC and big data applications via integrated scientific data processing. SciDP can directly process scientific data stored on a Parallel File System (PFS), which is typically deployed in an HPC environment, in a big data programming environment running atop Hadoop Distributed File System (HDFS). SciDP seamlessly integrates PFS, HDFS, and the widely-used R data analysis system to support highly efficient processing of scientific data. It utilizes the merits of both PFS and HDFS for fast data transfer, overlaps computing with data accessing, and integrates R into the data transfer process. Experimental results show that SciDP accelerates analysis and visualization of a production NASA Center for Climate Simulation (NCCS) climate and weather application by 6x to 8x when compared to existing solutions.
现代高性能计算(HPC)应用,比如地球科学模拟,由于计算能力的激增会产生大量数据,而大数据应用由于日益复杂的分析算法变得计算密集度更高。先进的高性能计算和大数据应用对高性能计算和大数据技术的需求产生了对集成系统支持的需求。在这项研究中,我们引入科学数据处理(SciDP),通过集成的科学数据处理来支持高性能计算和大数据应用。SciDP能够在运行于Hadoop分布式文件系统(HDFS)之上的大数据编程环境中直接处理存储在并行文件系统(PFS)中的科学数据,PFS通常部署在高性能计算环境中。SciDP将PFS、HDFS以及广泛使用的R数据分析系统无缝集成,以支持对科学数据的高效处理。它利用PFS和HDFS在快速数据传输方面的优势,使计算与数据访问重叠,并将R集成到数据传输过程中。实验结果表明,与现有解决方案相比,SciDP将美国国家航空航天局气候模拟中心(NCCS)的一个气候和天气生产应用的分析和可视化速度提高了6到8倍。
参考文献(27)
被引文献(5)

数据更新时间:{{ references.updateTime }}

关联基金

Eager: Collaborative Research: DiRecMR: Reconciling the Dichotomy of MapReduce for Efficient Speculation and Resilience
批准号:
1744317
批准年份:
2017
资助金额:
8
项目类别:
Standard Grant
Kun Feng;Xian-He Sun;Xi Yang;Shujia Zhou
通讯地址:
--
所属机构:
--
电子邮件地址:
--
免责声明免责声明
1、猫眼课题宝专注于为科研工作者提供省时、高效的文献资源检索和预览服务;
2、网站中的文献信息均来自公开、合规、透明的互联网文献查询网站,可以通过页面中的“来源链接”跳转数据网站。
3、在猫眼课题宝点击“求助全文”按钮,发布文献应助需求时求助者需要支付50喵币作为应助成功后的答谢给应助者,发送到用助者账户中。若文献求助失败支付的50喵币将退还至求助者账户中。所支付的喵币仅作为答谢,而不是作为文献的“购买”费用,平台也不从中收取任何费用,
4、特别提醒用户通过求助获得的文献原文仅用户个人学习使用,不得用于商业用途,否则一切风险由用户本人承担;
5、本平台尊重知识产权,如果权利所有者认为平台内容侵犯了其合法权益,可以通过本平台提供的版权投诉渠道提出投诉。一经核实,我们将立即采取措施删除/下架/断链等措施。
我已知晓