CAREER: Data-Intensive HPC Analytics: A Systems Approach Through Extended Interfaces, Data Restructuring and Data-centric Scheduling

职业:数据密集型 HPC 分析:通过扩展接口、数据重组和以数据为中心的调度的系统方法

基本信息

项目摘要

With the advent of emerging e-Science applications, today's scientific research increasingly relies on petascale-and-beyond computing over large data sets with petabyte-and-beyond sizes. Representatives include analytics- and simulation- driven applications such as the human vision simulation, astrophysics data analysis, earthquake modeling, climate modeling using ensemble runs, etc. In many of the above-mentioned fields, scientists are dealing with large amounts of data and analyzing them to explore new concepts and ideas. These applications make up data-intensive HPC analytics, which lies at the intersection of current HPC and Data-Intensive Scalable Computing (DISC).When HPC systems use traditional configurations to support data-intensive HPC analytics, data is copied from a large remote storage system to diskless compute nodes for processing. Copying data back and forth is an expensive and time consuming process. These data-intensive applications do not require compute intensive resources, but rather moderate compute power machines with the capability of local storage so that data can be processed in-place. One such example of this configuration is the Hadoop framework. However, there are currently limitations in this framework which must be overcome in order to make Hadoop an effective HPC tool. The investigator is leveraging the Hadoop framework to process large amount of patterned data in HPC. This research program includes three thrusts. It is developing the MapReduce API to support a wider range of I/O access patterns, various data restructuring schemes to improve I/O performance for these access patterns, and an efficient scheduling scheme considering multiple chunk locations and data transfer latencies over the network. The research is integrated into several educational activities, such as the development of data-intensive HPC curricula.
随着新兴的电子科学应用的出现,当今的科学研究越来越多地依赖于Petascale和Beyond计算的计算,而不是具有PBABYTE和BE-BEYOND大小的大型数据集。代表包括分析和模拟驱动的应用,例如人类视觉模拟,天体物理数据分析,地震建模,使用集合运行等的气候建模等。在许多上述领域中,科学家正在处理大量数据并分析它们以探索新的概念和想法。这些应用程序构成了数据密集型HPC分析,这是在当前HPC和数据密集型可扩展计算(DISC)的交集中。当HPC系统使用传统配置来支持数据密集型HPC分析时,数据将从大型远程存储系统中复制到无用的无远程存储系统来处理磁盘用于处理处理。来回复制数据是一个昂贵且耗时的过程。这些数据密集型应用程序不需要计算密集的资源,而是具有本地存储功能的中等计算机机器,因此可以将数据定为就地处理。此配置的一个这样的例子是Hadoop框架。但是,目前在此框架中有一些局限性必须克服,以使Hadoop成为有效的HPC工具。研究人员正在利用Hadoop框架来处理HPC中的大量图案数据。该研究计划包括三个推力。它正在开发MAPREDUCE API,以支持更广泛的I/O访问模式,各种数据重组方案,以改善这些访问模式的I/O性能以及考虑到网络上多个块位置和数据传输潜伏期的高效调度方案。该研究纳入了几项教育活动,例如开发数据密集型HPC课程。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Jun Wang其他文献

An asymmetric color-image cryptosystem based on spiral phase transformation and equal modulus decomposition
基于螺旋相变和等模分解的非对称彩色图像密码系统
  • DOI:
    10.1016/j.optlastec.2020.106106
  • 发表时间:
    2020-06
  • 期刊:
  • 影响因子:
    5
  • 作者:
    Zheng Zhu;Xu-Dong Chen;Chao Wu;Jun Wang;Weixing Wang
  • 通讯作者:
    Weixing Wang
Clustering Unsynchronized Time Series Subsequences with Phase Shift Weighted Spherical k-means Algorithm
使用相移加权球形 k 均值算法对不同步时间序列子序列进行聚类
  • DOI:
    10.4304/jcp.9.5.1103-1108
  • 发表时间:
    2014-01
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Tiantian Yang;Jun Wang
  • 通讯作者:
    Jun Wang
Curing kinetics and mechanical properties of cyanate ester/hyperbranched benzoxazine copolymers
氰酸酯/超支化苯并恶嗪共聚物的固化动力学和机械性能
  • DOI:
    10.1002/pat.5624
  • 发表时间:
    2022-01
  • 期刊:
  • 影响因子:
    3.4
  • 作者:
    Zhicheng Wang;Runjie Li;Qirui Qin;Mohamadou Al Hassan;Abdul Qadeer Dayo;Wenbin;Jun Wang
  • 通讯作者:
    Jun Wang
Roof Shale Flora of Coal Seam 6 from the Asselian (Lower Permian) Taiyuan Formation of the Wuda Coalfield, Inner Mongolia and Its Ecostratigraphic Significance
内蒙古乌达煤田阿塞尔系(下二叠统)太原组6号煤层顶板页岩植物群及其生态地层意义
  • DOI:
    10.1111/1755-6724.13061
  • 发表时间:
    2017-02
  • 期刊:
  • 影响因子:
    3.3
  • 作者:
    Wei-Ming Zhou;Gui-Jun Shi;Zhi-Yan Zhou;Jun Wang
  • 通讯作者:
    Jun Wang
Solubility of Rhodamine B in Supercritical Carbon Dioxide Fluids with or without Cosolvent
罗丹明 B 在有或没有助溶剂的超临界二氧化碳流体中的溶解度
  • DOI:
    10.4028/www.scientific.net/amr.332-334.146
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Chuan Zhao;Jun Wang;I. Tabata;T. Hori
  • 通讯作者:
    T. Hori

Jun Wang的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Jun Wang', 18)}}的其他基金

SHF: Small: Taming Huge Page Problems for Memory Bulk Operations Using a Hardware/Software Co-Design Approach
SHF:小:使用硬件/软件协同设计方法解决内存批量操作的大页面问题
  • 批准号:
    2400014
  • 财政年份:
    2024
  • 资助金额:
    $ 43.89万
  • 项目类别:
    Standard Grant
CDS&E/Collaborative Research: Data-Driven Inverse Design of Additively Manufacturable Aperiodic Architected Cellular Materials
CDS
  • 批准号:
    2245299
  • 财政年份:
    2023
  • 资助金额:
    $ 43.89万
  • 项目类别:
    Standard Grant
Discovery Projects - Grant ID: DP210101645
发现项目 - 拨款 ID:DP210101645
  • 批准号:
    ARC : DP210101645
  • 财政年份:
    2021
  • 资助金额:
    $ 43.89万
  • 项目类别:
    Discovery Projects
PPoSS: Planning: Data Centric Computing for Scalable Heterogeneous Memory and Storage Systems Architecture
PPoSS:规划:可扩展异构内存和存储系统架构的以数据为中心的计算
  • 批准号:
    2028481
  • 财政年份:
    2020
  • 资助金额:
    $ 43.89万
  • 项目类别:
    Standard Grant
SHF: Small: Revamping I/O Architectures Using Machine Learning Techniques on Big Compute Machines
SHF:小型:在大型计算机上使用机器学习技术改进 I/O 架构
  • 批准号:
    1907765
  • 财政年份:
    2019
  • 资助金额:
    $ 43.89万
  • 项目类别:
    Standard Grant
SHF: Small: Developing a Highly Efficient and Accurate Approximation System for Warehouse-Scale Computers with the Sub-dataset Distribution Aware Approach
SHF:小型:采用子数据集分布感知方法为仓库规模计算机开发高效、准确的近似系统
  • 批准号:
    1717388
  • 财政年份:
    2017
  • 资助金额:
    $ 43.89万
  • 项目类别:
    Standard Grant
SHF: Small: Multi-criteria optimization control for temperature constrained energy efficient data center using fuzzy decision making theory
SHF:小型:利用模糊决策理论对温度受限节能数据中心进行多准则优化控制
  • 批准号:
    1527249
  • 财政年份:
    2015
  • 资助金额:
    $ 43.89万
  • 项目类别:
    Standard Grant
XPS: SDA: Collaborative Research: A Scalable and Distributed System Framework for Compute-Intensive and Data-Parallel Applications
XPS:SDA:协作研究:用于计算密集型和数据并行应用的可扩展分布式系统框架
  • 批准号:
    1337244
  • 财政年份:
    2013
  • 资助金额:
    $ 43.89万
  • 项目类别:
    Standard Grant
CSR: Small: DSA-Cloud: Data Semantics Aware Clouds for High Performance Analytics
CSR:小型:DSA-Cloud:用于高性能分析的数据语义感知云
  • 批准号:
    1115665
  • 财政年份:
    2011
  • 资助金额:
    $ 43.89万
  • 项目类别:
    Standard Grant
SOCS: Socially Intelligent Computing to Support Citizen Science
SOCS:支持公民科学的社会智能计算
  • 批准号:
    0968470
  • 财政年份:
    2010
  • 资助金额:
    $ 43.89万
  • 项目类别:
    Standard Grant

相似国自然基金

岩石非线性粘弹本构关系研究及基于密集地震台阵数据的应用
  • 批准号:
    42374146
  • 批准年份:
    2023
  • 资助金额:
    51 万元
  • 项目类别:
    面上项目
密集数据驱动的路面性能推演模型研究
  • 批准号:
    52372305
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
复杂机械结构体密集紧固件装配质量的生成式多模态数据融合检测机理与方法
  • 批准号:
    52375494
  • 批准年份:
    2023
  • 资助金额:
    50.00 万元
  • 项目类别:
    面上项目
密集型追踪成对数据分析模型的建构及其在心理学研究中的应用
  • 批准号:
    32300938
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于海量数据的地震智能检测方法及其在密集地震序列中的应用研究
  • 批准号:
    42374081
  • 批准年份:
    2023
  • 资助金额:
    52.00 万元
  • 项目类别:
    面上项目

相似海外基金

Recovering Together after Cardiac Arrest: A dyadic mind-body intervention for emotional distress in cardiac arrest survivors and their informal caregivers
心脏骤停后一起康复:针对心脏骤停幸存者及其非正式护理人员情绪困扰的二元身心干预
  • 批准号:
    10723275
  • 财政年份:
    2023
  • 资助金额:
    $ 43.89万
  • 项目类别:
Managing the Uncertainty of Genetic Information in Neonates
管理新生儿遗传信息的不确定性
  • 批准号:
    10721451
  • 财政年份:
    2023
  • 资助金额:
    $ 43.89万
  • 项目类别:
The role of epigenetic regulator UHRF1 in stability of induced regulatory T-cell function during influenza A virus-induced lung injury
表观遗传调节因子 UHRF1 在甲型流感病毒诱导的肺损伤过程中诱导调节 T 细胞功能稳定性中的作用
  • 批准号:
    10389878
  • 财政年份:
    2023
  • 资助金额:
    $ 43.89万
  • 项目类别:
Predicting the Absence of Serious Bacterial Infection in the PICU
预测 PICU 中不存在严重细菌感染
  • 批准号:
    10806039
  • 财政年份:
    2023
  • 资助金额:
    $ 43.89万
  • 项目类别:
Nurse-Led Interventions in Pediatric Critical Care: Training in Pediatric Sleep Health, Delirium, and Multi-Site Research
护士主导的儿科重症监护干预措施:儿科睡眠健康、谵妄和多中心研究培训
  • 批准号:
    10751813
  • 财政年份:
    2023
  • 资助金额:
    $ 43.89万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了