CAREER: Data-Intensive HPC Analytics: A Systems Approach Through Extended Interfaces, Data Restructuring and Data-centric Scheduling
职业:数据密集型 HPC 分析:通过扩展接口、数据重组和以数据为中心的调度的系统方法
基本信息
- 批准号:0953946
- 负责人:
- 金额:$ 43.89万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2010
- 资助国家:美国
- 起止时间:2010-03-15 至 2017-02-28
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
With the advent of emerging e-Science applications, today's scientific research increasingly relies on petascale-and-beyond computing over large data sets with petabyte-and-beyond sizes. Representatives include analytics- and simulation- driven applications such as the human vision simulation, astrophysics data analysis, earthquake modeling, climate modeling using ensemble runs, etc. In many of the above-mentioned fields, scientists are dealing with large amounts of data and analyzing them to explore new concepts and ideas. These applications make up data-intensive HPC analytics, which lies at the intersection of current HPC and Data-Intensive Scalable Computing (DISC).When HPC systems use traditional configurations to support data-intensive HPC analytics, data is copied from a large remote storage system to diskless compute nodes for processing. Copying data back and forth is an expensive and time consuming process. These data-intensive applications do not require compute intensive resources, but rather moderate compute power machines with the capability of local storage so that data can be processed in-place. One such example of this configuration is the Hadoop framework. However, there are currently limitations in this framework which must be overcome in order to make Hadoop an effective HPC tool. The investigator is leveraging the Hadoop framework to process large amount of patterned data in HPC. This research program includes three thrusts. It is developing the MapReduce API to support a wider range of I/O access patterns, various data restructuring schemes to improve I/O performance for these access patterns, and an efficient scheduling scheme considering multiple chunk locations and data transfer latencies over the network. The research is integrated into several educational activities, such as the development of data-intensive HPC curricula.
随着新兴电子科学应用程序的出现,当今的科学研究越来越依赖于对 PB 级及以上规模的大型数据集进行千万级以上的计算。代表包括分析和模拟驱动的应用程序,例如人类视觉模拟、天体物理数据分析、地震建模、使用集合运行的气候建模等。在上述许多领域,科学家正在处理大量数据并进行分析他们探索新的概念和想法。这些应用程序构成了数据密集型 HPC 分析,它位于当前 HPC 和数据密集型可扩展计算 (DISC) 的交叉点。当 HPC 系统使用传统配置来支持数据密集型 HPC 分析时,数据是从大型远程存储复制的系统到无盘计算节点进行处理。来回复制数据是一个昂贵且耗时的过程。这些数据密集型应用程序不需要计算密集型资源,而是需要具有本地存储功能的中等计算能力的机器,以便可以就地处理数据。这种配置的一个例子是 Hadoop 框架。然而,目前该框架存在一些限制,必须克服这些限制才能使 Hadoop 成为有效的 HPC 工具。研究人员正在利用 Hadoop 框架在 HPC 中处理大量模式数据。该研究计划包括三个重点。它正在开发 MapReduce API 以支持更广泛的 I/O 访问模式、各种数据重组方案以提高这些访问模式的 I/O 性能,以及考虑多个块位置和网络上数据传输延迟的高效调度方案。该研究被整合到多项教育活动中,例如数据密集型 HPC 课程的开发。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Jun Wang其他文献
Length-to-weight and length-to-length relations of 15 freshwater fish species (Actinopterygii: Cypriniformes) from the Oujiang River, China
中国瓯江15种淡水鱼(放线鱼:鲤形目)的长度与重量和长度与长度的关系
- DOI:
10.3897/aiep.52.80322 - 发表时间:
2022-03-29 - 期刊:
- 影响因子:1
- 作者:
A. Zhang;W. Luo;Jun Wang;Ya;Shan Xiao;Zhimin Zhou - 通讯作者:
Zhimin Zhou
Antimycobacterial activity of fusaric acid from a mangrove endophyte and its metal complexes
红树林内生菌镰刀菌酸及其金属配合物的抗分枝杆菌活性
- DOI:
10.1007/s12272-011-0716-9 - 发表时间:
2011-08-03 - 期刊:
- 影响因子:6.7
- 作者:
Jia;Yi Chen;Yu;Yiwen Tao;Jun Wang;Yan Li;Yi Peng;T. Dong;X. Lai;Yong‐cheng Lin - 通讯作者:
Yong‐cheng Lin
Hand Vein Image Enhancement Based on Multi-Scale Top-Hat Transform
基于多尺度Top-Hat变换的手静脉图像增强
- DOI:
10.1515/cait-2016-0025 - 发表时间:
2016-06-01 - 期刊:
- 影响因子:1.2
- 作者:
Guoqing Wang;Jun Wang;Ming Li;Yaohao Zheng;Kai Wang - 通讯作者:
Kai Wang
Optical analysis of solar collector with new V-shaped CPC
采用新型 V 形 CPC 的太阳能集热器光学分析
- DOI:
10.1016/j.solener.2016.06.019 - 发表时间:
2016-10-01 - 期刊:
- 影响因子:6.7
- 作者:
Jun Wang;Lei Yu;Chuan Jiang;Song Yang;Tingting Liu - 通讯作者:
Tingting Liu
Hydrogen Production from Catalytic Microwave-Assisted Pyrolysis of Corncob Over Transition Metal (Fe, Co and Ni) Modified Palygorskite
过渡金属(Fe、Co、Ni)改性凹凸棒石催化微波辅助热解玉米芯制氢
- DOI:
10.1166/jbmb.2020.1926 - 发表时间:
2020-02-01 - 期刊:
- 影响因子:0.5
- 作者:
Xinyun Wang;Guoxu Qin;Chuan Li;Mingqiang Chen;Jun Wang - 通讯作者:
Jun Wang
Jun Wang的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Jun Wang', 18)}}的其他基金
SHF: Small: Taming Huge Page Problems for Memory Bulk Operations Using a Hardware/Software Co-Design Approach
SHF:小:使用硬件/软件协同设计方法解决内存批量操作的大页面问题
- 批准号:
2400014 - 财政年份:2024
- 资助金额:
$ 43.89万 - 项目类别:
Standard Grant
CDS&E/Collaborative Research: Data-Driven Inverse Design of Additively Manufacturable Aperiodic Architected Cellular Materials
CDS
- 批准号:
2245299 - 财政年份:2023
- 资助金额:
$ 43.89万 - 项目类别:
Standard Grant
Discovery Projects - Grant ID: DP210101645
发现项目 - 拨款 ID:DP210101645
- 批准号:
ARC : DP210101645 - 财政年份:2021
- 资助金额:
$ 43.89万 - 项目类别:
Discovery Projects
PPoSS: Planning: Data Centric Computing for Scalable Heterogeneous Memory and Storage Systems Architecture
PPoSS:规划:可扩展异构内存和存储系统架构的以数据为中心的计算
- 批准号:
2028481 - 财政年份:2020
- 资助金额:
$ 43.89万 - 项目类别:
Standard Grant
SHF: Small: Revamping I/O Architectures Using Machine Learning Techniques on Big Compute Machines
SHF:小型:在大型计算机上使用机器学习技术改进 I/O 架构
- 批准号:
1907765 - 财政年份:2019
- 资助金额:
$ 43.89万 - 项目类别:
Standard Grant
SHF: Small: Developing a Highly Efficient and Accurate Approximation System for Warehouse-Scale Computers with the Sub-dataset Distribution Aware Approach
SHF:小型:采用子数据集分布感知方法为仓库规模计算机开发高效、准确的近似系统
- 批准号:
1717388 - 财政年份:2017
- 资助金额:
$ 43.89万 - 项目类别:
Standard Grant
SHF: Small: Multi-criteria optimization control for temperature constrained energy efficient data center using fuzzy decision making theory
SHF:小型:利用模糊决策理论对温度受限节能数据中心进行多准则优化控制
- 批准号:
1527249 - 财政年份:2015
- 资助金额:
$ 43.89万 - 项目类别:
Standard Grant
XPS: SDA: Collaborative Research: A Scalable and Distributed System Framework for Compute-Intensive and Data-Parallel Applications
XPS:SDA:协作研究:用于计算密集型和数据并行应用的可扩展分布式系统框架
- 批准号:
1337244 - 财政年份:2013
- 资助金额:
$ 43.89万 - 项目类别:
Standard Grant
CSR: Small: DSA-Cloud: Data Semantics Aware Clouds for High Performance Analytics
CSR:小型:DSA-Cloud:用于高性能分析的数据语义感知云
- 批准号:
1115665 - 财政年份:2011
- 资助金额:
$ 43.89万 - 项目类别:
Standard Grant
SOCS: Socially Intelligent Computing to Support Citizen Science
SOCS:支持公民科学的社会智能计算
- 批准号:
0968470 - 财政年份:2010
- 资助金额:
$ 43.89万 - 项目类别:
Standard Grant
相似国自然基金
岩石非线性粘弹本构关系研究及基于密集地震台阵数据的应用
- 批准号:42374146
- 批准年份:2023
- 资助金额:51 万元
- 项目类别:面上项目
密集数据驱动的路面性能推演模型研究
- 批准号:52372305
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
密集时序影像数据支持下的海岸带湿地遥感识别方法研究
- 批准号:42301413
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
密集型追踪成对数据分析模型的建构及其在心理学研究中的应用
- 批准号:32300938
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于多模态遥感数据融合的多云多雨地区密集时间序列不透水面精准提取方法研究
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
相似海外基金
Sustainable Implementation of Prone Positioning for the Acute Respiratory Distress Syndrome
持续实施俯卧位治疗急性呼吸窘迫综合征
- 批准号:
10722194 - 财政年份:2023
- 资助金额:
$ 43.89万 - 项目类别:
Corticosteroids for Acute Exacerbations of Idiopathic Pulmonary Fibrosis: Patterns and Outcomes
皮质类固醇治疗特发性肺纤维化急性加重:模式和结果
- 批准号:
10679224 - 财政年份:2023
- 资助金额:
$ 43.89万 - 项目类别:
The effect of gestational age at delivery on lactation outcomes in pump-dependent mothers of critically ill infants
分娩孕周对危重婴儿依赖泵的母亲哺乳结局的影响
- 批准号:
10662962 - 财政年份:2023
- 资助金额:
$ 43.89万 - 项目类别:
Stress Response of Preterm Infants to NICU Caregiving
早产儿对 NICU 护理的应激反应
- 批准号:
10682923 - 财政年份:2023
- 资助金额:
$ 43.89万 - 项目类别:
Managing the Uncertainty of Genetic Information in Neonates
管理新生儿遗传信息的不确定性
- 批准号:
10721451 - 财政年份:2023
- 资助金额:
$ 43.89万 - 项目类别: