CAREER: Application-centric, Reliable and Efficient High Performance Computing

职业:以应用为中心、可靠且高效的高性能计算

基本信息

  • 批准号:
    1553645
  • 负责人:
  • 金额:
    $ 50万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2016
  • 资助国家:
    美国
  • 起止时间:
    2016-02-01 至 2023-01-31
  • 项目状态:
    已结题

项目摘要

Mission-critical scientific simulations (e.g., climate simulation and fluid dynamics simulation) and enterprise workloads (e.g., search and encryption) running on large-scale computing systems are jeopardized by the increase of faults and errors in hardware and software. Understanding the vulnerability of these large-scale applications is important to minimize performance and power. Lack of the knowledge of application vulnerability forms a major bottleneck of execution efficiency, and jeopardizes HPC simulation capabilities. Previous works rely on random fault injection or detailed architecture analysis to evaluate application vulnerability. They can be slow and inaccurate. There is a big gap between the needs of reliable and efficient HPC and what the current methodologies can provide. This research explores a new methodology to understand application vulnerability. It investigates new analytical and statistical models to quantify and characterize application vulnerability based on a novel metric and application semantics (including algorithm semantics and data semantics). The PI integrates modeling techniques into a broader context for vulnerability analysis to improve the modeling accuracy and explore reliable and efficient protection for applications while examine the interplay between reliability, power, and performance.The outcome from this research will provide support for execution correctness and efficiency of large-scale applications running on future computing systems that demand high data integrity. The proposed research will affect design of reliable applications and algorithms. Built upon the collaboration with industry, the research outcome is expected to be tangible and have direct impact on realistic scientific problems. Furthermore, the tight coupling between research components and education components creates a HPC learning culture to engage students in HPC, addressing HPC workforce shortage in the nation.
关键任务科学模拟(例如,气候模拟和流体动力学模拟)和企业工作负载(例如,在大规模计算系统上运行的企业工作负载(例如,搜索和加密))因硬件和软件中的故障和错误的增加而危害了大规模计算系统。了解这些大规模应用的脆弱性对于最大程度地降低性能和力量很重要。缺乏应用程序脆弱性的知识构成了执行效率的主要瓶颈,并危害了HPC模拟功能。以前的工作依靠随机的故障注入或详细的体系结构分析来评估应用程序漏洞。它们可能会很慢且不准确。可靠和有效的HPC的需求与当前方法可以提供的需求之间存在很大的差距。这项研究探讨了一种了解应用程序漏洞的新方法。它研究了新的分析和统计模型,以量化和表征基于新型指标和应用语义(包括算法语义和数据语义)的应用程序漏洞。 PI将建模技术集成到更广泛的环境中,以提高建模准确性,并探索对应用程序的可靠和有效保护,同时研究可靠性,权力和性能之间的相互作用。这项研究的结果将为实现高度数据完整性的未来计算系统的执行性和效率提供支持。拟议的研究将影响可靠的应用和算法的设计。基于与行业的合作,预计研究结果将是有形的,并直接影响现实的科学问题。此外,研究组件和教育组成部分之间的紧密结合创造了HPC学习文化,使学生参与HPC,以解决全国HPC劳动力短缺。

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Lobster: Load Balance-Aware I/O for Distributed DNN Training
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Dong Li其他文献

[Screening differentially expressed genes in human bone marrow stromal cells at defined stage of differentiation.].
筛选特定分化阶段人骨髓基质细胞差异表达基因
かご状シロキサンの分子内水素分子生成反応に関するAIMD計算による研究
AIMD计算笼型硅氧烷分子内氢分子生成反应的研究
  • DOI:
  • 发表时间:
    2009
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Y. Yatsumonji;T. Sugita;A. Tsubouchi;T. Takeda;江原正博,福田良一;Dong Li;工藤貴子
  • 通讯作者:
    工藤貴子
Heteroatom Chemistry in Asia; Past, Present and Future
亚洲杂原子化学;
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Y. Yatsumonji;T. Sugita;A. Tsubouchi;T. Takeda;江原正博,福田良一;Dong Li;工藤貴子;T. Kawashima
  • 通讯作者:
    T. Kawashima
Ion Mobility Spectrometry of Atomic and Molecular Clusters
原子和分子团簇的离子淌度谱测定
  • DOI:
  • 发表时间:
    2009
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Dong Li;Hirohisa Ohmiya;Masaya Sawamura;F. Misaizu
  • 通讯作者:
    F. Misaizu
Aortic coarctation and carotid artery aneurysm in a patient with hardikar syndrome: Cardiovascular implications for affected individuals
哈迪卡综合征患者的主动脉缩窄和颈动脉瘤:对受影响个体的心血管影响

Dong Li的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Dong Li', 18)}}的其他基金

Collaborative Research: PPoSS: LARGE: Cross-layer Coordination and Optimization for Scalable and Sparse Tensor Networks (CROSS)
合作研究:PPoSS:LARGE:可扩展和稀疏张量网络的跨层协调和优化(CROSS)
  • 批准号:
    2316202
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
IUCRC Preliminary Proposal Planning Grant UC Merced: Center for Memory System Research (CEMSYS)
IUCRC 初步提案规划拨款 加州大学默塞德分校:内存系统研究中心 (CEMSYS)
  • 批准号:
    2310919
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: PPoSS: Planning: Cross-layer Coordination and Optimization for Scalable and Sparse Tensor Networks (CROSS)
合作研究:PPoSS:规划:可扩展和稀疏张量网络的跨层协调和优化(CROSS)
  • 批准号:
    2217086
  • 财政年份:
    2022
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
NSF Student Travel Support for 2022 ACM Symposium on High-Performance Parallel and Distributed Computing (ACM HPDC)
NSF 学生为 2022 年 ACM 高性能并行和分布式计算研讨会 (ACM HPDC) 提供旅行支持
  • 批准号:
    2230513
  • 财政年份:
    2022
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: Elements: SciMem: Enabling High Performance Multi-Scale Simulation on Big Memory Platforms
协作研究:要素:SciMem:在大内存平台上实现高性能多尺度仿真
  • 批准号:
    2104116
  • 财政年份:
    2021
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
NSF Student Travel Support for 2019 ACM Symposium on High-Performance Parallel and Distributed Computing (ACM HPDC)
NSF 学生旅行支持 2019 年 ACM 高性能并行和分布式计算研讨会 (ACM HPDC)
  • 批准号:
    1928873
  • 财政年份:
    2019
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Student Travel Support for ACM High-Performance Parallel and Distributed Computing (HPDC) 2018
2018 年 ACM 高性能并行和分布式计算 (HPDC) 学生差旅支持
  • 批准号:
    1803286
  • 财政年份:
    2018
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CCF:Small:Collaborative Research: Taowu: A Heterogeneous Processing-in-Memory for High Performance Scientific Applications
CCF:Small:合作研究:Taowu:用于高性能科学应用的异构内存处理
  • 批准号:
    1718194
  • 财政年份:
    2017
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CSR: Small: Collaborative Research: Exploring Portable Data Placement on Massively Parallel Platforms with Heterogeneous Memory Architectures
CSR:小型:协作研究:探索具有异构内存架构的大规模并行平台上的便携式数据放置
  • 批准号:
    1617967
  • 财政年份:
    2016
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Overseas Travel Grant for a Maritime Logistics Symposium and a Research Visit at Shanghai
为海上物流研讨会和上海考察访问提供海外旅费资助
  • 批准号:
    EP/I005137/1
  • 财政年份:
    2010
  • 资助金额:
    $ 50万
  • 项目类别:
    Research Grant

相似国自然基金

多中心类别不平衡半监督医学影像分割及其在预后应用的方法研究
  • 批准号:
    62306254
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于丰产金属“再生”策略的磷手性中心不对称构建及应用
  • 批准号:
    22378363
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
杂原子中心螺环配体设计和应用
  • 批准号:
    22371293
  • 批准年份:
    2023
  • 资助金额:
    50.00 万元
  • 项目类别:
    面上项目
二价镧系离子掺杂含锂硅酸盐在反压力猝灭的双发光中心高压光学传感中的应用和其机制研究
  • 批准号:
    62305287
  • 批准年份:
    2023
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目
多项式混沌展开在五轴车铣复合加工中心加工精度可靠性分析中的应用研究
  • 批准号:
    52365063
  • 批准年份:
    2023
  • 资助金额:
    32 万元
  • 项目类别:
    地区科学基金项目

相似海外基金

REU Site: Software Dependability Centric Research and Application
REU 站点:以软件可靠性为中心的研究和应用
  • 批准号:
    2349347
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Michigan Collaborative Hub for TMD Patient-Centric Research (MICH T PCR)
密歇根州 TMD 以患者为中心的研究合作中心 (MICH T PCR)
  • 批准号:
    10834394
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
Electron Spin Multiple Resonance in Diamond and its Application to Quantum Sensor
金刚石中电子自旋多重共振及其在量子传感器中的应用
  • 批准号:
    22H01558
  • 财政年份:
    2022
  • 资助金额:
    $ 50万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Application of Distributed Hash Concept to Route Finding in Information Centric Networking
分布式哈希概念在信息中心网络路由查找中的应用
  • 批准号:
    22K12019
  • 财政年份:
    2022
  • 资助金额:
    $ 50万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Collaborative Research: SHF: Small: Rethinking Performance Variation for Emerging Applications - An Application-centric and Cross-layer Approach
协作研究:SHF:小型:重新思考新兴应用程序的性能变化 - 以应用程序为中心的跨层方法
  • 批准号:
    2134202
  • 财政年份:
    2022
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了