Collaborative Research: Frameworks: Diamond: Democratizing Large Neural Network Model Training for Science

合作研究:框架:钻石:科学大型神经网络模型训练的民主化

基本信息

  • 批准号:
    2311769
  • 负责人:
  • 金额:
    $ 75万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2023
  • 资助国家:
    美国
  • 起止时间:
    2023-10-01 至 2026-09-30
  • 项目状态:
    未结题

项目摘要

Diamond is a service designed to democratize access to cutting-edge DL methods by abstracting the use of HPC resources. Diamond combines novel computer science research with translational computer science to reduce the significant barriers that impede adoption of DL methods in science. With Diamond, domain scientists can focus on the neural network architecture design to solve their domain-specific challenges without worrying about Cyberinfrastructure management. Diamond also contributes to key educational outcomes. PhD students work directly on project goals, and tools developed in the project will be used in undergraduate and graduate-level courses. The tools will also be used in summer schools and programs at TACC, UChicago, and NCSA. Targeted recruitment of students from underserved communities at the graduate, undergraduate, and high-school levels will address diversity and outreach goals.Diamond builds upon prior work in software ecosystem management, parallel computing, deep learning, and data management, combining disparate capabilities into a cohesive and user-friendly framework. It provides a web service-enabled programming interface supporting the DL lifecycle from development to deployment and dissemination. It offers container configuration, automatic scaling for distributed training, hyper-parameter tuning, and model sharing. It also applies crucial performance optimizations, including planning for long training jobs, performance-aware model placement, cross-cluster training, and data management. Diamond results are made available to domain scientists, computer scientists, and engineers supporting DL applications in HPC centers.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
Diamond是一项旨在通过抽象使用HPC资源来使对尖端DL方法访问的访问的服务。 Diamond将新颖的计算机科学研究与转化计算机科学结合在一起,以减少阻碍科学中DL方法采用的重大障碍。借助Diamond,领域科学家可以专注于神经网络架构设计,以解决其特定领域的挑战,而不必担心网络基础设施管理。钻石还为关键的教育成果做出了贡献。博士生直接实现项目目标的工作,项目中开发的工具将用于本科和研究生级课程。这些工具还将在TACC,Uchicago和NCSA的暑期学校和计划中使用。来自研究生,本科和高中级别的服务不足社区的学生有针对性地招募学生,将解决多样性和外展目标。Diamond基于软件生态系统管理,并行计算,深度学习和数据管理的先前工作,并将不同的功能结合到凝聚力和用户友好的框架中。它提供了一个支持Web服务的编程接口,该界面支持DL生命周期从开发到部署和传播。它提供容器配置,用于分布式培训的自动缩放,超参数调整和模型共享。它还应用了至关重要的绩效优化,包括计划长期培训工作,表现吸引模型的位置,跨集群培训和数据管理。钻石结果可用于支持HPC中心中DL应用的领域科学家,计算机科学家和工程师。该奖项反映了NSF的法定任务,并且使用基金会的知识分子优点和更广泛的影响评估审查标准,认为值得通过评估值得支持。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Kyle Chard其他文献

GreenFaaS: Maximizing Energy Efficiency of HPC Workloads with FaaS
GreenFaaS:利用 FaaS 最大限度提高 HPC 工作负载的能源效率
  • DOI:
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Alok V. Kamatar;Valerie Hayot;Y. Babuji;André Bauer;Gourav Rattihalli;Ninad Hogade;D. Milojicic;Kyle Chard;Ian Foster
  • 通讯作者:
    Ian Foster
Walking the cost-accuracy tightrope: balancing trade-offs in data-intensive genomics
走成本准确性钢丝:平衡数据密集型基因组学的权衡
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    K. Leung;M. Kimball;Jason Pitt;A. Woodard;Kyle Chard
  • 通讯作者:
    Kyle Chard
Unveiling Temporal Performance Deviation: Leveraging Clustering in Microservices Performance Analysis
揭示时间性能偏差:在微服务性能分析中利用集群
  • DOI:
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    0
  • 作者:
    André Bauer;Timo Dittus;Martin Straesser;Alok V. Kamatar;Matt Baughman;Lukas Beierlieb;Marius Hadry;Daniel Grillmeyer;Yannik Lubas;Samuel Kounev;Ian Foster;Kyle Chard
  • 通讯作者:
    Kyle Chard
Regulating Traffic in a Crowded Cache: Overcoming the Container Explosion Problem
调节拥挤缓存中的流量:克服容器爆炸问题
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kevin Gao;Tim Shaffer;Kyle Chard
  • 通讯作者:
    Kyle Chard
SECRE: Surrogate-Based Error-Controlled Lossy Compression Ratio Estimation Framework
SECRE:基于代理的误差控制有损压缩比估计框架

Kyle Chard的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Kyle Chard', 18)}}的其他基金

Collaborative Research: REU Site: BigDataX: From theory to practice in Big Data computing at eXtreme scales
合作研究:REU 网站:BigDataX:极限规模大数据计算从理论到实践
  • 批准号:
    2150501
  • 财政年份:
    2022
  • 资助金额:
    $ 75万
  • 项目类别:
    Standard Grant
Collaborative Research: Sustainability: A Community-Centered Approach for Supporting and Sustaining Parsl
合作研究:可持续性:以社区为中心的支持和维持 Parsl 的方法
  • 批准号:
    2209919
  • 财政年份:
    2022
  • 资助金额:
    $ 75万
  • 项目类别:
    Standard Grant
Frameworks: Collaborative Research: ChronoLog: A High-Performance Storage Infrastructure for Activity and Log Workloads
框架:协作研究:ChronoLog:用于活动和日志工作负载的高性能存储基础架构
  • 批准号:
    2104008
  • 财政年份:
    2021
  • 资助金额:
    $ 75万
  • 项目类别:
    Standard Grant
Collaborative Research: OAC Core: Enabling Extremely Fine-grained Parallelism on Modern Many-core Architectures
合作研究:OAC Core:在现代多核架构上实现极其细粒度的并行性
  • 批准号:
    2107283
  • 财政年份:
    2021
  • 资助金额:
    $ 75万
  • 项目类别:
    Standard Grant
CCRI: Planning: Collaborative Research: Infrastructure for Enabling Systematic Development and Research of Scientific Workflow Management Systems
CCRI:规划:协作研究:支持科学工作流程管理系统系统开发和研究的基础设施
  • 批准号:
    2016682
  • 财政年份:
    2020
  • 资助金额:
    $ 75万
  • 项目类别:
    Standard Grant
CSR: Small: Cost-Aware Cloud Profiling, Prediction, and Provisioning as a Service
CSR:小:具有成本意识的云分析、预测和配置即服务
  • 批准号:
    1816611
  • 财政年份:
    2018
  • 资助金额:
    $ 75万
  • 项目类别:
    Standard Grant
REU Site: Collaborative Research: BigDataX: From theory to practice in Big Data computing at eXtreme scales
REU 网站:协作研究:BigDataX:极限规模大数据计算从理论到实践
  • 批准号:
    1757970
  • 财政年份:
    2018
  • 资助金额:
    $ 75万
  • 项目类别:
    Standard Grant
Collaborative Research: SI2-SSI: Swift/E: Integrating Parallel Scripted Workflow into the Scientific Software Ecosystem
协作研究:SI2-SSI:Swift/E:将并行脚本工作流程集成到科学软件生态系统中
  • 批准号:
    1550588
  • 财政年份:
    2016
  • 资助金额:
    $ 75万
  • 项目类别:
    Standard Grant

相似国自然基金

多价框架核酸与CRISPR/Cas协作传感平台研究及三阴性乳腺癌术后监测应用
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
多价框架核酸与CRISPR/Cas协作传感平台研究及三阴性乳腺癌术后监测应用
  • 批准号:
    22204104
  • 批准年份:
    2022
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目
基于高阶正则化半监督学习的多跟踪器框架模型及融合策略研究
  • 批准号:
    61571362
  • 批准年份:
    2015
  • 资助金额:
    57.0 万元
  • 项目类别:
    面上项目
表示模型框架下高光谱遥感影像分类若干技术研究
  • 批准号:
    61571033
  • 批准年份:
    2015
  • 资助金额:
    57.0 万元
  • 项目类别:
    面上项目
随机几何框架下的多层异构蜂窝网中物理层安全问题研究
  • 批准号:
    61401510
  • 批准年份:
    2014
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Collaborative Research: Frameworks: MobilityNet: A Trustworthy CI Emulation Tool for Cross-Domain Mobility Data Generation and Sharing towards Multidisciplinary Innovations
协作研究:框架:MobilityNet:用于跨域移动数据生成和共享以实现多学科创新的值得信赖的 CI 仿真工具
  • 批准号:
    2411152
  • 财政年份:
    2024
  • 资助金额:
    $ 75万
  • 项目类别:
    Standard Grant
Collaborative Research: Frameworks: hpcGPT: Enhancing Computing Center User Support with HPC-enriched Generative AI
协作研究:框架:hpcGPT:通过 HPC 丰富的生成式 AI 增强计算中心用户支持
  • 批准号:
    2411297
  • 财政年份:
    2024
  • 资助金额:
    $ 75万
  • 项目类别:
    Standard Grant
Collaborative Research: Frameworks: hpcGPT: Enhancing Computing Center User Support with HPC-enriched Generative AI
协作研究:框架:hpcGPT:通过 HPC 丰富的生成式 AI 增强计算中心用户支持
  • 批准号:
    2411298
  • 财政年份:
    2024
  • 资助金额:
    $ 75万
  • 项目类别:
    Standard Grant
Collaborative Research: Scalable Manufacturing of Large-Area Thin Films of Metal-Organic Frameworks for Separations Applications
合作研究:用于分离应用的大面积金属有机框架薄膜的可扩展制造
  • 批准号:
    2326714
  • 财政年份:
    2024
  • 资助金额:
    $ 75万
  • 项目类别:
    Standard Grant
Collaborative Research: AF: Small: Structural Graph Algorithms via General Frameworks
合作研究:AF:小型:通过通用框架的结构图算法
  • 批准号:
    2347322
  • 财政年份:
    2024
  • 资助金额:
    $ 75万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了