Acquiring a GPU server to accelerate developing deep learning methods to reconstruct protein structures from cryo-EM data

购买 GPU 服务器以加速开发深度学习方法,以从冷冻电镜数据重建蛋白质结构

基本信息

  • 批准号:
    10795465
  • 负责人:
  • 金额:
    $ 16.72万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2022
  • 资助国家:
    美国
  • 起止时间:
    2022-09-20 至 2026-05-31
  • 项目状态:
    未结题

项目摘要

Project Summary The goal of this supplement is to acquire a Dell high-performance computing server with 8 Nvidia A100 Graphics Processing Units (GPUs) to accelerate the development of deep learning methods to reconstruct protein structures from cryogenic electron microscopy (cryo-EM) image data accurately and automatically. The cryo-EM technology can determine the quaternary structure of large protein complexes and assemblies consisting of many chains that are difficult or even impossible for traditional techniques such as X-ray crystallography or nuclear magnetic resonance (NMR) to determine. As the cryo-EM technology routinely reached high resolution in recent years, it has been revolutionizing the field of structural biology and widely used to determine structures of large protein complexes and assemblies. However, the computational reconstruction of protein structures from cryo-EM image data is still a time-consuming and labor-intensive process. The advanced artificial intelligence (AI) methods such as deep learning hold the key to automate the process and improve the reconstruction accuracy. The parent R01 grant of this supplement aims to develop cutting-edge deep learning models such as 2D and 3D transformers to automate the key tasks of reconstructing protein structures from cryo-EM data: (1) picking protein particles in cryo-EM images (micrographs); (2) denoising cryo-EM density maps built from protein particle images; (3) reconstructing protein structures from cryo-EM density maps; and (4) integrating the methods of (1), (2) and (3) as a pipeline to automatically reconstruct high-accuracy protein structures from cryo-EM image data without human intervention. Our substantial progress in the first eight months of this project has demonstrated that the proposed methods are fully feasible and highly promising. However, training and testing the large deep learning transformer models on big cryo-EM datasets efficiently and effectively need a large amount of GPU computing power. Using the current GPU resource available to us, it takes about one year for a developer to complete the development of one deep learning method. Although the speed can yield significant progress, it is not fast enough to maximize the potential and impact of the cutting-edge deep learning methods of the parent R01 project. This supplement will enable us to acquire a high-performance computing server consisting of 8 Nvidia A100 80GB GPUs to drastically speed up the research in the parent R01 project. This GPU servers can reduce the time of completing the development of one deep learning model from about one year to less than two months, and therefore drastically improve the productivity of the developers and greatly accelerate publishing and releasing the methods and tools developed in this project. Moreover, the large (80GB) memory of each GPU will enable us to train high-quality deep transformers consisting of millions of parameters to maximize the accuracy of reconstructing protein structures from cryo-EM image data.
项目概要 本补充的目标是购买一台配备 8 个 Nvidia A100 显卡的戴尔高性能计算服务器 处理单元 (GPU) 加速开发重建蛋白质的深度学习方法 准确、自动地从低温电子显微镜 (cryo-EM) 图像数据中获取结构。冷冻电镜 技术可以确定大型蛋白质复合物和组件的四级结构,其中包括 许多链对于 X 射线晶体学或 X 射线晶体学等传统技术来说是困难甚至不可能的 核磁共振(NMR)来测定。由于冷冻电镜技术通常达到高分辨率 近年来,它彻底改变了结构生物学领域,并广泛用于确定结构 大型蛋白质复合物和组装体。然而,蛋白质结构的计算重建 冷冻电镜图像数据仍然是一个耗时且劳动密集型的过程。先进的人工智能 深度学习等人工智能方法是实现流程自动化和改进重建的关键 准确性。该补充的母 R01 资助旨在开发尖端的深度学习模型,例如 2D 和 3D 转换器可自动执行从冷冻电镜数据重建蛋白质结构的关键任务:(1) 在冷冻电镜图像(显微照片)中挑选蛋白质颗粒; (2) 由蛋白质构建的去噪冷冻电镜密度图 粒子图像; (3) 从冷冻电镜密度图重建蛋白质结构; (4) 整合方法 (1)、(2) 和 (3) 作为从冷冻电镜图像自动重建高精度蛋白质结构的管道 无需人工干预的数据。 我们在该项目的前八个月取得的实质性进展表明,拟议的 方法完全可行且前景广阔。然而,训练和测试大型深度学习 大型冷冻电镜数据集上的 Transformer 模型高效且有效地需要大量 GPU 计算 力量。使用我们当前可用的 GPU 资源,开发人员大约需要一年的时间才能完成 开发一种深度学习方法。虽然速度可以带来显着的进步,但还不够快 最大限度地发挥母公司 R01 项目的尖端深度学习方法的潜力和影响。这 补充将使我们能够获得由8个Nvidia A100 80GB组成的高性能计算服务器 GPU 可大幅加快父 R01 项目的研究速度。该GPU服务器可以减少 从大约一年到不到两个月的时间完成一个深度学习模型的开发,并且 因此极大地提高了开发人员的生产力并大大加快了发布和发布的速度 该项目中开发的方法和工具。此外,每个 GPU 的大内存 (80GB) 将使 我们训练由数百万个参数组成的高质量深度变压器,以最大限度地提高 从冷冻电镜图像数据重建蛋白质结构。

项目成果

期刊论文数量(8)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
A large expert-curated cryo-EM image dataset for machine learning protein particle picking.
  • DOI:
    10.1038/s41597-023-02280-2
  • 发表时间:
    2023-06-22
  • 期刊:
  • 影响因子:
    9.8
  • 作者:
    Dhakal, Ashwin;Gyawali, Rajan;Wang, Liguo;Cheng, Jianlin
  • 通讯作者:
    Cheng, Jianlin
De Novo Atomic Protein Structure Modeling for Cryo-EM Density Maps Using 3D Transformer and Hidden Markov Model.
使用 3D Transformer 和隐马尔可夫模型对冷冻电镜密度图进行从头原子蛋白质结构建模。
Correction to: Auto3DCryoMap: an automated particle alignment approach for 3D cryo-EM density map reconstruction.
  • DOI:
    10.1186/s12859-022-04630-0
  • 发表时间:
    2022-03-15
  • 期刊:
  • 影响因子:
    3
  • 作者:
    Al-Azzawi A;Ouadou A;Duan Y;Cheng J
  • 通讯作者:
    Cheng J
CryoVirusDB: A Labeled Cryo-EM Image Dataset for AI-Driven Virus Particle Picking.
CryoVirusDB:用于 AI 驱动的病毒颗粒挑选的标记 Cryo-EM 图像数据集。
  • DOI:
    10.1101/2023.12.25.573312
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Gyawali,Rajan;Dhakal,Ashwin;Wang,Liguo;Cheng,Jianlin
  • 通讯作者:
    Cheng,Jianlin
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Jianlin Cheng其他文献

Jianlin Cheng的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Jianlin Cheng', 18)}}的其他基金

Deep learning methods for automated and accurate reconstruction of protein structures from cryo-EM image data
用于从冷冻电镜图像数据自动准确重建蛋白质结构的深度学习方法
  • 批准号:
    10459829
  • 财政年份:
    2022
  • 资助金额:
    $ 16.72万
  • 项目类别:
Deep learning methods for automated and accurate reconstruction of protein structures from cryo-EM image data
用于从冷冻电镜图像数据自动准确重建蛋白质结构的深度学习方法
  • 批准号:
    10707036
  • 财政年份:
    2022
  • 资助金额:
    $ 16.72万
  • 项目类别:
Integrated Prediction of Protein Struture at 1D, 2D and 3D Levels
1D、2D 和 3D 水平的蛋白质结构综合预测
  • 批准号:
    7863766
  • 财政年份:
    2010
  • 资助金额:
    $ 16.72万
  • 项目类别:
Distance-based ab initio protein structure prediction
基于距离的从头算蛋白质结构预测
  • 批准号:
    10418784
  • 财政年份:
    2010
  • 资助金额:
    $ 16.72万
  • 项目类别:
Integrated Prediction of Protein Struture at 1D, 2D and 3D Levels
1D、2D 和 3D 水平的蛋白质结构综合预测
  • 批准号:
    8269738
  • 财政年份:
    2010
  • 资助金额:
    $ 16.72万
  • 项目类别:
Integrated Prediction and Validation of Protein Structures
蛋白质结构的综合预测和验证
  • 批准号:
    9119094
  • 财政年份:
    2010
  • 资助金额:
    $ 16.72万
  • 项目类别:
Distance-based ab initio protein structure prediction
基于距离的从头算蛋白质结构预测
  • 批准号:
    10627929
  • 财政年份:
    2010
  • 资助金额:
    $ 16.72万
  • 项目类别:
Integrated Prediction of Protein Struture at 1D, 2D and 3D Levels
1D、2D 和 3D 水平的蛋白质结构综合预测
  • 批准号:
    8476234
  • 财政年份:
    2010
  • 资助金额:
    $ 16.72万
  • 项目类别:
Distance-based ab initio protein structure prediction
基于距离的从头算蛋白质结构预测
  • 批准号:
    10251061
  • 财政年份:
    2010
  • 资助金额:
    $ 16.72万
  • 项目类别:
Integrated Prediction of Protein Struture at 1D, 2D and 3D Levels
1D、2D 和 3D 水平的蛋白质结构综合预测
  • 批准号:
    8059621
  • 财政年份:
    2010
  • 资助金额:
    $ 16.72万
  • 项目类别:

相似国自然基金

高功率激光驱动低β磁重联中磁岛对电子加速影响的研究
  • 批准号:
    12305275
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
U型离散顺流火蔓延非稳态热输运机理与加速机制研究
  • 批准号:
    52308532
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
实施科学视角下食管癌加速康复外科证据转化障碍机制与多元靶向干预策略研究
  • 批准号:
    82303925
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
TWIST1介导的ITGBL1+肿瘤相关成纤维细胞转化加速结肠癌动态演化进程机制及其预防干预研究
  • 批准号:
    82373112
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
NOTCH3/HLF信号轴驱动平滑肌细胞表型转化加速半月板退变的机制研究
  • 批准号:
    82372435
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目

相似海外基金

Semiconductor Biomaterials to Speed Bone Healing: A Bioengineering-Driven Approach
半导体生物材料加速骨骼愈合:生物工程驱动的方法
  • 批准号:
    10587508
  • 财政年份:
    2023
  • 资助金额:
    $ 16.72万
  • 项目类别:
Parallel Characterization of Genetic Variants in Chemotherapy-Induced Cardiotoxicity Using iPSCs
使用 iPSC 并行表征化疗引起的心脏毒性中的遗传变异
  • 批准号:
    10663613
  • 财政年份:
    2023
  • 资助金额:
    $ 16.72万
  • 项目类别:
Bioethical, Legal, and Anthropological Study of Technologies (BLAST)
技术的生物伦理、法律和人类学研究 (BLAST)
  • 批准号:
    10831226
  • 财政年份:
    2023
  • 资助金额:
    $ 16.72万
  • 项目类别:
Use Bayesian methods to facilitate the data integration for complex clinical trials
使用贝叶斯方法促进复杂临床试验的数据集成
  • 批准号:
    10714225
  • 财政年份:
    2023
  • 资助金额:
    $ 16.72万
  • 项目类别:
Imaging Cerebral Small Vessels in Vascular Cognitive Impairment and Dementia (VCID)
血管性认知障碍和痴呆 (VCID) 中的脑小血管成像
  • 批准号:
    10745164
  • 财政年份:
    2023
  • 资助金额:
    $ 16.72万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了