Acquiring a GPU server to accelerate developing deep learning methods to reconstruct protein structures from cryo-EM data

购买 GPU 服务器以加速开发深度学习方法,以从冷冻电镜数据重建蛋白质结构

基本信息

  • 批准号:
    10795465
  • 负责人:
  • 金额:
    $ 16.72万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2022
  • 资助国家:
    美国
  • 起止时间:
    2022-09-20 至 2026-05-31
  • 项目状态:
    未结题

项目摘要

Project Summary The goal of this supplement is to acquire a Dell high-performance computing server with 8 Nvidia A100 Graphics Processing Units (GPUs) to accelerate the development of deep learning methods to reconstruct protein structures from cryogenic electron microscopy (cryo-EM) image data accurately and automatically. The cryo-EM technology can determine the quaternary structure of large protein complexes and assemblies consisting of many chains that are difficult or even impossible for traditional techniques such as X-ray crystallography or nuclear magnetic resonance (NMR) to determine. As the cryo-EM technology routinely reached high resolution in recent years, it has been revolutionizing the field of structural biology and widely used to determine structures of large protein complexes and assemblies. However, the computational reconstruction of protein structures from cryo-EM image data is still a time-consuming and labor-intensive process. The advanced artificial intelligence (AI) methods such as deep learning hold the key to automate the process and improve the reconstruction accuracy. The parent R01 grant of this supplement aims to develop cutting-edge deep learning models such as 2D and 3D transformers to automate the key tasks of reconstructing protein structures from cryo-EM data: (1) picking protein particles in cryo-EM images (micrographs); (2) denoising cryo-EM density maps built from protein particle images; (3) reconstructing protein structures from cryo-EM density maps; and (4) integrating the methods of (1), (2) and (3) as a pipeline to automatically reconstruct high-accuracy protein structures from cryo-EM image data without human intervention. Our substantial progress in the first eight months of this project has demonstrated that the proposed methods are fully feasible and highly promising. However, training and testing the large deep learning transformer models on big cryo-EM datasets efficiently and effectively need a large amount of GPU computing power. Using the current GPU resource available to us, it takes about one year for a developer to complete the development of one deep learning method. Although the speed can yield significant progress, it is not fast enough to maximize the potential and impact of the cutting-edge deep learning methods of the parent R01 project. This supplement will enable us to acquire a high-performance computing server consisting of 8 Nvidia A100 80GB GPUs to drastically speed up the research in the parent R01 project. This GPU servers can reduce the time of completing the development of one deep learning model from about one year to less than two months, and therefore drastically improve the productivity of the developers and greatly accelerate publishing and releasing the methods and tools developed in this project. Moreover, the large (80GB) memory of each GPU will enable us to train high-quality deep transformers consisting of millions of parameters to maximize the accuracy of reconstructing protein structures from cryo-EM image data.
项目摘要 该补充的目的是使用8个NVIDIA A100图形获得Dell高性能计算服务器 加工单元(GPU)加速发展深度学习方法以重建蛋白质 来自低温电子显微镜(Cryo-EM)图像数据的结构准确,自动。冷冻EM 技术可以确定大型蛋白质复合物和组件的第四纪结构 对于传统技术(例如X射线晶体学或 核磁共振(NMR)确定。随着冷冻EM技术通常达到高分辨率 近年来,它一直在彻底改变结构生物学领域,并广泛用于确定结构 大型蛋白质复合物和组件。但是,蛋白质结构的计算重建 冷冻EM图像数据仍然是一个耗时且劳动密集型的过程。高级人工智能 (AI)诸如深度学习之类的方法拥有自动化过程并改善重建的关键 准确性。父母R01授予此补充剂旨在开发尖端的深度学习模型,例如 2D和3D变形金刚自动化从冷冻EM数据重建蛋白质结构的关键任务:(1) 在低温EM图像中挑选蛋白质颗粒(显微照片); (2)通过蛋白质构建的冷冻EM密度图 粒子图像; (3)从冷冻EM密度图中重建蛋白质结构; (4)整合方法 (1),(2)和(3)作为管道,以自动从低温EM图像重建高精度蛋白结构 无人干预的数据。 我们在该项目的前八个月中取得了重大进展,证明了拟议的 方法是完全可行的,而且高度有希望。但是,培训和测试大型深度学习 大型Cryo-EM数据集上的变压器模型有效,有效地需要大量的GPU计算 力量。使用当前可用的GPU资源,开发人员大约需要一年的时间才能完成 开发一种深度学习方法。尽管速度可以带来重大进展,但不够快 为了最大程度地提高父r01项目的尖端深度学习方法的潜力和影响。这 补充剂将使我们能够购买由8个NVIDIA A100 80GB组成的高性能计算服务器 GPU大大加快了父R01项目的研究。该GPU服务器可以减少 完成一个深度学习模型从大约一年到不到两个月的开发,并且 因此,大大提高了开发人员的生产率,并大大加速了发布和发布 该项目中开发的方法和工具。此外,每个GPU的大(80GB)内存将启用 我们训练由数百万参数组成的高质量深层变压器,以最大程度地提高准确性 从冷冻EM图像数据中重建蛋白质结构。

项目成果

期刊论文数量(8)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
A large expert-curated cryo-EM image dataset for machine learning protein particle picking.
  • DOI:
    10.1038/s41597-023-02280-2
  • 发表时间:
    2023-06-22
  • 期刊:
  • 影响因子:
    9.8
  • 作者:
    Dhakal, Ashwin;Gyawali, Rajan;Wang, Liguo;Cheng, Jianlin
  • 通讯作者:
    Cheng, Jianlin
De Novo Atomic Protein Structure Modeling for Cryo-EM Density Maps Using 3D Transformer and Hidden Markov Model.
使用 3D Transformer 和隐马尔可夫模型对冷冻电镜密度图进行从头原子蛋白质结构建模。
Correction to: Auto3DCryoMap: an automated particle alignment approach for 3D cryo-EM density map reconstruction.
  • DOI:
    10.1186/s12859-022-04630-0
  • 发表时间:
    2022-03-15
  • 期刊:
  • 影响因子:
    3
  • 作者:
    Al-Azzawi A;Ouadou A;Duan Y;Cheng J
  • 通讯作者:
    Cheng J
CryoVirusDB: A Labeled Cryo-EM Image Dataset for AI-Driven Virus Particle Picking.
CryoVirusDB:用于 AI 驱动的病毒颗粒挑选的标记 Cryo-EM 图像数据集。
  • DOI:
    10.1101/2023.12.25.573312
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Gyawali,Rajan;Dhakal,Ashwin;Wang,Liguo;Cheng,Jianlin
  • 通讯作者:
    Cheng,Jianlin
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Jianlin Cheng其他文献

Jianlin Cheng的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Jianlin Cheng', 18)}}的其他基金

Deep learning methods for automated and accurate reconstruction of protein structures from cryo-EM image data
用于从冷冻电镜图像数据自动准确重建蛋白质结构的深度学习方法
  • 批准号:
    10459829
  • 财政年份:
    2022
  • 资助金额:
    $ 16.72万
  • 项目类别:
Deep learning methods for automated and accurate reconstruction of protein structures from cryo-EM image data
用于从冷冻电镜图像数据自动准确重建蛋白质结构的深度学习方法
  • 批准号:
    10707036
  • 财政年份:
    2022
  • 资助金额:
    $ 16.72万
  • 项目类别:
Integrated Prediction of Protein Struture at 1D, 2D and 3D Levels
1D、2D 和 3D 水平的蛋白质结构综合预测
  • 批准号:
    7863766
  • 财政年份:
    2010
  • 资助金额:
    $ 16.72万
  • 项目类别:
Distance-based ab initio protein structure prediction
基于距离的从头算蛋白质结构预测
  • 批准号:
    10418784
  • 财政年份:
    2010
  • 资助金额:
    $ 16.72万
  • 项目类别:
Integrated Prediction of Protein Struture at 1D, 2D and 3D Levels
1D、2D 和 3D 水平的蛋白质结构综合预测
  • 批准号:
    8269738
  • 财政年份:
    2010
  • 资助金额:
    $ 16.72万
  • 项目类别:
Integrated Prediction and Validation of Protein Structures
蛋白质结构的综合预测和验证
  • 批准号:
    9119094
  • 财政年份:
    2010
  • 资助金额:
    $ 16.72万
  • 项目类别:
Distance-based ab initio protein structure prediction
基于距离的从头算蛋白质结构预测
  • 批准号:
    10627929
  • 财政年份:
    2010
  • 资助金额:
    $ 16.72万
  • 项目类别:
Integrated Prediction of Protein Struture at 1D, 2D and 3D Levels
1D、2D 和 3D 水平的蛋白质结构综合预测
  • 批准号:
    8476234
  • 财政年份:
    2010
  • 资助金额:
    $ 16.72万
  • 项目类别:
Distance-based ab initio protein structure prediction
基于距离的从头算蛋白质结构预测
  • 批准号:
    10251061
  • 财政年份:
    2010
  • 资助金额:
    $ 16.72万
  • 项目类别:
Integrated Prediction of Protein Struture at 1D, 2D and 3D Levels
1D、2D 和 3D 水平的蛋白质结构综合预测
  • 批准号:
    8059621
  • 财政年份:
    2010
  • 资助金额:
    $ 16.72万
  • 项目类别:

相似国自然基金

基于腔光机械效应的石墨烯光纤加速度计研究
  • 批准号:
    62305039
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于自持相干放大的高精度微腔光力加速度计研究
  • 批准号:
    52305621
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
位移、加速度双控式自复位支撑-高层钢框架结构的抗震设计方法及韧性评估研究
  • 批准号:
    52308484
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
高离心加速度行星排滚针轴承多场耦合特性与保持架断裂失效机理研究
  • 批准号:
    52305047
  • 批准年份:
    2023
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目
基于偏心光纤包层光栅的矢量振动加速度传感技术研究
  • 批准号:
    62305269
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Parallel Characterization of Genetic Variants in Chemotherapy-Induced Cardiotoxicity Using iPSCs
使用 iPSC 并行表征化疗引起的心脏毒性中的遗传变异
  • 批准号:
    10663613
  • 财政年份:
    2023
  • 资助金额:
    $ 16.72万
  • 项目类别:
Bioethical, Legal, and Anthropological Study of Technologies (BLAST)
技术的生物伦理、法律和人类学研究 (BLAST)
  • 批准号:
    10831226
  • 财政年份:
    2023
  • 资助金额:
    $ 16.72万
  • 项目类别:
Semiconductor Biomaterials to Speed Bone Healing: A Bioengineering-Driven Approach
半导体生物材料加速骨骼愈合:生物工程驱动的方法
  • 批准号:
    10587508
  • 财政年份:
    2023
  • 资助金额:
    $ 16.72万
  • 项目类别:
Use Bayesian methods to facilitate the data integration for complex clinical trials
使用贝叶斯方法促进复杂临床试验的数据集成
  • 批准号:
    10714225
  • 财政年份:
    2023
  • 资助金额:
    $ 16.72万
  • 项目类别:
Imaging Cerebral Small Vessels in Vascular Cognitive Impairment and Dementia (VCID)
血管性认知障碍和痴呆 (VCID) 中的脑小血管成像
  • 批准号:
    10745164
  • 财政年份:
    2023
  • 资助金额:
    $ 16.72万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了