Multimodal Machine-Learning and High Performance Computing Strategies for Big MS Proteomics Data

MS 蛋白质组大数据的多模态机器学习和高性能计算策略

基本信息

  • 批准号:
    10163880
  • 负责人:
  • 金额:
    $ 47.59万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2020
  • 资助国家:
    美国
  • 起止时间:
    2020-06-01 至 2023-05-31
  • 项目状态:
    已结题

项目摘要

Project Abstract/Summary Mass spectrometry (MS) data is high-dimensional data that is used for large-scale system biology proteomics. The current state of the art mass spectrometers can generate thousands of spectra from a single organism and experiment. This high-dimensional data is processed using database searches and denovo algorithms with varying degrees of success. The overarching objective of this study is to develop, test, integrate and evaluate novel image-processing and deep-learning algorithms that will allow us to deduce and identify reliable peptide sequences in a definitive and quantitative fashion. Our long-term goal is to improve on identification of MS based proteomics data using novel and scalable algorithms. The objective of this proposal is to investigate, design and implement machine-learning deep-learning algorithms for identification of peptides from MS data. Since deep-learning is very good at discovering intricate structures in high-dimensional data it will be ideal solution for discovering dark proteomics data and more accurate deduction of peptides. We predict that the integration of these methods, along with traditional numerical algorithms, will lead to a multimodal fusion-based approach for an optimized and accurate peptide deduction system for large-scale MS data. Further, we will design and implement data augmentation, memory-efficient indexing, and high-performance computing (HPC) to achieve these outcomes more efficiently with a shorter computational time. Therefore, this new line of investigation is significant since it has the potential to improve on long-stalled effort to increase accuracy, reliability and reproducibility of MS data analysis and search tools. The proximate expected outcome of this work is a novel set of deep-learning and image-processing tools which will allow much better insight in MS based proteomics data. The results will have an important positive impact immediately because these proposed research tasks will lay the groundwork to develop a new class of algorithms and will provide rapid, high-throughput, sensitive, and reproducible and reliable tools for MS based proteomics.
项目摘要/摘要 质谱(MS)数据是用于大规模系统生物学的高维数据 蛋白质组学。当前的艺术质谱仪可以从中产生数千个光谱 一个有机体和实验。使用数据库搜索处理此高维数据 和多个成功程度的Denovo算法。这项研究的总体目标是 开发,测试,整合和评估新型的图像处理和深度学习算法 允许我们以确定的定量方式推断和识别可靠的肽序列。我们的 长期目标是使用新颖和 可扩展算法。该建议的目的是调查,设计和实施 用于从MS数据鉴定肽的机器学习深度学习算法。自从 深度学习非常擅长在高维数据中发现复杂的结构 发现深蛋白质组学数据和更准确的肽的理想解决方案。我们 预测这些方法的集成以及传统的数值算法将领导 采用基于多模式融合的方法进行优化和准确的肽扣除 大型MS数据的系统。此外,我们将设计和实施数据增强, 记忆有效的索引和高性能计算(HPC)以实现这些结果 较短的计算时间更有效。因此,这一新的调查是 意义重大,因为它有可能改善长期努力以提高准确性,所以 MS数据分析和搜索工具的可靠性和可重复性。直观的预期 这项工作的结果是一组新颖的深度学习和图像处理工具,可以允许 更好地了解基于MS的蛋白质组学数据。结果将具有重要的积极 立即影响,因为这些提议的研究任务将为开发一个基础 新的算法类,并将提供快速,高通量,敏感和可重复的 可靠的基于MS的蛋白质组学的工具。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(4)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Fahad Saeed其他文献

Fahad Saeed的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Fahad Saeed', 18)}}的其他基金

Pilot Testing of a Communication Intervention to Promote Shared Dialysis Decision Making in Older Patients with Chronic Kidney Disease (DIAL-SDM Trial)
对促进老年慢性肾病患者共同透析决策的沟通干预进行试点测试(DIAL-SDM 试验)
  • 批准号:
    10159888
  • 财政年份:
    2020
  • 资助金额:
    $ 47.59万
  • 项目类别:
Pilot Testing of a Communication Intervention to Promote Shared Dialysis Decision Making in Older Patients with Chronic Kidney Disease (DIAL-SDM Trial)
对促进老年慢性肾病患者共同透析决策的沟通干预进行试点测试(DIAL-SDM 试验)
  • 批准号:
    9976804
  • 财政年份:
    2020
  • 资助金额:
    $ 47.59万
  • 项目类别:
Multimodal Machine-Learning and High Performance Computing Strategies for Big MS Proteomics Data
MS 蛋白质组大数据的多模态机器学习和高性能计算策略
  • 批准号:
    10372290
  • 财政年份:
    2020
  • 资助金额:
    $ 47.59万
  • 项目类别:
Pilot Testing of a Communication Intervention to Promote Shared Dialysis Decision Making in Older Patients with Chronic Kidney Disease (DIAL-SDM Trial)
对促进老年慢性肾病患者共同透析决策的沟通干预进行试点测试(DIAL-SDM 试验)
  • 批准号:
    10379466
  • 财政年份:
    2020
  • 资助金额:
    $ 47.59万
  • 项目类别:
Multimodal Machine-Learning and High Performance Computing Strategies for Big MS Proteomics Data
MS 蛋白质组大数据的多模态机器学习和高性能计算策略
  • 批准号:
    10413045
  • 财政年份:
    2020
  • 资助金额:
    $ 47.59万
  • 项目类别:
Compute-Cluster for Deep-Learning Models for Mass Spectrometry based Proteomics data
基于质谱的蛋白质组数据深度学习模型的计算集群
  • 批准号:
    10389445
  • 财政年份:
    2020
  • 资助金额:
    $ 47.59万
  • 项目类别:
Pilot Testing of a Communication Intervention to Promote Shared Dialysis Decision Making in Older Patients with Chronic Kidney Disease (DIAL-SDM Trial)
对促进老年慢性肾病患者共同透析决策的沟通干预进行试点测试(DIAL-SDM 试验)
  • 批准号:
    10887101
  • 财政年份:
    2020
  • 资助金额:
    $ 47.59万
  • 项目类别:
Pilot Testing of a Communication Intervention to Promote Shared Dialysis Decision Making in Older Patients with Chronic Kidney Disease (DIAL-SDM Trial)
对促进老年慢性肾病患者共同透析决策的沟通干预进行试点测试(DIAL-SDM 试验)
  • 批准号:
    10609444
  • 财政年份:
    2020
  • 资助金额:
    $ 47.59万
  • 项目类别:
Multimodal Machine-Learning and High Performance Computing Strategies for Big MS Proteomics Data
MS 蛋白质组大数据的多模态机器学习和高性能计算策略
  • 批准号:
    9973317
  • 财政年份:
    2020
  • 资助金额:
    $ 47.59万
  • 项目类别:

相似国自然基金

地表与大气层顶短波辐射多分量一体化遥感反演算法研究
  • 批准号:
    42371342
  • 批准年份:
    2023
  • 资助金额:
    52 万元
  • 项目类别:
    面上项目
高速铁路柔性列车运行图集成优化模型及对偶分解算法
  • 批准号:
    72361020
  • 批准年份:
    2023
  • 资助金额:
    27 万元
  • 项目类别:
    地区科学基金项目
随机密度泛函理论的算法设计和分析
  • 批准号:
    12371431
  • 批准年份:
    2023
  • 资助金额:
    43.5 万元
  • 项目类别:
    面上项目
基于全息交通数据的高速公路大型货车运行风险识别算法及主动干预方法研究
  • 批准号:
    52372329
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
强磁场作用下两相铁磁流体动力学相场模型的高精度数值算法研究
  • 批准号:
    12361074
  • 批准年份:
    2023
  • 资助金额:
    27 万元
  • 项目类别:
    地区科学基金项目

相似海外基金

Elucidating causal mechanisms of ethanol-induced analgesia in BXD recombinant inbred mouse lines
阐明 BXD 重组近交系小鼠乙醇诱导镇痛的因果机制
  • 批准号:
    10825737
  • 财政年份:
    2023
  • 资助金额:
    $ 47.59万
  • 项目类别:
Elucidating mechanisms of cellular communication critical for head and neck cancer progression and metastasis.
阐明对头颈癌进展和转移至关重要的细胞通讯机制。
  • 批准号:
    10752228
  • 财政年份:
    2023
  • 资助金额:
    $ 47.59万
  • 项目类别:
Deep Learning Image Analysis Algorithms to Improve Oral Cancer Risk Assessment for Oral Potentially Malignant Disorders
深度学习图像分析算法可改善口腔潜在恶性疾病的口腔癌风险评估
  • 批准号:
    10805177
  • 财政年份:
    2023
  • 资助金额:
    $ 47.59万
  • 项目类别:
Multi-modal Tracking of In Vivo Skeletal Structures and Implants
体内骨骼结构和植入物的多模式跟踪
  • 批准号:
    10839518
  • 财政年份:
    2023
  • 资助金额:
    $ 47.59万
  • 项目类别:
Dynamic neural coding of spectro-temporal sound features during free movement
自由运动时谱时声音特征的动态神经编码
  • 批准号:
    10656110
  • 财政年份:
    2023
  • 资助金额:
    $ 47.59万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了