Collaborative Research: FET: Small: De Novo Protein Scaffold Filling by Combinatorial Algorithms and Deep Learning Models

合作研究:FET:小型:通过组合算法和深度学习模型从头填充蛋白质支架

基本信息

  • 批准号:
    2307573
  • 负责人:
  • 金额:
    $ 9.92万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2023
  • 资助国家:
    美国
  • 起止时间:
    2023-07-01 至 2025-06-30
  • 项目状态:
    未结题

项目摘要

Protein sequencing plays an important role in identifying protein functions, analyzing protein-protein interactions, and characterizing post-translational modifications. Despite the recent progress in protein sequencing and assembly, many of the currently available assembled proteins come in a draft form. There are still many gaps in the assembled protein sequences even if one combines top-down and bottom-up sequencing methods. In other words, at the end of the sequencing step for a specific protein, it is more likely to see contigs separated with gaps (which is called a scaffold). Hence, an important but also natural combinatorial problem is to fill the missing amino acids into a scaffold to obtain a complete protein sequence. With the new framework produced by this project, de novo protein sequencing will greatly advance the research and clinical practice of identifying the function and structure of proteins. The project will provide researchers with powerful computational tools for obtaining the sequence information of antibodies, which is extremely valuable for the construction of antibody databases. This interdisciplinary research also provides various training projects to students at all levels, particularly to underrepresented African American students, and helps them to pursue high quality research from an open-minded and cross-disciplinary perspective. New advances achieved will be integrated into undergraduate/graduate curricula. The results will be disseminated through journal publications, conferences, open-source software release, tutorials, and seminar talks.In this project, the investigators will study the mass spectrometry-based de novo protein scaffold filling problem by two related phases. Firstly, the investigators will analyze the top-down and bottom-up tandem mass spectrometry to construct the protein scaffold without a proper reference. The methods include general global optimization, dynamic programming, and graph algorithms, which can also handle small protein mutations (where the mass of some amino acid changes). Secondly, the investigators will use deep learning methods, such as combined convolutional neural network and long short-term memory, convolutional denoising autoencoder, and transformer models to finish the last step of protein sequencing obtained by top-down and bottom-up tandem mass spectrometry analysis at first step. The project will result in a new framework of combined combinatorial and deep learning methods for protein scaffold filling, and a corresponding open-source software.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
蛋白质测序在识别蛋白质功能、分析蛋白质-蛋白质相互作用和表征翻译后修饰方面发挥着重要作用。尽管最近在蛋白质测序和组装方面取得了进展,但目前许多可用的组装蛋白质都是草稿形式。即使将自上而下和自下而上的测序方法结合起来,组装的蛋白质序列仍然存在许多间隙。换句话说,在特定蛋白质的测序步骤结束时,更有可能看到以间隙分隔的重叠群(称为支架)。因此,一个重要但也是自然的组合问题是将缺失的氨基酸填充到支架中以获得完整的蛋白质序列。借助该项目产生的新框架,从头蛋白质测序将极大地推进鉴定蛋白质功能和结构的研究和临床实践。该项目将为研究人员提供强大的计算工具来获取抗体的序列信息,这对于抗体数据库的构建极具价值。这种跨学科研究还为各个层次的学生,特别是代表性不足的非洲裔美国学生提供各种培训项目,帮助他们从开放的思想和跨学科的角度追求高质量的研究。取得的新进展将纳入本科生/研究生课程。研究结果将通过期刊出版物、会议、开源软件发布、教程和研讨会演讲来传播。 在这个项目中,研究人员将通过两个相关阶段研究基于质谱的从头蛋白质支架填充问题。首先,研究人员将分析自上而下和自下而上的串联质谱法,以在没有适当参考的情况下构建蛋白质支架。这些方法包括一般全局优化、动态规划和图形算法,它们还可以处理小的蛋白质突变(其中一些氨基酸的质量发生变化)。其次,研究人员将使用深度学习方法,例如组合卷积神经网络和长短期记忆、卷积去噪自动编码器和Transformer模型,完成自上而下和自下而上串联质谱获得的蛋白质测序的最后一步第一步分析。该项目将产生一个结合组合和深度学习方法的蛋白质支架填充新框架,以及相应的开源软件。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力优势和更广泛的评估进行评估,被认为值得支持。影响审查标准。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Xiaowen Liu其他文献

Gene expression Computing the maximum similarity bi-clusters of gene expression data
基因表达 计算基因表达数据的最大相似性双簇
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Xiaowen Liu;Lusheng Wang
  • 通讯作者:
    Lusheng Wang
Identification of Novel Piperazinylquinoxaline Derivatives as Potent Phosphoinositide 3-Kinase (PI3K) Inhibitors
新型哌嗪喹喔啉衍生物作为有效磷酸肌醇 3-激酶 (PI3K) 抑制剂的鉴定
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    3.7
  • 作者:
    Peng Wu;Yi Su;Xianghong Guan;Xiaowen Liu;Jiankang Zhang;Xiaowu Dong;Wenhai Huang;Yongzhou Hu
  • 通讯作者:
    Yongzhou Hu
Finding Additive Biclusters with Random Background ( Extended Abstract )
寻找具有随机背景的加性双簇(扩展摘要)
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Jing Xiao;Lusheng Wang;Xiaowen Liu;Tao Jiang
  • 通讯作者:
    Tao Jiang
CCN3 (NOV) regulates proliferation, adhesion, migration and invasion in clear cell renal cell carcinoma.
CCN3 (NOV) 调节透明细胞肾细胞癌的增殖、粘附、迁移和侵袭。
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    2.9
  • 作者:
    Shuai Liu;Zheng Liu;Dongbin Bi;X. Yuan;Xiaowen Liu;S. Ding;Jiaju Lu;Z. Niu
  • 通讯作者:
    Z. Niu
SPIDER : Reconstructive Protein Homology Search with De Novo Sequencing Tags
SPIDER:使用 De Novo 测序标签进行重建蛋白质同源性搜索
  • DOI:
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Xiaowen Liu;Yonghua Han
  • 通讯作者:
    Yonghua Han

Xiaowen Liu的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似国自然基金

二维铁电MOS场效应管的存算逻辑建模及其代数系统研究
  • 批准号:
    62304115
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
离子辐照精准调控SnS2栅极敏感材料缺陷密度增强碳基FET型气体传感器性能的研究
  • 批准号:
    12305330
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
GaN基芯片场效应管异质结亚十纳米空间热输运机理研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    54 万元
  • 项目类别:
    面上项目
基于离子敏感场效应管和微纳孔道的三维电荷传感系统研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    53 万元
  • 项目类别:
    面上项目
基于平面浮栅FET及脉冲电场传感调控的室温氢气传感研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Collaborative Research: FET: Small: Reservoir Computing with Ion-Channel-Based Memristors
合作研究:FET:小型:基于离子通道忆阻器的储层计算
  • 批准号:
    2403559
  • 财政年份:
    2024
  • 资助金额:
    $ 9.92万
  • 项目类别:
    Standard Grant
Collaborative Research: FET: Small: Algorithmic Self-Assembly with Crisscross Slats
合作研究:FET:小型:十字交叉板条的算法自组装
  • 批准号:
    2329908
  • 财政年份:
    2024
  • 资助金额:
    $ 9.92万
  • 项目类别:
    Standard Grant
Collaborative Research: FET: Small: Algorithmic Self-Assembly with Crisscross Slats
合作研究:FET:小型:十字交叉板条的算法自组装
  • 批准号:
    2329909
  • 财政年份:
    2024
  • 资助金额:
    $ 9.92万
  • 项目类别:
    Standard Grant
Collaborative Research: FET: Small: Reservoir Computing with Ion-Channel-Based Memristors
合作研究:FET:小型:基于离子通道忆阻器的储层计算
  • 批准号:
    2403560
  • 财政年份:
    2024
  • 资助金额:
    $ 9.92万
  • 项目类别:
    Standard Grant
Collaborative Research: FET: Medium:Compact and Energy-Efficient Compute-in-Memory Accelerator for Deep Learning Leveraging Ferroelectric Vertical NAND Memory
合作研究:FET:中型:紧凑且节能的内存计算加速器,用于利用铁电垂直 NAND 内存进行深度学习
  • 批准号:
    2312886
  • 财政年份:
    2023
  • 资助金额:
    $ 9.92万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了