蛋白质残基间相互作用预测算法研究及其在三级结构预测中的应用
项目介绍
AI项目解读
基本信息
- 批准号:31770775
- 项目类别:面上项目
- 资助金额:60.0万
- 负责人:
- 依托单位:
- 学科分类:C0504.物理生物学
- 结题年份:2021
- 批准年份:2017
- 项目状态:已结题
- 起止时间:2018-01-01 至2021-12-31
- 项目参与者:郑伟谋; 孔鲁鹏; 鞠富松; 朱建伟; 魏国正; 张琪; 李艳博; 曹晓然; 王冰;
- 关键词:
项目摘要
A protein is generally composed of a sequence of amino acids connected by peptide bonds. Under the interactions among amino acids, proteins will spontaneously fold into specific tertiary structures in nature environment. Thus, the accurate prediction of residue-residue contacts is fatally important to protein structure prediction as well as understanding of protein functionalities. . This proposal aims at the accurate prediction of residue-residue contacts from protein sequence. We plan to investigate the relationship between protein sequence and protein structure in the joint space of “sequence-structure-evolution”, and design prediction algorithms based on biological insights. Specifically, we plan to develop the following prediction algorithms: .1..To reduce the noise generated in the evolutionary process, we design a “low rank and sparsity” approach to decompose residue-residue correlation matrix. .2..To make multiple-sequence alignment consistent with residue-residue contacts, we design a re-alignment algorithm to optimize multiple-sequence alignment. .3..To better approximate joint likelihood of Markov random field, we propose to use composite-likelihood instead of pseudo-likelihood. .4..As an application of the predicted residue-residue contacts, we propose to recognize protein fold type based on the similarity of predicted contact patterns. We plan to develop a deep convolutionary neural network to achieve this objective. . These studies will promote the prediction of protein structure. In addition, these algorithms would also facilitate research in the field of natural language process, as the essence of both natural languages and proteins is the formation of complex structure from sequence.
蛋白质是由残基连接而成的长链。残基间的相互作用引导蛋白质折叠成特定的空间结构,以行使生物学功能。因此,准确预测残基相互作用,将有助于认识蛋白质结构和功能。.本课题研究残基相互作用预测问题。研究思路是:“在序列-结构-进化联合空间中考察序列与结构之间的关联关系,基于生物学观察设计统计模型和预测算法”。研究内容包括:(1)设计残基间相关性矩阵的低秩稀疏分解算法,以降低进化噪声的影响;(2)设计考虑相互作用的“迭代重比对”算法,以提高多序列联配与残基相互作用的一致性,并降低对联配中序列条数的要求;(3)设计“复合似然”模型,显式刻画残基间相互作用;和伪似然相比,复合似然是马尔科夫随机场模型的更优近似,且更契合预测相互作用这一目标,从而可提高预测精度;(4)采用深度学习技术,从预测出的残基相互作用中抽取折叠型相关信息,提高折叠型识别精度。.上述算法将集成于已有软件平台中,提供结构预测服务。
结项摘要
本课题研究残基相互作用预测问题,采用“在序列-结构-进化联合空间中考察序列与结构之间的关联关系,基于生物学观察设计统计模型和预测算法”的研究思路,取得了如下成果:.(1)提出了直接处理 MSA 数据的神经网络Seq-SetNet。Seq-SetNet 由两个关 键模块组成:) 编码器模块,该模块采用多序列联配作为输入,为每个残基编码 成上下文相关的残基突变特征。) 聚合器模块从所有同源序列中提取特征,然后 将这些特征进一步转换为包含结构属性的特征。编码器模块会自动学习有效的 特征从而避免了人工的特征工程。由于聚合器模块使用了对称函数,Seq-SetNet 将同源蛋白作为集合进行处理,使其预测结果不会随这些蛋白质的顺序变化。在 广泛使用的基准测试集上,Seq-SetNet 在蛋白质二级结构预测和扭转角预测任务上都有显著的提高。 .(2)提出了直接从 MSA 预测蛋白质残基间距离的神经网络CopulaNet。大多数残基间距离预测方法采用间接的策略,即从MSA中人工提取特征,进而用神经网络来推断;但这种间接策略无法充分利用MSA携带的信息。我们提出了一种端到端的深度神经网络 CopulaNet,可以直接从 MSA 估计残基间距离。 CopulaNet 的关键部分包括:)用于为每个残基建模上下文相关突变信息的编码 器;)用来建模残基共进化的聚合器。在 CASP13 目标蛋白质上,CopulaNet 在预测结构的质量和效率有显著改进。 .(3)提出了基于距离的快速蛋白质折叠方法FFD。准确的残基间距离预测 让从头预测蛋白质结构更加可靠并高效。已有的方法通常将蛋白质结构用内坐 标表示,使得残基间距离很难高效的并行计算。使用全原子的笛卡尔坐标又导致太大的自由度,增大搜索空间。我们提出了一个基于残基间距离的蛋白质折叠方法,该方法可以高度并行化并且支持在 GPU 设备上运算。为了平衡并行效率和搜索空间,我们使用姿态来表示每个残基,在基本不增加搜索空间的同时,显著提升并行度。实验结果表明FFD相比 trRosetta 速度提升100倍。.(4)研制了蛋白质结构预测预测软件ProFOLD和ProALIGN,其中ProFOLD性能超过AlphaFold,正努力赶超AlphaFold2。ProALIGN采用深度学习技术学习“联配模体”,进而准确预测蛋白质联配。
项目成果
期刊论文数量(11)
专著数量(0)
科研奖励数量(0)
会议论文数量(1)
专利数量(0)
CopulaNet: Learning residue co-evolution directly from multiple sequence alignment for protein structure prediction
CopulaNet:直接从多序列比对中学习残基协同进化以进行蛋白质结构预测
- DOI:10.1101/2020.10.06.327585
- 发表时间:2020-10
- 期刊:Nature Communications
- 影响因子:16.6
- 作者:Fusong Ju;Lupeng Kong;Wei-Mou Zheng;Jianwei Zhu;Tie-Yan Liu;Bin Shao;Dongbo Bu
- 通讯作者:Dongbo Bu
FALCON2: a web server for high-quality prediction of protein tertiary structures.
FALCON2:用于高质量蛋白质三级结构预测的网络服务器
- DOI:10.1186/s12859-021-04353-8
- 发表时间:2021-09-15
- 期刊:BMC bioinformatics
- 影响因子:3
- 作者:Kong L;Ju F;Zhang H;Sun S;Bu D
- 通讯作者:Bu D
DIFFUSE: predicting isoform functions from sequences and expression profiles via deep learning
DIFFUSE:通过深度学习从序列和表达谱预测异构体功能
- DOI:10.1093/bioinformatics/btz367
- 发表时间:2019-07-15
- 期刊:BIOINFORMATICS
- 影响因子:5.8
- 作者:Chen, Hao;Shaw, Dipan;Jiang, Tao
- 通讯作者:Jiang, Tao
Constructing effective energy functions for protein structure prediction through broadening attraction-basin and reverse Monte Carlo sampling
通过扩大吸引力盆地和反向蒙特卡罗采样构建有效的能量函数来预测蛋白质结构
- DOI:10.1186/s12859-019-2652-5
- 发表时间:2019-03
- 期刊:BMC Bioinformatics
- 影响因子:3
- 作者:Wang Chao;Wei Yi;Zhang Haicang;Kong Lupeng;Sun Shiwei;Zheng Wei-Mou;Bu Dongbo
- 通讯作者:Bu Dongbo
ISSEC: inferring contacts among protein secondary structure elements using deep object detection.
ISSEC:使用深度对象检测推断蛋白质二级结构元素之间的联系
- DOI:10.1186/s12859-020-03793-y
- 发表时间:2020-11-05
- 期刊:BMC bioinformatics
- 影响因子:3
- 作者:Zhang Q;Zhu J;Ju F;Kong L;Sun S;Zheng WM;Bu D
- 通讯作者:Bu D
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
结合原初能量函数的归范法蛋白结构预测
- DOI:--
- 发表时间:--
- 期刊:BMC Bioinformatics
- 影响因子:3
- 作者:王晟;邵明复;卜东波;郑伟谋
- 通讯作者:郑伟谋
面向多核体系结构的并行多模式串匹配算法
- DOI:--
- 发表时间:--
- 期刊:JOURNAL OF COMPUTER SCIENCE AND TECHNOLOGY
- 影响因子:0.7
- 作者:刘燕兵;刘萍;卜东波;谭光明
- 通讯作者:谭光明
基于局部茎搜索的RNA 二级结构预测算法
- DOI:--
- 发表时间:--
- 期刊:生物化学与生物物理进展
- 影响因子:--
- 作者:陈翔;张法;高文;卜东波
- 通讯作者:卜东波
正则表达式分组的1/(1-1/k)-近似算法
- DOI:--
- 发表时间:2012
- 期刊:软件学报
- 影响因子:--
- 作者:柳厅文;孙永;卜东波;郭莉;方滨兴
- 通讯作者:方滨兴
串联质谱寡糖结构鉴定方法综述
- DOI:--
- 发表时间:--
- 期刊:生物化学与生物物理进展
- 影响因子:--
- 作者:张敬玮;高枫;卜东波;孙世伟
- 通讯作者:孙世伟
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
卜东波的其他基金
针对单序列/多域蛋白质的蛋白质结构从头预测算法研究与软件研制
- 批准号:
- 批准年份:2022
- 资助金额:54 万元
- 项目类别:面上项目
蛋白质结构模体识别及结构预测算法研究
- 批准号:61272318
- 批准年份:2012
- 资助金额:80.0 万元
- 项目类别:面上项目
基于随机图模型的蛋白质三级结构预测算法研究
- 批准号:30800168
- 批准年份:2008
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}