从蛋白质序列识别连续与不连续结构域的方法研究
项目介绍
AI项目解读
基本信息
- 批准号:61772217
- 项目类别:面上项目
- 资助金额:50.0万
- 负责人:
- 依托单位:
- 学科分类:F0213.生物信息计算与数字健康
- 结题年份:2021
- 批准年份:2017
- 项目状态:已结题
- 起止时间:2018-01-01 至2021-12-31
- 项目参与者:薛志东; 张琼; 夏梦轩; 许微; 汪健; 吕尧; 肖旭文; 成鹏; 彭珂;
- 关键词:
项目摘要
Domain is a fundamental unit of protein structure, folding, function, evolution and design. It is very important to solve protein structure and function prediction. Recent domain annotation mainly depends on highly homologous templates and solved 3D structure. However,only 46.8% protein sequences in UniProt have domain annotations according to the latest data. ThreaDomEX developed by us recently performs better than traditional methods. But it is far from practical application for the protein sequences with bad templates. This project propose a new method by combination of deep learning and multi-threadings to detect domain boundaries. We propose to detect the discontinuous domains based on graph and segment assembling and construction of a more complete domain database of typical model organisms. Furthermore, we will verify the prediction results with X-ray data and the method of I-TASSER-MR. The implementation of the project will improve the domain annotation of the protein sequences of model organisms in the UniProt database.
结构域是蛋白质折叠、功能、进化和设计的基本单位,对蛋白质结构解析、功能注释具有重要意义。但蛋白质序列数据库UniProt只对其中46.8%的序列进行了结构域注释,其原因是当前结构域注释主要依赖近同源比对或已知蛋白质三级结构。申请人等近期开发的ThreaDomEX较以往结构域识别方法有明显优势,但对较难找到高质量远同源模板的蛋白质序列的识别,距离实际应用还有较大距离。本项目拟综合利用新兴的深度学习算法与基于远同源比对方法的优势,开发从序列预测蛋白质结构域的新方法;探索基于图模型和基于序列组装与对称比对的两种不连续结构域检测的新方法;并综合利用X-ray衍射等实验数据和I-TASSER-MR等计算方法,对预测结果进行验证;构建更全面的典型模式生物的蛋白质结构域数据库供研究者使用。本项目的顺利实施将有望大幅提高UniProt中模式生物蛋白质序列结构域注释的比例。
结项摘要
结构域是蛋白质的一个结构层次, 可以看作是蛋白质结构、折叠、功能、进化和设计的基本单位。根据PDB数据库统计,已知结构蛋白质中约40%为多结构域蛋白。结构域的不同组合使多结构域蛋白质具有不同的三级结构并具有不同的功能。准确识别蛋白质结构域对结构基因组学选择目标序列、结构解析至关重要,也是预测和理解蛋白质功能关键的一步。本项目的主要研究内容是蛋白质结构域边界预测、不连续结构域检测、结构域功能注释和构建模式生物蛋白质结构域数据库。在该项目的资助下,申请人与团队开发了基于卷积神经网络结构域边界预测方法DNN-Dom,我们在casp9-casp12数据集上将DNN-Dom与另外三种当时最好的基于机器学习的结构域预测方法DOMpro、PPRODO与DROP进行了对比,结果显示对于单多结构域分类,DNN-Dom在所有这些数据集中都取得了最高的MCC值,同时DNN-Dom在casp9-casp12数据集上进行结构域边界预测的NDO-score值分别为0.867、0.896、0.849和0.873,DBD-score的值分别为0.802、0.838、0.741和0.796,在比较的四种方法中都取得了最高值。最近我们进一步改进了DNN-Dom,开发了基于残差网络和迁移学习预测结构域的方法Res-Dom,进一步提高了单多结构域分类准确性和结构域边界预测性能。尽管DNN-Dom和ResDom在结构域边界划分性能优异,但是不能检测不连续结构域,不连续结构域检测是结构域检测中的难题之一,因此我们利用预测的蛋白质残基接触图,开发基于目标检测的不连续结构域检测方法,在性能上优于当时最好的能预测不连续结构域的工具ThreaDom。此外我们还基于深度卷积神经网络与深度循环神经网络模型构建了预测结构域功能的工具DeepDomGO。综合上述工具的开发,我们对Uniprot数据库中没有结构域注释的人类与八种模式生物的126043条蛋白序列进行了结构域注释,并搭建了结构域数据库网站MOPDdb。
项目成果
期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
pmTM-align: scalable pairwise and multiple structure alignment with Apache Spark and OpenMP.
pmTM-align:使用 Apache Spark 和 OpenMP 进行可扩展的成对和多重结构对齐
- DOI:10.1186/s12859-020-03757-2
- 发表时间:2020-09-29
- 期刊:BMC bioinformatics
- 影响因子:3
- 作者:Chen W;Yao C;Guo Y;Wang Y;Xue Z
- 通讯作者:Xue Z
DNN-Dom: predicting protein domain boundary from sequence alone by deep neural network
DNN-Dom:通过深度神经网络仅根据序列预测蛋白质域边界。
- DOI:10.1093/bioinformatics/btz464
- 发表时间:2019-12-15
- 期刊:BIOINFORMATICS
- 影响因子:5.8
- 作者:Shi, Qiang;Chen, Weiya;Xue, Zhidong
- 通讯作者:Xue, Zhidong
Deep learning for mining protein data
用于挖掘蛋白质数据的深度学习。
- DOI:10.1093/bib/bbz156
- 发表时间:2021-01-01
- 期刊:BRIEFINGS IN BIOINFORMATICS
- 影响因子:9.5
- 作者:Shi, Qiang;Chen, Weiya;Xue, Zhidong
- 通讯作者:Xue, Zhidong
蛋白质结构域划分方法及在线服务综述
- DOI:--
- 发表时间:2019
- 期刊:广州大学学报(自然科学版)
- 影响因子:--
- 作者:王燕;石强;薛志东
- 通讯作者:薛志东
StraPep: a structure database of bioactive peptides.
StraPep:生物活性肽的结构数据库
- DOI:10.1093/database/bay038
- 发表时间:2018-01-01
- 期刊:Database : the journal of biological databases and curation
- 影响因子:--
- 作者:Wang J;Yin T;Xiao X;He D;Xue Z;Jiang X;Wang Y
- 通讯作者:Wang Y
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
V型墩连续刚构桥0号块空间应力分析及优化设计
- DOI:10.3969/j.issn.1002-0268.2019.11.008
- 发表时间:2019
- 期刊:公路交通科技
- 影响因子:--
- 作者:张飞;黄福云;王燕
- 通讯作者:王燕
中老年女性血清铁蛋白(SF)水平与年龄和体质指数(BMI)之间的关系的流行病学研究(英文)
- DOI:10.13241/j.cnki.pmb.2016.16.026
- 发表时间:2016
- 期刊:现代生物医学进展
- 影响因子:--
- 作者:贾茹;王燕;马爱国;郭郡;孙晓岚;张冠军;张华琦
- 通讯作者:张华琦
常规超声及甲状腺球蛋白检测诊断甲状腺滤泡癌的价值
- DOI:10.19732/j.cnki.2096-6210.2019.01.001
- 发表时间:2019
- 期刊:肿瘤影像学
- 影响因子:--
- 作者:瞿嫣慧;王燕;李艺;吴琼;刘亦伦
- 通讯作者:刘亦伦
基于模型参考自适应的异步电机转速辨识新方法研究
- DOI:10.13462/j.cnki.mmtamt.2019.06.024
- 发表时间:2019
- 期刊:组合机床与自动化加工技术
- 影响因子:--
- 作者:江松秦;董绍江;蔡巍巍;胡宇;王燕;张潇汀
- 通讯作者:张潇汀
Effects of 7-nitroindazole, a selective neural nitric oxide synthase inhibitor, on context-shock associative learning in a two-process contextual fear conditioning paradigm
7-硝基吲唑(一种选择性神经一氧化氮合酶抑制剂)对双过程情境恐惧调节范式中情境休克联想学习的影响
- DOI:10.1016/j.nlm.2016.07.033
- 发表时间:2016-10
- 期刊:Neurobiol Learn Mem
- 影响因子:--
- 作者:王燕;王夏青;袁加锦;李鸣
- 通讯作者:李鸣
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
王燕的其他基金
致密核心大囊泡分泌的系统生物学研究
- 批准号:30700162
- 批准年份:2007
- 资助金额:19.0 万元
- 项目类别:青年科学基金项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}