Data-driven Computational Modeling and Refinement of Protein Structures on Genomic Scales
数据驱动的计算建模和基因组尺度蛋白质结构的细化
基本信息
- 批准号:10707069
- 负责人:
- 金额:$ 38.45万
- 依托单位:
- 依托单位国家:美国
- 项目类别:
- 财政年份:2020
- 资助国家:美国
- 起止时间:2020-09-15 至 2025-07-31
- 项目状态:未结题
- 来源:
- 关键词:AccelerationAlgorithmsAmino Acid SequenceAutomobile DrivingBasic ScienceBioinformaticsBiologyCollaborationsCommunitiesComplexComputational BiologyComputer ModelsComputer softwareDarknessDataDatabasesDevelopmentDiseaseDrug DesignFamilyFosteringGenomicsHealthHomology ModelingHumanInfrastructureLaboratoriesMedicineMethodsModelingMolecularMolecular BiologyMolecular ConformationMolecular DiseaseNational Institute of General Medical SciencesPlayProtein FamilyProteinsProteomeResearchResearch PersonnelResolutionStructureSupercomputingTechniquesUnderrepresented Populationsbiological systemsdeep learningdrug discoverygenome-wideimprovedmembernext generationnovelprogramsprotein foldingprotein structureprotein structure predictionpublic databaserestrainttraining opportunityweb server
项目摘要
PROJECT SUMMARY/ABSTRACT:
A key remaining gap in our understanding of biological systems at the molecular level is how to structurally
annotate the “dark” protein families—the portion of protein families unsolved by experimental structure
determination techniques and inaccessible to homology modeling. Nearly a quarter of protein families are
currently dark, where molecular conformation is completely unknown and this gap is likely to expand further
with the rapid accumulation of new protein sequences without annotated structures. The key challenge is now
how to bridge this gap to gain a comprehensive understanding of biology and disease, thereby paving the way
to structure-based drug design at genomic scale. Computational protein modeling plays a key role in this effort
due to its scalability and genome-wide applicability. My laboratory focuses on the development and application
of novel data-driven computational modeling and refinement methods to increase accuracy and coverage of
protein structure prediction on genomic scale irrespective of homology. Future research focuses on improving
homology-free protein folding using multiscale de novo modeling driven by deep learning-based inter-residue
interactions, enhancing low-homology threading or fold recognition by formulating new algorithms for remote
template identification despite low evolutionary relatedness, and developing methods for high-resolution
restrained structure refinement guided by generalized ensemble search for driving computational models to
near-experimental accuracy. Proteome-wide computational modeling and refinement effort will be conducted,
leveraging our unique access to large-scale supercomputing infrastructure, to build high-confidence models
covering the dark protein families, which will be organized in a database for public access. This comprehensive
database of structural annotations will shed light on the structures, functions, and interactions of the dark
proteome, with broad implications in drug discovery and human health. Software and web servers will be freely
disseminated to help worldwide community of biomedical researchers to apply these methods to their specific
research problems, thus multiplying the impact of computational modeling on basic research in biology and
medicine. My research program will involve close collaborations with other NIGMS-supported investigators,
create training opportunities for the next generation of researchers including members from underrepresented
groups, and foster future research advances in structural bioinformatics and computational biology.
项目概要/摘要:
我们在分子水平上对生物系统的理解中仍然存在的一个关键差距是如何在结构上
注释“暗”蛋白质家族——实验结构未解决的蛋白质家族部分
近四分之一的蛋白质家族无法进行测定技术和同源建模。
目前处于黑暗状态,分子构象完全未知,并且这种差距可能会进一步扩大
随着没有注释结构的新蛋白质序列的快速积累,现在的关键挑战是。
如何弥合这一差距,获得对生物学和疾病的全面了解,从而铺平道路
基因组规模的基于结构的药物设计在这项工作中发挥着关键作用。
由于其可扩展性和全基因组适用性,我的实验室专注于开发和应用。
新颖的数据驱动计算建模和细化方法,以提高准确性和覆盖范围
基因组规模的蛋白质结构预测,无论同源性如何,未来的研究重点是改进。
使用基于深度学习的残基间驱动的多尺度从头建模进行无同源蛋白质折叠
通过制定新的远程算法来增强低同源性线程或折叠识别
尽管进化相关性较低,但仍可进行模板识别,并开发高分辨率方法
由广义集成搜索引导的约束结构细化,用于驱动计算模型
将进行接近实验的准确性的蛋白质组计算建模和细化工作,
利用我们对大规模超级计算基础设施的独特访问权限,构建高可信度模型
涵盖暗蛋白质家族,这些蛋白质将被组织在一个数据库中供公众访问。
结构注释数据库将揭示黑暗的结构、功能和相互作用
对药物发现和人类健康具有广泛影响的蛋白质组软件和网络服务器将免费开放。
传播以帮助全球生物医学研究人员将这些方法应用于他们的特定领域
研究问题,从而倍增计算模型对生物学和基础研究的影响
我的研究计划将涉及与其他 NIGMS 支持的研究人员的密切合作,
为下一代研究人员(包括代表性不足的成员)创造培训机会
组,并促进结构生物信息学和计算生物学的未来研究进展。
项目成果
期刊论文数量(16)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Structural bioinformatics DisCovER: distance-based covariational threading for weakly homologous proteins
结构生物信息学 DisCovER:弱同源蛋白的基于距离的协变线程
- DOI:10.1016/j.cemconres.2014.05.007
- 发表时间:2024-09-13
- 期刊:
- 影响因子:11.4
- 作者:Sutanu Bhattacharya;Rahmatullah Roche;Debswapna Bhattacharya
- 通讯作者:Debswapna Bhattacharya
lociPARSE: a locality-aware invariant point attention model for scoring RNA 3D structures.
lociPARSE:一种用于对 RNA 3D 结构进行评分的局部感知不变点注意力模型。
- DOI:
- 发表时间:2024-07-11
- 期刊:
- 影响因子:0
- 作者:Tarafder S;Bhattacharya D
- 通讯作者:Bhattacharya D
DeepRefiner: high-accuracy protein structure refinement by deep network calibration.
DeepRefiner:通过深度网络校准进行高精度蛋白质结构细化。
- DOI:
- 发表时间:2021-07-02
- 期刊:
- 影响因子:14.9
- 作者:Shuvo, Md Hossain;Gulfam, Muhammad;Bhattacharya, Debswapna
- 通讯作者:Bhattacharya, Debswapna
EquiPNAS: improved protein-nucleic acid binding site prediction using protein-language-model-informed equivariant deep graph neural networks.
EquiPNAS:使用蛋白质语言模型通知的等变深度图神经网络改进蛋白质-核酸结合位点预测。
- DOI:
- 发表时间:2023-09-16
- 期刊:
- 影响因子:0
- 作者:Roche, Rahmatullah;Moussad, Bernard;Shuvo, Md Hossain;Tarafder, Sumit;Bhattacharya, Debswapna
- 通讯作者:Bhattacharya, Debswapna
PolyFold: An interactive visual simulator for distance-based protein folding.
PolyFold:基于距离的蛋白质折叠的交互式视觉模拟器。
- DOI:
- 发表时间:2020
- 期刊:
- 影响因子:3.7
- 作者:McGehee, Andrew J;Bhattacharya, Sutanu;Roche, Rahmatullah;Bhattacharya, Debswapna
- 通讯作者:Bhattacharya, Debswapna
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Debswapna Bhattacharya其他文献
Debswapna Bhattacharya的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Debswapna Bhattacharya', 18)}}的其他基金
Data-driven Computational Modeling and Refinement of Protein Structures on Genomic Scales
数据驱动的计算建模和基因组尺度蛋白质结构的细化
- 批准号:
10456948 - 财政年份:2020
- 资助金额:
$ 38.45万 - 项目类别:
Data-driven Computational Modeling and Refinement of Protein Structures on Genomic Scales
数据驱动的计算建模和基因组尺度蛋白质结构的细化
- 批准号:
10029150 - 财政年份:2020
- 资助金额:
$ 38.45万 - 项目类别:
Data-driven Computational Modeling and Refinement of Protein Structures on Genomic Scales
数据驱动的计算建模和基因组尺度蛋白质结构的细化
- 批准号:
10604529 - 财政年份:2020
- 资助金额:
$ 38.45万 - 项目类别:
相似国自然基金
基于肿瘤病理图片的靶向药物敏感生物标志物识别及统计算法的研究
- 批准号:82304250
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
多模态高层语义驱动的深度伪造检测算法研究
- 批准号:62306090
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
高精度海表反照率遥感算法研究
- 批准号:42376173
- 批准年份:2023
- 资助金额:51 万元
- 项目类别:面上项目
基于新型深度学习算法和多组学研究策略鉴定非编码区剪接突变在肌萎缩侧索硬化症中的分子机制
- 批准号:82371878
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
基于深度学习与水平集方法的心脏MR图像精准分割算法研究
- 批准号:62371156
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
相似海外基金
Proteasomal recruiters of PAX3-FOXO1 Designed via Sequence-Based Generative Models
通过基于序列的生成模型设计的 PAX3-FOXO1 蛋白酶体招募剂
- 批准号:
10826068 - 财政年份:2023
- 资助金额:
$ 38.45万 - 项目类别:
Integrative deep learning algorithms for understanding protein sequence-structure-function relationships: representation, prediction, and discovery
用于理解蛋白质序列-结构-功能关系的集成深度学习算法:表示、预测和发现
- 批准号:
10712082 - 财政年份:2023
- 资助金额:
$ 38.45万 - 项目类别:
Method development for simultaneous automatic assignment and structure determination in protein NMR
蛋白质 NMR 中同时自动分配和结构测定的方法开发
- 批准号:
10700808 - 财政年份:2022
- 资助金额:
$ 38.45万 - 项目类别:
Computational design of novel protein binders based on structure mining and learning from data
基于结构挖掘和数据学习的新型蛋白质结合剂的计算设计
- 批准号:
10541909 - 财政年份:2020
- 资助金额:
$ 38.45万 - 项目类别:
Towards Accurate Protein Structure Predictions with SAXS Technology (TAPESTRY)
利用 SAXS 技术 (TAPESTRY) 实现准确的蛋白质结构预测
- 批准号:
10624898 - 财政年份:2020
- 资助金额:
$ 38.45万 - 项目类别: