Machine learning of biomolecular interactions and the human signaling networks they comprise

生物分子相互作用及其组成的人类信号网络的机器学习

基本信息

项目摘要

My lab will use machine learning to build physically-grounded models of biomolecules and their interactions and apply these models at proteome (genome) scale to address basic questions in the systems biology of human signaling. On the modeling front, our efforts will focus on building computational models of protein-ligand interactions, with a specific emphasis on post-translationally modified ligands that cells widely employ in signaling networks. I hypothesize that a step change in accuracy and generality of protein-ligand interaction models is possible using deep learning advances in protein structure prediction and protein representation learning. My lab has been at the forefront of these advances, having developed the first end-to-end differentiable model of protein structure prediction (RGN); the first protein language model (UniRep), a key technique for learning mathematical representations that capture chemical, structural, and evolutionary properties of proteins; and one of the first deep learning methods for protein-protein interactions (HSM). We will leverage our expertise in these domains to predict protein-ligand interactions based on both sequence and structure information. We will further develop specialized models for predicting protein structures and alternate protein conformations for the purpose of predicting protein-ligand interaction, using these predictions as inputs for our protein-ligand interaction models. On the biological front, we will employ these machine-learned models to assemble person-specific signaling networks to understand how normal allelic variation is manifested at the level of signaling networks, and how these networks are perturbed in human diseases. To study general variation in signaling networks, we will use exome sequences (UK Biobank and NHLBI TOPMed) to build individualized networks that map person-specific protein sequences to protein-ligand affinities. We will quantify how network topology varies among individuals and populations and test whether disease-associated traits correlate with topology. We will also compare networks of healthy and disease-afflicted persons to identify topological differences that predispose individuals to genetic diseases. Ultimately, I expect machine-learned models to be sufficiently predictive of ligand binding that mechanistic understanding of pathway rewiring by mutations is possible. While my focus will be computational, I expect to carry out close collaborations—with the Fordyce Lab (Stanford) to experimentally characterize and validate protein-ligand interactions and the Shen Lab (Columbia) to perform statistical genetic analyses—to exploit synergies at the interface of computation and experimentation.
我的实验室将使用机器学习来构建生物分子及其相互作用的物理模型 在蛋白质组(基因组)规模上应用这些模型来解决人类系统生物学中的基本问题 在建模方面,我们的工作重点是建立蛋白质配体的计算模型。 相互作用,特别强调细胞广泛用于信号传导的翻译后修饰配体 我认为蛋白质-配体相互作用模型的准确性和通用性发生了重大变化。 利用蛋白质结构预测和蛋白质表示学习方面的深度学习进展成为可能。 实验室一直处于这些进步的最前沿,开发了第一个端到端可微分模型 蛋白质结构预测(RGN);第一个蛋白质语言模型(UniRep),学习的关键技术 捕获蛋白质的化学、结构和进化特性的数学表示; 我们将利用我们在这些领域的专业知识。 我们将进一步基于序列和结构信息来预测蛋白质-配体相互作用。 为此目的开发专门的模型来预测蛋白质结构和替代蛋白质构象 预测蛋白质-配体相互作用,使用这些预测作为我们的蛋白质-配体相互作用模型的输入。 在生物学方面,我们将利用这些机器学习模型来组装特定于人的信号 网络来了解正常等位基因变异如何在信号网络水平上表现出来,以及如何 为了研究信号网络的一般变化,我们将使用这些网络。 外显子组序列(英国生物银行和 NHLBI TOPMed)用于构建映射个人特异性的个性化网络 我们将量化个体之间网络拓扑的变化。 和人群并测试疾病相关特征是否与拓扑相关。我们还将进行比较。 健康人和受疾病影响的人的网络,以确定易受个体影响的拓扑差异 最终,我希望机器学习模型能够充分预测配体结合。 对突变重新布线的机制的理解是可能的,而我的重点是。 在计算方面,我希望与福代斯实验室(斯坦福大学)进行密切合作,进行实验 表征并验证蛋白质-配体相互作用,并由 Shen Lab(哥伦比亚)进行统计遗传学 分析——利用计算和实验界面的协同作用。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Mohammed Nazar AlQuraishi其他文献

Mohammed Nazar AlQuraishi的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似国自然基金

抗原非特异性B细胞进入生发中心并实现亲和力成熟的潜力与调控机制
  • 批准号:
    32370941
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
面向免疫疗法标志物识别的基于多特征融合的肽与MHC亲和力预测研究
  • 批准号:
    62302277
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于胞内蛋白亲和力标记策略进行新型抗类风湿性关节炎的选择性OGG1小分子抑制剂的发现
  • 批准号:
    82304698
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于计算生物学技术小分子农兽药残留物驼源单域抗体虚拟筛选与亲和力成熟 -以内蒙古阿拉善双峰驼为例
  • 批准号:
    32360190
  • 批准年份:
    2023
  • 资助金额:
    34 万元
  • 项目类别:
    地区科学基金项目
DNA四面体限域辅助的高亲和力铅笔芯微电极用于早期癌症精准诊断研究
  • 批准号:
    22304062
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

TNFRSF13B polymorphisms and immunity to transplantation
TNFRSF13B 多态性与移植免疫
  • 批准号:
    10734879
  • 财政年份:
    2023
  • 资助金额:
    $ 41.13万
  • 项目类别:
Characterization of Tagged Type IV Collagen
标记的 IV 型胶原蛋白的表征
  • 批准号:
    10724541
  • 财政年份:
    2023
  • 资助金额:
    $ 41.13万
  • 项目类别:
Dopaminergic mechanisms of resilience to Alzheimer's disease neuropathology
阿尔茨海默病神经病理学恢复的多巴胺能机制
  • 批准号:
    10809199
  • 财政年份:
    2023
  • 资助金额:
    $ 41.13万
  • 项目类别:
Tumor cell instrinsic DNA damage signaling to the immune response
肿瘤细胞内在 DNA 损伤向免疫反应发出信号
  • 批准号:
    10626282
  • 财政年份:
    2023
  • 资助金额:
    $ 41.13万
  • 项目类别:
Investigating Cis and Trans Regulation of Complex Phenotypes
研究复杂表型的顺式和反式调节
  • 批准号:
    10644267
  • 财政年份:
    2023
  • 资助金额:
    $ 41.13万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了