Novel Use of Genome Information to Understand Mutations

利用基因组信息来理解突变的新方法

基本信息

  • 批准号:
    10661834
  • 负责人:
  • 金额:
    $ 46.5万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2021
  • 资助国家:
    美国
  • 起止时间:
    2021-09-13 至 2026-06-30
  • 项目状态:
    未结题

项目摘要

There are significant advantages from translating genome sequences into proteins, where there is a large body of accumulated knowledge regarding their relationships among sequence, structure and function. Advances in genome sequencing are producing a deluge of data that can be used to train and test prediction methods to identify the characteristics of various mutants by building atop the large functional protein data. Clinicians need to know the functional behavior of mutants - whether they are neutral or deleterious - whether they affect protein structure – whether they affect protein dynamics - whether they affect protein binding specificity. Protein structures have local environments for each amino acid in the sequence, and usually amino acids at each position are compatible with their local environment. This leads to strongly correlated amino acids as manifested in the multiple sequence alignments. This project will combine protein sequence and structure data together with amino acid properties and their correlations to characterize each site in the protein structure to investigate the hypothesis that outliers in the distributions over the important amino acid properties for each position will negatively impact functionality, i.e. they will be deleterious mutants. The project will drill down deeply to learn what is the nature of the impaired mechanism. Two diverse approaches will be taken in the two aims: Aim 1 will investigate the amino acid property distributions to identify the properties that best characterize each position in the sequence and structure, and determine how the outliers negatively impact the functional structures, dynamics and binding characteristics. Preliminary results show that the deleterious mutants usually have a significantly broader range of single amino acid properties for the deleterious mutants. Data from these analyses will be fed into Aim 2 where two type of machine learning approaches – Extreme Learning Machines and Random Forests will be jointly applied. Preliminary results show that incorporating just one amino acid property yields significant gains over existing methods. One of the major strengths of this project is that results from the two Aims will be exchanged frequently to achieve improved predictions for both approaches. The project builds on the long experience of the PIs in datamining from protein structures and sequences, as well as previous machine learning applications. Important potential outcomes include a more reliable, more informed understanding of how mutants affect function. In addition, the project aims to predict connections of mutants to specific diseases. The results of the project will be important for drug development, because the specific part of the protein where function is impaired will be identified, to allow drug developers to narrow their focus onto more limited parts of a protein that is targeted for drug design. The predictors established by this project will also have the potential to screen for large numbers of previously unknown mutations that could be used to identify specific regions of a protein structure susceptible to further disease-related mutations.
从将基因组序列转换为蛋白质,有很大的优势,那里有一个大物体 关于它们在序列,结构和功能之间关系的积累知识。进步 基因组测序正在产生大量数据,这些数据可用于训练和测试预测方法 通过在大型功能蛋白数据上构建各种突变体的特征。临床医生 需要知道突变体的功能行为 - 无论它们是中性还是有害的 - 它们是否影响 蛋白质结构 - 是否影响蛋白质动力学 - 它们是否影响蛋白质结合特异性。 蛋白质结构在序列中具有每个氨基酸的局部环境,通常在 每个位置都与他们的本地环境兼容。这导致强烈相关的氨基酸作为 在多个序列比对中表现出来。该项目将结合蛋白质序列和结构数据 以及氨基酸特性及其相关性,以表征蛋白质结构中的每个位点与 调查以下假设:每个都在分布中的分布在每个重要氨基酸特性上的异常值 位置将对功能产生负面影响,即它们将被删除突变体。该项目将钻探 两种潜水员的方法将在两者中采取 目的:AIM 1将研究氨基酸性质分布,以识别最能表征的特性 序列和结构中的每个位置,并确定异常值如何对功能产生负面影响 结构,动力学和结合特征。初步结果表明,通常已删除的突变体 对于有害突变体的单个氨基酸性质的范围明显较宽。这些数据 分析将被馈入目标2,其中两种机器学习方法 - 极限学习机器 并将共同应用随机森林。初步结果表明,仅掺入一个氨基酸 财产对现有方法产生了可观的收益。该项目的主要优势之一是结果 从这两个目标中将经常交换,以实现两种方法的改进预测。这 项目基于PI的长期经验,从蛋白质结构和序列中的数据进行研究中 作为以前的机器学习应用程序。重要的潜在结果包括一个更可靠,更多的结果 了解突变体如何影响功能的了解。此外,该项目旨在预测 特定疾病的突变体。该项目的结果对于药物开发将很重要,因为 将确定功能受损的蛋白质的特定部分,以允许药物开发人员缩小其范围 专注于针对药物设计的蛋白质的更多有限部分。由此建立的预测因素 项目还有可能筛选大量以前未知的突变 用于鉴定蛋白质结构的特定区域,易受与疾病相关的突变的影响。

项目成果

期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Exploration of Potential Ewing Sarcoma Drugs from FDA-Approved Pharmaceuticals through Computational Drug Repositioning, Pharmacogenomics, Molecular Docking, and MD Simulation Studies.
  • DOI:
    10.1021/acsomega.2c00518
  • 发表时间:
    2022-06-14
  • 期刊:
  • 影响因子:
    4.1
  • 作者:
    Hassan, Mubashir;Yasir, Muhammad;Shahzadi, Saba;Kloczkowski, Andrzej
  • 通讯作者:
    Kloczkowski, Andrzej
JSONWP: a static website generator for protein bioinformatics research.
  • DOI:
    10.1093/bioadv/vbad154
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Coarse-graining protein structures into their dynamic communities with DCI, a dynamic community identifier.
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

ROBERT L JERNIGAN其他文献

ROBERT L JERNIGAN的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('ROBERT L JERNIGAN', 18)}}的其他基金

Novel Use of Genome Information to Understand Mutations
利用基因组信息来理解突变的新方法
  • 批准号:
    10488281
  • 财政年份:
    2021
  • 资助金额:
    $ 46.5万
  • 项目类别:
Novel Use of Genome Information to Understand Mutations
利用基因组信息来理解突变的新方法
  • 批准号:
    10303852
  • 财政年份:
    2021
  • 资助金额:
    $ 46.5万
  • 项目类别:
Modeling Ribosomal Control, Function and Assembly
核糖体控制、功能和组装建模
  • 批准号:
    7290378
  • 财政年份:
    2006
  • 资助金额:
    $ 46.5万
  • 项目类别:
Modeling Ribosomal Control, Function and Assembly
核糖体控制、功能和组装建模
  • 批准号:
    7486144
  • 财政年份:
    2006
  • 资助金额:
    $ 46.5万
  • 项目类别:
Modeling Ribosomal Control, Function and Assembly
核糖体控制、功能和组装建模
  • 批准号:
    7681539
  • 财政年份:
    2006
  • 资助金额:
    $ 46.5万
  • 项目类别:
Modeling Ribosomal Control, Function and Assembly
核糖体控制、功能和组装建模
  • 批准号:
    7149659
  • 财政年份:
    2006
  • 资助金额:
    $ 46.5万
  • 项目类别:
Coarse-Grained Models of Proteins
蛋白质的粗粒度模型
  • 批准号:
    6914431
  • 财政年份:
    2004
  • 资助金额:
    $ 46.5万
  • 项目类别:
Coarse-Grained Models of Proteins
蛋白质的粗粒度模型
  • 批准号:
    6829176
  • 财政年份:
    2004
  • 资助金额:
    $ 46.5万
  • 项目类别:
Coarse-Grained Models of Proteins
蛋白质的粗粒度模型
  • 批准号:
    8209105
  • 财政年份:
    2004
  • 资助金额:
    $ 46.5万
  • 项目类别:
Coarse-Grained Models of Proteins
蛋白质的粗粒度模型
  • 批准号:
    7254261
  • 财政年份:
    2004
  • 资助金额:
    $ 46.5万
  • 项目类别:

相似国自然基金

海洋缺氧对持久性有机污染物入海后降解行为的影响
  • 批准号:
    42377396
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
氮磷的可获得性对拟柱孢藻水华毒性的影响和调控机制
  • 批准号:
    32371616
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
还原条件下铜基催化剂表面供-受电子作用表征及其对CO2电催化反应的影响
  • 批准号:
    22379027
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
CCT2分泌与内吞的机制及其对毒性蛋白聚集体传递的影响
  • 批准号:
    32300624
  • 批准年份:
    2023
  • 资助金额:
    10 万元
  • 项目类别:
    青年科学基金项目
在轨扰动影响下空间燃料电池系统的流动沸腾传质机理与抗扰控制研究
  • 批准号:
    52377215
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目

相似海外基金

Cellular Mechanisms of Neuroligin-4 Gene in Human Neurons
Neuroligin-4 基因在人类神经元中的细胞机制
  • 批准号:
    10367707
  • 财政年份:
    2022
  • 资助金额:
    $ 46.5万
  • 项目类别:
Cellular Mechanisms of Neuroligin-4 Gene in Human Neurons
Neuroligin-4 基因在人类神经元中的细胞机制
  • 批准号:
    10552576
  • 财政年份:
    2022
  • 资助金额:
    $ 46.5万
  • 项目类别:
Novel Use of Genome Information to Understand Mutations
利用基因组信息来理解突变的新方法
  • 批准号:
    10488281
  • 财政年份:
    2021
  • 资助金额:
    $ 46.5万
  • 项目类别:
Novel Use of Genome Information to Understand Mutations
利用基因组信息来理解突变的新方法
  • 批准号:
    10303852
  • 财政年份:
    2021
  • 资助金额:
    $ 46.5万
  • 项目类别:
A poly-omic study of the molecular mechanisms underlying maternal diet interventions for offspring obesity and NAFLD
母亲饮食干预对后代肥胖和 NAFLD 分子机制的多组学研究
  • 批准号:
    9903288
  • 财政年份:
    2017
  • 资助金额:
    $ 46.5万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了