Statistical methods for higher order dependences to understand protein functions

用于了解蛋白质功能的高阶依赖性统计方法

基本信息

  • 批准号:
    10492723
  • 负责人:
  • 金额:
    $ 20.33万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2021
  • 资助国家:
    美国
  • 起止时间:
    2021-09-23 至 2024-08-31
  • 项目状态:
    已结题

项目摘要

This proposal brings together a strong team from molecular science and statistics to tackle the important problem of how to integrate protein structure and sequence information in complex systems. Some of the most important characteristics of these data are the strong correlations buried within them, with the pairwise correlations in the sequence data already being routinely used to predict structural contacts. Here, we are developing novel ways to use huge data sets to extract higher-order dependences, which are now possible with the availability of the large volumes of sequence data from genomics; and in addition, in the molecular structures such higher-order dependences are directly observable in the protein structures where groups of amino acids interact directly. Importantly, these higher-order dependences reflect the dense physical environment in the cell that requires for proper statistical characterization. A new model free information-theoretic measure is introduced to quantify the higher-order dependences, which serves as the central method in this project. By identifying the major challenges in drawing statistical inference based on this measure, we develop, evaluate, and improve a new statistical inference and computational framework for analyses of higher-order dependences with discrete data of a general type, motivated by the protein multiple sequence data. The new computationally efficient framework makes it possible to discover reliable higher-order dependences with the ability of quantifying uncertainty. The preliminary data here combine the information from sequences and structures to yield unexpected results that immediately relate to the dynamics of the protein structures. The outcome is an entirely new approach to handle the large volumes of protein sequence data and other omics data now available and the enormous volumes about to arrive on the doorsteps of omics analysts.
该提案汇集了一个来自分子科学和统计数据的强大团队,以应对重要的团队 如何在复杂系统中整合蛋白质结构和序列信息的问题。一些 这些数据的最重要特征是埋在其中的强相关性,与 序列数据中的成对相关性已经通常用于预测结构接触。这里, 我们正在开发新颖的方法来使用巨大的数据集来提取高阶依赖性,而现在 可能会从基因组学中获得大量序列数据的可用性;此外,在 分子结构在蛋白质结构中可以直接观察到这种高阶依赖性 氨基酸组直接相互作用。重要的是,这些高阶依赖性反映了密集 细胞中需要正确统计表征的物理环境。免费的新型号 引入了信息理论措施以量化高阶依赖性,这作为 该项目的中心方法。通过确定基于统计推断的主要挑战 我们开发,评估和改进了新的统计推断和计算框架 用于用一般类型的离散数据的高阶依赖分析,由蛋白质促进 多个序列数据。新的计算高效框架使发现可靠 高阶依赖性具有量化不确定性的能力。这里的初步数据结合了 来自序列和结构的信息,产生意外的结果,这些结果立即与 蛋白质结构的动力学。结果是处理大量大量的全新方法 现在可用的蛋白质序列数据和其他OMIC数据以及即将到达的大量卷 OMICS分析师的大门。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Wen Zhou其他文献

Wen Zhou的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Wen Zhou', 18)}}的其他基金

ConProject-001
ConProject-001
  • 批准号:
    10707337
  • 财政年份:
    2021
  • 资助金额:
    $ 20.33万
  • 项目类别:
ConProject-001
ConProject-001
  • 批准号:
    10492724
  • 财政年份:
    2021
  • 资助金额:
    $ 20.33万
  • 项目类别:
Statistical methods for higher order dependences to understand protein functions
用于了解蛋白质功能的高阶依赖性统计方法
  • 批准号:
    10378307
  • 财政年份:
    2021
  • 资助金额:
    $ 20.33万
  • 项目类别:
Statistical methods for higher order dependences to understand protein functions
用于了解蛋白质功能的高阶依赖性统计方法
  • 批准号:
    10707332
  • 财政年份:
    2021
  • 资助金额:
    $ 20.33万
  • 项目类别:
ConProject-002
ConProject-002
  • 批准号:
    10492725
  • 财政年份:
    2021
  • 资助金额:
    $ 20.33万
  • 项目类别:
ConProject-002
ConProject-002
  • 批准号:
    10707338
  • 财政年份:
    2021
  • 资助金额:
    $ 20.33万
  • 项目类别:

相似国自然基金

基于氨基酸序列及药物化合物分子指纹的药物-靶标相互作用预测研究
  • 批准号:
    61572506
  • 批准年份:
    2015
  • 资助金额:
    64.0 万元
  • 项目类别:
    面上项目
基于氨基酸序列协同进化编码的蛋白质热点残基预测
  • 批准号:
    61300058
  • 批准年份:
    2013
  • 资助金额:
    27.0 万元
  • 项目类别:
    青年科学基金项目
基于数字化氨基酸序列研究无晶体结构的酪氨酸激酶抑制剂作用的活性位点
  • 批准号:
    81001423
  • 批准年份:
    2010
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
肠三叶因子受体cDNA的筛选、受体蛋白氨基酸序列分析及结构预测
  • 批准号:
    30570844
  • 批准年份:
    2005
  • 资助金额:
    26.0 万元
  • 项目类别:
    面上项目
基于氨基酸序列的高效专一HIV-1整合酶抑制剂的设计、合成和评估
  • 批准号:
    30200351
  • 批准年份:
    2002
  • 资助金额:
    25.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Cerebral infarction treatment strategy using collagen-like "triple helix peptide" containing functional amino acid sequence
含功能氨基酸序列的类胶原“三螺旋肽”治疗脑梗塞策略
  • 批准号:
    23K06972
  • 财政年份:
    2023
  • 资助金额:
    $ 20.33万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Establishment of a screening method for functional microproteins independent of amino acid sequence conservation
不依赖氨基酸序列保守性的功能性微生物蛋白筛选方法的建立
  • 批准号:
    23KJ0939
  • 财政年份:
    2023
  • 资助金额:
    $ 20.33万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
Effects of amino acid sequence and lipids on the structure and self-association of transmembrane helices
氨基酸序列和脂质对跨膜螺旋结构和自缔合的影响
  • 批准号:
    19K07013
  • 财政年份:
    2019
  • 资助金额:
    $ 20.33万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Construction of electron-transfer amino acid sequence probe with an interaction for protein and cell
蛋白质与细胞相互作用的电子转移氨基酸序列探针的构建
  • 批准号:
    16K05820
  • 财政年份:
    2016
  • 资助金额:
    $ 20.33万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Development of artificial antibody of anti-bitter taste receptor using random amino acid sequence library
利用随机氨基酸序列库开发抗苦味受体人工抗体
  • 批准号:
    16K08426
  • 财政年份:
    2016
  • 资助金额:
    $ 20.33万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了