COMPUTER ANALYSIS OF LOW-COMPLEXITY AMINO ACID SEQUENCES

低复杂性氨基酸序列的计算机分析

基本信息

  • 批准号:
    3845113
  • 负责人:
  • 金额:
    --
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
  • 资助国家:
    美国
  • 起止时间:
  • 项目状态:
    未结题

项目摘要

Computer methods were developed to define, classify and analyze all segments of protein sequences of improbably low compositional complexity. These include residue clusters of predominantly one or a few amino acid types, which commonly contain homopolymeric tracts or mosaics of these, aperiodic patterns and sections of low-period repeats. The abundance of these segments in sequence databases was determined and their properties were related to evidence of biological functions. A. Methods: Different formal definitions of local compositional complexity were developed to permit unbiassed identification of low-complexity segments, irrespective of their specific residue clustering or repeat patterns. Algorithms were developed and refined for optimal partitioning of sequences into segments of low and high complexity. Various statistical properties of the segments were used as optimization and classification heuristics and were tuned to (a) select segments for further study and (b) filter out non-informative segments prior to database searches. B. Abundance and biological properties: Using a relatively stringent complexity threshold, approximately 15% of the residues in protein databases are in low-complexity segments of typical lengths 15-50 amino acids, and approximately 40% of proteins contain one or more such segments. They are highly abundant in many eukaryotic proteins crucial in morphogenesis and embryonic development, transcriptional regulation, signal transduction and aspects of cellular and extracellular structural integrity and interactions. The sequences show diverse molecular interactions and tend to evolve rapidly. Significance of project: The project has highlighted the high abundance and biological importance of low-complexity protein segments and emphasized the relative lack of knowledge of their molecular structure and dynamics. The new computer methods are enhancing sequence database searches and analysis.
开发了计算机方法来定义,分类和分析所有 不可能低组成复杂性的蛋白质序列的片段。 其中包括主要的一个或几个氨基酸的残留簇 类型通常包含均聚糖区或镶嵌物的类型, 低周期重复序列的基本模式和部分。丰富的 确定了序列数据库中的这些段,并将其属性 与生物学功能的证据有关。 A.方法:当地构图的不同形式定义 开发了复杂性,以允许公正地识别 低复杂性段,无论其特定残留集群不管 或重复模式。开发并完善算法以获得最佳 将序列划分为低复杂性和高复杂性段。 各个段的各种统计特性用作优化 和分类启发式方法,并调整为(a)选择的部分 进一步的研究和(b)在 数据库搜索。 B.丰度和生物学特性:使用相对严格的 复杂性阈值,大约15%的蛋白质残基 数据库处于典型长度15-50氨基的低复杂性段 酸,大约40%的蛋白质含有一个或多个此类蛋白质 细分市场。 它们在许多至关重要的真核蛋白中很丰富 形态发生和胚胎发育,转录调控, 信号转导和细胞外结构的各个方面 完整性和互动。序列显示分子多样 相互作用并倾向于迅速发展。 项目的意义:该项目强调了很高的丰度 低复杂性蛋白段的生物学重要性和 强调了对其分子结构的相对缺乏知识和 动力学。新的计算机方法正在增强序列数据库 搜索和分析。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

J WOOTTON其他文献

J WOOTTON的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('J WOOTTON', 18)}}的其他基金

INCREASED SENSITIVITY OF COMPUTER ANALYSES OF LARGE GENOMES
提高大基因组计算机分析的灵敏度
  • 批准号:
    3845115
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
SUBTLE SEQUENCE PATTERNS IN DNA-BINDING COMPLEXES
DNA 结合复合物中的微妙序列模式
  • 批准号:
    3781283
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
MOLECULAR NOVELTY AND CONSERVATION IN BACTERIAL PROTEIN SEQUENCES
细菌蛋白质序列的分子新颖性和保守性
  • 批准号:
    3781269
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
COMPUTER ANALYSIS OF LOW-COMPLEXITY AMINO ACID SEQUENCES
低复杂性氨基酸序列的计算机分析
  • 批准号:
    3759306
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
COMPUTER ANALYSIS OF LOW-COMPLEXITY AMINO ACID AND NUCLEOTIDE SEQUENCES
低复杂性氨基酸和核苷酸序列的计算机分析
  • 批准号:
    5203621
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
MOLECULAR NOVELTY AND CONSERVATION IN BACTERIAL PROTEIN SEQUENCES
细菌蛋白质序列的分子新颖性和保守性
  • 批准号:
    3845114
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
DNA SEQUENCE COMPLEXITY AND MUTATIONAL DYNAMICS
DNA 序列复杂性和突变动力学
  • 批准号:
    3781282
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
DNA SEQUENCE COMPLEXITY AND MUTATIONAL DYNAMICS
DNA 序列复杂性和突变动力学
  • 批准号:
    3759318
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
SUBTLE SEQUENCE PATTERNS IN DNA-BINDING COMPLEXES
DNA 结合复合物中的微妙序列模式
  • 批准号:
    3759319
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
MOLECULAR NOVELTY AND CONSERVATION IN BACTERIAL PROTEIN SEQUENCES
细菌蛋白质序列的分子新颖性和保守性
  • 批准号:
    5203622
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:

相似国自然基金

基于CUDA异构平台的大规模高精度药物-靶标相互作用预测研究
  • 批准号:
    61702444
  • 批准年份:
    2017
  • 资助金额:
    28.0 万元
  • 项目类别:
    青年科学基金项目
基于氨基酸序列及药物化合物分子指纹的药物-靶标相互作用预测研究
  • 批准号:
    61572506
  • 批准年份:
    2015
  • 资助金额:
    64.0 万元
  • 项目类别:
    面上项目

相似海外基金

Proteomics
蛋白质组学
  • 批准号:
    8350782
  • 财政年份:
    2011
  • 资助金额:
    --
  • 项目类别:
PROTEOMICS
蛋白质组学
  • 批准号:
    8180951
  • 财政年份:
    2010
  • 资助金额:
    --
  • 项目类别:
Proteomics Facility
蛋白质组学设施
  • 批准号:
    7945027
  • 财政年份:
    2009
  • 资助金额:
    --
  • 项目类别:
Cellular and Molecular Biology Core
细胞和分子生物学核心
  • 批准号:
    7647692
  • 财政年份:
    2009
  • 资助金额:
    --
  • 项目类别:
Pathogenesis of Ovarian Serous Borderline Tumors
卵巢浆液性交界性肿瘤的发病机制
  • 批准号:
    7386056
  • 财政年份:
    2007
  • 资助金额:
    --
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了