Computer Analysis Of Low-complexity Amino Acid And Nucleotide Sequences

低复杂性氨基酸和核苷酸序列的计算机分析

基本信息

  • 批准号:
    8149593
  • 负责人:
  • 金额:
    $ 29.38万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
  • 资助国家:
    美国
  • 起止时间:
  • 项目状态:
    未结题

项目摘要

We are investigating segments of protein and nucleotide sequences that show compositional bias and raise several challenges for computational analysis. We develop methods to help to understand the structural, functional and evolutionary significance of these regions and their pathology. The sequences include local low complexity regions or domains, including conformationally mobile or intrinsically unstructured regions of proteins, and tandemly-repeated sequences. Further problems arise from more generally distributed amino acid content biases that can reflect directional mutation pressures at the genomic level and constraints specific to protein or domain function. Low complexity regions comprise a large proportion of the genome-encoded amino acids, and may contain homopolymeric tracts or mosaics of a few amino acids, or repeated patterns, frequently subtle, including those typical of many non-globular domains and dynamic or intrinsically unstructured segments of proteins. We have developed mathematical definitions and algorithms to define and identify regions of compositional bias, and to discover and analyze properties of these regions relevant to their structures, interactions, and evolution. Local regions of low complexity and tandemly repeated amino acid sequences occur in many proteins involved in cellular differentiation and embryonic development, RNA processing, transcriptional regulation, signal transduction and aspects of cellular and extracellular structural integrity. Segments of proteins are commonly non-globular, intrinsically unstructured, or conformationally mobile: however, knowledge of the molecular structures and dynamics of these domains is still very limited. They are generally relatively intractable to investigation by crystallography and NMR, and they still account for less than 1% of the residues in 3-dimensional structural databases. Current computer methods based on molecular mechanics and dynamics have given inconsistent results when applied to low-complexity amino acid sequences. Accordingly, we are experimenting with ab initio quantum chemical methods to investigate the ensembles of conformational states accessible to these regions of proteins. As specific examples to motivate this development, we are investigating amino acid sequence repeats of malaria parasites with possible roles in immune evasion as components of malaria vaccines. A related problem is compositional bias that can affect not only local segments but is distributed generally over the entire genome or proteins of an organism. This is shown, for example, by the biases in codons or proteins encoded by very AT-rich or GC-rich genomes including those of several important infectious disease organisms. Such variation and bias in genome-wide amino acid and nucleotide compositions raise problems for several commonly used sequence analysis algorithms. Accordingly, current research with Stephen Altschul and Yi-Kuo Yu is developing the theoretical foundation and implementation of these algorithms further in ways that include an improved treatment of background frequencies.
我们正在研究蛋白质和核苷酸序列的片段,这些序列显示出组成偏差并为计算分析带来了一些挑战。 我们开发了帮助了解这些区域及其病理的结构,功能和进化意义的方法。 这些序列包括局部低复杂性区域或域,包括蛋白质的构象移动或本质上的非结构化区域以及串联重复的序列。 进一步的问题是由更普遍的分布的氨基酸含量偏见引起的,这些氨基酸含量偏见可以反映基因组水平上的方向突变压力以及特定于蛋白质或结构域功能的约束。 低复杂性区域包括很大一部分基因组编码的氨基酸,并且可能包含几种氨基酸或重复模式的均聚糖区或镶嵌物,通常是微妙的,包括许多非全球域的典型型号,以及蛋白质的非整体域或固有非结构性片段。我们已经开发了数学定义和算法来定义和确定组成偏差的区域,并发现和分析与它们的结构,相互作用和进化相关的这些区域的属性。低复杂性和串联重复的氨基酸序列的局部区域发生在许多参与细胞分化和胚胎发育,RNA处理,转录调控,信号转导以及细胞外结构完整性方面的蛋白质中。蛋白质的片段通常是非整体,本质上非结构化或构象移动的:但是,对这些域的分子结构和动力学的了解仍然非常有限。它们通常与晶体学和NMR的研究相对棘手,并且在3维结构数据库中仍然不到1%的残基。 当应用于低复杂性氨基酸序列时,基于分子力学和动力学的当前计算机方法给出了不一致的结果。 因此,我们正在尝试量子化学方法,以研究这些蛋白质区域可访问的构象状态的集合。 作为激励这种发展的具体例子,我们正在研究疟疾寄生虫的氨基酸序列重复序列,在免疫逃避中可能作用为疟疾疫苗的成分。 一个相关的问题是组成偏差,不仅可以影响局部细分,而且通常在生物体的整个基因组或蛋白质上分布。 例如,由非常丰富或富含GC的基因组(包括几种重要的感染性疾病生物的基因组)所编码的密码子或蛋白质的偏见显示了这一点。 全基因组氨基酸和核苷酸组成的这种变异和偏差引起了几种常用序列分析算法的问题。 因此,目前对Stephen Altschul和Yi-Kuo Yu的研究正在以包括改进的背景频率处理的方式进一步发展这些算法的理论基础和实施。

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
The construction and use of log-odds substitution scores for multiple sequence alignment.
  • DOI:
    10.1371/journal.pcbi.1000852
  • 发表时间:
    2010-07-15
  • 期刊:
  • 影响因子:
    4.3
  • 作者:
    Altschul SF;Wootton JC;Zaslavsky E;Yu YK
  • 通讯作者:
    Yu YK
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

JOHN C. WOOTTON其他文献

JOHN C. WOOTTON的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('JOHN C. WOOTTON', 18)}}的其他基金

COMPUTER ANALYSIS OF SEQUENCES FROM MICROORGANISMS
微生物序列的计算机分析
  • 批准号:
    6111061
  • 财政年份:
  • 资助金额:
    $ 29.38万
  • 项目类别:
Computational Biology and Genetics Of Malaria Parasites
疟疾寄生虫的计算生物学和遗传学
  • 批准号:
    6681329
  • 财政年份:
  • 资助金额:
    $ 29.38万
  • 项目类别:
Computational Biology and Genetics Of Malaria and Toxoplasma Parasites
疟疾和弓形虫寄生虫的计算生物学和遗传学
  • 批准号:
    7969203
  • 财政年份:
  • 资助金额:
    $ 29.38万
  • 项目类别:
Computational Biology and Genetics Of Malaria and Toxopl
疟疾和弓形虫的计算生物学和遗传学
  • 批准号:
    7316231
  • 财政年份:
  • 资助金额:
    $ 29.38万
  • 项目类别:
Computational Biology and Genetics Of Malaria Parasites
疟疾寄生虫的计算生物学和遗传学
  • 批准号:
    6988451
  • 财政年份:
  • 资助金额:
    $ 29.38万
  • 项目类别:
Computer Analysis Of Low-complexity Amino Acid And Nucle
低复杂性氨基酸和核酸的计算机分析
  • 批准号:
    7316230
  • 财政年份:
  • 资助金额:
    $ 29.38万
  • 项目类别:
Computational Biology and Genetics Of Malaria Parasites
疟疾寄生虫的计算生物学和遗传学
  • 批准号:
    6843563
  • 财政年份:
  • 资助金额:
    $ 29.38万
  • 项目类别:
Computer Analysis Of Low-complexity Amino Acid And Nucleotide Sequences
低复杂性氨基酸和核苷酸序列的计算机分析
  • 批准号:
    7735065
  • 财政年份:
  • 资助金额:
    $ 29.38万
  • 项目类别:
Analysis-Low-complexity Amino Acid-Nucleotide Sequences
低复杂性氨基酸-核苷酸序列分析
  • 批准号:
    7148025
  • 财政年份:
  • 资助金额:
    $ 29.38万
  • 项目类别:
Computer Analysis Of Low-complexity Amino Acid And Nucleotide Sequences
低复杂性氨基酸和核苷酸序列的计算机分析
  • 批准号:
    7594457
  • 财政年份:
  • 资助金额:
    $ 29.38万
  • 项目类别:

相似国自然基金

基于微观仿真的城市交通宏观基本图特性研究
  • 批准号:
    11672289
  • 批准年份:
    2016
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
新医改多重政策实施背景下基本药物可及性评价:指标及方法的建立与实证
  • 批准号:
    71473170
  • 批准年份:
    2014
  • 资助金额:
    63.0 万元
  • 项目类别:
    面上项目
国家基本药物制度对医疗服务利用与药品合理使用的长期影响追踪研究
  • 批准号:
    71273016
  • 批准年份:
    2012
  • 资助金额:
    55.0 万元
  • 项目类别:
    面上项目
组合恒等式的研究
  • 批准号:
    11226295
  • 批准年份:
    2012
  • 资助金额:
    3.0 万元
  • 项目类别:
    数学天元基金项目
Ti-Al合金系的基本原子团序列和亚稳相高温结构材料的设计
  • 批准号:
    50471058
  • 批准年份:
    2004
  • 资助金额:
    25.0 万元
  • 项目类别:
    面上项目

相似海外基金

Reinventing dN/dS and the study of natural selection
重塑 dN/dS 和自然选择的研究
  • 批准号:
    10535021
  • 财政年份:
    2022
  • 资助金额:
    $ 29.38万
  • 项目类别:
Discovery of Novel Autism-Associated Variation in Brain Miniproteins
发现大脑微蛋白中与自闭症相关的新变异
  • 批准号:
    10574820
  • 财政年份:
    2022
  • 资助金额:
    $ 29.38万
  • 项目类别:
Novel Carbohydrate-binding Antibodies to Human Glycans Using the Lamprey System
使用 Lamprey 系统开发针对人类聚糖的新型碳水化合物结合抗体
  • 批准号:
    10454419
  • 财政年份:
    2021
  • 资助金额:
    $ 29.38万
  • 项目类别:
Development of a Fully Enzymatic Oligonucleotide Synthesis Cycle by Engineered Template Independent Polymerases and a Novel Phosphate dNTP Blocking Group
通过工程模板独立聚合酶和新型磷酸 dNTP 封闭基团开发全酶促寡核苷酸合成循环
  • 批准号:
    10201535
  • 财政年份:
    2021
  • 资助金额:
    $ 29.38万
  • 项目类别:
Selecting HA glycosylation for improved vaccine responses
选择 HA 糖基化以改善疫苗反应
  • 批准号:
    10298131
  • 财政年份:
    2021
  • 资助金额:
    $ 29.38万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了