Computer Analysis Of Low-complexity Amino Acid And Nucleotide Sequences

低复杂性氨基酸和核苷酸序列的计算机分析

基本信息

  • 批准号:
    7969201
  • 负责人:
  • 金额:
    $ 26.72万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
  • 资助国家:
    美国
  • 起止时间:
  • 项目状态:
    未结题

项目摘要

We are investigating segments of protein and nucleotide sequences that show compositional bias and raise several challenges for computational analysis. We develop methods to help to understand the structural, functional and evolutionary significance of these regions and their pathology. The sequences include local low complexity regions or domains, including conformationally mobile or intrinsically unstructured regions of proteins, and tandemly-repeated sequences. Further problems arise from more generally distributed amino acid content biases that can reflect directional mutation pressures at the genomic level and constraints specific to protein or domain function. Low complexity regions comprise a large proportion of the genome-encoded amino acids, and may contain homopolymeric tracts or mosaics of a few amino acids, or repeated patterns, frequently subtle, including those typical of many non-globular domains and dynamic or intrinsically unstructured segments of proteins. We have developed mathematical definitions and algorithms to define and identify regions of compositional bias, and to discover and analyze properties of these regions relevant to their structures, interactions, and evolution. Local regions of low complexity and tandemly repeated amino acid sequences occur in many proteins involved in cellular differentiation and embryonic development, RNA processing, transcriptional regulation, signal transduction and aspects of cellular and extracellular structural integrity. Segments of proteins are commonly non-globular, intrinsically unstructured, or conformationally mobile: however, knowledge of the molecular structures and dynamics of these domains is still very limited. They are generally relatively intractable to investigation by crystallography and NMR, and they still account for less than 1% of the residues in 3-dimensional structural databases. Current computer methods based on molecular mechanics and dynamics have given inconsistent results when applied to low-complexity amino acid sequences. Accordingly, we are experimenting with ab initio quantum chemical methods to investigate the ensembles of conformational states accessible to these regions of proteins. As specific examples to motivate this development, we are investigating amino acid sequence repeats of malaria parasites with possible roles in immune evasion as components of malaria vaccines. A related problem is compositional bias that can affect not only local segments but is distributed generally over the entire genome or proteins of an organism. This is shown, for example, by the biases in codons or proteins encoded by very AT-rich or GC-rich genomes including those of several important infectious disease organisms. Such variation and bias in genome-wide amino acid and nucleotide compositions raise problems for several commonly used sequence analysis algorithms. Accordingly, current research with Stephen Altschul and Yi-Kuo Yu is developing the theoretical foundation and implementation of these algorithms further in ways that include an improved treatment of background frequencies.
我们正在研究蛋白质和核苷酸序列的片段,这些序列显示出组成偏差并为计算分析带来了一些挑战。 我们开发了帮助了解这些区域及其病理的结构,功能和进化意义的方法。 这些序列包括局部低复杂性区域或域,包括蛋白质的构象移动或本质上的非结构化区域以及串联重复的序列。 进一步的问题是由更普遍的分布的氨基酸含量偏见引起的,这些氨基酸含量偏见可以反映基因组水平上的方向突变压力以及特定于蛋白质或结构域功能的约束。 低复杂性区域包括很大一部分基因组编码的氨基酸,并且可能包含几种氨基酸或重复模式的均聚糖区或镶嵌物,通常是微妙的,包括许多非全球域的典型型号,以及蛋白质的非整体域或固有非结构性片段。我们已经开发了数学定义和算法来定义和确定组成偏差的区域,并发现和分析与它们的结构,相互作用和进化相关的这些区域的属性。低复杂性和串联重复的氨基酸序列的局部区域发生在许多参与细胞分化和胚胎发育,RNA处理,转录调控,信号转导以及细胞外结构完整性方面的蛋白质中。蛋白质的片段通常是非整体,本质上非结构化或构象移动的:但是,对这些域的分子结构和动力学的了解仍然非常有限。它们通常与晶体学和NMR的研究相对棘手,并且在3维结构数据库中仍然不到1%的残基。 当应用于低复杂性氨基酸序列时,基于分子力学和动力学的当前计算机方法给出了不一致的结果。 因此,我们正在尝试量子化学方法,以研究这些蛋白质区域可访问的构象状态的集合。 作为激励这种发展的具体例子,我们正在研究疟疾寄生虫的氨基酸序列重复序列,在免疫逃避中可能作用为疟疾疫苗的成分。 一个相关的问题是组成偏差,不仅可以影响局部细分,而且通常在生物体的整个基因组或蛋白质上分布。 例如,由非常丰富或富含GC的基因组(包括几种重要的感染性疾病生物的基因组)所编码的密码子或蛋白质的偏见显示了这一点。 全基因组氨基酸和核苷酸组成的这种变异和偏差引起了几种常用序列分析算法的问题。 因此,目前对Stephen Altschul和Yi-Kuo Yu的研究正在以包括改进的背景频率处理的方式进一步发展这些算法的理论基础和实施。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

JOHN C. WOOTTON其他文献

JOHN C. WOOTTON的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('JOHN C. WOOTTON', 18)}}的其他基金

COMPUTER ANALYSIS OF SEQUENCES FROM MICROORGANISMS
微生物序列的计算机分析
  • 批准号:
    6111061
  • 财政年份:
  • 资助金额:
    $ 26.72万
  • 项目类别:
Computational Biology and Genetics Of Malaria Parasites
疟疾寄生虫的计算生物学和遗传学
  • 批准号:
    6681329
  • 财政年份:
  • 资助金额:
    $ 26.72万
  • 项目类别:
Computational Biology and Genetics Of Malaria and Toxopl
疟疾和弓形虫的计算生物学和遗传学
  • 批准号:
    7316231
  • 财政年份:
  • 资助金额:
    $ 26.72万
  • 项目类别:
Computational Biology and Genetics Of Malaria and Toxoplasma Parasites
疟疾和弓形虫寄生虫的计算生物学和遗传学
  • 批准号:
    7969203
  • 财政年份:
  • 资助金额:
    $ 26.72万
  • 项目类别:
Computational Biology and Genetics Of Malaria Parasites
疟疾寄生虫的计算生物学和遗传学
  • 批准号:
    6988451
  • 财政年份:
  • 资助金额:
    $ 26.72万
  • 项目类别:
Computer Analysis Of Low-complexity Amino Acid And Nucle
低复杂性氨基酸和核酸的计算机分析
  • 批准号:
    7316230
  • 财政年份:
  • 资助金额:
    $ 26.72万
  • 项目类别:
Computational Biology and Genetics Of Malaria Parasites
疟疾寄生虫的计算生物学和遗传学
  • 批准号:
    6843563
  • 财政年份:
  • 资助金额:
    $ 26.72万
  • 项目类别:
Computer Analysis Of Low-complexity Amino Acid And Nucleotide Sequences
低复杂性氨基酸和核苷酸序列的计算机分析
  • 批准号:
    7735065
  • 财政年份:
  • 资助金额:
    $ 26.72万
  • 项目类别:
Analysis-Low-complexity Amino Acid-Nucleotide Sequences
低复杂性氨基酸-核苷酸序列分析
  • 批准号:
    7148025
  • 财政年份:
  • 资助金额:
    $ 26.72万
  • 项目类别:
Computer Analysis Of Low-complexity Amino Acid And Nucleotide Sequences
低复杂性氨基酸和核苷酸序列的计算机分析
  • 批准号:
    7594457
  • 财政年份:
  • 资助金额:
    $ 26.72万
  • 项目类别:

相似国自然基金

环境治理目标下的公司财务、会计和审计行为研究
  • 批准号:
    72332002
  • 批准年份:
    2023
  • 资助金额:
    165.00 万元
  • 项目类别:
    重点项目
信用信息共享机制对企业会计稳健性、风险行为决策以及失信后果的影响研究
  • 批准号:
    72302198
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
套期会计有效性的研究:实证检验及影响机制
  • 批准号:
    72302225
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
新证券法对证券审计市场格局和会计师事务所行为策略的影响研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
新证券法对证券审计市场格局和会计师事务所行为策略的影响研究
  • 批准号:
    72202176
  • 批准年份:
    2022
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Delineating the functional impact of recurrent repeat expansions in ALS using integrative multiomic analysis
使用综合多组学分析描述 ALS 中反复重复扩增的功能影响
  • 批准号:
    10776994
  • 财政年份:
    2023
  • 资助金额:
    $ 26.72万
  • 项目类别:
Multifunctional Nanoparticle Platform to Prevent Alcohol-Associated HCC Development
多功能纳米颗粒平台可预防酒精相关的 HCC 发展
  • 批准号:
    10736984
  • 财政年份:
    2023
  • 资助金额:
    $ 26.72万
  • 项目类别:
Epigenomic Drivers of EBV Epithelial Cancers
EB 病毒上皮癌的表观基因组驱动因素
  • 批准号:
    10627690
  • 财政年份:
    2023
  • 资助金额:
    $ 26.72万
  • 项目类别:
PRC1-dependent H2A Monoubiquitination During Human Corticogenesis
人类皮质生成过程中 PRC1 依赖性 H2A 单泛素化
  • 批准号:
    10604561
  • 财政年份:
    2023
  • 资助金额:
    $ 26.72万
  • 项目类别:
Subchondral Trabecular Plate and Rod Abnormalities in Human Osteoarthritis
人类骨关节炎的软骨下小梁板和杆异常
  • 批准号:
    10660605
  • 财政年份:
    2023
  • 资助金额:
    $ 26.72万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了