Analysis-Low-complexity Amino Acid-Nucleotide Sequences

低复杂性氨基酸-核苷酸序列分析

基本信息

  • 批准号:
    7148025
  • 负责人:
  • 金额:
    --
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
  • 资助国家:
    美国
  • 起止时间:
  • 项目状态:
    未结题

项目摘要

The goal of this project is to define and analyze, using computational methods, segments of protein and nucleotide sequences showing compositional bias and to understand their structural, functional and evolutionary significance, and their pathology. These sequences include local low complexity regions or domains, including conformationally mobile or intrinsically unstructured regions of proteins, tandemly-repeated sequences, and also more generally distributed amino acid content bias. The latter can reflect directional mutation pressures at the genomic level and constraints specific to protein or domain function. Low complexity regions comprise a large proportion of the genome-encoded amino acids, and may contain homopolymeric tracts or mosaics of a few amino acids, or repeated patterns, frequently subtle, including those typical of many non-globular domains. New mathematical definitions and algorithms have been developed to identify regions of compositional bias, and to discover and analyze properties of these regions relevant to their structures, interactions, biological functions, and evolution. Strong background bias is shown by proteins encoded by very AT-rich or GC-rich genomes, which include those of several important infectious disease organisms: these raise problems for sequence alignment algorithms which are being addressed. Local regions of low complexity and tandemly repeated amino acid sequences occur in many proteins involved in cellular differentiation and embryonic development, RNA processing, transcriptional regulation, signal transduction and aspects of cellular and extracellular structural integrity. Experimental data indicate that low complexity segments of proteins are generally non-globular, intrinsically unstructured, or conformationally mobile: however, knowledge of the molecular structures and dynamics of these domains is still very limited. They are generally relatively intractable to investigation by crystallography and NMR, and they account for less than 1% of the residues in current structural databases. Hence, mathematically rigorous sequence analysis and ab initio quantum chemical methods, together with some relevant high-resolution structural data, are methods of choice for gaining insights into these regions of proteins and for raising questions to be investigated expermentally. These methods are also valuable, for both nucleotide and amino acid sequences, in detecting and eliminating some artifacts in sequence database searches and alignment analysis.
该项目的目的是使用计算方法,蛋白质和核苷酸序列的片段来定义和分析显示组成偏差的片段,并了解其结构,功能和进化意义及其病理学。这些序列包括局部低复杂性区域或域,包括蛋白质的构象移动或本质上的非结构化区域,串联重复的序列以及更普遍分布的氨基酸含量偏见。后者可以反映基因组水平上的定向突变压力,并针对蛋白质或结构域功能的约束。低复杂性区域包括很大一部分基因组编码的氨基酸,并且可能包含几种氨基酸或重复模式的同质膜或马赛克,通常是微妙的,包括许多非球形域的典型域。已经开发了新的数学定义和算法来识别组成偏差的区域,并发现和分析与它们的结构,相互作用,生物学功能和进化相关的这些区域的特性。强烈的背景偏见是由非常丰富或富含GC的基因组编码的蛋白质显示的,其中包括几种重要的感染性疾病生物的蛋白质:这些引起了正在解决的序列比对算法的问题。低复杂性和串联重复的氨基酸序列的局部区域发生在许多参与细胞分化和胚胎发育,RNA处理,转录调控,信号转导以及细胞外结构完整性方面的蛋白质中。实验数据表明,蛋白质的低复杂性片段通常是非全球,本质上非结构化或构象移动的:但是,对这些结构域的分子结构和动力学的了解仍然非常有限。它们通常与晶体学和NMR的研究相对棘手,并且在当前结构数据库中不到1%的残基。因此,在数学上进行了严格的序列分析和从头量量子化学方法以及一些相关的高分辨率结构数据,是获得对这些蛋白质区域的见解的选择,并在实验上提出问题。对于核苷酸和氨基酸序列,这些方法在检测和消除序列数据库搜索和比对分析中的某些伪影方面也很有价值。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

JOHN C. WOOTTON其他文献

JOHN C. WOOTTON的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('JOHN C. WOOTTON', 18)}}的其他基金

COMPUTER ANALYSIS OF SEQUENCES FROM MICROORGANISMS
微生物序列的计算机分析
  • 批准号:
    6111061
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
Computational Biology and Genetics Of Malaria Parasites
疟疾寄生虫的计算生物学和遗传学
  • 批准号:
    6681329
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
Computational Biology and Genetics Of Malaria and Toxoplasma Parasites
疟疾和弓形虫寄生虫的计算生物学和遗传学
  • 批准号:
    7969203
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
Computational Biology and Genetics Of Malaria and Toxopl
疟疾和弓形虫的计算生物学和遗传学
  • 批准号:
    7316231
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
Computational Biology and Genetics Of Malaria Parasites
疟疾寄生虫的计算生物学和遗传学
  • 批准号:
    6988451
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
Computer Analysis Of Low-complexity Amino Acid And Nucle
低复杂性氨基酸和核酸的计算机分析
  • 批准号:
    7316230
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
Computational Biology and Genetics Of Malaria Parasites
疟疾寄生虫的计算生物学和遗传学
  • 批准号:
    6843563
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
Computer Analysis Of Low-complexity Amino Acid And Nucleotide Sequences
低复杂性氨基酸和核苷酸序列的计算机分析
  • 批准号:
    7735065
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
Computer Analysis Of Low-complexity Amino Acid And Nucleotide Sequences
低复杂性氨基酸和核苷酸序列的计算机分析
  • 批准号:
    7594457
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
Computational Biology and Genetics Of Malaria and Toxoplasma Parasites
疟疾和弓形虫寄生虫的计算生物学和遗传学
  • 批准号:
    7735066
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:

相似国自然基金

2023年(第四届)国际生物数学与医学应用研讨会
  • 批准号:
    12342004
  • 批准年份:
    2023
  • 资助金额:
    8.00 万元
  • 项目类别:
    专项项目
突变和修饰重塑蛋白质亚细胞定位的生物信息学研究
  • 批准号:
    32370698
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
基于生物信息学的类风湿性关节炎患者衰弱预测模型的构建与验证
  • 批准号:
    82301786
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于结构表征的蛋白质与长链非编码RNA相互作用预测的生物信息学方法研究
  • 批准号:
    62373216
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
蛋白质降解决定因子的生物信息学筛选及其耐药突变的多组学分析研究
  • 批准号:
    32300528
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Computational Modeling Applications in Cardiopulmonary Dynamics
心肺动力学中的计算建模应用
  • 批准号:
    7251792
  • 财政年份:
    2007
  • 资助金额:
    --
  • 项目类别:
Systems Biology of Cell Decision Processes
细胞决策过程的系统生物学
  • 批准号:
    7285298
  • 财政年份:
    2003
  • 资助金额:
    --
  • 项目类别:
Systems Biology of Cell Decision Processes
细胞决策过程的系统生物学
  • 批准号:
    7479966
  • 财政年份:
    2003
  • 资助金额:
    --
  • 项目类别:
Research Training for Computation and Informatics in Biology and Medicine
生物学和医学计算和信息学研究培训
  • 批准号:
    7625392
  • 财政年份:
    2002
  • 资助金额:
    --
  • 项目类别:
Research Training for Computation and Informatics in Biology and Medicine
生物学和医学计算和信息学研究培训
  • 批准号:
    7557935
  • 财政年份:
    2002
  • 资助金额:
    --
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了