Maintenance and Development of RepeatMasker

RepeatMasker的维护与开发

基本信息

项目摘要

DESCRIPTION (provided by applicant): Most eukaryotic genomes include vast numbers of interspersed repeats (IRs), which are the remnants of mostly selfishly amplified transposable elements. Transposable elements have an exceptionally wide- ranging mutagenic effect on genomes, while recognition of IRs provide unparalleled information on genome evolution and is crucial in many aspects of bioinformatics. This grant would continue support for the maintenance and further development of RepeatMasker, a computational tool that has become the de facto standard for identification and characterization of IRs, and support the development of RepeatModeler, a program designed to derive RepeatMasker-grade databases of IR consensus sequences. The source code for these tools are freely available to the public. Development will emphasize the following: a) With the rapid growth of sequenced mammalian species, the building of mammalian repeat libraries has become our highest priority. The RepeatModeler program already excels in its consensus building ability and IR classification scheme, but is still in an early phase and many modules need to be developed. b) RepeatMasker development will initially be focused on the annotation modules. These need to be parallelized and made auditable in order to link annotations to the relevant database entries. We also present strategies to improve RepeatMasker"s detection of ancient, highly fragmented IRs and of IRs in draft genomes, and one that allows it to recognize genomic recombination sites within IRs. c) For many applications of RepeatMasker, including interspecies genome alignments and inference of species phylogenies, knowledge of the age and species distribution of IRs is crucial. We aim to automate and refine the process of "phylogenetic labeling" of consensus sequences in the library. d) We will further develop our website, by adding our transcript prediction program FEAST, increasing the number of pre-analyzed genomes, expanding our new protein based repeat masking services, and optionally presenting data in a graphical form.
描述(由申请人提供):大多数真核基因组都包括大量散布的重复序列(IRS),这些重复序列是大多数自私放大的转座元素的残余物。转座元素对基因组具有异常广泛的诱变作用,而对IRS的识别则提供了有关基因组进化的无与伦比的信息,并且在生物信息学的许多方面至关重要。该赠款将继续支持ReponMasker的维护和进一步开发,ReponMasker是一种计算工具,已成为IRS识别和表征的事实上的标准,并支持ReponModeler的开发,该计划旨在得出IR共识序列的ReponMasker级数据库。这些工具的源代码可向公众免费使用。开发将强调以下内容:a)随着测序哺乳动物物种的快速增长,哺乳动物重复文库的建设已成为我们的最高优先级。 RepotModeler程序已经在其共识建筑能力和IR分类方案方面表现出色,但仍处于早期阶段,需要开发许多模块。 b)最初将重点放在注释模块上。这些需要并行化并进行审核,以将注释链接到相关数据库条目。我们还提出了改善重复效果的策略,以对基因组草案中的古代,高度分散的IRS和IRS的检测,并允许其识别IRS内的基因组重组站点。c)c)对于Reproker的许多应用,包括跨性别的基因组基因组对准和cr ands cristory of per and progential of per and progential of Irs and of irs and per and per and per and ph and per and per and。标记“图书馆中的共识序列。d)我们将通过添加成绩单预测计划盛宴,增加预先分析的基因组的数量,扩大我们新的基于蛋白质的重复掩盖服务,并选择以图形形式显示数据,从而进一步开发我们的网站。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Arian Fredericus Anthonius Smit其他文献

Arian Fredericus Anthonius Smit的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Arian Fredericus Anthonius Smit', 18)}}的其他基金

Further development of the FEAST software, and its use for novel gene predictions
FEAST 软件的进一步开发及其在新基因预测中的应用
  • 批准号:
    7287974
  • 财政年份:
    2007
  • 资助金额:
    $ 36.9万
  • 项目类别:
Further development of the FEAST software, and its use for novel gene predictions
FEAST 软件的进一步开发及其在新基因预测中的应用
  • 批准号:
    7668499
  • 财政年份:
    2007
  • 资助金额:
    $ 36.9万
  • 项目类别:
Further development of the FEAST software, and its use for novel gene predictions
FEAST 软件的进一步开发及其在新基因预测中的应用
  • 批准号:
    7473268
  • 财政年份:
    2007
  • 资助金额:
    $ 36.9万
  • 项目类别:
Development and Maintenance of RepeatMasker
RepeatMasker的开发与维护
  • 批准号:
    9905539
  • 财政年份:
    2003
  • 资助金额:
    $ 36.9万
  • 项目类别:
Maintenance and Development of RepeatMasker and GESTALT
RepeatMasker和GESTALT的维护和开发
  • 批准号:
    6912723
  • 财政年份:
    2003
  • 资助金额:
    $ 36.9万
  • 项目类别:
Development and Maintenance of RepeatMasker
RepeatMasker的开发与维护
  • 批准号:
    8697975
  • 财政年份:
    2003
  • 资助金额:
    $ 36.9万
  • 项目类别:
Maintenance and Development of RepeatMasker and GESTALT
RepeatMasker和GESTALT的维护和开发
  • 批准号:
    6788158
  • 财政年份:
    2003
  • 资助金额:
    $ 36.9万
  • 项目类别:
Maintenance and Development of RepeatMasker and RepeatModeler
RepeatMasker和RepeatModeler的维护和开发
  • 批准号:
    7785285
  • 财政年份:
    2003
  • 资助金额:
    $ 36.9万
  • 项目类别:
Maintenance and Development of RepeatMasker and GESTALT
RepeatMasker和GESTALT的维护和开发
  • 批准号:
    6676869
  • 财政年份:
    2003
  • 资助金额:
    $ 36.9万
  • 项目类别:
Maintenance and Development of RepeatMasker
RepeatMasker的维护与开发
  • 批准号:
    7143783
  • 财政年份:
    2003
  • 资助金额:
    $ 36.9万
  • 项目类别:

相似国自然基金

2023年(第四届)国际生物数学与医学应用研讨会
  • 批准号:
    12342004
  • 批准年份:
    2023
  • 资助金额:
    8.00 万元
  • 项目类别:
    专项项目
突变和修饰重塑蛋白质亚细胞定位的生物信息学研究
  • 批准号:
    32370698
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
基于生物信息学的类风湿性关节炎患者衰弱预测模型的构建与验证
  • 批准号:
    82301786
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于结构表征的蛋白质与长链非编码RNA相互作用预测的生物信息学方法研究
  • 批准号:
    62373216
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
蛋白质降解决定因子的生物信息学筛选及其耐药突变的多组学分析研究
  • 批准号:
    32300528
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Data Management and Bioinformatics
数据管理和生物信息学
  • 批准号:
    10633367
  • 财政年份:
    2023
  • 资助金额:
    $ 36.9万
  • 项目类别:
Multimodal ventral tegmental area decrements in a mouse Alzheimer's model
小鼠阿尔茨海默病模型中多模式腹侧被盖面积减少
  • 批准号:
    10709503
  • 财政年份:
    2022
  • 资助金额:
    $ 36.9万
  • 项目类别:
The Genomic Architecture of Pregnancy Loss
流产的基因组结构
  • 批准号:
    10705318
  • 财政年份:
    2021
  • 资助金额:
    $ 36.9万
  • 项目类别:
The Genomic Architecture of Pregnancy Loss
流产的基因组结构
  • 批准号:
    10226655
  • 财政年份:
    2021
  • 资助金额:
    $ 36.9万
  • 项目类别:
Immune epigenetic biomarkers of survival in glioma epidemiology
神经胶质瘤流行病学中生存的免疫表观遗传生物标志物
  • 批准号:
    9751071
  • 财政年份:
    2017
  • 资助金额:
    $ 36.9万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了