Development and Maintenance of RepeatMasker

RepeatMasker的开发与维护

基本信息

项目摘要

DESCRIPTION (provided by applicant): Most eukaryotic genomes include vast numbers of interspersed repeats (IRs), which are the remnants of mostly selfishly amplified transposable elements. Transposable elements have an exceptionally wide-ranging mutagenic effect on genomes, while recognition of IRs provide unparalleled information on genome evolution and is crucial in many aspects of bioinformatics. This grant would continue support for the maintenance and further development of RepeatMasker, a computational tool that has become the de facto standard for identification and characterization of IRs, RepeatModeler, a program designed to derive RepeatMasker-grade databases of IR consensus sequences, and related software. The source code for these tools is freely available to the public. We have recently co-created a database of profile Hidden Markov Models, called Dfam, for repeat families found in the human genome. RepeatMasker can use this database and we have found dramatically increased sensitivity over previous results. Our research and development plans include the following: a) We propose several ways in which sensitivity of detection can still be improved, including the creation of better profiles and exploiting our false positive and false negative benchmarks. b) To prepare for the onslaught of the 10,000 vertebrate genome project, we propose significant speed up strategies for both library creation and repeat analysis, and plan to improve repeat analysis for NextGen generated genomes. c) Dfam is meant to eventually comprise repeats for "all" genomes In collaboration with our colleagues at the Howard Hughes Medical Institute who house Dfam, we aim to develop tools to simplify and enhance submission and curation of entries. d) We plan to optimize our method of superimposing the RepeatMasker annotation of reconstructed ancestral genomes on extant genomes. We also propose several strategies involving IRs that could improve the construction of ancestral genomes.
描述(由申请人提供): 大多数真核生物基因组都包含大量散在重复序列(IR),它们是大多数自私扩增的转座元件的残余物。转座元件对基因组具有异常广泛的诱变作用,而IR的识别提供了关于基因组进化的无与伦比的信息,并且在生物信息学的许多方面至关重要。这笔赠款将继续支持 RepeatMasker 的维护和进一步开发,RepeatMasker 是一种计算工具,已成为 IR 识别和表征的事实上的标准;RepeatModeler 是一个旨在派生 IR 一致序列的 RepeatMasker 级数据库的程序,以及相关软件。这些工具的源代码免费向公众开放。我们最近共同创建了一个名为 Dfam 的隐马尔可夫模型数据库,用于在人类基因组中发现的重复家族。 RepeatMasker 可以使用该数据库,我们发现与之前的结果相比,灵敏度显着提高。我们的研究和开发计划包括以下内容:a)我们提出了几种仍然可以提高检测灵敏度的方法,包括创建更好的配置文件以及利用我们的误报和误报基准。 b) 为了准备迎接 10,000 个脊椎动物基因组计划的冲击,我们提出了文库创建和重复分析的显着加速策略,并计划改进 NextGen 生成的基因组的重复分析。 c) Dfam 旨在最终包含“所有”基因组的重复序列 通过与 Dfam 所在地霍华德休斯医学研究所的同事合作,我们的目标是开发工具来简化和增强条目的提交和管理。 d) 我们计划优化将重建祖先基因组的 RepeatMasker 注释叠加到现存基因组上的方法。我们还提出了几种涉及 IR 的策略,可以改善祖先基因组的构建。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Arian Fredericus Anthonius Smit其他文献

Arian Fredericus Anthonius Smit的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Arian Fredericus Anthonius Smit', 18)}}的其他基金

Further development of the FEAST software, and its use for novel gene predictions
FEAST 软件的进一步开发及其在新基因预测中的应用
  • 批准号:
    7287974
  • 财政年份:
    2007
  • 资助金额:
    $ 44.61万
  • 项目类别:
Further development of the FEAST software, and its use for novel gene predictions
FEAST 软件的进一步开发及其在新基因预测中的应用
  • 批准号:
    7473268
  • 财政年份:
    2007
  • 资助金额:
    $ 44.61万
  • 项目类别:
Further development of the FEAST software, and its use for novel gene predictions
FEAST 软件的进一步开发及其在新基因预测中的应用
  • 批准号:
    7668499
  • 财政年份:
    2007
  • 资助金额:
    $ 44.61万
  • 项目类别:
Maintenance and Development of RepeatMasker and RepeatModeler
RepeatMasker和RepeatModeler的维护和开发
  • 批准号:
    8235956
  • 财政年份:
    2003
  • 资助金额:
    $ 44.61万
  • 项目类别:
Maintenance and Development of RepeatMasker and GESTALT
RepeatMasker和GESTALT的维护和开发
  • 批准号:
    6788158
  • 财政年份:
    2003
  • 资助金额:
    $ 44.61万
  • 项目类别:
Maintenance and Development of RepeatMasker and GESTALT
RepeatMasker和GESTALT的维护和开发
  • 批准号:
    6676869
  • 财政年份:
    2003
  • 资助金额:
    $ 44.61万
  • 项目类别:
Maintenance and Development of RepeatMasker and RepeatModeler
RepeatMasker和RepeatModeler的维护和开发
  • 批准号:
    7785285
  • 财政年份:
    2003
  • 资助金额:
    $ 44.61万
  • 项目类别:
Maintenance and Development of RepeatMasker and GESTALT
RepeatMasker和GESTALT的维护和开发
  • 批准号:
    6912723
  • 财政年份:
    2003
  • 资助金额:
    $ 44.61万
  • 项目类别:
Maintenance and Development of RepeatMasker
RepeatMasker的维护与开发
  • 批准号:
    7143783
  • 财政年份:
    2003
  • 资助金额:
    $ 44.61万
  • 项目类别:
Maintenance and Development of RepeatMasker
RepeatMasker的维护与开发
  • 批准号:
    7459675
  • 财政年份:
    2003
  • 资助金额:
    $ 44.61万
  • 项目类别:

相似国自然基金

采用新型视觉-电刺激配对范式长期、特异性改变成年期动物视觉系统功能可塑性
  • 批准号:
    32371047
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
Fosl2调控染色质开放性在哺乳动物卵丘-卵母细胞复合物成熟过程中的机制研究
  • 批准号:
    82301863
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
H5亚型禽流感病毒PA蛋白诱导降解JAK1增强病毒对哺乳动物致病性的作用及机制研究
  • 批准号:
    32373042
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
动物双歧杆菌对不同聚合度低聚木糖同化差异性的分子机制研究
  • 批准号:
    32302789
  • 批准年份:
    2023
  • 资助金额:
    20 万元
  • 项目类别:
    青年科学基金项目
基于扁颅蝠类群系统解析哺乳动物脑容量适应性减小的演化机制
  • 批准号:
    32330014
  • 批准年份:
    2023
  • 资助金额:
    215 万元
  • 项目类别:
    重点项目

相似海外基金

Development of a rapid screening test for the detection of dihydroanatoxin-a
开发检测二氢虾毒素-a 的快速筛选试验
  • 批准号:
    10545266
  • 财政年份:
    2023
  • 资助金额:
    $ 44.61万
  • 项目类别:
Understanding the effects of sleep deprivation on the gut's cellular homeostatic process
了解睡眠不足对肠道细胞稳态过程的影响
  • 批准号:
    10679154
  • 财政年份:
    2023
  • 资助金额:
    $ 44.61万
  • 项目类别:
Therapeutic targeting of master regulators in non-canonical AR driven advanced lethal prostate cancers
非经典 AR 驱动的晚期致命性前列腺癌中主调节因子的治疗靶向
  • 批准号:
    10737204
  • 财政年份:
    2023
  • 资助金额:
    $ 44.61万
  • 项目类别:
Visuomotor Coordinate Transformation During Drosophila Chasing Behavior
果蝇追逐行为过程中视觉运动坐标的转变
  • 批准号:
    10601535
  • 财政年份:
    2023
  • 资助金额:
    $ 44.61万
  • 项目类别:
Center for Environmental and Health Effects of PFAS
PFAS 环境与健康影响中心
  • 批准号:
    10747757
  • 财政年份:
    2023
  • 资助金额:
    $ 44.61万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了