Dfam: sustainable growth, curation support, and improved quality for mobile element annotation
Dfam:可持续增长、管理支持和移动元素注释质量的提高
基本信息
- 批准号:10714226
- 负责人:
- 金额:$ 54.06万
- 依托单位:
- 依托单位国家:美国
- 项目类别:
- 财政年份:2018
- 资助国家:美国
- 起止时间:2018-08-15 至 2028-06-30
- 项目状态:未结题
- 来源:
- 关键词:Biological databasesClassificationCollectionCommon Data ElementCommunitiesComplexComputer softwareConsensus SequenceDNADNA Transposable ElementsDataData CommonsData SetDatabasesDetectionDevelopmentEducational workshopElementsEvolutionExcisionFamilyFeedbackFosteringFoundationsGenomeGrantGrowthHuman GenomeHybridsKnowledgeLibrariesLicensingLifeMedicalMetadataMethodsModelingMorphologic artifactsMutationPolishesProteinsPublicationsRepetitive SequenceResearchResearch InstituteResourcesScientistSequence AlignmentSequence AnalysisSourceTrainingWorkcommunity engagementdetection platformexperiencegenetic informationgenome annotationgenome-wideimprovedinnovationinterestmarkov modelmeetingsmethod developmentmosaicnovelpressureprototypereconstructionreference genomeresponsesuccesstrustworthinessvertebrate genome
项目摘要
Project Summary / Abstract
Repetitive DNA, especially that due to transposable elements (TEs), makes up a large fraction of many genomes.
Thorough and accurate annotation of repetitive content in genomes depends on a comprehensive database of
known TEs, along with robust statistical and procedural methods for recognizing decayed instances of elements
and disentangling their complex relationships.
Annotation of TE instances is usually performed using our RepeatMasker software, which compares a genome
to a database containing representations of known repeat families. These have historically been consensus
sequences, which generally approximate the sequences of the original TEs. Our Dfam database is an open
access collection of repetitive DNA families, in which each family is represented by a multiple sequence
alignment and a profile hidden Markov model (HMM). We have demonstrated that profile HMMs support
improved annotation sensitivity, and Dfam provides numerous aids to both curators of TE families and those who
make use of the resulting annotations.
During the life of this grant, the database has grown to include families belonging to more than 1000 species
(from a baseline of 5). This growth has introduced a number of scale-based pressures, which in some cases
have forced us to reduce Dfam functionality in response, and in other cases highlighted ways that the resource
can better meet the needs of the community. Our proposed efforts largely target these matters while continuing
to expand and diversify the resource.
项目概要/摘要
重复DNA,尤其是由转座元件(TE) 引起的重复DNA,构成了许多基因组的很大一部分。
对基因组中重复内容进行彻底、准确的注释取决于一个全面的数据库
已知的 TE,以及用于识别元素腐烂实例的强大统计和程序方法
并理清他们复杂的关系。
TE 实例的注释通常使用我们的 RepeatMasker 软件来执行,该软件会比较基因组
到包含已知重复家族表示的数据库。这些都是历史上的共识
序列,通常近似于原始 TE 的序列。我们的 Dfam 数据库是开放的
访问重复DNA家族的集合,其中每个家族由多个序列表示
对齐和轮廓隐马尔可夫模型(HMM)。我们已经证明了 Profile HMM 支持
提高了注释敏感性,Dfam 为 TE 家族的管理者和那些
使用生成的注释。
在本次资助期间,数据库已发展到包含 1000 多个物种的科
(从 5 的基线开始)。这种增长带来了许多基于规模的压力,在某些情况下
迫使我们减少 Dfam 功能作为回应,并在其他情况下强调了资源的方式
能够更好地满足社会的需求。我们提出的努力主要针对这些问题,同时继续
扩大资源并使之多样化。
项目成果
期刊论文数量(14)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Methodologies for the De novo Discovery of Transposable Element Families.
- DOI:10.3390/genes13040709
- 发表时间:2022-04-17
- 期刊:
- 影响因子:3.5
- 作者:
- 通讯作者:
Extensive Independent Amplification of Platy-1 Retroposons in Tamarins, Genus Saguinus.
- DOI:10.3390/genes14071436
- 发表时间:2023-07-13
- 期刊:
- 影响因子:3.5
- 作者:Storer, Jessica M.;Walker, Jerilyn A.;Beckstrom, Thomas O.;Batzer, Mark A.
- 通讯作者:Batzer, Mark A.
Curation Guidelines for de novo Generated Transposable Element Families.
- DOI:10.1002/cpz1.154
- 发表时间:2021-06
- 期刊:
- 影响因子:0
- 作者:Storer, Jessica M;Hubley, Robert;Rosen, Jeb;Smit, Arian F A
- 通讯作者:Smit, Arian F A
Framework of the Alu Subfamily Evolution in the Platyrrhine Three-Family Clade of Cebidae, Callithrichidae, and Aotidae.
- DOI:10.3390/genes14020249
- 发表时间:2023-01-18
- 期刊:
- 影响因子:3.5
- 作者:
- 通讯作者:
Sensitive and error-tolerant annotation of protein-coding DNA with BATH.
使用 BATH 对蛋白质编码 DNA 进行灵敏且容错的注释。
- DOI:10.1101/2023.12.31.573773
- 发表时间:2024
- 期刊:
- 影响因子:0
- 作者:Krause,GenevieveR;Shands,Walt;Wheeler,TravisJ
- 通讯作者:Wheeler,TravisJ
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Robert MacDonald Hubley其他文献
Robert MacDonald Hubley的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Robert MacDonald Hubley', 18)}}的其他基金
Development and Maintenance of RepeatMasker and RepeatModeler
RepeatMasker和RepeatModeler的开发和维护
- 批准号:
10367846 - 财政年份:2022
- 资助金额:
$ 54.06万 - 项目类别:
Development and Maintenance of RepeatMasker and RepeatModeler
RepeatMasker和RepeatModeler的开发和维护
- 批准号:
10563214 - 财政年份:2022
- 资助金额:
$ 54.06万 - 项目类别:
Dfam: sustainable growth, curation support, and improved quality for mobile element annotation
Dfam:可持续增长、管理支持和移动元素注释质量的提高
- 批准号:
10165778 - 财政年份:2018
- 资助金额:
$ 54.06万 - 项目类别:
Dfam: sustainable growth, curation support, and improved quality for mobile element annotation
Dfam:可持续增长、管理支持和移动元素注释质量的提高
- 批准号:
9764454 - 财政年份:2018
- 资助金额:
$ 54.06万 - 项目类别:
Dfam: sustainable growth, curation support, and improved quality for mobile element annotation
Dfam:可持续增长、管理支持和移动元素注释质量的提高
- 批准号:
10407543 - 财政年份:2018
- 资助金额:
$ 54.06万 - 项目类别:
相似国自然基金
紫堇属南黄堇组的分类修订
- 批准号:32300176
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
高光谱图像可信深度学习分类方法研究
- 批准号:62371169
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
宁夏典型地物目标分类及其多源遥感影像信息处理模型与算法研究
- 批准号:42361056
- 批准年份:2023
- 资助金额:33 万元
- 项目类别:地区科学基金项目
具有相同内禀增长率的三维Lotka-Volterra系统的全局分类
- 批准号:12301221
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
超平面配置中的分类问题
- 批准号:12301424
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
相似海外基金
Genetic Architecture of Aging-Related TDP-43 and Mixed Pathology Dementia
衰老相关 TDP-43 和混合病理痴呆的遗传结构
- 批准号:
10658215 - 财政年份:2023
- 资助金额:
$ 54.06万 - 项目类别:
Biospecimen Acquisition, Processing, and Classification Unit
生物样本采集、处理和分类装置
- 批准号:
10904039 - 财政年份:2023
- 资助金额:
$ 54.06万 - 项目类别:
Antifungal discovery from previously uncultivated bacteria
从以前未培养的细菌中发现抗真菌药物
- 批准号:
10693593 - 财政年份:2023
- 资助金额:
$ 54.06万 - 项目类别:
Interrogating immune signatures in the thoracic duct of patients with multiple sclerosis
询问多发性硬化症患者胸导管中的免疫特征
- 批准号:
10386390 - 财政年份:2023
- 资助金额:
$ 54.06万 - 项目类别: