The Genome Aggregation Database (gnomAD)
基因组聚合数据库 (gnomAD)
基本信息
- 批准号:10089969
- 负责人:
- 金额:$ 218.7万
- 依托单位:
- 依托单位国家:美国
- 项目类别:
- 财政年份:2021
- 资助国家:美国
- 起止时间:2021-02-08 至 2026-01-31
- 项目状态:未结题
- 来源:
- 关键词:All of Us Research ProgramArchitectureBasic ScienceBiologicalClinVarClinicalCollectionCommunitiesComputer softwareDNADataData AggregationData SetDatabasesDiagnosticDiseaseEnsureFrequenciesFundingGenesGenetic VariationGenomeGenomic medicineGenomicsGenotypeHealthHumanHuman GeneticsIndividualInfrastructureIntuitionJointsLeadLinkMaintenanceMapsMedical GeneticsMethodsMutationNatural SelectionsPathogenicityPhenotypePopulationProductionPublicationsQuality ControlResolutionResourcesSample SizeSamplingScientistSingle Nucleotide PolymorphismStatistical Data InterpretationStructureTrainingUntranslated RNAVariantWorkbasebiobankcloud basedcohortcost efficientdata accessdata sharingexomefunctional genomicsgenetic variantgenome sequencinggenomic datahealth care settingsimprovedinsertion/deletion mutationlarge datasetsnovelphenotypic datapressureprotein expressionrare varianttoolvirtualweb site
项目摘要
Project Summary
The Genome Aggregation Database (gnomAD) is a ubiquitous resource for basic research and clinical
interpretation. The world’s largest genetic variation resource, the gnomAD dataset is used in virtually all clinical
genetic diagnostic pipelines worldwide, and the website has over 20 million page views to date. Here we
outline a proposal that will expand the gnomAD resource to millions of samples across diverse global
populations. Our proposal will scale variant-calling and quality control to match this sample size, integrate
statistical tools and other genomic resources critical to clinical interpretation, and ensure that the data we
aggregate will continue to be shared freely with the biomedical community. To accomplish this we will apply a
highly computationally efficient strategy to call all classes of variation (including SNVs, small indels, and the
mutational spectrum of structural variants) across millions of sequenced samples enriched for under-
represented ancestry groups. We will deploy a cloud-based framework for the efficient storage and automated
quality control of these very large and heterogeneous sequence data sets using the massively parallel Hail
architecture. We will leverage the scale of gnomAD to provide increasingly high-resolution maps of the
depletion of functional variation across regions of the genome (highlighting genome regions where natural
selection constrains DNA change) and provide statistical frameworks for quantitatively assessing whether the
population frequency of a variant is consistent with pathogenicity, linking this information with evidence from
the ClinVar resource. We will continue to share all of this data as rapidly and openly as possible with the
biomedical community, long before publication. We will support and expand functionality in our widely
accessed data browser as well as create scalable and publicly accessible datasets that integrate our variation
data with clinical and functional genomic annotations, accessible through API frameworks to empower novel
applications of the datasets. We will also provide resources and training to improve the use of gnomAD
resources by the clinical genetics and wider biomedical communities.
项目概要
基因组聚合数据库 (gnomAD) 是基础研究和临床的普遍资源
gnomAD 数据集是世界上最大的遗传变异资源,几乎用于所有临床。
全球基因诊断管道,迄今为止该网站的页面浏览量已超过 2000 万次。
概述了一项提案,该提案将把 gnomAD 资源扩展到全球不同地区的数百万个样本
我们的建议将扩展变异调用和质量控制以匹配该样本量,并进行整合。
统计工具和其他对临床解释至关重要的基因组资源,并确保我们的数据
为了实现这一目标,我们将继续与生物医学界自由共享。
高计算效率的策略来调用所有类别的变异(包括 SNV、小插入缺失和
结构变体的突变谱)跨越数百万个测序样本,这些样本富集了欠缺的
我们将部署一个基于云的框架来实现高效存储和自动化。
使用大规模并行 Hail 对这些非常大且异构的序列数据集进行质量控制
我们将利用 gnomAD 的规模来提供越来越高分辨率的地图。
基因组各区域功能变异的耗尽(突出显示天然存在的基因组区域)
选择约束 DNA 变化)并提供统计框架来定量评估是否
变异的群体频率与致病性一致,将此信息与证据联系起来
我们将继续尽可能快速、公开地与 ClinVar 资源共享所有这些数据。
生物医学界,早在出版之前我们就会广泛支持和扩展功能。
访问数据浏览器以及创建集成我们的变体的可扩展且可公开访问的数据集
具有临床和功能基因组注释的数据,可通过 API 框架访问,以增强新颖性
我们还将提供资源和培训来改进 gnomAD 的使用。
临床遗传学和更广泛的生物医学界的资源。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Mark Joseph Daly其他文献
Mark Joseph Daly的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Mark Joseph Daly', 18)}}的其他基金
Enhancing gnomAD Sustainability: Implementing Site Reliability Engineering Principles for Genomic Data Infrastructure
增强 gnomAD 可持续性:实施基因组数据基础设施站点可靠性工程原则
- 批准号:
10838180 - 财政年份:2023
- 资助金额:
$ 218.7万 - 项目类别:
2/4 The Autism Sequencing Consortium: Discovering autism risk genes and how they impact core features of the disorder
2/4 自闭症测序联盟:发现自闭症风险基因以及它们如何影响该疾病的核心特征
- 批准号:
10579317 - 财政年份:2022
- 资助金额:
$ 218.7万 - 项目类别:
The Autism Sequencing Consortium: Autism Gene Discovery in >50,000 Exomes
自闭症测序联盟:在超过 50,000 个外显子组中发现自闭症基因
- 批准号:
9217934 - 财政年份:2017
- 资助金额:
$ 218.7万 - 项目类别:
Network-based prediction and validation of causal schizophrenia genes and variants
基于网络的精神分裂症致病基因和变异的预测和验证
- 批准号:
9108677 - 财政年份:2016
- 资助金额:
$ 218.7万 - 项目类别:
相似国自然基金
“共享建筑学”的时空要素及表达体系研究
- 批准号:
- 批准年份:2019
- 资助金额:63 万元
- 项目类别:面上项目
基于城市空间日常效率的普通建筑更新设计策略研究
- 批准号:51778419
- 批准年份:2017
- 资助金额:61.0 万元
- 项目类别:面上项目
宜居环境的整体建筑学研究
- 批准号:51278108
- 批准年份:2012
- 资助金额:68.0 万元
- 项目类别:面上项目
The formation and evolution of planetary systems in dense star clusters
- 批准号:11043007
- 批准年份:2010
- 资助金额:10.0 万元
- 项目类别:专项基金项目
新型钒氧化物纳米组装结构在智能节能领域的应用
- 批准号:20801051
- 批准年份:2008
- 资助金额:18.0 万元
- 项目类别:青年科学基金项目
相似海外基金
Using epigenetic science to improve environmental health literacy
利用表观遗传学提高环境健康素养
- 批准号:
10524680 - 财政年份:2023
- 资助金额:
$ 218.7万 - 项目类别:
Fear learning-related reconfiguration of local and large-scale cortical networks
局部和大规模皮层网络的恐惧学习相关重构
- 批准号:
10722925 - 财政年份:2023
- 资助金额:
$ 218.7万 - 项目类别:
3D Printed Configurable and Themoresponsive Intracortical Electrode Array Platform
3D 打印可配置和热响应皮质内电极阵列平台
- 批准号:
10883867 - 财政年份:2023
- 资助金额:
$ 218.7万 - 项目类别:
ECHO Laboratory Core at Vanderbilt for Integrated Sample Biobanking and Processing
范德堡大学 ECHO 实验室核心,用于集成样本生物库和处理
- 批准号:
10745188 - 财政年份:2023
- 资助金额:
$ 218.7万 - 项目类别: