Software for exploring all forms of genetic variation in any species

用于探索任何物种中所有形式的遗传变异的软件

基本信息

  • 批准号:
    9749979
  • 负责人:
  • 金额:
    $ 45.75万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2017
  • 资助国家:
    美国
  • 起止时间:
    2017-08-01 至 2021-07-31
  • 项目状态:
    已结题

项目摘要

Modern DNA sequencing technologies have revolutionized the design of experiments investigating the biology of the genome and the genetic basis of traits. Arguably the most powerful application of these technologies has been the creation of exquisitely detailed catalogs describing the landscape of genetic variation in multiple species. However, discovery of genetic variation is merely the beginning. Exploration and analysis of the resulting catalogs is required to catalyze new insights into the relationship between genotype and phenotype. This proposal is motivated by two fundamental limitations inhibiting discovery from genetic variation datasets. First, existing software for mining variation to understand disease and other traits does not scale to large datasets involving thousands of samples. Second, most existing tools are focused on human studies; consequently, this inhibits the application of modern DNA sequencing to genetic studies of model organisms, livestock genetics, and newly sequenced species. We propose to solve these challenges by building upon our GEMINI framework. Since 2012, we have maintained GEMINI as a powerful software framework for exploring genome variation. GEMINI's strength is that it integrates genetic variation with a diverse set of genome annotations into a database to facilitate variant prioritization. It allows researchers to conduct complex analyses with simple queries based on sample genotypes, phenotypes, inheritance patterns, and genome annotations. GEMINI has quickly become a very popular tool for rare human disease research leading to discoveries by multiple labs, including our own. Despite its power and popularity, GEMINI has three important limitations. It was not designed for studies involving genetic variation from more than a few hundred samples. Furthermore, its focus is the analysis of single-nucleotide (SNP) and insertion-deletion (INDEL); it is blind to structural and copy number variation. Finally, GEMINI can only analyze genetic variation datasets for the human genome; no other species or genome builds are supported. Therefore, this proposal seeks to provide geneticists studying any species with a powerful, flexible and simple to use software system that is fast and scalable enough to support genetic research for many years to come. We will do this but achieving the following Specific Aims: (1) Develop a scalable, high performance genotype and haplotype query engine to empower large scale genome studies. (2) Devise new methods for genotyping, integrating and prioritizing structural variation. (3) Enable scalable, flexible genome analysis in any species and genome build. In summary, by completing these aims, the proposed research will provide geneticists studying any species with a powerful, flexible and simple to use software system that is fast and scalable enough to support genetic research for many years to come.
现代DNA测序技术已彻底改变了研究的实验设计 基因组的生物学和特征的遗传基础。可以说是这些最强大的应用 技术已经创建了描述遗传景观的精美详细目录 多种物种的变化。但是,遗传变异的发现仅仅是开始。探索和 需要对所得目录的分析来催化对基因型之间关系的新见解 和表型。该提议是由两个基本限制抑制了遗传发现的基本限制的动机 变体数据集。首先,现有用于理解疾病和其他特征的采矿变化软件不会 扩展到涉及数千个样本的大型数据集。其次,大多数现有工具都集中在人类上 研究;因此,这抑制了现代DNA测序在模型的遗传研究中的应用 生物,牲畜遗传学和新测序的物种。 我们建议通过建立双子座框架来解决这些挑战。自2012年以来,我们有 将双子座保留为探索基因组变异的强大软件框架。双子座的力量是 它将遗传变异与各种基因组注释集整合到数据库中,以促进变体 优先级。它允许研究人员根据样品进行简单查询进行复杂的分析 基因型,表型,遗传模式和基因组注释。双子座很快变得非常 稀有人类疾病研究的流行工具,导致包括我们自己在内的多个实验室发现。 尽管具有其力量和知名度,但双子座仍有三个重要的局限性。它不是为 涉及数百多个样本的遗传变异的研究。此外,它的重点是 分析单核苷酸(SNP)和插入 - 缺失(Indel);它对结构和拷贝数视而不见 变化。最后,双子座只能分析人类基因组的遗传变异数据集。没有其他物种 或支持基因组构建。因此,该提议旨在为研究任何物种的遗传学家提供 具有功能强大,灵活且易于使用的软件系统,该软件系统足够快,可扩展以支持遗传 未来多年的研究。我们将做到这一点,但要实现以下特定目标: (1)开发可扩展的高性能基因型和单倍型查询引擎以授权 大规模基因组研究。 (2)设计用于基因分型,整合和确定结构变化的新方法。 (3)在任何物种和基因组构建中启用可扩展的,灵活的基因组分析。 总而言之,通过完成这些目标,拟议的研究将为研究任何人提供遗传学家 具有功能强大,灵活且易于使用的软件系统的物种,足以支持足以支持 遗传研究已有很多年了。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

暂无数据

数据更新时间:2024-06-01

Aaron R Quinlan的其他基金

New algorithms and tools for large-scale genomic analyses
用于大规模基因组分析的新算法和工具
  • 批准号:
    10357060
    10357060
  • 财政年份:
    2022
  • 资助金额:
    $ 45.75万
    $ 45.75万
  • 项目类别:
New algorithms and tools for large-scale genomic analyses
用于大规模基因组分析的新算法和工具
  • 批准号:
    10560502
    10560502
  • 财政年份:
    2022
  • 资助金额:
    $ 45.75万
    $ 45.75万
  • 项目类别:
Scalable detection and interpretation of structural variation in human genomes
人类基因组结构变异的可扩展检测和解释
  • 批准号:
    10576268
    10576268
  • 财政年份:
    2020
  • 资助金额:
    $ 45.75万
    $ 45.75万
  • 项目类别:
Scalable detection and interpretation of structural variation in human genomes
人类基因组结构变异的可扩展检测和解释
  • 批准号:
    9973582
    9973582
  • 财政年份:
    2020
  • 资助金额:
    $ 45.75万
    $ 45.75万
  • 项目类别:
Scalable detection and interpretation of structural variation in human genomes
人类基因组结构变异的可扩展检测和解释
  • 批准号:
    10341175
    10341175
  • 财政年份:
    2020
  • 资助金额:
    $ 45.75万
    $ 45.75万
  • 项目类别:
Scalable detection and interpretation of structural variation in human genomes
人类基因组结构变异的可扩展检测和解释
  • 批准号:
    10153847
    10153847
  • 财政年份:
    2020
  • 资助金额:
    $ 45.75万
    $ 45.75万
  • 项目类别:
New algorithms and tools for large-scale genomic analyses
用于大规模基因组分析的新算法和工具
  • 批准号:
    8273206
    8273206
  • 财政年份:
    2012
  • 资助金额:
    $ 45.75万
    $ 45.75万
  • 项目类别:
New algorithms and tools for large-scale genomic analyses
用于大规模基因组分析的新算法和工具
  • 批准号:
    9272425
    9272425
  • 财政年份:
    2012
  • 资助金额:
    $ 45.75万
    $ 45.75万
  • 项目类别:
New algorithms and tools for large-scale genomic analyses
用于大规模基因组分析的新算法和工具
  • 批准号:
    8661785
    8661785
  • 财政年份:
    2012
  • 资助金额:
    $ 45.75万
    $ 45.75万
  • 项目类别:
New algorithms and tools for large-scale genomic analyses
用于大规模基因组分析的新算法和工具
  • 批准号:
    8460819
    8460819
  • 财政年份:
    2012
  • 资助金额:
    $ 45.75万
    $ 45.75万
  • 项目类别:

相似国自然基金

等位基因聚合网络模型的构建及其在叶片茸毛发育中的应用
  • 批准号:
    32370714
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
基于等位基因非平衡表达的鹅掌楸属生长量杂种优势机理研究
  • 批准号:
    32371910
  • 批准年份:
    2023
  • 资助金额:
    50.00 万元
  • 项目类别:
    面上项目
基于人诱导多能干细胞技术研究突变等位基因特异性敲除治疗1型和2型长QT综合征
  • 批准号:
    82300353
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
ACR11A不同等位基因调控番茄低温胁迫的机理解析
  • 批准号:
    32302535
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
肠杆菌多粘菌素异质性耐药中phoPQ等位基因差异介导不同亚群共存的机制研究
  • 批准号:
    82302575
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Orthogonal CRISPR GEMMs
正交 CRISPR GEMM
  • 批准号:
    10639698
    10639698
  • 财政年份:
    2023
  • 资助金额:
    $ 45.75万
    $ 45.75万
  • 项目类别:
Germline Genetic Modifiers of Radiation Response
辐射反应的种系遗传修饰剂
  • 批准号:
    10741022
    10741022
  • 财政年份:
    2023
  • 资助金额:
    $ 45.75万
    $ 45.75万
  • 项目类别:
Specificity of RPSA-dependent translational control in mouse and human fetal spleen cells
小鼠和人胎儿脾细胞中 RPSA 依赖性翻译控制的特异性
  • 批准号:
    10647605
    10647605
  • 财政年份:
    2023
  • 资助金额:
    $ 45.75万
    $ 45.75万
  • 项目类别:
Resource Section
资源部分
  • 批准号:
    10773479
    10773479
  • 财政年份:
    2023
  • 资助金额:
    $ 45.75万
    $ 45.75万
  • 项目类别:
Role of POU4F1 in a Novel Form of Ataxia
POU4F1 在新型共济失调中的作用
  • 批准号:
    10741382
    10741382
  • 财政年份:
    2023
  • 资助金额:
    $ 45.75万
    $ 45.75万
  • 项目类别: