Cross-platform structural variant discovery with deep learning

通过深度学习跨平台结构变体发现

基本信息

  • 批准号:
    10686879
  • 负责人:
  • 金额:
    $ 57.59万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2022
  • 资助国家:
    美国
  • 起止时间:
    2022-09-01 至 2027-06-30
  • 项目状态:
    未结题

项目摘要

Structural variants (SV) are a major driver of the genetic diversity and disease in the human genome and their discovery is imperative to advances in precision medicine and our understanding of human genetics. Due to revolutionary breakthroughs in whole-genome sequencing technologies, we now have access to genomic data at an unprecedented scale and resolution. However, despite tremendous effort and progress in SV calling methodology, general SV discovery still remains unsolved. Existing techniques use hand-engineered features and heuristics to model SV classes, relying heavily on developer expertise, which cannot scale to the vast diversity of SV types and sequencing platforms nor fully harness all the information available in raw sequencing data. As a result, these methods are usually tightly coupled to the properties of a particular sequencing technology and operate optimally only on certain SV types and sizes, rendering us blind to many other classes of SVs and their role in disease. Deep neural networks have the ability to learn complex abstractions automatically from the data and hence offer a promising avenue for general SV discovery. Deep learning has recently transformed the field of machine learning and led to remarkable advances in science and medicine. In this proposal we aim to leverage the potential of deep learning for the problem of SV detection. We lay out how to efficiently formulate SV detection as a deep learning task, and propose the development of a comprehensive framework to call and genotype SVs of different size and type, including complex and subclonal SVs, given data from a range of sequencing platforms. In particular, we demonstrate that state-of-the-art results can be obtained using our approach for short, linked, and long read datasets. In order to ensure that our models generalize across different datasets, an important goal of our proposal is also to assemble diverse and representative training data and perform extensive evaluation using publicly- available multi-platform datasets to accurately assess model performance. Our software will be built with extensibility and scalability in mind, and will be released, along with pretrained models and callsets, freely to the community.
结构变异(SV)是人类基因组及其遗传多样性和疾病的主要驱动因素 发现对于精准医学的进步和我们对人类遗传学的理解至关重要。由于 全基因组测序技术的革命性突破,我们现在可以快速获取基因组数据 前所未有的规模和分辨率。然而,尽管在 SV 调用方法方面付出了巨大的努力和进步, 一般的 SV 发现仍然没有解决。现有技术使用手工设计的特征和启发式方法 模型 SV 类,严重依赖开发人员的专业知识,无法扩展到 SV 类型的巨大多样性和 测序平台也不能充分利用原始测序数据中的所有可用信息。结果,这些 方法通常与特定测序技术的特性紧密结合并以最佳方式运行 仅针对某些 SV 类型和大小,使我们对许多其他类别的 SV 及其在疾病中的作用视而不见。深的 神经网络有能力从数据中自动学习复杂的抽象,从而提供 通用 SV 发现的有希望的途径。深度学习最近改变了机器学习领域 并导致了科学和医学的显着进步。在本提案中,我们的目标是利用深度学习的潜力 SV检测问题的学习。我们阐述了如何有效地将 SV 检测制定为深度学习 任务,并提出开发一个综合框架来调用和基因分型不同大小的 SV 类型,包括复杂的和亚克隆的 SV,给定来自一系列测序平台的数据。特别是,我们 证明使用我们的短读、链接读和长读方法可以获得最先进的结果 数据集。为了确保我们的模型能够在不同的数据集上泛化,我们提案的一个重要目标 还在于收集多样化且具有代表性的培训数据,并使用公开的方法进行广泛的评估 可用的多平台数据集来准确评估模型性能。我们的软件将构建为 考虑到可扩展性和可扩展性,并将与预训练模型和调用集一起免费发布给 社区。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Victoria Popic其他文献

Victoria Popic的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Victoria Popic', 18)}}的其他基金

Cross-platform structural variant discovery with deep learning
通过深度学习跨平台结构变体发现
  • 批准号:
    10453237
  • 财政年份:
    2022
  • 资助金额:
    $ 57.59万
  • 项目类别:

相似国自然基金

基于神经退行性疾病前瞻性队列的新烟碱类杀虫剂暴露对阿尔茨海默病的影响及作用机制研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    53 万元
  • 项目类别:
    面上项目
基于miRNA介导ceRNA网络调控作用的防治阿尔茨海默病及认知障碍相关疾病药物的发现研究
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    55 万元
  • 项目类别:
    面上项目
LMTK1调控核内体转运介导阿尔茨海默病神经元Reserve机制研究
  • 批准号:
    81903703
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
MBP酶切L1CAM介导的线粒体自噬在阿尔茨海默病中的作用和机制
  • 批准号:
    81901296
  • 批准年份:
    2019
  • 资助金额:
    20.5 万元
  • 项目类别:
    青年科学基金项目
基于自组装多肽纳米探针检测蛋白标志物用于阿尔茨海默病精准诊断的研究
  • 批准号:
    31900984
  • 批准年份:
    2019
  • 资助金额:
    25.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Administrative Core
行政核心
  • 批准号:
    10555724
  • 财政年份:
    2023
  • 资助金额:
    $ 57.59万
  • 项目类别:
Traumatic Brain Injury Anti-Seizure Prophylaxis in the Medicare Program
医疗保险计划中的创伤性脑损伤抗癫痫预防
  • 批准号:
    10715238
  • 财政年份:
    2023
  • 资助金额:
    $ 57.59万
  • 项目类别:
CRCNS: Deep Learning to Discover Neurovascular Disruptions in Alzheimer's Disease
CRCNS:深度学习发现阿尔茨海默病的神经血管破坏
  • 批准号:
    10831259
  • 财政年份:
    2023
  • 资助金额:
    $ 57.59万
  • 项目类别:
Leveraging natural and engineered genetic barcodes from single cell RNA sequencing to investigate cellular evolution, clonal expansion, and associations between cellular genotypes and phenotypes
利用单细胞 RNA 测序中的天然和工程遗传条形码来研究细胞进化、克隆扩增以及细胞基因型和表型之间的关联
  • 批准号:
    10679186
  • 财政年份:
    2023
  • 资助金额:
    $ 57.59万
  • 项目类别:
A Novel Algorithm to Identify People with Undiagnosed Alzheimer's Disease and Related Dementias
一种识别未确诊阿尔茨海默病和相关痴呆症患者的新算法
  • 批准号:
    10696912
  • 财政年份:
    2023
  • 资助金额:
    $ 57.59万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了