The construction and utility of reference pan-genome graphs

参考泛基因组图的构建和利用

基本信息

  • 批准号:
    10777673
  • 负责人:
  • 金额:
    $ 80.2万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2023
  • 资助国家:
    美国
  • 起止时间:
    2023-02-04 至 2024-02-29
  • 项目状态:
    已结题

项目摘要

PROJECT SUMMARY The current human reference genome, GRCh38, plays a central role in medical and population human genetics. It primarily models a single human individual and is missing hundreds of thousands of large structural variations segregating in the population. This underrepresentation of genetic diversity leads to various artifacts in data analysis and significantly hampers our understanding of the functional and medical relevance of these large human variations, which may collectively have pervasive impact. To address this issue, we will extend our previous work on sequence graphs and alignment algorithms and construct a pan-genome reference graph from hundreds of long-read human assemblies that more completely represent genetic diversity. Specifically, we will (1) design a reference graph model with a stable coordinate system compatible with GRCh38 and develop toolkits and libraries to interact with this model; (2) develop minimizer-based sequence-to-graph alignment algorithms for short and long sequences; (3) incrementally construct a reference graph by mapping assemblies to an existing graph and updating the graph; and (4) develop a graph-based genotyping algorithm and apply it to short-read based projects to call structural variations missed by the current pipelines. Upon completion, the proposed project could replace the current practices based on a linear genome and will enable the profiling and study of complex human variations missed in most current research.
项目摘要 当前的人类参考基因组GRCH38在医学和人群人遗传学中起着核心作用。 它主要是建模一个人,并且缺少数十万个大型结构变化 人口隔离。遗传多样性的这种代表性不足会导致数据中的各种文物 分析并显着阻碍我们对这些大型功能和医学相关性的理解 人类的变化,可能会产生普遍影响。为了解决这个问题,我们将扩展我们的 先前在序列图和对齐算法上的工作,并从 数百种更完全代表遗传多样性的长阅读人类集会。具体来说,我们会的 (1)设计具有与GRCH38兼容的稳定坐标系的参考图模型并开发 工具包和库与此模型交互; (2)开发基于最小化器的序列到射线对齐 短序列和长序列的算法; (3)通过映射组件逐步构建参考图 到现有图并更新图形; (4)开发基于图的基因分算法并应用它 基于简短的项目,以调用当前管道错过的结构变化。完成后, 拟议的项目可以基于线性基因组替代当前实践,并将实现分析和 在大多数当前研究中,对复杂的人类变异的研究缺失。

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
KmerKeys: a web resource for searching indexed genome assemblies and variants.
  • DOI:
    10.1093/nar/gkac266
  • 发表时间:
    2022-07-05
  • 期刊:
  • 影响因子:
    14.9
  • 作者:
    Pavlichin, Dmitri S.;Lee, HoJoon;Greer, Stephanie U.;Grimes, Susan M.;Weissman, Tsachy;Ji, Hanlee P.
  • 通讯作者:
    Ji, Hanlee P.
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Heng Li其他文献

Heng Li的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Heng Li', 18)}}的其他基金

The construction and utility of reference pan-genome graphs
参考泛基因组图的构建和利用
  • 批准号:
    10112282
  • 财政年份:
    2020
  • 资助金额:
    $ 80.2万
  • 项目类别:
The construction and utility of reference pan-genome graphs
参考泛基因组图的构建和利用
  • 批准号:
    9904877
  • 财政年份:
    2020
  • 资助金额:
    $ 80.2万
  • 项目类别:
The construction and utility of reference pan-genome graphs
参考泛基因组图的构建和利用
  • 批准号:
    10379369
  • 财政年份:
    2020
  • 资助金额:
    $ 80.2万
  • 项目类别:
Advanced computational methods in analyzing high-throughput sequencing data
分析高通量测序数据的先进计算方法
  • 批准号:
    10559560
  • 财政年份:
    2018
  • 资助金额:
    $ 80.2万
  • 项目类别:
Bioinformatics Technology to Characterize Tumor Infiltrating Immune Repertoires
生物信息学技术表征肿瘤浸润免疫库
  • 批准号:
    9888343
  • 财政年份:
    2018
  • 资助金额:
    $ 80.2万
  • 项目类别:
Advanced computational methods in analyzing high-throughput sequencing data
分析高通量测序数据的先进计算方法
  • 批准号:
    10367263
  • 财政年份:
    2018
  • 资助金额:
    $ 80.2万
  • 项目类别:

相似国自然基金

分布式非凸非光滑优化问题的凸松弛及高低阶加速算法研究
  • 批准号:
    12371308
  • 批准年份:
    2023
  • 资助金额:
    43.5 万元
  • 项目类别:
    面上项目
资源受限下集成学习算法设计与硬件实现研究
  • 批准号:
    62372198
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
基于物理信息神经网络的电磁场快速算法研究
  • 批准号:
    52377005
  • 批准年份:
    2023
  • 资助金额:
    52 万元
  • 项目类别:
    面上项目
考虑桩-土-水耦合效应的饱和砂土变形与流动问题的SPH模型与高效算法研究
  • 批准号:
    12302257
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
面向高维不平衡数据的分类集成算法研究
  • 批准号:
    62306119
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

High-throughput thermodynamic and kinetic measurements for variant effects prediction in a major protein superfamily
用于预测主要蛋白质超家族变异效应的高通量热力学和动力学测量
  • 批准号:
    10752370
  • 财政年份:
    2023
  • 资助金额:
    $ 80.2万
  • 项目类别:
Previvors Recharge: A Resilience Program for Cancer Previvors
癌症预防者恢复活力计划:癌症预防者恢复力计划
  • 批准号:
    10698965
  • 财政年份:
    2023
  • 资助金额:
    $ 80.2万
  • 项目类别:
Programmable peptide-guided protein degradation
可编程肽引导的蛋白质降解
  • 批准号:
    10741655
  • 财政年份:
    2023
  • 资助金额:
    $ 80.2万
  • 项目类别:
Noninvasive prediction of skin precancer severity using in vivo cellular imaging and deep learning algorithms.
使用体内细胞成像和深度学习算法无创预测皮肤癌前病变的严重程度。
  • 批准号:
    10761578
  • 财政年份:
    2023
  • 资助金额:
    $ 80.2万
  • 项目类别:
i-AKC: Integrated AIRR Knowledge Commons
i-AKC:综合 AIRR 知识共享
  • 批准号:
    10712558
  • 财政年份:
    2023
  • 资助金额:
    $ 80.2万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了