The construction and utility of reference pan-genome graphs

参考泛基因组图的构建和利用

基本信息

  • 批准号:
    10379369
  • 负责人:
  • 金额:
    $ 80万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2020
  • 资助国家:
    美国
  • 起止时间:
    2020-03-01 至 2024-02-29
  • 项目状态:
    已结题

项目摘要

PROJECT SUMMARY The current human reference genome, GRCh38, plays a central role in medical and population human genetics. It primarily models a single human individual and is missing hundreds of thousands of large structural variations segregating in the population. This underrepresentation of genetic diversity leads to various artifacts in data analysis and significantly hampers our understanding of the functional and medical relevance of these large human variations, which may collectively have pervasive impact. To address this issue, we will extend our previous work on sequence graphs and alignment algorithms and construct a pan-genome reference graph from hundreds of long-read human assemblies that more completely represent genetic diversity. Specifically, we will (1) design a reference graph model with a stable coordinate system compatible with GRCh38 and develop toolkits and libraries to interact with this model; (2) develop minimizer-based sequence-to-graph alignment algorithms for short and long sequences; (3) incrementally construct a reference graph by mapping assemblies to an existing graph and updating the graph; and (4) develop a graph-based genotyping algorithm and apply it to short-read based projects to call structural variations missed by the current pipelines. Upon completion, the proposed project could replace the current practices based on a linear genome and will enable the profiling and study of complex human variations missed in most current research.
项目概要 当前的人类参考基因组 GRCh38 在医学和人口人类遗传学中发挥着核心作用。 它主要模拟单个人类个体,并且缺少数十万个大型结构变化 人口中的隔离。遗传多样性的代表性不足导致数据中存在各种伪影 分析并极大地妨碍了我们对这些大的功能和医学相关性的理解 人类的差异,这些差异可能共同产生普遍的影响。为了解决这个问题,我们将延长我们的 之前关于序列图和比对算法的工作,并从构建泛基因组参考图 数百个长读的人类组合更完整地代表了遗传多样性。具体来说,我们将 (1)设计兼容GRCh38的稳定坐标系的参考图模型并开发 与该模型交互的工具包和库; (2) 开发基于最小化的序列到图的对齐 短序列和长序列的算法; (3) 通过映射程序集增量构建参考图 到现有图表并更新该图表; (4) 开发基于图的基因分型算法并应用 基于短读的项目来调用当前管道遗漏的结构变化。完成后,将 拟议的项目可以取代基于线性基因组的当前实践,并将能够进行分析和 目前大多数研究都忽略了对复杂人类变异的研究。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Heng Li其他文献

Heng Li的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Heng Li', 18)}}的其他基金

The construction and utility of reference pan-genome graphs
参考泛基因组图的构建和利用
  • 批准号:
    10777673
  • 财政年份:
    2023
  • 资助金额:
    $ 80万
  • 项目类别:
The construction and utility of reference pan-genome graphs
参考泛基因组图的构建和利用
  • 批准号:
    10112282
  • 财政年份:
    2020
  • 资助金额:
    $ 80万
  • 项目类别:
The construction and utility of reference pan-genome graphs
参考泛基因组图的构建和利用
  • 批准号:
    9904877
  • 财政年份:
    2020
  • 资助金额:
    $ 80万
  • 项目类别:
Advanced computational methods in analyzing high-throughput sequencing data
分析高通量测序数据的先进计算方法
  • 批准号:
    10367263
  • 财政年份:
    2018
  • 资助金额:
    $ 80万
  • 项目类别:
Bioinformatics Technology to Characterize Tumor Infiltrating Immune Repertoires
生物信息学技术表征肿瘤浸润免疫库
  • 批准号:
    9888343
  • 财政年份:
    2018
  • 资助金额:
    $ 80万
  • 项目类别:
Advanced computational methods in analyzing high-throughput sequencing data
分析高通量测序数据的先进计算方法
  • 批准号:
    10559560
  • 财政年份:
    2018
  • 资助金额:
    $ 80万
  • 项目类别:

相似国自然基金

采用复合防护材料的水下多介质耦合作用下重力坝抗爆机理研究
  • 批准号:
    51779168
  • 批准年份:
    2017
  • 资助金额:
    59.0 万元
  • 项目类别:
    面上项目
采用数值计算求解一类半代数系统全部整数解
  • 批准号:
    11671377
  • 批准年份:
    2016
  • 资助金额:
    48.0 万元
  • 项目类别:
    面上项目
采用pinball loss的MEE算法研究
  • 批准号:
    11401247
  • 批准年份:
    2014
  • 资助金额:
    23.0 万元
  • 项目类别:
    青年科学基金项目
采用路径算法和管网简化的城市内涝近实时模拟
  • 批准号:
    41301419
  • 批准年份:
    2013
  • 资助金额:
    25.0 万元
  • 项目类别:
    青年科学基金项目
采用ε近似算法的盲信道均衡
  • 批准号:
    60172058
  • 批准年份:
    2001
  • 资助金额:
    16.0 万元
  • 项目类别:
    面上项目

相似海外基金

Improving Diagnosis in Gastrointestinal Cancer: Integrating Prediction Models into Routine Clinical Care
改善胃肠癌的诊断:将预测模型纳入常规临床护理
  • 批准号:
    10641060
  • 财政年份:
    2023
  • 资助金额:
    $ 80万
  • 项目类别:
ARISE (Achieving Routine Intervention and Screening for Emotional health)
ARISE(实现情绪健康的常规干预和筛查)
  • 批准号:
    10655877
  • 财政年份:
    2023
  • 资助金额:
    $ 80万
  • 项目类别:
Connecting Latinos en Pareja: A Couples-based HIV Prevention Intervention for Latino Male Couples
连接拉丁裔与帕雷哈:针对拉丁裔男性夫妇的基于夫妇的艾滋病毒预防干预措施
  • 批准号:
    10706860
  • 财政年份:
    2023
  • 资助金额:
    $ 80万
  • 项目类别:
Early Detection of Pancreatic Cancer with Human-in-the-Loop Deep Learning
通过人在环深度学习早期检测胰腺癌
  • 批准号:
    10592060
  • 财政年份:
    2023
  • 资助金额:
    $ 80万
  • 项目类别:
mAnaging siCkle CELl disease through incReased AdopTion of hydroxyurEa in Nigeria (ACCELERATE)
在尼日利亚通过增加羟基脲的使用来控制镰状细胞病(加速)
  • 批准号:
    10638598
  • 财政年份:
    2023
  • 资助金额:
    $ 80万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了