Representing structural haplotypes and complex genetic variation in pan-genome graphs

表示泛基因组图中的结构单倍型和复杂的遗传变异

基本信息

  • 批准号:
    10832934
  • 负责人:
  • 金额:
    $ 26.76万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2023
  • 资助国家:
    美国
  • 起止时间:
    2023-02-01 至 2024-01-31
  • 项目状态:
    已结题

项目摘要

Project Summary The initial phase of sequencing the human pangenome has resulted in the assembly of a diverse collection of genomes. In parallel, an ecosystem of sophisticated computational methods were developed to organize the pangenome a graphical data structure that efficiently reflects the diversity of a global population, as well as sequence analysis methods required for geneticists to use the pangenome to improve how their studies are performed relative to a single reference genome. The pangenome revealed important factors about human genetic variation. In particular, there is a considerable amount of sequence diversity and novel sequences in the pangenome that arise from repetitive DNA. Because the initial methods developed to analyze variation in the pangenome were created for relatively simplistic variation outside of repetitive DNA, it is necessary to develop novel methods to discover, genotype, and organize, and validate variation in repetitive regions of the genome. The scope of this analysis spans short repeated DNA sequences that are hundreds of bases long, to entire regions that encompass genes. We will specifically develop methods to discover rare variation in variable-number tandem repeat sequences, and perform paralog-specific discovery of copy-number variation of genes. These methods will be developed to analyze short-read sequencing data so that large scale datasets such as those generated by TOPMed can take advantage of these methods to improve variant discovery in their cohorts. We will additionally develop methods to improve the representation of repetitive or rearranged sequences in the graphical representation of the pangenome. This will be accomplished by modeling the evolutionary relationships of repetitive sequences while building the graph, and validating assembly organization using public datasets from the single-cell sequencing technique, Strand-Seq. All of our development will be performed collaboratively with other members of the Human Pangenome Reference Consortium. We will share methods for variant discovery with other researchers who are studying large cohorts. Finally, any improvements in the pangenome graph will be released in coordination with production and other groups so that there is a standardized pangenome graph for other researchers in the public to base research from.
项目摘要 测序的人斑点的初始阶段导致了A组装 各种基因组收集。同时,复杂计算的生态系统 开发了组织pangenome的图形数据结构的方法 反映了全球人群的多样性,以及所需的序列分析方法 遗传学家使用pangenome来改善其研究的方式 单个参考基因组。 pangenome揭示了有关人遗传的重要因素 变化。特别是,有相当多的序列多样性和新颖 由重复DNA引起的pangenome中的序列。因为初始方法 为分析pangenome的变异而开发的是为了相对简单的变化而创建的 在重复的DNA之外,有必要开发出新的方法来发现,基因型和 组织并验证基因组重复区域的变化。该分析的范围 跨越短的重复的DNA序列,该序列长度为数百个碱基,到整个区域 包含基因。我们将专门开发发现罕见变化的方法 可变数字的串联重复序列,并执行旁系同源的发现 基因的拷贝数变异。这些方法将开发以分析短阅读 测序数据使得大规模数据集(例如由Topmed生成的数据集)可以接受 这些方法的优势可以改善同类群体中的变异发现。我们还将 开发方法来改善重复或重新排列序列的表示 Pangenome的图形表示。这将通过建模 重复序列的进化关系,并在构建图形并验证 使用单细胞测序技术中的公共数据集的组装组织, Strand-seq。我们所有的发展都将与其他成员合作 人类pangenome参考联盟。我们将与 其他正在研究大型队列的研究人员。最后,pangenome的任何改进 图将与生产和其他组协调发布,以便有一个 公众其他研究人员的标准化pangenome图。

项目成果

期刊论文数量(5)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Constructing founder sets under allelic and non-allelic homologous recombination.
  • DOI:
    10.1186/s13015-023-00241-3
  • 发表时间:
    2023-09-29
  • 期刊:
  • 影响因子:
    1
  • 作者:
    Bonnet, Konstantinn;Marschall, Tobias;Doerr, Daniel
  • 通讯作者:
    Doerr, Daniel
Profiling variable-number tandem repeat variation across populations using repeat-pangenome graphs.
  • DOI:
    10.1038/s41467-021-24378-0
  • 发表时间:
    2021-07-12
  • 期刊:
  • 影响因子:
    16.6
  • 作者:
    Lu TY;Human Genome Structural Variation Consortium;Chaisson MJP
  • 通讯作者:
    Chaisson MJP
lra: A long read aligner for sequences and contigs.
  • DOI:
    10.1371/journal.pcbi.1009078
  • 发表时间:
    2021-06
  • 期刊:
  • 影响因子:
    4.3
  • 作者:
    Ren J;Chaisson MJP
  • 通讯作者:
    Chaisson MJP
The Human Pangenome Project: a global resource to map genomic diversity.
  • DOI:
    10.1038/s41586-022-04601-8
  • 发表时间:
    2022-04
  • 期刊:
  • 影响因子:
    64.8
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Mark Chaisson其他文献

Mark Chaisson的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Mark Chaisson', 18)}}的其他基金

Detection and genotyping complex human genetic variation using single-molecule sequencing
使用单分子测序对复杂的人类遗传变异进行检测和基因分型
  • 批准号:
    10186109
  • 财政年份:
    2021
  • 资助金额:
    $ 26.76万
  • 项目类别:
Detection and genotyping complex human genetic variation using single-molecule sequencing
使用单分子测序对复杂的人类遗传变异进行检测和基因分型
  • 批准号:
    10655573
  • 财政年份:
    2021
  • 资助金额:
    $ 26.76万
  • 项目类别:
Detection and genotyping complex human genetic variation using single-molecule sequencing
使用单分子测序对复杂的人类遗传变异进行检测和基因分型
  • 批准号:
    10447193
  • 财政年份:
    2021
  • 资助金额:
    $ 26.76万
  • 项目类别:
Representing structural haplotypes and complex genetic variation in pan-genome graphs
表示泛基因组图中的结构单倍型和复杂的遗传变异
  • 批准号:
    10337078
  • 财政年份:
    2020
  • 资助金额:
    $ 26.76万
  • 项目类别:
Representing structural haplotypes and complex genetic variation in pan-genome graphs
表示泛基因组图中的结构单倍型和复杂的遗传变异
  • 批准号:
    9906038
  • 财政年份:
    2020
  • 资助金额:
    $ 26.76万
  • 项目类别:

相似国自然基金

复杂海洋环境多水下结构系统振动声辐射分析的半解析联合计算方法
  • 批准号:
    12372196
  • 批准年份:
    2023
  • 资助金额:
    53 万元
  • 项目类别:
    面上项目
大尺度复杂体系电子-声子相互作用计算方法的拓展与应用
  • 批准号:
    12374008
  • 批准年份:
    2023
  • 资助金额:
    53 万元
  • 项目类别:
    面上项目
复杂条件下的小型反应堆高保真共振计算方法研究
  • 批准号:
    12305198
  • 批准年份:
    2023
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目
复杂能谱干涉效应下基于准扩散的全堆芯pin-by-pin高效精确计算方法研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
复杂三维动态中子输运的空间-角度自适应计算方法研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Bayesian genetic association analysis of all rare diseases in the Kids First cohort
Kids First 队列中所有罕见疾病的贝叶斯遗传关联分析
  • 批准号:
    10643463
  • 财政年份:
    2023
  • 资助金额:
    $ 26.76万
  • 项目类别:
Knowledgebase of Escherichia coli Genome and Metabolism
大肠杆菌基因组和代谢知识库
  • 批准号:
    10716050
  • 财政年份:
    2023
  • 资助金额:
    $ 26.76万
  • 项目类别:
A universal approach for determining three-dimensional RNA structures
确定三维 RNA 结构的通用方法
  • 批准号:
    10724848
  • 财政年份:
    2023
  • 资助金额:
    $ 26.76万
  • 项目类别:
Structural and biochemical characterization of VCPIP1 and VCP complex
VCPIP1 和 VCP 复合物的结构和生化表征
  • 批准号:
    10675974
  • 财政年份:
    2023
  • 资助金额:
    $ 26.76万
  • 项目类别:
Big Data Training for Cancer Research
癌症研究大数据培训
  • 批准号:
    10880158
  • 财政年份:
    2023
  • 资助金额:
    $ 26.76万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了