Representing structural haplotypes and complex genetic variation in pan-genome graphs

表示泛基因组图中的结构单倍型和复杂的遗传变异

基本信息

  • 批准号:
    10832934
  • 负责人:
  • 金额:
    $ 26.76万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2023
  • 资助国家:
    美国
  • 起止时间:
    2023-02-01 至 2024-01-31
  • 项目状态:
    已结题

项目摘要

Project Summary The initial phase of sequencing the human pangenome has resulted in the assembly of a diverse collection of genomes. In parallel, an ecosystem of sophisticated computational methods were developed to organize the pangenome a graphical data structure that efficiently reflects the diversity of a global population, as well as sequence analysis methods required for geneticists to use the pangenome to improve how their studies are performed relative to a single reference genome. The pangenome revealed important factors about human genetic variation. In particular, there is a considerable amount of sequence diversity and novel sequences in the pangenome that arise from repetitive DNA. Because the initial methods developed to analyze variation in the pangenome were created for relatively simplistic variation outside of repetitive DNA, it is necessary to develop novel methods to discover, genotype, and organize, and validate variation in repetitive regions of the genome. The scope of this analysis spans short repeated DNA sequences that are hundreds of bases long, to entire regions that encompass genes. We will specifically develop methods to discover rare variation in variable-number tandem repeat sequences, and perform paralog-specific discovery of copy-number variation of genes. These methods will be developed to analyze short-read sequencing data so that large scale datasets such as those generated by TOPMed can take advantage of these methods to improve variant discovery in their cohorts. We will additionally develop methods to improve the representation of repetitive or rearranged sequences in the graphical representation of the pangenome. This will be accomplished by modeling the evolutionary relationships of repetitive sequences while building the graph, and validating assembly organization using public datasets from the single-cell sequencing technique, Strand-Seq. All of our development will be performed collaboratively with other members of the Human Pangenome Reference Consortium. We will share methods for variant discovery with other researchers who are studying large cohorts. Finally, any improvements in the pangenome graph will be released in coordination with production and other groups so that there is a standardized pangenome graph for other researchers in the public to base research from.
项目概要 人类泛基因组测序的初始阶段已经组装了 不同的基因组集合。与此同时,一个由复杂计算组成的生态系统 开发了方法来组织泛基因组,这是一种有效的图形数据结构 反映了全球人口的多样性,以及所需的序列分析方法 遗传学家使用泛基因组来改进他们的研究相对于 单一参考基因组。全基因组揭示了人类遗传的重要因素 变化。特别是,存在大量的序列多样性和新颖性 泛基因组中由重复 DNA 产生的序列。因为最初的方法 开发用于分析全基因组变异,是为相对简单的变异而创建的 除了重复的 DNA 之外,有必要开发新的方法来发现、基因分型和 组织并验证基因组重复区域的变异。本次分析的范围 跨越数百个碱基长的短重复DNA序列,到整个区域 涵盖基因。我们将专门开发方法来发现罕见的变异 可变数量串联重复序列,并执行旁系同源特异性发现 基因的拷贝数变异。这些方法将被开发来分析短读 对数据进行排序,以便大规模数据集(例如由 TOPMed 生成的数据集)可以采用 利用这些方法来改善其群体中的变异发现。我们还将另外 开发方法来改善重复或重新排列序列的表示 全基因组的图形表示。这将通过建模来完成 构建图表并验证时重复序列的进化关系 使用单细胞测序技术的公共数据集进行组装组织, 链序列。我们所有的开发都将与其他成员合作进行 人类泛基因组参考联盟。我们将与您分享变异发现的方法 其他正在研究大型队列的研究人员。最后,泛基因组的任何改进 图表将与生产和其他小组协调发布,以便有一个 标准化的全基因组图,供公众中的其他研究人员作为基础研究。

项目成果

期刊论文数量(5)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Constructing founder sets under allelic and non-allelic homologous recombination.
  • DOI:
    10.1186/s13015-023-00241-3
  • 发表时间:
    2023-09-29
  • 期刊:
  • 影响因子:
    1
  • 作者:
    Bonnet, Konstantinn;Marschall, Tobias;Doerr, Daniel
  • 通讯作者:
    Doerr, Daniel
Profiling variable-number tandem repeat variation across populations using repeat-pangenome graphs.
  • DOI:
    10.1038/s41467-021-24378-0
  • 发表时间:
    2021-07-12
  • 期刊:
  • 影响因子:
    16.6
  • 作者:
    Lu TY;Human Genome Structural Variation Consortium;Chaisson MJP
  • 通讯作者:
    Chaisson MJP
lra: A long read aligner for sequences and contigs.
  • DOI:
    10.1371/journal.pcbi.1009078
  • 发表时间:
    2021-06
  • 期刊:
  • 影响因子:
    4.3
  • 作者:
    Ren J;Chaisson MJP
  • 通讯作者:
    Chaisson MJP
The Human Pangenome Project: a global resource to map genomic diversity.
  • DOI:
    10.1038/s41586-022-04601-8
  • 发表时间:
    2022-04
  • 期刊:
  • 影响因子:
    64.8
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Mark Chaisson其他文献

Mark Chaisson的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Mark Chaisson', 18)}}的其他基金

Detection and genotyping complex human genetic variation using single-molecule sequencing
使用单分子测序对复杂的人类遗传变异进行检测和基因分型
  • 批准号:
    10186109
  • 财政年份:
    2021
  • 资助金额:
    $ 26.76万
  • 项目类别:
Detection and genotyping complex human genetic variation using single-molecule sequencing
使用单分子测序对复杂的人类遗传变异进行检测和基因分型
  • 批准号:
    10655573
  • 财政年份:
    2021
  • 资助金额:
    $ 26.76万
  • 项目类别:
Detection and genotyping complex human genetic variation using single-molecule sequencing
使用单分子测序对复杂的人类遗传变异进行检测和基因分型
  • 批准号:
    10447193
  • 财政年份:
    2021
  • 资助金额:
    $ 26.76万
  • 项目类别:
Representing structural haplotypes and complex genetic variation in pan-genome graphs
表示泛基因组图中的结构单倍型和复杂的遗传变异
  • 批准号:
    10337078
  • 财政年份:
    2020
  • 资助金额:
    $ 26.76万
  • 项目类别:
Representing structural haplotypes and complex genetic variation in pan-genome graphs
表示泛基因组图中的结构单倍型和复杂的遗传变异
  • 批准号:
    9906038
  • 财政年份:
    2020
  • 资助金额:
    $ 26.76万
  • 项目类别:

相似国自然基金

大尺度复杂体系电子-声子相互作用计算方法的拓展与应用
  • 批准号:
    12374008
  • 批准年份:
    2023
  • 资助金额:
    53 万元
  • 项目类别:
    面上项目
复杂海洋环境多水下结构系统振动声辐射分析的半解析联合计算方法
  • 批准号:
    12372196
  • 批准年份:
    2023
  • 资助金额:
    53 万元
  • 项目类别:
    面上项目
复杂能谱干涉效应下基于准扩散的全堆芯pin-by-pin高效精确计算方法研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
复杂微纳光场的准正规模理论和高效率时域计算方法研究
  • 批准号:
    62235006
  • 批准年份:
    2022
  • 资助金额:
    274 万元
  • 项目类别:
    重点项目
面向无人船自主决策的复杂物理信息感知与混合驱动智能计算方法
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    54 万元
  • 项目类别:
    面上项目

相似海外基金

Bayesian genetic association analysis of all rare diseases in the Kids First cohort
Kids First 队列中所有罕见疾病的贝叶斯遗传关联分析
  • 批准号:
    10643463
  • 财政年份:
    2023
  • 资助金额:
    $ 26.76万
  • 项目类别:
Knowledgebase of Escherichia coli Genome and Metabolism
大肠杆菌基因组和代谢知识库
  • 批准号:
    10716050
  • 财政年份:
    2023
  • 资助金额:
    $ 26.76万
  • 项目类别:
Structural and biochemical characterization of VCPIP1 and VCP complex
VCPIP1 和 VCP 复合物的结构和生化表征
  • 批准号:
    10675974
  • 财政年份:
    2023
  • 资助金额:
    $ 26.76万
  • 项目类别:
A universal approach for determining three-dimensional RNA structures
确定三维 RNA 结构的通用方法
  • 批准号:
    10724848
  • 财政年份:
    2023
  • 资助金额:
    $ 26.76万
  • 项目类别:
Big Data Training for Cancer Research
癌症研究大数据培训
  • 批准号:
    10880158
  • 财政年份:
    2023
  • 资助金额:
    $ 26.76万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了