Representing structural haplotypes and complex genetic variation in pan-genome graphs
表示泛基因组图中的结构单倍型和复杂的遗传变异
基本信息
- 批准号:10832934
- 负责人:
- 金额:$ 26.76万
- 依托单位:
- 依托单位国家:美国
- 项目类别:
- 财政年份:2023
- 资助国家:美国
- 起止时间:2023-02-01 至 2024-01-31
- 项目状态:已结题
- 来源:
- 关键词:CollectionComplexComputing MethodologiesCopy Number PolymorphismDNADNA SequenceDataData SetDevelopmentEcosystemGenesGenetic VariationGenomeGenotypeGrantGraphHaplotypesHumanHuman GeneticsMethodsMinisatellite RepeatsModelingPhasePopulationProductionRecording of previous eventsRepetitive SequenceResearchResearch PersonnelSamplingSequence AnalysisStandardizationStructureTandem Repeat SequencesTechniquesTrans-Omics for Precision MedicineVariantbasecohortdata structurehuman pangenomeimprovedlarge scale datamembermethod developmentnovelpan-genomeparalogous generare variantreference genomesingle cell sequencing
项目摘要
Project Summary
The initial phase of sequencing the human pangenome has resulted in the assembly of a
diverse collection of genomes. In parallel, an ecosystem of sophisticated computational
methods were developed to organize the pangenome a graphical data structure that efficiently
reflects the diversity of a global population, as well as sequence analysis methods required for
geneticists to use the pangenome to improve how their studies are performed relative to a
single reference genome. The pangenome revealed important factors about human genetic
variation. In particular, there is a considerable amount of sequence diversity and novel
sequences in the pangenome that arise from repetitive DNA. Because the initial methods
developed to analyze variation in the pangenome were created for relatively simplistic variation
outside of repetitive DNA, it is necessary to develop novel methods to discover, genotype, and
organize, and validate variation in repetitive regions of the genome. The scope of this analysis
spans short repeated DNA sequences that are hundreds of bases long, to entire regions that
encompass genes. We will specifically develop methods to discover rare variation in
variable-number tandem repeat sequences, and perform paralog-specific discovery of
copy-number variation of genes. These methods will be developed to analyze short-read
sequencing data so that large scale datasets such as those generated by TOPMed can take
advantage of these methods to improve variant discovery in their cohorts. We will additionally
develop methods to improve the representation of repetitive or rearranged sequences in the
graphical representation of the pangenome. This will be accomplished by modeling the
evolutionary relationships of repetitive sequences while building the graph, and validating
assembly organization using public datasets from the single-cell sequencing technique,
Strand-Seq. All of our development will be performed collaboratively with other members of the
Human Pangenome Reference Consortium. We will share methods for variant discovery with
other researchers who are studying large cohorts. Finally, any improvements in the pangenome
graph will be released in coordination with production and other groups so that there is a
standardized pangenome graph for other researchers in the public to base research from.
项目摘要
测序的人斑点的初始阶段导致了A组装
各种基因组收集。同时,复杂计算的生态系统
开发了组织pangenome的图形数据结构的方法
反映了全球人群的多样性,以及所需的序列分析方法
遗传学家使用pangenome来改善其研究的方式
单个参考基因组。 pangenome揭示了有关人遗传的重要因素
变化。特别是,有相当多的序列多样性和新颖
由重复DNA引起的pangenome中的序列。因为初始方法
为分析pangenome的变异而开发的是为了相对简单的变化而创建的
在重复的DNA之外,有必要开发出新的方法来发现,基因型和
组织并验证基因组重复区域的变化。该分析的范围
跨越短的重复的DNA序列,该序列长度为数百个碱基,到整个区域
包含基因。我们将专门开发发现罕见变化的方法
可变数字的串联重复序列,并执行旁系同源的发现
基因的拷贝数变异。这些方法将开发以分析短阅读
测序数据使得大规模数据集(例如由Topmed生成的数据集)可以接受
这些方法的优势可以改善同类群体中的变异发现。我们还将
开发方法来改善重复或重新排列序列的表示
Pangenome的图形表示。这将通过建模
重复序列的进化关系,并在构建图形并验证
使用单细胞测序技术中的公共数据集的组装组织,
Strand-seq。我们所有的发展都将与其他成员合作
人类pangenome参考联盟。我们将与
其他正在研究大型队列的研究人员。最后,pangenome的任何改进
图将与生产和其他组协调发布,以便有一个
公众其他研究人员的标准化pangenome图。
项目成果
期刊论文数量(5)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Constructing founder sets under allelic and non-allelic homologous recombination.
- DOI:10.1186/s13015-023-00241-3
- 发表时间:2023-09-29
- 期刊:
- 影响因子:1
- 作者:Bonnet, Konstantinn;Marschall, Tobias;Doerr, Daniel
- 通讯作者:Doerr, Daniel
Profiling variable-number tandem repeat variation across populations using repeat-pangenome graphs.
- DOI:10.1038/s41467-021-24378-0
- 发表时间:2021-07-12
- 期刊:
- 影响因子:16.6
- 作者:Lu TY;Human Genome Structural Variation Consortium;Chaisson MJP
- 通讯作者:Chaisson MJP
lra: A long read aligner for sequences and contigs.
- DOI:10.1371/journal.pcbi.1009078
- 发表时间:2021-06
- 期刊:
- 影响因子:4.3
- 作者:Ren J;Chaisson MJP
- 通讯作者:Chaisson MJP
The Human Pangenome Project: a global resource to map genomic diversity.
- DOI:10.1038/s41586-022-04601-8
- 发表时间:2022-04
- 期刊:
- 影响因子:64.8
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Mark Chaisson其他文献
Mark Chaisson的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Mark Chaisson', 18)}}的其他基金
Detection and genotyping complex human genetic variation using single-molecule sequencing
使用单分子测序对复杂的人类遗传变异进行检测和基因分型
- 批准号:
10186109 - 财政年份:2021
- 资助金额:
$ 26.76万 - 项目类别:
Detection and genotyping complex human genetic variation using single-molecule sequencing
使用单分子测序对复杂的人类遗传变异进行检测和基因分型
- 批准号:
10655573 - 财政年份:2021
- 资助金额:
$ 26.76万 - 项目类别:
Detection and genotyping complex human genetic variation using single-molecule sequencing
使用单分子测序对复杂的人类遗传变异进行检测和基因分型
- 批准号:
10447193 - 财政年份:2021
- 资助金额:
$ 26.76万 - 项目类别:
Representing structural haplotypes and complex genetic variation in pan-genome graphs
表示泛基因组图中的结构单倍型和复杂的遗传变异
- 批准号:
10337078 - 财政年份:2020
- 资助金额:
$ 26.76万 - 项目类别:
Representing structural haplotypes and complex genetic variation in pan-genome graphs
表示泛基因组图中的结构单倍型和复杂的遗传变异
- 批准号:
9906038 - 财政年份:2020
- 资助金额:
$ 26.76万 - 项目类别:
相似国自然基金
复杂海洋环境多水下结构系统振动声辐射分析的半解析联合计算方法
- 批准号:12372196
- 批准年份:2023
- 资助金额:53 万元
- 项目类别:面上项目
大尺度复杂体系电子-声子相互作用计算方法的拓展与应用
- 批准号:12374008
- 批准年份:2023
- 资助金额:53 万元
- 项目类别:面上项目
复杂条件下的小型反应堆高保真共振计算方法研究
- 批准号:12305198
- 批准年份:2023
- 资助金额:30.00 万元
- 项目类别:青年科学基金项目
复杂能谱干涉效应下基于准扩散的全堆芯pin-by-pin高效精确计算方法研究
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
复杂三维动态中子输运的空间-角度自适应计算方法研究
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
相似海外基金
Bayesian genetic association analysis of all rare diseases in the Kids First cohort
Kids First 队列中所有罕见疾病的贝叶斯遗传关联分析
- 批准号:
10643463 - 财政年份:2023
- 资助金额:
$ 26.76万 - 项目类别:
Knowledgebase of Escherichia coli Genome and Metabolism
大肠杆菌基因组和代谢知识库
- 批准号:
10716050 - 财政年份:2023
- 资助金额:
$ 26.76万 - 项目类别:
A universal approach for determining three-dimensional RNA structures
确定三维 RNA 结构的通用方法
- 批准号:
10724848 - 财政年份:2023
- 资助金额:
$ 26.76万 - 项目类别:
Structural and biochemical characterization of VCPIP1 and VCP complex
VCPIP1 和 VCP 复合物的结构和生化表征
- 批准号:
10675974 - 财政年份:2023
- 资助金额:
$ 26.76万 - 项目类别: