Sequence-resolved structural variation of human genomes
人类基因组的序列解析结构变异
基本信息
- 批准号:10202688
- 负责人:
- 金额:$ 63万
- 依托单位:
- 依托单位国家:美国
- 项目类别:
- 财政年份:2018
- 资助国家:美国
- 起止时间:2018-09-06 至 2023-06-30
- 项目状态:已结题
- 来源:
- 关键词:AlgorithmsAllelesBase PairingComplexCopy Number PolymorphismDNADataData SetDiseaseFutureGenerationsGeneticGenetic PolymorphismGenetic VariationGenomeGenotypeGoalsGraphHaplotypesHeritabilityHumanHuman GeneticsHuman GenomeLinkMethodsMutationNucleotidesPhasePolyploidyPopulationPopulation GeneticsPropertyResearchResolutionSamplingShotgunsStructureTechnologyTimeVariantWorkbasegenetic variantgenome sequencinggenome-widehuman diseaseimprovedinsertion/deletion mutationinsightnovelparalogous genepopulation basedreference genomesingle moleculesingle molecule real time sequencingwhole genome
项目摘要
Understanding the genetic basis of human disease requires a comprehensive assessment of the full spectrum
of human genetic variation. Genome structural variation, including larger deletions, insertions, and inversions
(>50 bp), has been more difficult to characterize due to the association with repetitive DNA. The majority of
structural variation, including common structural variants or SVs, has not yet been discovered using short-read
whole-genome datasets and standard SV callers. Advances in sequencing technology over the last three
years, however, have made the systematic discovery of this variation possible for the first time. This proposal
focuses on the discovery, sequence resolution, and genotyping of the most complex and under-ascertained
forms of human genetic variation, including multi-copy number variants (mCNVs), inversions, and intermediate-
size insertions and deletions. We target a diversity panel of 34 human genomes and partition long-read single-
molecule, real-time sequencing data using 10X linked reads and Strand-seq data in order to fully phase and
sequence-resolve SVs on each human haplotype. Using these long-read sequence data, we further develop a
computational graph-based approach to distinguish and assemble distinct copies underlying large mCNVs
mapping to high-identity segmental duplications. Finally, we take advantage of the sequence structure,
including breakpoints and sequence differences among the copies, to more accurately genotype these variants
in a diversity panel of >2,800 human genomes where short-read whole-genome sequence data are already
available. The work will develop new methods to characterize more complex forms of human genetic variation
and provide fundamental insight into their diversity, mechanism of origin, and mutational properties. This
research has the additional benefit that it will improve genome assembly, characterize new human genome
sequence, identify a large class of missing genetic variation, and provide us with the ability to systematically
explore this form of human genetic variation as part of disease-association studies.
了解人类疾病的遗传基础需要对全谱进行全面评估
人类遗传变异。基因组结构变异,包括较大的缺失、插入和倒位
(>50 bp),由于与重复 DNA 相关,因此更难以表征。大多数
尚未使用短读长发现结构变异,包括常见的结构变异或 SV
全基因组数据集和标准 SV 调用者。过去三年测序技术的进展
然而,多年来首次系统地发现了这种变异。这个提议
专注于最复杂和尚未确定的基因的发现、序列解析和基因分型
人类遗传变异的形式,包括多拷贝数变异(mCNV)、倒位和中间变异
插入和删除的大小。我们以 34 个人类基因组的多样性为目标,并对长读长的单片段进行分区
分子、实时测序数据,使用 10X 链接读取和 Strand-seq 数据,以便完全定相和
每个人类单倍型上的序列解析 SV。利用这些长读序列数据,我们进一步开发了
基于计算图的方法来区分和组装大型 mCNV 下的不同副本
映射到高同一性片段重复。最后,我们利用序列结构,
包括副本之间的断点和序列差异,以更准确地对这些变异进行基因分型
在超过 2,800 个人类基因组的多样性面板中,短读全基因组序列数据已经
可用的。这项工作将开发新方法来表征更复杂形式的人类遗传变异
并提供对其多样性、起源机制和突变特性的基本见解。这
研究还有额外的好处,它将改善基因组组装,表征新的人类基因组
序列,识别一大类缺失的遗传变异,并使我们能够系统地
作为疾病关联研究的一部分,探索这种形式的人类遗传变异。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Evan Eichler其他文献
Evan Eichler的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Evan Eichler', 18)}}的其他基金
An "Embedded ELSI" Approach to the Creation of a Novel Human PanGenome Reference: Administrative Supplement to the Center for Human Reference Genome Diversity
创建新型人类泛基因组参考的“嵌入式 ELSI”方法:人类参考基因组多样性中心的行政补充
- 批准号:
10622227 - 财政年份:2019
- 资助金额:
$ 63万 - 项目类别:
ELSI Administrative Supplement - Center for Human Reference Genome Diversity
ELSI 行政补充 - 人类参考基因组多样性中心
- 批准号:
10423448 - 财政年份:2019
- 资助金额:
$ 63万 - 项目类别:
Sequence resolution of complex human genome structural variation
复杂人类基因组结构变异的序列解析
- 批准号:
10656792 - 财政年份:2018
- 资助金额:
$ 63万 - 项目类别:
相似国自然基金
等位基因聚合网络模型的构建及其在叶片茸毛发育中的应用
- 批准号:32370714
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
基于人诱导多能干细胞技术研究突变等位基因特异性敲除治疗1型和2型长QT综合征
- 批准号:82300353
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
肠杆菌多粘菌素异质性耐药中phoPQ等位基因差异介导不同亚群共存的机制研究
- 批准号:82302575
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
ACR11A不同等位基因调控番茄低温胁迫的机理解析
- 批准号:32302535
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
玉米穗行数QTL克隆及优异等位基因型鉴定
- 批准号:
- 批准年份:2022
- 资助金额:55 万元
- 项目类别:面上项目
相似海外基金
A comprehensive study of tandem repeat variation as a cause of Alzheimer's disease
串联重复变异作为阿尔茨海默病病因的综合研究
- 批准号:
10585034 - 财政年份:2023
- 资助金额:
$ 63万 - 项目类别:
Leveraging biobank-scale whole-genome sequencing for polygenic risk prediction
利用生物库规模的全基因组测序进行多基因风险预测
- 批准号:
10716534 - 财政年份:2023
- 资助金额:
$ 63万 - 项目类别:
Canine MHC-I genotyping and tumor specific neoantigen determination
犬 MHC-I 基因分型和肿瘤特异性新抗原测定
- 批准号:
10404109 - 财政年份:2021
- 资助金额:
$ 63万 - 项目类别:
Canine MHC-I genotyping and tumor specific neoantigen determination
犬 MHC-I 基因分型和肿瘤特异性新抗原测定
- 批准号:
10630913 - 财政年份:2021
- 资助金额:
$ 63万 - 项目类别:
Canine MHC-I genotyping and tumor specific neoantigen determination
犬 MHC-I 基因分型和肿瘤特异性新抗原测定
- 批准号:
10220542 - 财政年份:2021
- 资助金额:
$ 63万 - 项目类别: