Computational methods for variant calling and haplotyping using long-read sequencing technologies
使用长读长测序技术进行变异调用和单倍型分析的计算方法
基本信息
- 批准号:10441522
- 负责人:
- 金额:$ 38.16万
- 依托单位:
- 依托单位国家:美国
- 项目类别:
- 财政年份:2020
- 资助国家:美国
- 起止时间:2020-09-01 至 2024-06-30
- 项目状态:已结题
- 来源:
- 关键词:AddressAlgorithmsBar CodesBenchmarkingBiological SciencesCatalogsCharacteristicsChromosome MappingClinicalCodeComplexComputing MethodologiesDNADataData SetDetectionDiploidyDiseaseEvolutionExhibitsGene DuplicationGenerationsGenesGenetic DiseasesGenetic VariationGenetic studyGenomeGenomicsGenotypeGoalsHaplotypesHereditary Nonpolyposis Colorectal NeoplasmsHuman GeneticsHuman GenomeIndividualLibrariesLinkMalignant NeoplasmsMapsMassive Parallel SequencingMedicalMedical GeneticsMendelian disorderMethodsModelingMutationPMS2 genePhasePopulationPopulation GeneticsPopulation StudyPreparationRepetitive SequenceSequence HomologsSequence HomologySingle Nucleotide PolymorphismSoftware ToolsTechnologyVariantbasecomputerized toolsdisease-causing mutationgenetic analysisgenome sequencinghearing impairmenthuman diseasehuman genome sequencinghuman reference genomeimprovedinnovationinsertion/deletion mutationmultiple datasetsnanoporenext generation sequencingpreventpublic health relevancesingle moleculetoolvariant detectionvirtualwhole genome
项目摘要
Project Summary/Abstract
In this project, we propose to develop computational methods and tools for whole-genome haplotyping and
small variant calling using long-read sequencing technologies such as Pacific Biosciences and Oxford
Nanopore and linked-read technologies. Haplotype information is crucial for interpretation of genetic variation
in individual genomes, disease mapping, clinical genomics and several other analysis of human genetic
variation. The lack of phase or haplotype information in human genomes sequenced using short reads is a
major barrier in identifying disease associations with compound heterozygous mutations. More than 600 genes
overlap segmental duplications with high sequence identity and variants in more than 100 such genes have
been associated with rare Mendelian disorders and complex diseases including cancer. The inability to detect
variants with high accuracy in duplicated regions of the genome using short-read sequencing technologies
reduces the ability to identify disease causing mutations in medical genetics studies. In Aim 1, we will develop
a general computational method for long-read based diploid genotyping that will enable accurate haplotyping
for single nucleotide variants and short indels using long-read and linked-reads as well as accurate small
variant calling using SMS technologies. In Aim 2, we will develop computational methods for sensitive mapping
of SMS reads and accurate variant calling in repetitive regions of the human genome that are currently
excluded from benchmark small variant call sets for reference human genomes. Finally, in Aim 3, we will
leverage the methods from Aims 1 and 2 to perform variant calling on multiple genomes sequenced using SMS
technologies to catalog variant PSVs and leverage this catalog to improve read mapping and variant calling
accuracy of short-read sequencing in repetitive regions of the genome. We will implement the methods in
robust and computationally efficient software tools and benchmark their accuracy using publicly available long-
read sequence datasets for multiple human genomes of diverse ancestries.
项目概要/摘要
在这个项目中,我们建议开发用于全基因组单倍型分析的计算方法和工具
使用 Pacific Biosciences 和 Oxford 等长读长测序技术进行小变异检出
纳米孔和链接读取技术。单倍型信息对于解释遗传变异至关重要
在个体基因组、疾病图谱、临床基因组学和其他一些人类遗传分析中
变化。使用短读长测序的人类基因组中缺乏相位或单倍型信息是一个问题
识别与复合杂合突变的疾病关联的主要障碍。超过600个基因
具有高序列同一性的重叠片段重复和超过 100 个此类基因的变异
与罕见的孟德尔疾病和包括癌症在内的复杂疾病有关。无法检测
使用短读长测序技术在基因组重复区域中获得高精度变异
降低了医学遗传学研究中识别致病突变的能力。在目标 1 中,我们将开发
一种基于长读长的二倍体基因分型的通用计算方法,可实现准确的单倍型分析
对于单核苷酸变异和短插入缺失,使用长读和链接读以及精确的小读
使用短信技术进行变异调用。在目标 2 中,我们将开发敏感映射的计算方法
目前,人类基因组重复区域中的短信读取和准确变异调用
从参考人类基因组的基准小变异调用集中排除。最后,在目标 3 中,我们将
利用目标 1 和 2 中的方法对使用 SMS 测序的多个基因组执行变异调用
对变体 PSV 进行编目并利用该目录来改进读取映射和变体调用的技术
基因组重复区域中短读长测序的准确性。我们将实施以下方法
强大且计算高效的软件工具,并使用公开的长期数据来衡量其准确性
读取不同祖先的多个人类基因组的序列数据集。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Vikas Bansal其他文献
Vikas Bansal的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Vikas Bansal', 18)}}的其他基金
Computational methods for variant calling and haplotyping using long-read sequencing technologies
使用长读长测序技术进行变异调用和单倍型分析的计算方法
- 批准号:
10247821 - 财政年份:2020
- 资助金额:
$ 38.16万 - 项目类别:
Computational methods for variant calling and haplotyping using long-read sequencing technologies
使用长读长测序技术进行变异调用和单倍型分析的计算方法
- 批准号:
10058104 - 财政年份:2020
- 资助金额:
$ 38.16万 - 项目类别:
Computational methods for variant calling and haplotyping using long-read sequencing technologies
使用长读长测序技术进行变异调用和单倍型分析的计算方法
- 批准号:
10657420 - 财政年份:2020
- 资助金额:
$ 38.16万 - 项目类别:
Methods for detecting short indels from high-throughput sequence data
从高通量序列数据中检测短插入缺失的方法
- 批准号:
8706938 - 财政年份:2013
- 资助金额:
$ 38.16万 - 项目类别:
Methods for detecting short indels from high-throughput sequence data
从高通量序列数据中检测短插入缺失的方法
- 批准号:
8572023 - 财政年份:2013
- 资助金额:
$ 38.16万 - 项目类别:
相似国自然基金
随机阻尼波动方程的高效保结构算法研究
- 批准号:12301518
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
大规模黎曼流形稀疏优化算法及应用
- 批准号:12371306
- 批准年份:2023
- 资助金额:43.5 万元
- 项目类别:面上项目
基于任意精度计算架构的量子信息处理算法硬件加速技术研究
- 批准号:62304037
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
分布式非凸非光滑优化问题的凸松弛及高低阶加速算法研究
- 批准号:12371308
- 批准年份:2023
- 资助金额:43.5 万元
- 项目类别:面上项目
基于物理信息神经网络的雷达回波资料反演蒸发波导算法研究
- 批准号:42305048
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
相似海外基金
Simple and Accessible Microfluidic Platform for Single Molecule Sequence Profiling of Tumor-derived DNA within Liquid Biopsies
简单易用的微流体平台,用于液体活检中肿瘤来源 DNA 的单分子序列分析
- 批准号:
10699214 - 财政年份:2023
- 资助金额:
$ 38.16万 - 项目类别:
Simple and Accessible Microfluidic Platform for Single Molecule Sequence Profiling of Tumor-derived DNA within Liquid Biopsies
简单易用的微流体平台,用于液体活检中肿瘤来源 DNA 的单分子序列分析
- 批准号:
10699214 - 财政年份:2023
- 资助金额:
$ 38.16万 - 项目类别:
Quick and Accurate Measurements of HIV Broadly Neutralizing Antibody Susceptibility
快速准确地测量 HIV 广泛中和抗体敏感性
- 批准号:
10676422 - 财政年份:2023
- 资助金额:
$ 38.16万 - 项目类别:
Synthetic mRNA Control Set for Nanopore-Based Pseudouridine Modification Profiling in Human Transcriptomes
用于人类转录组中基于纳米孔的假尿苷修饰分析的合成 mRNA 对照集
- 批准号:
10582330 - 财政年份:2023
- 资助金额:
$ 38.16万 - 项目类别:
Systematic Characterization and Targeting of Neomorphic Drivers in Cancer
癌症新形态驱动因素的系统表征和靶向
- 批准号:
10717973 - 财政年份:2023
- 资助金额:
$ 38.16万 - 项目类别: