Detection and genotyping complex human genetic variation using single-molecule sequencing
使用单分子测序对复杂的人类遗传变异进行检测和基因分型
基本信息
- 批准号:10447193
- 负责人:
- 金额:$ 41.25万
- 依托单位:
- 依托单位国家:美国
- 项目类别:
- 财政年份:2021
- 资助国家:美国
- 起止时间:2021-07-15 至 2026-04-30
- 项目状态:未结题
- 来源:
- 关键词:AlgorithmsComplexComputer softwareCopy Number PolymorphismDNA Sequence RearrangementDataData SetDatabasesDetectionDevelopmentDiagnosticDiseaseEcosystemFrequenciesGenetic DiseasesGenetic Predisposition to DiseaseGenetic VariationGenomeGenotypeGoalsHaplotypesHeritabilityHigh-Throughput Nucleotide SequencingHumanHuman GeneticsHuman GenomeIndividualKnowledgeLengthMapsMethodsMinisatellite RepeatsMinorOpticsPopulationRepetitive SequenceResearchResourcesRoleSensitivity and SpecificitySequence AlignmentSingle Nucleotide PolymorphismSoftware ToolsStructureTechnologyTestingTrans-Omics for Precision MedicineVariantWorkalgorithm developmentbasecohortcontiggenome sequencingimprovedinnovationinsertion/deletion mutationlight weightnovelpan-genomesingle moleculevariant detection
项目摘要
Project summary
Although single-molecule sequencing (SMS) technologies have advanced in recent years to enable routine
sequencing and assembly of human genomes, new software is required to utilize the potential of SMS in human
genetics. The long term goal is to help improve our understanding of complex variation in human diversity and
its role in disease. To achieve this, we will develop methods to (1) detect variation in SMS reads, (2) assemble
duplicated sequences missing from SMS de novo assemblies, and (3) genotype complex variation in large HTS
datasets using lightweight data structures. While several years of algorithm development for SMS data have
resulted in an software ecosystem to detect variation in SMS genomes, the rationale for the need to continue
development is that sensitivity and specificity are not yet sufficient for disease studies, important classes of
variation are not resolved by current assembly approaches, and the knowledge gained from sequencing SMS
genomes must be used to improve what can be discovered in large disease studies that rely heavily on short
read data such as those conducted under TOPMed. The algorithmic innovations we will provide for SMS data
are an alignment algorithm that explicitly optimizes over rearranged sequences, an assembly approach that
exploits minor differences between duplication copies to resolve genome function. Software will be supported
through Bioconda installation and distributed test cases. Once a variant is discovered by SMS, it may be more
easily genotyped in short read data. We will develop methods to generate databases of SMS variation that may
be queried with short read data. To aid in development of assembly algorithms for duplicated sequences, we will
generate a public resource of SMS data for individuals with known copy number polymorphisms. The significance
of this work is to enable SMS genomes to be used in disease studies, both by uncovering previously hidden
variation, and by increasing the amount of variation found in large short-read datasets.
项目概要
尽管单分子测序 (SMS) 技术近年来取得了进步,使得常规测序成为可能
人类基因组的测序和组装,需要新的软件来利用短信在人类中的潜力
遗传学。长期目标是帮助提高我们对人类多样性和复杂变异的理解
它在疾病中的作用。为了实现这一目标,我们将开发方法来(1)检测短信读取的变化,(2)组装
SMS de novo 组装中缺少重复序列,以及 (3) 大型 HTS 中的基因型复杂变异
使用轻量级数据结构的数据集。虽然短信数据算法的多年开发已经
产生了一个软件生态系统来检测 SMS 基因组的变异,这是需要继续下去的理由
发展的一个问题是敏感性和特异性还不足以用于疾病研究,重要的类别
当前的组装方法无法解决变异问题,并且从 SMS 测序中获得的知识
基因组必须用于改进严重依赖短时间的大型疾病研究中可以发现的内容
读取数据,例如在 TOPMed 下进行的数据。我们将为短信数据提供的算法创新
是一种显式优化重排序列的比对算法,是一种组装方法
利用重复拷贝之间的微小差异来解决基因组功能。软件将得到支持
通过 Bioconda 安装和分布式测试用例。一旦通过短信发现变种,可能会导致更多
很容易在短读数据中进行基因分型。我们将开发生成短信变体数据库的方法,这些数据库可能
通过短读数据进行查询。为了帮助开发重复序列的组装算法,我们将
为具有已知拷贝数多态性的个体生成 SMS 数据的公共资源。意义
这项工作的目的是通过揭示以前隐藏的信息,使 SMS 基因组能够用于疾病研究
变异,以及增加大型短读数据集中发现的变异量。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Mark Chaisson其他文献
Mark Chaisson的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Mark Chaisson', 18)}}的其他基金
Representing structural haplotypes and complex genetic variation in pan-genome graphs
表示泛基因组图中的结构单倍型和复杂的遗传变异
- 批准号:
10832934 - 财政年份:2023
- 资助金额:
$ 41.25万 - 项目类别:
Detection and genotyping complex human genetic variation using single-molecule sequencing
使用单分子测序对复杂的人类遗传变异进行检测和基因分型
- 批准号:
10186109 - 财政年份:2021
- 资助金额:
$ 41.25万 - 项目类别:
Detection and genotyping complex human genetic variation using single-molecule sequencing
使用单分子测序对复杂的人类遗传变异进行检测和基因分型
- 批准号:
10655573 - 财政年份:2021
- 资助金额:
$ 41.25万 - 项目类别:
Representing structural haplotypes and complex genetic variation in pan-genome graphs
表示泛基因组图中的结构单倍型和复杂的遗传变异
- 批准号:
10337078 - 财政年份:2020
- 资助金额:
$ 41.25万 - 项目类别:
Representing structural haplotypes and complex genetic variation in pan-genome graphs
表示泛基因组图中的结构单倍型和复杂的遗传变异
- 批准号:
9906038 - 财政年份:2020
- 资助金额:
$ 41.25万 - 项目类别:
相似国自然基金
高维复杂失效域下飞行器结构可靠性分析的双层自适应学习方法研究
- 批准号:52305150
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
复杂网络上非线性动力系统临界点的严格边界
- 批准号:12305038
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于深度学习的乘性分数高斯噪声驱动下复杂系统的动力学分析
- 批准号:12362005
- 批准年份:2023
- 资助金额:31 万元
- 项目类别:地区科学基金项目
基于缓冲区的复杂研发多项目系统动态优化与实证研究
- 批准号:72372008
- 批准年份:2023
- 资助金额:40 万元
- 项目类别:面上项目
复杂非线性系统的预设性能鲁棒输出调节问题及其应用
- 批准号:62373156
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
相似海外基金
Non-invasive Condition Monitoring of Ventricular Assistive Devices Using Automated Advanced Acoustic Methods
使用自动化先进声学方法对心室辅助装置进行无创状态监测
- 批准号:
10629554 - 财政年份:2023
- 资助金额:
$ 41.25万 - 项目类别:
BioGRID: An open resource for biological interactions and network analysis
BioGRID:生物相互作用和网络分析的开放资源
- 批准号:
10819019 - 财政年份:2023
- 资助金额:
$ 41.25万 - 项目类别:
Bioethical, Legal, and Anthropological Study of Technologies (BLAST)
技术的生物伦理、法律和人类学研究 (BLAST)
- 批准号:
10831226 - 财政年份:2023
- 资助金额:
$ 41.25万 - 项目类别:
Implementation of an impact assessment tool to optimize responsible stewardship of genomic data in the cloud
实施影响评估工具以优化云中基因组数据的负责任管理
- 批准号:
10721762 - 财政年份:2023
- 资助金额:
$ 41.25万 - 项目类别:
Unified, Scalable, and Reproducible Neurostatistical Software
统一、可扩展且可重复的神经统计软件
- 批准号:
10725500 - 财政年份:2023
- 资助金额:
$ 41.25万 - 项目类别: