The construction and utility of reference pan-genome graphs
参考泛基因组图的构建和利用
基本信息
- 批准号:10777673
- 负责人:
- 金额:$ 80.2万
- 依托单位:
- 依托单位国家:美国
- 项目类别:
- 财政年份:2023
- 资助国家:美国
- 起止时间:2023-02-04 至 2024-02-29
- 项目状态:已结题
- 来源:
- 关键词:AddressAlgorithmsBase SequenceBiomedical ResearchCactaceaeCommunitiesComplexDataData AnalysesData SetDevelopmentDiagnosticDiseaseGenesGenetic ResearchGenetic VariationGenomeGenotypeGerm-Line MutationGraphHaplotypesHeartHumanHuman GenomeHuman ResourcesIndividualLibrariesMapsMedicalMethodsModelingMorphologic artifactsPerformancePhenotypePlayPopulationPopulation GeneticsResearchResolutionResourcesRoleStructureSystemUpdateVariantWorkcancer genomicsdesignexperiencehuman pangenomehuman population geneticshuman reference genomeimprovedmosaicpan-genomepractical applicationprogramsreference genomesegregationsuccesssupport toolstooltranscriptome sequencingworking group
项目摘要
PROJECT SUMMARY
The current human reference genome, GRCh38, plays a central role in medical and population human genetics.
It primarily models a single human individual and is missing hundreds of thousands of large structural variations
segregating in the population. This underrepresentation of genetic diversity leads to various artifacts in data
analysis and significantly hampers our understanding of the functional and medical relevance of these large
human variations, which may collectively have pervasive impact. To address this issue, we will extend our
previous work on sequence graphs and alignment algorithms and construct a pan-genome reference graph from
hundreds of long-read human assemblies that more completely represent genetic diversity. Specifically, we will
(1) design a reference graph model with a stable coordinate system compatible with GRCh38 and develop
toolkits and libraries to interact with this model; (2) develop minimizer-based sequence-to-graph alignment
algorithms for short and long sequences; (3) incrementally construct a reference graph by mapping assemblies
to an existing graph and updating the graph; and (4) develop a graph-based genotyping algorithm and apply it
to short-read based projects to call structural variations missed by the current pipelines. Upon completion, the
proposed project could replace the current practices based on a linear genome and will enable the profiling and
study of complex human variations missed in most current research.
项目概要
当前的人类参考基因组 GRCh38 在医学和人口人类遗传学中发挥着核心作用。
它主要模拟单个人类个体,并且缺少数十万个大型结构变化
人口中的隔离。遗传多样性的代表性不足导致数据中存在各种伪影
分析并极大地妨碍了我们对这些大的功能和医学相关性的理解
人类的差异,这些差异可能共同产生普遍的影响。为了解决这个问题,我们将延长我们的
之前关于序列图和比对算法的工作,并从构建泛基因组参考图
数百个长读的人类组合更完整地代表了遗传多样性。具体来说,我们将
(1)设计兼容GRCh38的稳定坐标系的参考图模型并开发
与该模型交互的工具包和库; (2) 开发基于最小化的序列到图的对齐
短序列和长序列的算法; (3) 通过映射程序集增量构建参考图
到现有图表并更新该图表; (4) 开发基于图的基因分型算法并应用
基于短读的项目来调用当前管道遗漏的结构变化。完成后,将
拟议的项目可以取代基于线性基因组的当前实践,并将能够进行分析和
目前大多数研究都忽略了对复杂人类变异的研究。
项目成果
期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
KmerKeys: a web resource for searching indexed genome assemblies and variants.
KmerKeys:用于搜索索引基因组组件和变体的网络资源。
- DOI:
- 发表时间:2022-07-05
- 期刊:
- 影响因子:14.9
- 作者:Pavlichin, Dmitri S;Lee, HoJoon;Greer, Stephanie U;Grimes, Susan M;Weissman, Tsachy;Ji, Hanlee P
- 通讯作者:Ji, Hanlee P
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Heng Li其他文献
Heng Li的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Heng Li', 18)}}的其他基金
The construction and utility of reference pan-genome graphs
参考泛基因组图的构建和利用
- 批准号:
10112282 - 财政年份:2020
- 资助金额:
$ 80.2万 - 项目类别:
The construction and utility of reference pan-genome graphs
参考泛基因组图的构建和利用
- 批准号:
10379369 - 财政年份:2020
- 资助金额:
$ 80.2万 - 项目类别:
The construction and utility of reference pan-genome graphs
参考泛基因组图的构建和利用
- 批准号:
9904877 - 财政年份:2020
- 资助金额:
$ 80.2万 - 项目类别:
Advanced computational methods in analyzing high-throughput sequencing data
分析高通量测序数据的先进计算方法
- 批准号:
10367263 - 财政年份:2018
- 资助金额:
$ 80.2万 - 项目类别:
Bioinformatics Technology to Characterize Tumor Infiltrating Immune Repertoires
生物信息学技术表征肿瘤浸润免疫库
- 批准号:
9888343 - 财政年份:2018
- 资助金额:
$ 80.2万 - 项目类别:
Advanced computational methods in analyzing high-throughput sequencing data
分析高通量测序数据的先进计算方法
- 批准号:
10559560 - 财政年份:2018
- 资助金额:
$ 80.2万 - 项目类别:
相似国自然基金
基于肿瘤病理图片的靶向药物敏感生物标志物识别及统计算法的研究
- 批准号:82304250
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
多模态高层语义驱动的深度伪造检测算法研究
- 批准号:62306090
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
高精度海表反照率遥感算法研究
- 批准号:42376173
- 批准年份:2023
- 资助金额:51 万元
- 项目类别:面上项目
基于新型深度学习算法和多组学研究策略鉴定非编码区剪接突变在肌萎缩侧索硬化症中的分子机制
- 批准号:82371878
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
基于深度学习与水平集方法的心脏MR图像精准分割算法研究
- 批准号:62371156
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
相似海外基金
Noninvasive prediction of skin precancer severity using in vivo cellular imaging and deep learning algorithms.
使用体内细胞成像和深度学习算法无创预测皮肤癌前病变的严重程度。
- 批准号:
10761578 - 财政年份:2023
- 资助金额:
$ 80.2万 - 项目类别:
m6A-suite: an informatics pipeline and resource for elucidating roles of m6A epitranscriptome in cancer
m6A-suite:用于阐明 m6A 表观转录组在癌症中的作用的信息学管道和资源
- 批准号:
10645584 - 财政年份:2023
- 资助金额:
$ 80.2万 - 项目类别:
Previvors Recharge: A Resilience Program for Cancer Previvors
癌症预防者恢复活力计划:癌症预防者恢复力计划
- 批准号:
10698965 - 财政年份:2023
- 资助金额:
$ 80.2万 - 项目类别:
Scaling up computational genomics with tree sequences
用树序列扩展计算基因组学
- 批准号:
10585745 - 财政年份:2023
- 资助金额:
$ 80.2万 - 项目类别: