Novel bioinformatics methods for integrative detection of structural variants from long-read sequencing

用于从长读长测序中综合检测结构变异的新型生物信息学方法

基本信息

  • 批准号:
    10752265
  • 负责人:
  • 金额:
    $ 4.77万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2023
  • 资助国家:
    美国
  • 起止时间:
    2023-09-15 至 2026-09-14
  • 项目状态:
    未结题

项目摘要

Project Summary/Abstract Structural variants (SVs) are the largest source of variations in the human genome and are frequently associated with disease phenotypes. Thus, the identification and characterization of SVs are essential for understanding human genome structure and function. The goal of this proposal is to develop a generalized SV calling pipeline that can leverage information from the latest developments in sequencing technology and human reference genome representations to discover and resolve SVs at high accuracy. I will first integrate information across sequencing platforms to increase SV calling accuracy. Multiple sequencing and mapping platforms are now used to detect SVs from human genome data. My pipeline will increase the accuracy of SV calling with a data integration model that handles a diverse set of genomic platforms. I will next develop a novel SV scoring model based on genomic context and coverage. Several factors, such as the generally low sequence coverage in typical long-read studies, as well as alignment errors due to highly repetitive sequences, can result in a potentially high rates of false positives for SVs when using parameters for high-sensitivity calling. I use two sets of important features of SVs, genomic context and coverage, into a machine-learning model to compute confidence in SV calls for downstream analysis. Finally, I will add support for graph genome alignments by implementing support for sequence data aligned to graph genome assemblies in GFA file format. Unlike single reference genomes, pangenomes are particularly useful for characterizing large-scale structural differences in genomes between different ethnicity groups. Pangenomes would bring us closer to capturing the full extent of human genomic variation, and thus represent an important resource to leverage for SV calling. In summary, in this project I will develop a generalized SV calling pipeline capable of integrating multiple technical platforms for discovering SVs and providing support for future developments in pangenome graph assemblies. With the research training plan, I will 1) gain expertise in genomics and bioinformatics, 2) promote diversity in biomedical research though involvement in educational efforts in the community, 3) develop oral and written communication skills, and 4) prepare a scientific career focused on the study and education of human genome variation.
项目摘要/摘要 结构变异(SV)是人类基因组中最大的变异来源,并且经常是 与疾病表型相关。因此,SV的识别和表征对于 了解人类的基因组结构和功能。该提议的目的是开发广义的SV 致电管道,可以利用测序技术最新进展的信息和 人类参考基因组表示以高精度发现和解决SV。我将首先整合 跨排序平台的信息以提高SV通话准确性。多次测序和映射 现在,平台用于从人类基因组数据中检测SV。我的管道将提高SV的准确性 使用数据集成模型来呼叫,该模型可以处理各种基因组平台。接下来我将发展一本小说 基于基因组上下文和覆盖范围的SV评分模型。几个因素,例如通常很低 典型的长阅读研究中的序列覆盖范围以及由于高度重复序列而导致的对齐误差 在使用参数以实现高敏性时,可能导致SVS的假阳性率可能高高 打电话。我将SVS的两组重要特征,基因组上下文和覆盖范围用于机器学习 模型以计算对SV呼吁下游分析的信心。最后,我将增加对图基因组的支持 通过实现对与GFA文件中图形基因组组件的序列数据的支持来对齐 格式。与单个参考基因组不同,pangenomes对于表征大规模特别有用 不同种族群体之间基因组的结构差异。 Pangenomes会使我们更接近 捕获人类基因组变异的全部范围,因此代表了利用的重要资源 SV打电话。总而言之,在此项目中,我将开发一条能够集成的通用SV呼叫管道 多个技术平台,用于发现SVS并为Pangenome的未来发展提供支持 图组件。通过研究培训计划,我将1)获得基因组学和生物信息学方面的专业知识,2) 尽管参与社区的教育工作,但在生物医学研究中促进多样性,3) 发展口头和书面沟通技巧,以及4)准备专注于研究的科学职业, 人类基因组变异的教育。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

暂无数据

数据更新时间:2024-06-01

相似国自然基金

跨区域调水工程与区域经济增长:效应测度、机制探究与政策建议
  • 批准号:
    72373114
  • 批准年份:
    2023
  • 资助金额:
    40 万元
  • 项目类别:
    面上项目
农产品区域公用品牌地方政府干预机制与政策优化研究
  • 批准号:
    72373068
  • 批准年份:
    2023
  • 资助金额:
    41 万元
  • 项目类别:
    面上项目
新型城镇化与区域协调发展的机制与治理体系研究
  • 批准号:
    72334006
  • 批准年份:
    2023
  • 资助金额:
    167 万元
  • 项目类别:
    重点项目
我国西南地区节点城市在次区域跨国城市网络中的地位、功能和能级提升研究
  • 批准号:
    72364037
  • 批准年份:
    2023
  • 资助金额:
    28 万元
  • 项目类别:
    地区科学基金项目
多时序CT联合多区域数字病理早期预测胃癌新辅助化疗抵抗的研究
  • 批准号:
    82360345
  • 批准年份:
    2023
  • 资助金额:
    32 万元
  • 项目类别:
    地区科学基金项目

相似海外基金

Implementation of Innovative Treatment for Moral Injury Syndrome: A Hybrid Type 2 Study
道德伤害综合症创新治疗的实施:2 型混合研究
  • 批准号:
    10752930
    10752930
  • 财政年份:
    2024
  • 资助金额:
    $ 4.77万
    $ 4.77万
  • 项目类别:
Identifying and addressing missingness and bias to enhance discovery from multimodal health data
识别和解决缺失和偏见,以增强多模式健康数据的发现
  • 批准号:
    10637391
    10637391
  • 财政年份:
    2023
  • 资助金额:
    $ 4.77万
    $ 4.77万
  • 项目类别:
Advancing Student Potential for Inclusion with Research Experiences (ASPIRE)
通过研究经验提升学生融入的潜力(ASPIRE)
  • 批准号:
    10678356
    10678356
  • 财政年份:
    2023
  • 资助金额:
    $ 4.77万
    $ 4.77万
  • 项目类别:
Society of Behavioral Medicine 2023 Annual Meeting & Scientific Sessions
行为医学学会2023年年会
  • 批准号:
    10681958
    10681958
  • 财政年份:
    2023
  • 资助金额:
    $ 4.77万
    $ 4.77万
  • 项目类别:
Mitigating the Impact of Stigma and Shame as a Barrier to Viral Suppression Among MSM Living with HIV and Substance Use Disorders
减轻耻辱感和羞耻感对感染艾滋病毒和药物滥用的 MSM 的病毒抑制造成的影响
  • 批准号:
    10683694
    10683694
  • 财政年份:
    2023
  • 资助金额:
    $ 4.77万
    $ 4.77万
  • 项目类别: