基因组启发式三代测序校正方法研究及应用

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    31871326
  • 项目类别:
    面上项目
  • 资助金额:
    59.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    C0608.生物数据资源与分析方法
  • 结题年份:
    2022
  • 批准年份:
    2018
  • 项目状态:
    已结题
  • 起止时间:
    2019-01-01 至2022-12-31

项目摘要

Third generation sequencing (TGS), such as PacBio single molecule real time (SMRT) and Oxford Nanopore, have several distinguishing characteristics, including long read length and unbiased sequencing. TGS has advantages in many genomics studies and has been widely applied into de novo genome assemblies and structural variants analysis. However, TGS reads have high-error sequencing rate (12-25%) and it brings a huge challenge for TST data analysis. To reduce their error of raw reads,no-hybrid error correction has been introduced to correct their errors, but the output rate of corrected reads is only 40-50% and the data loss issue seriously restricted the application range of corrected data. Based on our MECAT tools (published in Nature Methods), we plan to develop an reference-based high-rate correction strategy: an raw dataset should be split into many small datasets with high closeness relation according to reference location information of raw reads and noisy correction with high sensitivity and high output rate were processed in every small dataset. We also plan to develop some application interface for de novo assembly and structural variant analysis. Our research will improve the output rate of the corrected data and data integrity significantly, thus it will support a channel for applying next generation sequencing software to analyze TGS data and accelerated extensive application of TGS.
三代测序(单分子测序)具有读长长和无GC偏好性特征,近几年被广泛应用于基因组装和结构变异检测。然而三代测序高测序错误率(12-25%)给后期数据处理带来了巨大困难。为了降低测序错误率,三代测序采用自校正的方法校正三代测序数据,然而目前方法的校正数据产出率只有40-50%,大量数据损失严重制约了校正数据的应用范围。在我们开发MECAT软件包(已发表Nature Methods)的基础上,本项目试图采用无校正组装contigs或已发表基因组作为参考基因组,利用三代数据参考基因组比对位置信息,将原始数据划分成多个关系紧密的小数据集,在小数据集中实现高灵敏度和高产出率的自校正过程,从而建立基因组启发式三代测序校正方法;并建立校正数据应用于基因组组装和结构变异检测应用接口。我们的研究可以大幅提高校正数据的产出率和数据完整度,为二代测序软件应用于三代测序数据分析提供通道,从而加速三代测序应用。

结项摘要

三代测序(Nanopore和PacBio)具有读长长和无GC偏好性特征,近几年被广泛应用于基因组研究。然而三代测序高测序错误率(7-25%)给后期数据处理带来了巨大困难。本课题组按照研究计划中的研究内容和技术路线展开了研究,取得了较好的研究成果:1)针对三代测序序列比对和校正模型不足,我们先后建立了融入剪切读长的参考基因组比对模型、基于读长匹配完整度的数据分类规则及划分规则和高校三代测序序列校正参数模型;2)针对三代测序Nanopore测序错误分布广泛且局部错误率高的校正问题,在已构建上述三个模型基础上,我们提出了Nanopore渐进式校正方法和渐进式组装方法,并且开发了Nanopore高效校正组装软件(NECAT),该研究成果可以将99%高错误区域校正恢复,基因组完整性提高2倍以上。3)针对高阶三维基因组Pore-C文库Nanopore测序堵孔问题,我们发现DNA交联了肽段造成了Nanopore测序堵孔,从而提出了两次酶解和混合酶酶解方案解决交联肽段过长问题,实现高通量Pore-C测序技术(HiPore-C),并通过深入地生物信息分析揭示了三维结构单分子拓扑特征,与此同时,应用HiPore-C高阶互作信息,我们建立了融入Pore-C高维3D信息的单倍型基因组组装方法,使单倍型基因组达到染色体级别;4)针对模式生物DNA-6mA图谱解析不足问题,我们广泛下载了多个模式生物的三代测序基因组数据,解析了模式生物DNA-6mA图谱特征及构建模式生物DNA-6mA数据库(MRM);5)针对新冠康复期病人不稳定情况,我们构建康复期病人单细胞图谱,提示新冠患者出院后仍然是脆弱的,需要加强对康复期患者的医学观察,使治疗效果得到进一步巩固,该研究成果被广泛报道。本课题组共发表了学术论文7篇,其中JCR一区论文4篇,发表论文主要包括Nature Communications(2篇)、Cell Discovery,Horticulture Research,BMC Genomics,Frontier in Genetics,Scientific Report等国际刊物,项目培养博士研究生1人和硕士研究生3人。

项目成果

期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Immune cell profiling of COVID-19 patients in the recovery stage by single-cell sequencing
通过单细胞测序对恢复阶段的 COVID-19 患者进行免疫细胞分析
  • DOI:
    10.1038/s41421-020-0168-9
  • 发表时间:
    2020-05-04
  • 期刊:
    CELL DISCOVERY
  • 影响因子:
    33.5
  • 作者:
    Wen, Wen;Su, Wenru;Wang, Hongyang
  • 通讯作者:
    Wang, Hongyang
MDR: an integrative DNA N6-methyladenine and N4-methylcytosine modification database for Rosaceae
MDR:蔷薇科 DNA N6-甲基腺嘌呤和 N4-甲基胞嘧啶综合修饰数据库
  • DOI:
    10.1038/s41438-019-0160-4
  • 发表时间:
    2019-06-15
  • 期刊:
    HORTICULTURE RESEARCH
  • 影响因子:
    8.7
  • 作者:
    Liu, Zhao-Yu;Xing, Jian-Feng;Xiao, Chuan-Le
  • 通讯作者:
    Xiao, Chuan-Le
DNA N6-Methyladenosine modification role in transmitted variations from genomic DNA to RNA in Herrania umbratica.
DNA N6-甲基腺苷修饰在海拉尼亚 umbratica 基因组 DNA 到 RNA 传播变异中的作用
  • DOI:
    10.1186/s12864-019-5776-0
  • 发表时间:
    2019
  • 期刊:
    BMC Genomics
  • 影响因子:
    4.4
  • 作者:
    Luan Mei-Wei;Chen Wei;Xing Jian-Feng;Xiao Chuan-Le;Chen Ying;Xie Shang-Qian
  • 通讯作者:
    Xie Shang-Qian
N6-Methyladenine DNA modification in Xanthomonas oryzae pv. oryzicola genome.
米黄单胞菌 (Xanthomonas oryzae pv.) 中的 N6-甲基腺嘌呤 DNA 修饰。
  • DOI:
    10.1038/s41598-018-34559-5
  • 发表时间:
    2018-11-02
  • 期刊:
    Scientific reports
  • 影响因子:
    4.6
  • 作者:
    Xiao CL;Xie SQ;Xie QB;Liu ZY;Xing JF;Ji KK;Tao J;Dai LY;Luo F
  • 通讯作者:
    Luo F
Efficient assembly of nanopore reads via highly accurate and intact error correction.
通过高精度和完整的纠错,高效组装纳米孔读数。
  • DOI:
    10.1038/s41467-020-20236-7
  • 发表时间:
    2021-01-04
  • 期刊:
    Nature communications
  • 影响因子:
    16.6
  • 作者:
    Chen Y;Nie F;Xie SQ;Zheng YF;Dai Q;Bray T;Wang YX;Xing JF;Huang ZJ;Wang DP;He LJ;Luo F;Wang JX;Liu YZ;Xiao CL
  • 通讯作者:
    Xiao CL

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

肖传乐的其他基金

高阶三维基因组数据单倍型分析方法研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    54 万元
  • 项目类别:
    面上项目
基于纳米孔电信号腺嘌呤N6甲基化修饰识别方法研究及应用
  • 批准号:
    91953122
  • 批准年份:
    2019
  • 资助金额:
    60.0 万元
  • 项目类别:
    重大研究计划

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码