基因组启发式三代测序校正方法研究及应用
项目介绍
AI项目解读
基本信息
- 批准号:31871326
- 项目类别:面上项目
- 资助金额:59.0万
- 负责人:
- 依托单位:
- 学科分类:C0608.生物数据资源与分析方法
- 结题年份:2022
- 批准年份:2018
- 项目状态:已结题
- 起止时间:2019-01-01 至2022-12-31
- 项目参与者:于倩; 陈凯宁; 陈聪颖; 郑鹤; 彭凯; 李悦; 余扬; 季凯凯; 邢剑锋;
- 关键词:
项目摘要
Third generation sequencing (TGS), such as PacBio single molecule real time (SMRT) and Oxford Nanopore, have several distinguishing characteristics, including long read length and unbiased sequencing. TGS has advantages in many genomics studies and has been widely applied into de novo genome assemblies and structural variants analysis. However, TGS reads have high-error sequencing rate (12-25%) and it brings a huge challenge for TST data analysis. To reduce their error of raw reads,no-hybrid error correction has been introduced to correct their errors, but the output rate of corrected reads is only 40-50% and the data loss issue seriously restricted the application range of corrected data. Based on our MECAT tools (published in Nature Methods), we plan to develop an reference-based high-rate correction strategy: an raw dataset should be split into many small datasets with high closeness relation according to reference location information of raw reads and noisy correction with high sensitivity and high output rate were processed in every small dataset. We also plan to develop some application interface for de novo assembly and structural variant analysis. Our research will improve the output rate of the corrected data and data integrity significantly, thus it will support a channel for applying next generation sequencing software to analyze TGS data and accelerated extensive application of TGS.
三代测序(单分子测序)具有读长长和无GC偏好性特征,近几年被广泛应用于基因组装和结构变异检测。然而三代测序高测序错误率(12-25%)给后期数据处理带来了巨大困难。为了降低测序错误率,三代测序采用自校正的方法校正三代测序数据,然而目前方法的校正数据产出率只有40-50%,大量数据损失严重制约了校正数据的应用范围。在我们开发MECAT软件包(已发表Nature Methods)的基础上,本项目试图采用无校正组装contigs或已发表基因组作为参考基因组,利用三代数据参考基因组比对位置信息,将原始数据划分成多个关系紧密的小数据集,在小数据集中实现高灵敏度和高产出率的自校正过程,从而建立基因组启发式三代测序校正方法;并建立校正数据应用于基因组组装和结构变异检测应用接口。我们的研究可以大幅提高校正数据的产出率和数据完整度,为二代测序软件应用于三代测序数据分析提供通道,从而加速三代测序应用。
结项摘要
三代测序(Nanopore和PacBio)具有读长长和无GC偏好性特征,近几年被广泛应用于基因组研究。然而三代测序高测序错误率(7-25%)给后期数据处理带来了巨大困难。本课题组按照研究计划中的研究内容和技术路线展开了研究,取得了较好的研究成果:1)针对三代测序序列比对和校正模型不足,我们先后建立了融入剪切读长的参考基因组比对模型、基于读长匹配完整度的数据分类规则及划分规则和高校三代测序序列校正参数模型;2)针对三代测序Nanopore测序错误分布广泛且局部错误率高的校正问题,在已构建上述三个模型基础上,我们提出了Nanopore渐进式校正方法和渐进式组装方法,并且开发了Nanopore高效校正组装软件(NECAT),该研究成果可以将99%高错误区域校正恢复,基因组完整性提高2倍以上。3)针对高阶三维基因组Pore-C文库Nanopore测序堵孔问题,我们发现DNA交联了肽段造成了Nanopore测序堵孔,从而提出了两次酶解和混合酶酶解方案解决交联肽段过长问题,实现高通量Pore-C测序技术(HiPore-C),并通过深入地生物信息分析揭示了三维结构单分子拓扑特征,与此同时,应用HiPore-C高阶互作信息,我们建立了融入Pore-C高维3D信息的单倍型基因组组装方法,使单倍型基因组达到染色体级别;4)针对模式生物DNA-6mA图谱解析不足问题,我们广泛下载了多个模式生物的三代测序基因组数据,解析了模式生物DNA-6mA图谱特征及构建模式生物DNA-6mA数据库(MRM);5)针对新冠康复期病人不稳定情况,我们构建康复期病人单细胞图谱,提示新冠患者出院后仍然是脆弱的,需要加强对康复期患者的医学观察,使治疗效果得到进一步巩固,该研究成果被广泛报道。本课题组共发表了学术论文7篇,其中JCR一区论文4篇,发表论文主要包括Nature Communications(2篇)、Cell Discovery,Horticulture Research,BMC Genomics,Frontier in Genetics,Scientific Report等国际刊物,项目培养博士研究生1人和硕士研究生3人。
项目成果
期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Immune cell profiling of COVID-19 patients in the recovery stage by single-cell sequencing
通过单细胞测序对恢复阶段的 COVID-19 患者进行免疫细胞分析
- DOI:10.1038/s41421-020-0168-9
- 发表时间:2020-05-04
- 期刊:CELL DISCOVERY
- 影响因子:33.5
- 作者:Wen, Wen;Su, Wenru;Wang, Hongyang
- 通讯作者:Wang, Hongyang
MDR: an integrative DNA N6-methyladenine and N4-methylcytosine modification database for Rosaceae
MDR:蔷薇科 DNA N6-甲基腺嘌呤和 N4-甲基胞嘧啶综合修饰数据库
- DOI:10.1038/s41438-019-0160-4
- 发表时间:2019-06-15
- 期刊:HORTICULTURE RESEARCH
- 影响因子:8.7
- 作者:Liu, Zhao-Yu;Xing, Jian-Feng;Xiao, Chuan-Le
- 通讯作者:Xiao, Chuan-Le
DNA N6-Methyladenosine modification role in transmitted variations from genomic DNA to RNA in Herrania umbratica.
DNA N6-甲基腺苷修饰在海拉尼亚 umbratica 基因组 DNA 到 RNA 传播变异中的作用
- DOI:10.1186/s12864-019-5776-0
- 发表时间:2019
- 期刊:BMC Genomics
- 影响因子:4.4
- 作者:Luan Mei-Wei;Chen Wei;Xing Jian-Feng;Xiao Chuan-Le;Chen Ying;Xie Shang-Qian
- 通讯作者:Xie Shang-Qian
N6-Methyladenine DNA modification in Xanthomonas oryzae pv. oryzicola genome.
米黄单胞菌 (Xanthomonas oryzae pv.) 中的 N6-甲基腺嘌呤 DNA 修饰。
- DOI:10.1038/s41598-018-34559-5
- 发表时间:2018-11-02
- 期刊:Scientific reports
- 影响因子:4.6
- 作者:Xiao CL;Xie SQ;Xie QB;Liu ZY;Xing JF;Ji KK;Tao J;Dai LY;Luo F
- 通讯作者:Luo F
Efficient assembly of nanopore reads via highly accurate and intact error correction.
通过高精度和完整的纠错,高效组装纳米孔读数。
- DOI:10.1038/s41467-020-20236-7
- 发表时间:2021-01-04
- 期刊:Nature communications
- 影响因子:16.6
- 作者:Chen Y;Nie F;Xie SQ;Zheng YF;Dai Q;Bray T;Wang YX;Xing JF;Huang ZJ;Wang DP;He LJ;Luo F;Wang JX;Liu YZ;Xiao CL
- 通讯作者:Xiao CL
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
肖传乐的其他基金
高阶三维基因组数据单倍型分析方法研究
- 批准号:
- 批准年份:2022
- 资助金额:54 万元
- 项目类别:面上项目
基于纳米孔电信号腺嘌呤N6甲基化修饰识别方法研究及应用
- 批准号:91953122
- 批准年份:2019
- 资助金额:60.0 万元
- 项目类别:重大研究计划
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}