基于“无拼接组装、无参考基因组”的PB量级组学大数据高速“反向检索”新方法及其高移植性、高可视化平台在基因型分型的应用

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    31771478
  • 项目类别:
    面上项目
  • 资助金额:
    25.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    C0608.生物数据资源与分析方法
  • 结题年份:
    2019
  • 批准年份:
    2017
  • 项目状态:
    已结题
  • 起止时间:
    2018-01-01 至2019-12-31

项目摘要

We are rapidly approaching the era of millions of human genomes. The conventional assembly- and reference-based methodologies store part of the information from a limited number of genomes and thus have difficulties in utilising comprehensive information for 1000-genome scale data. Current available methods for omics analysis, mostly assembly- and reference-based, are incapable of providing ultrafast searches on comprehensive data and unfit for the localization of analyses. New non-reference- and non-assembly-based methodologies are increasingly needed in PB-scale omics data analyses, and has become a new approach to break out the bottlenecks of omics data analyses. .Our previous studies have published a bioinformatics tool platform that handles 10TB-scale and ~250 thousand omics databases, a suite of patent sequence databases with maximum coverage of data source, and a multiple sequence alignment tool to rapidly cluster hundreds of thousand sequences. At the end of last year, we released a sequence search tool - PSISearch2, which implemented a query-seeded method to increase selectivity to ~20-fold. Basing on these achievements, we propose to create and establish a method called “reverse-search”, to facilitate integrative non-reference- and non-assembly-based analyses for PB-scale omics data, and to offer applications in genotyping.
我们正迈向百万人基因组时代。以拼接组装和参考基因组为基础的研究方法只保留了少部分人的基因信息,在面对千人量级以上基因组时无法全面地利用数据,因而无法提供对完整数据的高速检索和快速分析,同时难于适应海量数据的本地化分析需求。基于“无拼接组装”与“无参考基因组”的研究方法成为当前挖掘PB量级组学数据最急切的需要之一,也是突破组学大数据分析瓶颈的新途径之一。.前期研究中,我们发表了处理和检索10TB量级数据、25万个组学库的生物信息检索和分析工具平台、最大覆盖的生物专利序列库群,以及10万量级的序列多重比对工具;去年底我们发表的PSISearch2序列检索新方法,精确度提高约20倍。本项目课题承前启后,整合上述研究成果,运用无拼接组装、无参考基因组的方法,提出和建立“反向检索”的新方法。该新方法预期可应用于罕见病基因突变和外源性致病基因快速检测等基因型分析中。

结项摘要

面对海量的生命组学数据,传统的基于拼接组装和参考基因组的方法无法提供对完整数据的高速检索和快速分析。基于无拼接组装与无参考基因组的数据检索方法成为当前挖掘组学大数据最急切的需要之一,也为生命组学大数据和疾病表型的关联分析提供了新途径。.本项目的核心目标是研发和实现的生命组学数据“反向检索”方法,应用于外源性致病微生物基因组、宏基因组的检索分析以及与人类疾病的关联分析。针对这个目标,项目组研究了无参考基因组的组学数据库群的索引方法,整合了外源性致病微生物的关联数据,建立了微生物核心基因与疾病的关联模型,并建成了微生物核心基因与人类疾病关联的在线数据库MicroPhenoDB(lilab2.sysu.edu.cn/microphenodb);其次,项目组在以上高通量序列与疾病关联数据平台上建立了序列“反向检索”方法,大大提高了对组学数据的检索的效率;再次,项目组利用上述索引数据库群和方法,建立了基于MetaPhlan2、Bowtie2、SBT、BLAST、PSISearch2D、seqChecksum等不同算法基础上的反向检索、序列检索和迭代检索等在线网络分析应用。.项目组探索了基于反向检索在基因分析的应用,尤其是应用于外源性病原微生物核心基因的检测以及与人类疾病的关联分析,探究感染类疾病与微生物种类、微生物核心标记基因的关系。反向检索及其相关数据库的应用,可以转化成对外源性疾病微生物检测的一种方法,为面向临床感染性疾病的非侵入式检测和临床用药提供数据分析支撑。.项目执行期间发表基金号第一标注和第二标注SCI论文各一篇,申请专利3项,超额完成项目任务指标。

项目成果

期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(3)
Combined alignments of sequences and domains characterize unknown proteins with remotely related protein search PSISearch2D
序列和结构域的组合比对通过远程相关蛋白质搜索 PSISearch2D 表征未知蛋白质
  • DOI:
    10.1093/database/baz092
  • 发表时间:
    2019
  • 期刊:
    Database-The Journal of Biological Databases and Curation
  • 影响因子:
    5.8
  • 作者:
    Yang Minglei;Zhang Wenliang;Yao Guocai;Zhang Haiyue;Li Weizhong
  • 通讯作者:
    Li Weizhong
Computational resources associating diseases with genotypes, phenotypes and exposures
将疾病与基因型、表型和暴露相关联的计算资源
  • DOI:
    10.1093/bib/bby071
  • 发表时间:
    2019-11-27
  • 期刊:
    Briefings in Bioinformatics
  • 影响因子:
    9.5
  • 作者:
    Zhang W;Zhang H;Yang H;Li M;Xie Z;Li W
  • 通讯作者:
    Li W

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

水轮机活动导叶匀速开关过程的三维湍流数值模拟
  • DOI:
    --
  • 发表时间:
    2017
  • 期刊:
    排灌机械工程学报
  • 影响因子:
    --
  • 作者:
    王文全;李伟忠;闫妍
  • 通讯作者:
    闫妍
一种投影浸入边界法的快速直接求解方法
  • DOI:
    --
  • 发表时间:
    2014
  • 期刊:
    计算力学学报
  • 影响因子:
    --
  • 作者:
    王文全;李伟忠;闫妍;梁林
  • 通讯作者:
    梁林
摆动方式对水翼输入功率的影响
  • DOI:
    --
  • 发表时间:
    2017
  • 期刊:
    计算力学学报
  • 影响因子:
    --
  • 作者:
    李伟忠;王文全;闫妍
  • 通讯作者:
    闫妍

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码