微生物组构成分析的精确方法研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61673231
  • 项目类别:
    面上项目
  • 资助金额:
    65.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0304.系统工程理论与技术
  • 结题年份:
    2020
  • 批准年份:
    2016
  • 项目状态:
    已结题
  • 起止时间:
    2017-01-01 至2020-12-31

项目摘要

Microbiomes are important for human health. The composition of human microbiomes is very complicated, and metagenome sequencing is a major technology for studying them. There are severe noises and biases in metagenome data. People’s knowledge on the noises and biases are still very limited, which buries many pitfalls for current methods used in microbiome composition analysis at both taxonomy levels and gene levels. And different methods for the same task may give very different results. In this project, we’ll take a systematic effort to address these questions. We’ll develop mathematical models for every major steps in microbiome sample collection, processing and metagenome sequencing, investigate factors that affect metagenome data quality, design simulation models and artificial synthetic microbial mixture models to build up benchmark datasets, and develop new methods for precision analysis of microbiome composition. And we’ll also investigate machine learning approaches for predicting the rough quantity and abundance distribution of unknown genomes from unmapped metagenome data. These study will produce more precise and reliable methods for better understanding the relation between microbiomes and human health.
生活在人体各部位的微生物组与人类健康密切相关,它们有十分复杂的物种和基因构成。宏基因组测序是当前研究微生物组构成的主要手段,但宏基因组数据中存在大量噪声和偏差,人们对这些噪声和偏差的分布特点与影响因素尚缺乏定量认识,导致当前用于物种和基因构成分析的方法存在很多缺陷,不同方法之间结果差异很大。本项目将从对微生物组样本采集、处理、建库和宏基因组测序各环节的数学建模开始,系统研究影响宏基因组数据质量的因素,设计仿真模型和人工合成微生物群落模型,建立标准数据集,基于对噪声和偏差分布的定量数学模型,研究微生物组构成分析的新的精确方法,并探索对数据中未知基因组数目和丰度的机器学习预测方法,为研究微生物组与人类健康关系提供更精确可靠的模型和方法。

结项摘要

人体各部位的微生物组是多种已知和未知的微生物构成的群落,宏基因组测序是对它们基因组的混合测序,要从中估计出各成分微生物的定量构成,有很多信息学挑战。其中一个基础挑战是,对于任何实际采样到的微生物组样本,其真实的微生物定量构成是无法得知的,宏基因组测序就是为了回答这个问题,但对这个问题回答得是否正确,没有标准答案可以检验。本项目的第一部分工作是建立尽可能接近实际数据产生过程的仿真模型,通过仿真模型产生已知答案的标准数据集,这是发展准确估计方法的基础。另一个重要挑战是,宏基因组数据中往往包含未知微生物的基因组,现有的方法都是忽略可能对应这些基因组的测序数据,只根据能比对到已知基因组上的测序数据来估算成分微生物的构成,但这种做法会带来很大的估计偏差。本项目的另一个主要工作是发展了一种统计模型和计算方法,估计宏基因组数据中包含未知基因组在内的基因组总长度,用这个总长度进行归一化能够更准确地估计各种成分基因组的含量。本项目采集了一批慢性胃炎病人的舌苔微生物组样本进行了宏基因组测序和生物信息学分析,发现了对检测胃炎向胃癌转化有早期提示作用的舌苔微生物标志物。此外,项目还发展了从宏基因组测序或基因组测序数据中高效检测重复序列的一种算法,并开发了相应的软件。

项目成果

期刊论文数量(8)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
A new statistic for efficient detection of repetitive sequences
一种有效检测重复序列的新统计方法
  • DOI:
    10.1093/bioinformatics/btz262
  • 发表时间:
    2019-11-15
  • 期刊:
    BIOINFORMATICS
  • 影响因子:
    5.8
  • 作者:
    Chen, Sijie;Chen, Yixin;Zhang, Xuegong
  • 通讯作者:
    Zhang, Xuegong
Estimating the total genome length of a metagenomic sample using k-mers
使用 k-mers 估计宏基因组样本的基因组总长度
  • DOI:
    10.1186/s12864-019-5467-x
  • 发表时间:
    2018-04
  • 期刊:
    BMC Genomics
  • 影响因子:
    4.4
  • 作者:
    Kui Hua;Xuegong Zhang
  • 通讯作者:
    Xuegong Zhang
Comprehensive simulation of metagenomics sequencing data with non-uniform sampling distribution
非均匀采样分布的宏基因组测序数据综合模拟
  • DOI:
    --
  • 发表时间:
    2018
  • 期刊:
    Quantitative Biology
  • 影响因子:
    3.1
  • 作者:
    Shansong Liu;Kui Hua;Sijie Chen;Xuegong Zhang
  • 通讯作者:
    Xuegong Zhang
A case study on the detailed reproducibility of a human cell altas project
关于人类细胞阿尔塔斯项目详细再现性的案例研究
  • DOI:
    --
  • 发表时间:
    2019
  • 期刊:
    Quantitative Biology
  • 影响因子:
    3.1
  • 作者:
    Kui Hua;Xuegong Zhang
  • 通讯作者:
    Xuegong Zhang
Tongue coating microbiome as a potential biomarker for gastritis including precancerous cascade
舌苔微生物组作为胃炎(包括癌前级联)的潜在生物标志物
  • DOI:
    10.1007/s13238-018-0596-6
  • 发表时间:
    2019-07-01
  • 期刊:
    PROTEIN & CELL
  • 影响因子:
    21.1
  • 作者:
    Cui, Jiaxing;Cui, Hongfei;Li, Shao
  • 通讯作者:
    Li, Shao

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

多巴胺通路的基因与精神分裂症风险的多位点关联研究
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    中国科学C辑
  • 影响因子:
    --
  • 作者:
    孙向青;贾彦彬;张学工;许琪;沈岩;李衍达
  • 通讯作者:
    李衍达
新一代高通量 RNA 测序数据的处理与分析
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    生物化学与生物物理进展
  • 影响因子:
    --
  • 作者:
    王立坤;冯智星;汪小我;张学工;王曦
  • 通讯作者:
    王曦
脊椎动物中微小RNA进化模式研究
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    中国科学(C辑:生命科学)
  • 影响因子:
    --
  • 作者:
    张学工;李衍达;汪小我
  • 通讯作者:
    汪小我

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

张学工的其他基金

人类细胞图谱复杂数据的智能表示理论与信息框架
  • 批准号:
    62250005
  • 批准年份:
    2022
  • 资助金额:
    249 万元
  • 项目类别:
    专项基金项目
人类细胞图谱复杂数据的智能表示理论与信息框架
  • 批准号:
    62050178
  • 批准年份:
    2020
  • 资助金额:
    98.46 万元
  • 项目类别:
    专项基金项目
基因表达数据中的二维模式发现方法研究
  • 批准号:
    60575014
  • 批准年份:
    2005
  • 资助金额:
    23.0 万元
  • 项目类别:
    面上项目
基因芯片数据分析中的模式识别问题研究
  • 批准号:
    60275007
  • 批准年份:
    2002
  • 资助金额:
    22.0 万元
  • 项目类别:
    面上项目
基于统计学习理论的模式识别方法研究
  • 批准号:
    69885004
  • 批准年份:
    1998
  • 资助金额:
    12.0 万元
  • 项目类别:
    专项基金项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码