微生物组构成分析的精确方法研究
项目介绍
AI项目解读
基本信息
- 批准号:61673231
- 项目类别:面上项目
- 资助金额:65.0万
- 负责人:
- 依托单位:
- 学科分类:F0304.系统工程理论与技术
- 结题年份:2020
- 批准年份:2016
- 项目状态:已结题
- 起止时间:2017-01-01 至2020-12-31
- 项目参与者:刘莉扬; 崔鸿飞; 花奎; 崔丽嘉; 刘山松; 罗东阳; 李季;
- 关键词:
项目摘要
Microbiomes are important for human health. The composition of human microbiomes is very complicated, and metagenome sequencing is a major technology for studying them. There are severe noises and biases in metagenome data. People’s knowledge on the noises and biases are still very limited, which buries many pitfalls for current methods used in microbiome composition analysis at both taxonomy levels and gene levels. And different methods for the same task may give very different results. In this project, we’ll take a systematic effort to address these questions. We’ll develop mathematical models for every major steps in microbiome sample collection, processing and metagenome sequencing, investigate factors that affect metagenome data quality, design simulation models and artificial synthetic microbial mixture models to build up benchmark datasets, and develop new methods for precision analysis of microbiome composition. And we’ll also investigate machine learning approaches for predicting the rough quantity and abundance distribution of unknown genomes from unmapped metagenome data. These study will produce more precise and reliable methods for better understanding the relation between microbiomes and human health.
生活在人体各部位的微生物组与人类健康密切相关,它们有十分复杂的物种和基因构成。宏基因组测序是当前研究微生物组构成的主要手段,但宏基因组数据中存在大量噪声和偏差,人们对这些噪声和偏差的分布特点与影响因素尚缺乏定量认识,导致当前用于物种和基因构成分析的方法存在很多缺陷,不同方法之间结果差异很大。本项目将从对微生物组样本采集、处理、建库和宏基因组测序各环节的数学建模开始,系统研究影响宏基因组数据质量的因素,设计仿真模型和人工合成微生物群落模型,建立标准数据集,基于对噪声和偏差分布的定量数学模型,研究微生物组构成分析的新的精确方法,并探索对数据中未知基因组数目和丰度的机器学习预测方法,为研究微生物组与人类健康关系提供更精确可靠的模型和方法。
结项摘要
人体各部位的微生物组是多种已知和未知的微生物构成的群落,宏基因组测序是对它们基因组的混合测序,要从中估计出各成分微生物的定量构成,有很多信息学挑战。其中一个基础挑战是,对于任何实际采样到的微生物组样本,其真实的微生物定量构成是无法得知的,宏基因组测序就是为了回答这个问题,但对这个问题回答得是否正确,没有标准答案可以检验。本项目的第一部分工作是建立尽可能接近实际数据产生过程的仿真模型,通过仿真模型产生已知答案的标准数据集,这是发展准确估计方法的基础。另一个重要挑战是,宏基因组数据中往往包含未知微生物的基因组,现有的方法都是忽略可能对应这些基因组的测序数据,只根据能比对到已知基因组上的测序数据来估算成分微生物的构成,但这种做法会带来很大的估计偏差。本项目的另一个主要工作是发展了一种统计模型和计算方法,估计宏基因组数据中包含未知基因组在内的基因组总长度,用这个总长度进行归一化能够更准确地估计各种成分基因组的含量。本项目采集了一批慢性胃炎病人的舌苔微生物组样本进行了宏基因组测序和生物信息学分析,发现了对检测胃炎向胃癌转化有早期提示作用的舌苔微生物标志物。此外,项目还发展了从宏基因组测序或基因组测序数据中高效检测重复序列的一种算法,并开发了相应的软件。
项目成果
期刊论文数量(8)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
A new statistic for efficient detection of repetitive sequences
一种有效检测重复序列的新统计方法
- DOI:10.1093/bioinformatics/btz262
- 发表时间:2019-11-15
- 期刊:BIOINFORMATICS
- 影响因子:5.8
- 作者:Chen, Sijie;Chen, Yixin;Zhang, Xuegong
- 通讯作者:Zhang, Xuegong
Estimating the total genome length of a metagenomic sample using k-mers
使用 k-mers 估计宏基因组样本的基因组总长度
- DOI:10.1186/s12864-019-5467-x
- 发表时间:2018-04
- 期刊:BMC Genomics
- 影响因子:4.4
- 作者:Kui Hua;Xuegong Zhang
- 通讯作者:Xuegong Zhang
Comprehensive simulation of metagenomics sequencing data with non-uniform sampling distribution
非均匀采样分布的宏基因组测序数据综合模拟
- DOI:--
- 发表时间:2018
- 期刊:Quantitative Biology
- 影响因子:3.1
- 作者:Shansong Liu;Kui Hua;Sijie Chen;Xuegong Zhang
- 通讯作者:Xuegong Zhang
A case study on the detailed reproducibility of a human cell altas project
关于人类细胞阿尔塔斯项目详细再现性的案例研究
- DOI:--
- 发表时间:2019
- 期刊:Quantitative Biology
- 影响因子:3.1
- 作者:Kui Hua;Xuegong Zhang
- 通讯作者:Xuegong Zhang
Tongue coating microbiome as a potential biomarker for gastritis including precancerous cascade
舌苔微生物组作为胃炎(包括癌前级联)的潜在生物标志物
- DOI:10.1007/s13238-018-0596-6
- 发表时间:2019-07-01
- 期刊:PROTEIN & CELL
- 影响因子:21.1
- 作者:Cui, Jiaxing;Cui, Hongfei;Li, Shao
- 通讯作者:Li, Shao
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
多巴胺通路的基因与精神分裂症风险的多位点关联研究
- DOI:--
- 发表时间:--
- 期刊:中国科学C辑
- 影响因子:--
- 作者:孙向青;贾彦彬;张学工;许琪;沈岩;李衍达
- 通讯作者:李衍达
新一代高通量 RNA 测序数据的处理与分析
- DOI:--
- 发表时间:--
- 期刊:生物化学与生物物理进展
- 影响因子:--
- 作者:王立坤;冯智星;汪小我;张学工;王曦
- 通讯作者:王曦
脊椎动物中微小RNA进化模式研究
- DOI:--
- 发表时间:--
- 期刊:中国科学(C辑:生命科学)
- 影响因子:--
- 作者:张学工;李衍达;汪小我
- 通讯作者:汪小我
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}

内容获取失败,请点击重试

查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图

请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
张学工的其他基金
人类细胞图谱复杂数据的智能表示理论与信息框架
- 批准号:62250005
- 批准年份:2022
- 资助金额:249 万元
- 项目类别:专项基金项目
人类细胞图谱复杂数据的智能表示理论与信息框架
- 批准号:62050178
- 批准年份:2020
- 资助金额:98.46 万元
- 项目类别:专项基金项目
基因表达数据中的二维模式发现方法研究
- 批准号:60575014
- 批准年份:2005
- 资助金额:23.0 万元
- 项目类别:面上项目
基因芯片数据分析中的模式识别问题研究
- 批准号:60275007
- 批准年份:2002
- 资助金额:22.0 万元
- 项目类别:面上项目
基于统计学习理论的模式识别方法研究
- 批准号:69885004
- 批准年份:1998
- 资助金额:12.0 万元
- 项目类别:专项基金项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}