基于元基因组相似度计算的海量微生物群落数据挖掘
项目介绍
AI项目解读
基本信息
- 批准号:61303161
- 项目类别:青年科学基金项目
- 资助金额:23.0万
- 负责人:
- 依托单位:
- 学科分类:F0213.生物信息计算与数字健康
- 结题年份:2016
- 批准年份:2013
- 项目状态:已结题
- 起止时间:2014-01-01 至2016-12-31
- 项目参与者:周茜; 任立辉; 王雪涛; 黄适; 胡建强;
- 关键词:
项目摘要
Metagenomic method is one of the most important methods to analysis the structure and function of microbial communities. The development of the NGS technology and the exponentially increasing number of microbial community samples produced massive metagenomic data. Limited by the lack of efficient analysis and comparison methods among microbial communities and low utitlize rate of metagenomic data,currently we cannot obtain valuable biological information from the massive data.This project aims to find the principal environmental factors which lead to the structural difference of microbial communities, by data mining methods based on the metagenomic similarity computing and the environmental information. The similarity between microbial communities is generated by the similarity computation of the weighted binary phylogenetic tree of metagenomic data, and then GPGPU CUDA architecture is implemented for parallel computing of the similarity value matrix of massive microbial community samples. By environmental difference and clustering analysis of the similarity value matrix, and correlation analysis between the clustering analysis results and the environmental factors, we can quantitively compute the diversity among the microbial communities occurred by environmental factors, and then realize the environmental factors that majorly affect the microbial communities' structure. This project can also provide fundamental methods and experience for the analysis of big data in metagenomic research.
元基因组学是分析微生物群落结构和功能的最重要手段之一。高通量测序技术的发展以及群落样本的指数级增加,产生了海量的元基因组数据。由于目前研究中缺乏微生物群落之间高效的比较与分析方法,对元基因组数据利用率低,无法从海量的数据中获取宝贵的生物学信息。本项目基于元基因组数据的相似度对海量微生物群落的结构信息进行数据挖掘,同时结合相应群落的采样环境信息,从而发现导致微生物群落结构差异的主要环境因素。微生物群落之间的相似度由计算元基因组数据加权二叉进化树的相似性来获得,并采用GPGPU CUDA架构并行化计算海量微生物群落的相似度矩阵。通过相似度矩阵中不同样本的环境条件差异性分析,自然聚类分析,以及聚类结果与环境条件的相关性分析等数据挖掘方法,量化地计算环境条件对微生物群落结构造成的影响。本项目同时也为元基因组的大数据分析提供基础方法和经验。
结项摘要
本项目基于元基因组数据的相似度计算,设计了微生物群落深入挖掘的数据模型和分析策略,并实现了完整的方法和软件开发,从而发现海量微生物组数据中所蕴含的深入科学意义,完成了本项目的研究计划。首先,本项目开发了针对元基因组解析的工具,对海量微生物组样本进行群落结构解析和功能预测;进而,实现了基于加权二叉进化树的微生物组相似度算法,并采用GPGPU CUDA 架构并行化计算海量微生物群落的相似度矩阵;第三,设计了微生物群落的MDV(Multi-Dimensional View)数据计算模型,并基于矩阵完成了完整的快速数据挖掘流程,量化不同环境因素对微生物群落结构和功能造成的影响,并筛选出生物特征标记。最终,将本项目的相关研究成果在人体健康、中药鉴定、转化医学等方面进行实际应用。本项目共发表9篇学术论文,相关成果获得2项软件著作权授权,并申请1项发明专利。2016年5月美国启动国家微生物组计划,同时中国的微生物组计划也呼之欲出,而海量数据的生物信息分析已经成为微生物组研究中的瓶颈。本项目不仅为大数据分析和挖掘提供有力的支撑,用数据分析来推动微生物组技术的发展,同时也为进一步充分有效地利用这些宝贵的大数据打下坚实的基础。
项目成果
期刊论文数量(9)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Rapid comparison and correlation analysis among massive number of microbial community samples based on MDV data model
基于MDV数据模型的海量微生物群落样本快速比对及相关性分析
- DOI:--
- 发表时间:2014
- 期刊:Scientific Reports
- 影响因子:4.6
- 作者:Su; Xiaoquan;Hu; Jianqiang;Huang; Shi;Ning; Kang
- 通讯作者:Kang
元基因组学及其在转化医学中的应用
- DOI:--
- 发表时间:2015
- 期刊:遗传
- 影响因子:--
- 作者:孙政;王晓君;苏晓泉;宁康
- 通讯作者:宁康
GPU-Meta-Storms: computing the structure similarities among massive amount of microbial community samples using GPU
GPU-Meta-Storms:使用GPU计算大量微生物群落样本之间的结构相似性
- DOI:--
- 发表时间:2014
- 期刊:Bioinformatics
- 影响因子:5.8
- 作者:Su; Xiaoquan;Wang; Xuetao;Jing; Gongchao;Ning; Kang
- 通讯作者:Kang
Assessment of quality control approaches for metagenomic data analysis
宏基因组数据分析的质量控制方法评估
- DOI:10.1038/srep06957
- 发表时间:2014-11-07
- 期刊:Scientific Reports
- 影响因子:4.6
- 作者:Zhou Q;Su X;Ning K
- 通讯作者:Ning K
Parallel-META 2.0: Enhanced Metagenomic Data Analysis with Functional Annotation, High Performance Computing and Advanced Visualization
Parallel-META 2.0:通过功能注释、高性能计算和高级可视化增强宏基因组数据分析
- DOI:--
- 发表时间:2014
- 期刊:PLOS ONE
- 影响因子:3.7
- 作者:Pan; Weihua;Song; Baoxing;Xu; Jian;Ning; Kang
- 通讯作者:Kang
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
元基因组学及其在转化医学中的应用
- DOI:--
- 发表时间:2015
- 期刊:遗传
- 影响因子:--
- 作者:孙政;王晓君;苏晓泉;宁康
- 通讯作者:宁康
使用Meta-Apo对16S扩增子的微生物组功能信息进行校正
- DOI:10.21769/bioprotoc.2104023
- 发表时间:2021
- 期刊:Bio-101
- 影响因子:--
- 作者:张明乾;张文科;荆功超;苏晓泉
- 通讯作者:苏晓泉
全球微生物组整体结构和功能的搜索
- DOI:10.1104/pp.17.00642
- 发表时间:2021
- 期刊:Bio-101
- 影响因子:--
- 作者:赵丰洋;李坚;荆功超;苏晓泉
- 通讯作者:苏晓泉
Dynamic Meta-Storms算法:基于物种水平的生物分类学和系统发育信息对宏基因组进行全面比较
- DOI:--
- 发表时间:2021
- 期刊:Bio-101
- 影响因子:--
- 作者:张玉凤;荆功超;陈俞竹;徐健;苏晓泉
- 通讯作者:苏晓泉
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
苏晓泉的其他基金
基于GPU-CPU混合并行计算的微生物组大数据索引与搜索方法学研究
- 批准号:31771463
- 批准年份:2017
- 资助金额:55.0 万元
- 项目类别:面上项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}