Statistical methods for analyzing messy microbiome data: detection of hidden artifacts and robust modeling approaches
分析杂乱微生物组数据的统计方法:隐藏伪影的检测和稳健的建模方法
基本信息
- 批准号:10503637
- 负责人:
- 金额:$ 38.02万
- 依托单位:
- 依托单位国家:美国
- 项目类别:
- 财政年份:2022
- 资助国家:美国
- 起止时间:2022-09-23 至 2027-08-31
- 项目状态:未结题
- 来源:
- 关键词:AddressAlgorithmsBirthCationsCellsCharacteristicsClinical ResearchCohort StudiesCollectionCommunitiesComplexComputer softwareDNADataData AnalysesData SetDepositionDetectionDiseaseEtiologyEvaluationFailureFoundationsGenesHealthHumanHuman MicrobiomeInvestigationMethodsModelingMorphologic artifactsNew HampshireObservational StudyOdds RatioPerformancePersonal SatisfactionPhenotypePhylogenetic AnalysisPlayPrevention strategyProceduresProcessProtocols documentationPublic DomainsReproducibilityResearchResearch PersonnelResistanceRoleSamplingShotgunsStatistical MethodsStructureSurvival AnalysisTaxonTaxonomyTestingTimeWorkanalytical methodbacterial communitybasebeta diversitydata toolsdata visualizationdesigndisorder riskepidemiology studyexperimental studyhigh dimensionalityhuman microbiotaimprovedinterestmetagenomic sequencingmicrobialmicrobiomemicrobiome analysismicrobiome researchmicrobiome sequencingmicroorganismnovelnovel strategiesopen sourceresearch studysemiparametricsimulationtooltranscriptome sequencingtreatment strategytrustworthinessuser friendly softwarevaping
项目摘要
Project Abstract:
Recent research has highlighted the importance of human associated microbiota in many diseases and health
conditions. Nowadays marker-gene amplicon and shotgun metagenomics sequencing (jointly, MGS) have been
routinely used in epidemiological and clinical studies to investigate the health impact of the microbiome commu-
nity. In the public domain, many researchers now deposit MGS data together with other data for other researchers
to investigate. Despite being increasingly available, MGS data analysis remains difficult. In addition to the classic
statistical challenges inherent to MGS data such as the compositionality, the sparsity, the over dispersion and the
phylogenetic relationship between taxa, large scale MGS studies feature additional complications including the
experimental bias and hidden artifacts (batch effects), which will invalidate downstream analysis if not accounted
for properly. Current analytic approaches largely ignore or insufficiently handle these difficulties.
This proposal aims to develop powerful and robust statistical methods for reproducible microbiome discoveries
that adjust for unknown batch effects and are resistant to sequencing biases. In aim 1, we will develop a novel
approach to search for unmeasured artifacts through a novel surrogate variable analysis and multiple quantile
thresholding. Our approach advances the existing surrogate variable analysis approach to specifically address
the characteristics of MGS data including the differences in variabilities, the sparsity and the zero inflation. In
aims 2 & 3, we develop bias resistant modeling for assessing microbiome-phenotype association and community
level analysis. We will also develop, distribute and support user-friendly software for the proposed methods to
benefit the entire research community. The proposed methods will be evaluated against extensive simulations
and analysis of real microbiome data including data from our motivating studies as in VAPing Observational
Research Study (VAPORS) and the New Hampshire birth cohort study. Successful completion of this proposal
will fill the gap between the increasing research interest in microbiome and the lack of robust and bias-resistant
tools, and facilitate our in-depth understanding of human microbiome in health and disease.
项目摘要:
最近的研究强调了人类相关微生物群在许多疾病和健康中的重要性
如今,标记基因扩增子和鸟枪法宏基因组测序(联合称为 MGS)已成为主流。
常规用于流行病学和临床研究,以调查微生物群落对健康的影响
在公共领域,许多研究人员现在将 MGS 数据与其他研究人员的其他数据一起存放
尽管越来越可用,MGS 数据分析仍然很困难。
MGS 数据固有的统计挑战,例如组合性、稀疏性、过度分散性和
类群之间的系统发育关系,大规模 MGS 研究具有额外的并发症,包括
实验偏差和隐藏的人为因素(批次效应),如果不考虑这些因素将使下游分析无效
目前的分析方法很大程度上忽视或没有充分处理这些困难。
该提案旨在开发强大而稳健的统计方法来实现可重复的微生物组发现
调整未知批次效应并抵抗测序偏差 在目标 1 中,我们将开发一种新颖的方法。
通过新颖的替代变量分析和多分位数来搜索未测量的伪影的方法
我们的方法改进了现有的替代变量分析方法,以专门解决问题。
MGS数据的特征包括变量差异、稀疏性和零通胀。
目标 2 和 3,我们开发抗偏差模型来评估微生物组-表型关联和群落
我们还将为所提出的方法开发、分发和支持用户友好的软件。
所提出的方法将根据广泛的模拟进行评估。
以及对真实微生物组数据的分析,包括来自我们的 VAPing 观察性研究的数据
研究(VAPORS)和新罕布什尔州出生队列研究成功完成了该提案。
将填补对微生物组日益增长的研究兴趣与缺乏稳健和抗偏倚之间的空白
工具,并促进我们深入了解健康和疾病中的人类微生物组。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Ni Zhao其他文献
Ni Zhao的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Ni Zhao', 18)}}的其他基金
Statistical methods for analyzing messy microbiome data: detection of hidden artifacts and robust modeling approaches
分析杂乱微生物组数据的统计方法:隐藏伪影的检测和稳健的建模方法
- 批准号:
10708908 - 财政年份:2022
- 资助金额:
$ 38.02万 - 项目类别:
Statistical methods for integrative analysis of multiple microbiome datasets
多个微生物组数据集综合分析的统计方法
- 批准号:
10380772 - 财政年份:2021
- 资助金额:
$ 38.02万 - 项目类别:
Statistical methods for integrative analysis of multiple microbiome datasets
多个微生物组数据集综合分析的统计方法
- 批准号:
10217316 - 财政年份:2021
- 资助金额:
$ 38.02万 - 项目类别:
相似国自然基金
基于肿瘤病理图片的靶向药物敏感生物标志物识别及统计算法的研究
- 批准号:82304250
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
多模态高层语义驱动的深度伪造检测算法研究
- 批准号:62306090
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
高精度海表反照率遥感算法研究
- 批准号:42376173
- 批准年份:2023
- 资助金额:51 万元
- 项目类别:面上项目
基于新型深度学习算法和多组学研究策略鉴定非编码区剪接突变在肌萎缩侧索硬化症中的分子机制
- 批准号:82371878
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
基于深度学习与水平集方法的心脏MR图像精准分割算法研究
- 批准号:62371156
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
相似海外基金
Dynamic embedding time series models in functional brain imaging
功能性脑成像中的动态嵌入时间序列模型
- 批准号:
10711521 - 财政年份:2023
- 资助金额:
$ 38.02万 - 项目类别:
Functional analysis of ESRP1/2 and CTNND1 gene variants in orofacial cleft
ESRP1/2和CTNND1基因变异在口面裂中的功能分析
- 批准号:
10565102 - 财政年份:2023
- 资助金额:
$ 38.02万 - 项目类别:
Learn Systems Biology Equations From Snapshot Single Cell Genomic Data
从快照单细胞基因组数据学习系统生物学方程
- 批准号:
10736507 - 财政年份:2023
- 资助金额:
$ 38.02万 - 项目类别:
mAnaging siCkle CELl disease through incReased AdopTion of hydroxyurEa in Nigeria (ACCELERATE)
在尼日利亚通过增加羟基脲的使用来控制镰状细胞病(加速)
- 批准号:
10638598 - 财政年份:2023
- 资助金额:
$ 38.02万 - 项目类别:
Exploring parental perspectives on pediatric genome testing, research, and data management in a multicultural population
探索多元文化人群中家长对儿科基因组测试、研究和数据管理的看法
- 批准号:
10667281 - 财政年份:2023
- 资助金额:
$ 38.02万 - 项目类别: