Bayesian Sparse Dirichlet-Multinomial Models for Discovering Latent Structure in High-Dimensional Compositional Count Data
用于发现高维组合计数数据中潜在结构的贝叶斯稀疏狄利克雷多项模型
基本信息
- 批准号:2245492
- 负责人:
- 金额:$ 16.5万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2023
- 资助国家:美国
- 起止时间:2023-09-01 至 2026-08-31
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
The collection and analysis of microbiome data have broad implications for furthering our understanding of human health and performance, agriculture, and ecology, among other areas. Human microbiome research, for example, aims to better understand the role of our microbial communities and how they interact with their host, respond to their environment, and influence disease. In addition to microbiome data being compositional, as the sum of the microbial taxa reads is fixed, and high-dimensional, they are also zero-inflated, as there are typically more zero reads observed than expected, which has profound implications on modeling and inference. This project aims to advance statistical methods and computational algorithms for the analysis of zero-inflated multivariate compositional count data. While developed to address the current challenges of microbiome data analysis, the methods will be generally applicable to other settings in which multivariate compositional count data with excess zeros are observed, including biomedical and public health research, econometrics, and ecology. The project will additionally provide educational and professional training and mentoring to graduate students.Analyzing multivariate count data generated by high-throughput sequencing technology in omics research is challenging due to the high-dimensional and compositional structure of the data, over-dispersion, and potential zero inflation. In practice, researchers often use the Dirichlet-multinomial (DM) distribution and its variants to model these data. However, under the assumptions of a DM model, estimated probabilities for zero counts are strictly positive even if the true probability of occurrence is zero. This research project aims to develop a novel sparse DM (sDM) model which allows zero count probabilities to take on zero values to simultaneously accommodate potential zero inflation in multivariate compositional count data while estimating compositional probabilities. Additionally, this project will investigate extensions of the sDM modeling framework to high-dimensional variable selection and clustering problems and contribute Markov chain Monte Carlo algorithms for posterior inference that will be made publicly available to practitioners and other researchers.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
微生物组数据的收集和分析对于进一步了解人类健康和表现、农业和生态学等领域具有广泛的影响。例如,人类微生物组研究旨在更好地了解微生物群落的作用以及它们如何与宿主相互作用、对环境做出反应以及影响疾病。除了微生物组数据是组成性的之外,由于微生物分类群读数的总和是固定的并且是高维的,它们也是零膨胀的,因为观察到的零读数通常比预期多,这对建模和推理具有深远的影响。该项目旨在推进用于分析零膨胀多元成分计数数据的统计方法和计算算法。虽然开发这些方法是为了解决当前微生物组数据分析的挑战,但这些方法通常适用于观察到具有过多零的多元成分计数数据的其他环境,包括生物医学和公共卫生研究、计量经济学和生态学。该项目还将为研究生提供教育和专业培训和指导。由于数据的高维和组成结构、过度分散和潜在的潜在风险,在组学研究中分析高通量测序技术生成的多变量计数数据具有挑战性。零通货膨胀。在实践中,研究人员经常使用狄利克雷多项式 (DM) 分布及其变体来对这些数据进行建模。然而,在 DM 模型的假设下,即使真实发生概率为零,零计数的估计概率也严格为正。该研究项目旨在开发一种新颖的稀疏 DM (sDM) 模型,该模型允许零计数概率呈现零值,以在估计成分概率的同时适应多元成分计数数据中潜在的零膨胀。此外,该项目将研究 sDM 建模框架对高维变量选择和聚类问题的扩展,并贡献用于后验推理的马尔可夫链蒙特卡罗算法,该算法将公开提供给从业者和其他研究人员。该奖项反映了 NSF 的法定使命和通过使用基金会的智力优点和更广泛的影响审查标准进行评估,该项目被认为值得支持。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Matthew Koslovsky其他文献
Matthew Koslovsky的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似国自然基金
超双疏表面静电驱动化学反应及其可控性研究
- 批准号:22375169
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
亲/疏水功能调控类沸石超分子组装体(ZSAs)对低湿度环境水蒸气捕获
- 批准号:22301154
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
油田管道超疏热水复合涂层构建及其多场耦合防垢机制研究
- 批准号:52371076
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
高炉用炭基复合耐火材料疏铁水表/界面构筑及其抗铁水侵蚀机制
- 批准号:52302013
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
防液态食品黏附的仿生超疏液表界面构建及其性能优化
- 批准号:52305211
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
相似海外基金
CAREER: Compiler and Runtime Support for Sampled Sparse Computations on Heterogeneous Systems
职业:异构系统上采样稀疏计算的编译器和运行时支持
- 批准号:
2338144 - 财政年份:2024
- 资助金额:
$ 16.5万 - 项目类别:
Continuing Grant
The Global Structure of Sparse Networks
稀疏网络的全局结构
- 批准号:
DP240100198 - 财政年份:2024
- 资助金额:
$ 16.5万 - 项目类别:
Discovery Projects
10~12世紀東アジア天台浄土教思想交流の研究―『観経疏顕要記破文』を中心に
10世纪至12世纪东亚天台净土宗思想交流研究——以《观景所见行记哈文》为中心
- 批准号:
24KJ0829 - 财政年份:2024
- 资助金额:
$ 16.5万 - 项目类别:
Grant-in-Aid for JSPS Fellows
高野山における真言教学の基礎的研究―『大疏指南鈔』の校訂・分析を中心に―
高野山真言宗教义的基础研究——以《大圣正南书》的修订和分析为中心
- 批准号:
24K03386 - 财政年份:2024
- 资助金额:
$ 16.5万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
ERI: AI-Enhanced Dynamic Interference Suppression in Cognitive Sensing with Reconfigurable Sparse Arrays
ERI:利用可重构稀疏阵列在认知传感中进行人工智能增强型动态干扰抑制
- 批准号:
2347220 - 财政年份:2024
- 资助金额:
$ 16.5万 - 项目类别:
Standard Grant