Bayesian Sparse Dirichlet-Multinomial Models for Discovering Latent Structure in High-Dimensional Compositional Count Data
用于发现高维组合计数数据中潜在结构的贝叶斯稀疏狄利克雷多项模型
基本信息
- 批准号:2245492
- 负责人:
- 金额:$ 16.5万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2023
- 资助国家:美国
- 起止时间:2023-09-01 至 2026-08-31
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
The collection and analysis of microbiome data have broad implications for furthering our understanding of human health and performance, agriculture, and ecology, among other areas. Human microbiome research, for example, aims to better understand the role of our microbial communities and how they interact with their host, respond to their environment, and influence disease. In addition to microbiome data being compositional, as the sum of the microbial taxa reads is fixed, and high-dimensional, they are also zero-inflated, as there are typically more zero reads observed than expected, which has profound implications on modeling and inference. This project aims to advance statistical methods and computational algorithms for the analysis of zero-inflated multivariate compositional count data. While developed to address the current challenges of microbiome data analysis, the methods will be generally applicable to other settings in which multivariate compositional count data with excess zeros are observed, including biomedical and public health research, econometrics, and ecology. The project will additionally provide educational and professional training and mentoring to graduate students.Analyzing multivariate count data generated by high-throughput sequencing technology in omics research is challenging due to the high-dimensional and compositional structure of the data, over-dispersion, and potential zero inflation. In practice, researchers often use the Dirichlet-multinomial (DM) distribution and its variants to model these data. However, under the assumptions of a DM model, estimated probabilities for zero counts are strictly positive even if the true probability of occurrence is zero. This research project aims to develop a novel sparse DM (sDM) model which allows zero count probabilities to take on zero values to simultaneously accommodate potential zero inflation in multivariate compositional count data while estimating compositional probabilities. Additionally, this project will investigate extensions of the sDM modeling framework to high-dimensional variable selection and clustering problems and contribute Markov chain Monte Carlo algorithms for posterior inference that will be made publicly available to practitioners and other researchers.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
微生物组数据的收集和分析对我们对人类健康和绩效,农业和生态学等领域以及其他领域的了解具有广泛的影响。例如,人类微生物组的研究旨在更好地了解我们微生物群落的作用,以及它们如何与宿主相互作用,对环境反应并影响疾病。除了微生物组数据的组成之外,由于微生物分类单元读取的总和是固定的,而且高维的,它们也被泄漏到零,因为通常观察到的零读数比预期的要多,这对建模和推断具有深远的影响。该项目旨在推进统计方法和计算算法,以分析零膨胀的多元组成计数数据。虽然开发了用于应对微生物组数据分析的当前挑战,但这些方法通常适用于其他观察到具有过量零的多元组成计数数据,包括生物医学和公共卫生研究,计量经济学和生态学。该项目还将为研究生提供教育和专业的培训和指导。由于数据,过度分散和潜在的零通货膨胀的高维和组成结构的高维和组成结构,因此在OMICS研究中由高通量测序技术产生的多变量计数数据具有挑战性。在实践中,研究人员经常使用Dirichlet-Multinomial(DM)分布及其变体来对这些数据进行建模。但是,在DM模型的假设下,即使出现的真实概率为零,零计数的估计概率也是严格的。该研究项目旨在开发一种新型的稀疏DM(SDM)模型,该模型允许零计数概率以零值为零,以同时适应多变量组成计数数据中的潜在零通胀,同时估计组成概率。此外,该项目将调查SDM建模框架的扩展,以对高维变量选择和聚类问题进行贡献,并为马尔可夫链蒙特卡洛算法提供后推理,该算法将公开可为从业人员和其他研究人员公开可用。该奖项反映了NSF的法定任务,反映了通过评估的构成群体的构成群体的范围。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Matthew Koslovsky其他文献
Matthew Koslovsky的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似国自然基金
益肾固疏方通过WTAP介导ALOX15-m6A甲基化抑制成骨细胞铁死亡治疗绝经后骨质疏松症的机制研究
- 批准号:82360937
- 批准年份:2023
- 资助金额:33 万元
- 项目类别:地区科学基金项目
亲/疏水功能调控类沸石超分子组装体(ZSAs)对低湿度环境水蒸气捕获
- 批准号:22301154
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
锌金属负极“疏锌—亲锌”型界面层的设计及电化学性能研究
- 批准号:52301274
- 批准年份:2023
- 资助金额:30.00 万元
- 项目类别:青年科学基金项目
超双疏表面静电驱动化学反应及其可控性研究
- 批准号:22375169
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
油田管道超疏热水复合涂层构建及其多场耦合防垢机制研究
- 批准号:52371076
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
相似海外基金
The Global Structure of Sparse Networks
稀疏网络的全局结构
- 批准号:
DP240100198 - 财政年份:2024
- 资助金额:
$ 16.5万 - 项目类别:
Discovery Projects
CAREER: Compiler and Runtime Support for Sampled Sparse Computations on Heterogeneous Systems
职业:异构系统上采样稀疏计算的编译器和运行时支持
- 批准号:
2338144 - 财政年份:2024
- 资助金额:
$ 16.5万 - 项目类别:
Continuing Grant
高野山における真言教学の基礎的研究―『大疏指南鈔』の校訂・分析を中心に―
高野山真言宗教义的基础研究——以《大圣正南书》的修订和分析为中心
- 批准号:
24K03386 - 财政年份:2024
- 资助金额:
$ 16.5万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
10~12世紀東アジア天台浄土教思想交流の研究―『観経疏顕要記破文』を中心に
10世纪至12世纪东亚天台净土宗思想交流研究——以《观景所见行记哈文》为中心
- 批准号:
24KJ0829 - 财政年份:2024
- 资助金额:
$ 16.5万 - 项目类别:
Grant-in-Aid for JSPS Fellows
ERI: AI-Enhanced Dynamic Interference Suppression in Cognitive Sensing with Reconfigurable Sparse Arrays
ERI:利用可重构稀疏阵列在认知传感中进行人工智能增强型动态干扰抑制
- 批准号:
2347220 - 财政年份:2024
- 资助金额:
$ 16.5万 - 项目类别:
Standard Grant