Fast and flexible Bayesian phylogenetics via modern machine learning
通过现代机器学习快速灵活的贝叶斯系统发育学
基本信息
- 批准号:10593362
- 负责人:
- 金额:$ 47.61万
- 依托单位:
- 依托单位国家:美国
- 项目类别:
- 财政年份:2021
- 资助国家:美国
- 起止时间:2021-07-01 至 2026-06-30
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
Project Abstract/Summary
The SARS-CoV-2 pandemic underlines both our susceptibility to and the toll of a global pathogen outbreak.
Phylogenetic analysis of viral genomes provides key insight into disease pathophysiology, spread and po-
tential control. However, if these methods are to be used in a viral control strategy they must reliably account for
uncertainty and be able to perform inference on 1,000s of genomes in actionable time. Scaling Bayesian phylogenet-
ics to meet this need is a grand challenge that is unlikely to be met by optimizing existing algorithms.
We will meet this challenge with a radically new approach: Bayesian variational inference for phylogenet-
ics (VIP) using flexible distributions on phylogenetic trees that are fit using gradient-based methods analogous
to how one efficiently trains massive neural networks. By taking a variational approach we will also be able
to integrate phylogenetic analysis into very powerful open-source modeling frameworks such as TensorFlow
and PyTorch. This will open up new classes of models, such as neural network models, to integrate data such
as sampling location and migration patterns with phylogenetic inference. These flexible models will inform
strategies for viral control.
In Aim 1 we will develop the theory necessary for scalable and reliable VIP, including subtree marginal-
ization, local gradient updates needed for online algorithms, convergence diagnostics, and parameter support
estimates. We will implement these algorithms in our C++ foundation library for VIP. In Aim 2 we will
develop a flexible TensorFlow-based modeling platform for phylogenetics, enabling a whole new realm of
phylogenetic models based on neural networks to learn phylodynamic heterogeneity with minimal program-
ming effort. We will provide efficient gradients to this implementation via our C++ library. In Aim 3 we will
use the fact that VIP posteriors are durable and extensible descriptions of the full data posterior to enable
dynamic online computation of variational posteriors, including divide-and-conquer Bayesian phylogenetics.
This work will enable a cloud-based viral phylogenetics solution to rapidly update our current estimate of the
posterior distribution when new data arrive or the model is modified.
1
项目摘要/总结
SARS-CoV-2 大流行凸显了我们对全球病原体爆发的易感性和造成的损失。
病毒基因组的系统发育分析为疾病病理生理学、传播和传播提供了重要的见解。
然而,如果要在病毒控制策略中使用这些方法,它们必须可靠地考虑。
不确定性,并能够在可行的时间内对数千个基因组进行推断。
满足这一需求的集成电路是一项巨大的挑战,不可能通过优化现有算法来解决。
我们将用一种全新的方法来应对这一挑战:系统发育的贝叶斯变分推理
ics(VIP)在系统发育树上使用灵活的分布,该树使用基于梯度的类似方法进行拟合
通过采用变分方法,我们也将能够有效地训练大规模神经网络。
将系统发育分析集成到非常强大的开源建模框架(例如 TensorFlow)中
和 PyTorch,这将开辟新的模型类别,例如神经网络模型,以集成数据,例如
这些灵活的模型将提供系统发育推断的采样位置和迁移模式。
病毒控制策略。
在目标 1 中,我们将开发可扩展且可靠的 VIP 所需的理论,包括子树边际-
在线算法所需的局部梯度更新、收敛诊断和参数支持
估计我们将在我们的 VIP 的 C++ 基础库中实现这些算法。
开发一个灵活的基于 TensorFlow 的系统发育建模平台,实现一个全新的领域
基于神经网络的系统发育模型,以最小的程序学习系统动力学异质性
我们将通过我们的 C++ 库为该实现提供有效的梯度。
利用 VIP 后验是完整数据后验的持久且可扩展的描述这一事实来启用
变分后验的动态在线计算,包括分而治之的贝叶斯系统发育学。
这项工作将使基于云的病毒系统发育解决方案能够快速更新我们目前对病毒的估计
新数据到达或模型修改时的后验分布。
1
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Frederick Albert Matsen其他文献
Frederick Albert Matsen的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Frederick Albert Matsen', 18)}}的其他基金
Fast and flexible Bayesian phylogenetics via modern machine learning
通过现代机器学习快速灵活的贝叶斯系统发育学
- 批准号:
10654594 - 财政年份:2021
- 资助金额:
$ 47.61万 - 项目类别:
Fast and flexible Bayesian phylogenetics via modern machine learning
通过现代机器学习快速灵活的贝叶斯系统发育学
- 批准号:
10434141 - 财政年份:2021
- 资助金额:
$ 47.61万 - 项目类别:
Fast and flexible Bayesian phylogenetics via modern machine learning
通过现代机器学习快速灵活的贝叶斯系统发育学
- 批准号:
10266670 - 财政年份:2021
- 资助金额:
$ 47.61万 - 项目类别:
Blending deep learning with probabilistic mechanistic models to predict and understand the evolution and function of adaptive immune receptors
将深度学习与概率机制模型相结合,以预测和理解适应性免疫受体的进化和功能
- 批准号:
10593356 - 财政年份:2019
- 资助金额:
$ 47.61万 - 项目类别:
Blending deep learning with probabilistic mechanistic models to predict and understand the evolution and function of adaptive immune receptors
将深度学习与概率机制模型相结合,以预测和理解适应性免疫受体的进化和功能
- 批准号:
10159730 - 财政年份:2019
- 资助金额:
$ 47.61万 - 项目类别:
Blending deep learning with probabilistic mechanistic models to predict and understand the evolution and function of adaptive immune receptors
将深度学习与概率机制模型相结合,以预测和理解适应性免疫受体的进化和功能
- 批准号:
10415985 - 财政年份:2019
- 资助金额:
$ 47.61万 - 项目类别:
Leveraing deep sequencing data to understand antibody maturation
利用深度测序数据了解抗体成熟度
- 批准号:
8825760 - 财政年份:2014
- 资助金额:
$ 47.61万 - 项目类别:
Leveraging deep sequencing data to understand antibody maturation
利用深度测序数据了解抗体成熟度
- 批准号:
9119033 - 财政年份:2014
- 资助金额:
$ 47.61万 - 项目类别:
Leveraging deep sequencing data to understand antibody maturation
利用深度测序数据了解抗体成熟度
- 批准号:
9318527 - 财政年份:2014
- 资助金额:
$ 47.61万 - 项目类别:
相似国自然基金
活性口袋区水分子簇和构象灵活性调控丝氨酸蛋白酶催化活性的机制及靶向酶抑制剂的研究
- 批准号:32370990
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
海马DG脑区PV抑制性中间神经元参与认知灵活性调控的机制及其失调与自闭症样行为的关系
- 批准号:82301727
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
面向灵活性挖掘的电-气-氢混联综合能源系统协同运行
- 批准号:52377091
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
面向孤岛新能源消纳的低成本紧凑化―HVDC灵活接入型换流站构建方法及应用
- 批准号:52307210
- 批准年份:2023
- 资助金额:20 万元
- 项目类别:青年科学基金项目
激励分布式资源支撑灵活性与弹性提升的配网零售侧电价优化定价方法
- 批准号:52307136
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
相似海外基金
Representational dynamics for flexible learning in complex environments
复杂环境中灵活学习的表征动力学
- 批准号:
10818994 - 财政年份:2022
- 资助金额:
$ 47.61万 - 项目类别:
Flexible Bayesian approaches to causal inference with multilevel survival data and multiple treatments
利用多级生存数据和多种治疗进行因果推理的灵活贝叶斯方法
- 批准号:
10442178 - 财政年份:2021
- 资助金额:
$ 47.61万 - 项目类别:
Fast and flexible Bayesian phylogenetics via modern machine learning
通过现代机器学习快速灵活的贝叶斯系统发育学
- 批准号:
10654594 - 财政年份:2021
- 资助金额:
$ 47.61万 - 项目类别:
Fast and flexible Bayesian phylogenetics via modern machine learning
通过现代机器学习快速灵活的贝叶斯系统发育学
- 批准号:
10434141 - 财政年份:2021
- 资助金额:
$ 47.61万 - 项目类别:
Fast and flexible Bayesian phylogenetics via modern machine learning
通过现代机器学习快速灵活的贝叶斯系统发育学
- 批准号:
10266670 - 财政年份:2021
- 资助金额:
$ 47.61万 - 项目类别: