Fast and flexible Bayesian phylogenetics via modern machine learning

通过现代机器学习快速灵活的贝叶斯系统发育学

基本信息

项目摘要

Project Abstract/Summary The SARS-CoV-2 pandemic underlines both our susceptibility to and the toll of a global pathogen outbreak. Phylogenetic analysis of viral genomes provides key insight into disease pathophysiology, spread and po- tential control. However, if these methods are to be used in a viral control strategy they must reliably account for uncertainty and be able to perform inference on 1,000s of genomes in actionable time. Scaling Bayesian phylogenet- ics to meet this need is a grand challenge that is unlikely to be met by optimizing existing algorithms. We will meet this challenge with a radically new approach: Bayesian variational inference for phylogenet- ics (VIP) using flexible distributions on phylogenetic trees that are fit using gradient-based methods analogous to how one efficiently trains massive neural networks. By taking a variational approach we will also be able to integrate phylogenetic analysis into very powerful open-source modeling frameworks such as TensorFlow and PyTorch. This will open up new classes of models, such as neural network models, to integrate data such as sampling location and migration patterns with phylogenetic inference. These flexible models will inform strategies for viral control. In Aim 1 we will develop the theory necessary for scalable and reliable VIP, including subtree marginal- ization, local gradient updates needed for online algorithms, convergence diagnostics, and parameter support estimates. We will implement these algorithms in our C++ foundation library for VIP. In Aim 2 we will develop a flexible TensorFlow-based modeling platform for phylogenetics, enabling a whole new realm of phylogenetic models based on neural networks to learn phylodynamic heterogeneity with minimal program- ming effort. We will provide efficient gradients to this implementation via our C++ library. In Aim 3 we will use the fact that VIP posteriors are durable and extensible descriptions of the full data posterior to enable dynamic online computation of variational posteriors, including divide-and-conquer Bayesian phylogenetics. This work will enable a cloud-based viral phylogenetics solution to rapidly update our current estimate of the posterior distribution when new data arrive or the model is modified. 1
项目摘要/总结 SARS-CoV-2 大流行凸显了我们对全球病原体爆发的易感性和造成的损失。 病毒基因组的系统发育分析为疾病病理生理学、传播和传播提供了重要的见解。 然而,如果要在病毒控制策略中使用这些方法,它们必须可靠地考虑。 不确定性,并能够在可行的时间内对数千个基因组进行推断。 满足这一需求的集成电路是一项巨大的挑战,不可能通过优化现有算法来解决。 我们将用一种全新的方法来应对这一挑战:系统发育的贝叶斯变分推理 ics(VIP)在系统发育树上使用灵活的分布,该树使用基于梯度的类似方法进行拟合 通过采用变分方法,我们也将能够有效地训练大规模神经网络。 将系统发育分析集成到非常强大的开源建模框架(例如 TensorFlow)中 和 PyTorch,这将开辟新的模型类别,例如神经网络模型,以集成数据,例如 这些灵活的模型将提供系统发育推断的采样位置和迁移模式。 病毒控制策略。 在目标 1 中,我们将开发可扩展且可靠的 VIP 所需的理论,包括子树边际- 在线算法所需的局部梯度更新、收敛诊断和参数支持 估计我们将在我们的 VIP 的 C++ 基础库中实现这些算法。 开发一个灵活的基于 TensorFlow 的系统发育建模平台,实现一个全新的领域 基于神经网络的系统发育模型,以最小的程序学习系统动力学异质性 我们将通过我们的 C++ 库为该实现提供有效的梯度。 利用 VIP 后验是完整数据后验的持久且可扩展的描述这一事实来启用 变分后验的动态在线计算,包括分而治之的贝叶斯系统发育学。 这项工作将使基于云的病毒系统发育解决方案能够快速更新我们目前对病毒的估计 新数据到达或模型修改时的后验分布。 1

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Frederick Albert Matsen其他文献

Frederick Albert Matsen的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Frederick Albert Matsen', 18)}}的其他基金

Fast and flexible Bayesian phylogenetics via modern machine learning
通过现代机器学习快速灵活的贝叶斯系统发育学
  • 批准号:
    10654594
  • 财政年份:
    2021
  • 资助金额:
    $ 32.13万
  • 项目类别:
Fast and flexible Bayesian phylogenetics via modern machine learning
通过现代机器学习快速灵活的贝叶斯系统发育学
  • 批准号:
    10434141
  • 财政年份:
    2021
  • 资助金额:
    $ 32.13万
  • 项目类别:
Fast and flexible Bayesian phylogenetics via modern machine learning
通过现代机器学习快速灵活的贝叶斯系统发育学
  • 批准号:
    10593362
  • 财政年份:
    2021
  • 资助金额:
    $ 32.13万
  • 项目类别:
Blending deep learning with probabilistic mechanistic models to predict and understand the evolution and function of adaptive immune receptors
将深度学习与概率机制模型相结合,以预测和理解适应性免疫受体的进化和功能
  • 批准号:
    10593356
  • 财政年份:
    2019
  • 资助金额:
    $ 32.13万
  • 项目类别:
Blending deep learning with probabilistic mechanistic models to predict and understand the evolution and function of adaptive immune receptors
将深度学习与概率机制模型相结合,以预测和理解适应性免疫受体的进化和功能
  • 批准号:
    10159730
  • 财政年份:
    2019
  • 资助金额:
    $ 32.13万
  • 项目类别:
Blending deep learning with probabilistic mechanistic models to predict and understand the evolution and function of adaptive immune receptors
将深度学习与概率机制模型相结合,以预测和理解适应性免疫受体的进化和功能
  • 批准号:
    10415985
  • 财政年份:
    2019
  • 资助金额:
    $ 32.13万
  • 项目类别:
Leveraing deep sequencing data to understand antibody maturation
利用深度测序数据了解抗体成熟度
  • 批准号:
    8825760
  • 财政年份:
    2014
  • 资助金额:
    $ 32.13万
  • 项目类别:
Leveraging deep sequencing data to understand antibody maturation
利用深度测序数据了解抗体成熟度
  • 批准号:
    9119033
  • 财政年份:
    2014
  • 资助金额:
    $ 32.13万
  • 项目类别:
Leveraging deep sequencing data to understand antibody maturation
利用深度测序数据了解抗体成熟度
  • 批准号:
    9318527
  • 财政年份:
    2014
  • 资助金额:
    $ 32.13万
  • 项目类别:

相似国自然基金

随机阻尼波动方程的高效保结构算法研究
  • 批准号:
    12301518
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
大规模黎曼流形稀疏优化算法及应用
  • 批准号:
    12371306
  • 批准年份:
    2023
  • 资助金额:
    43.5 万元
  • 项目类别:
    面上项目
基于任意精度计算架构的量子信息处理算法硬件加速技术研究
  • 批准号:
    62304037
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
分布式非凸非光滑优化问题的凸松弛及高低阶加速算法研究
  • 批准号:
    12371308
  • 批准年份:
    2023
  • 资助金额:
    43.5 万元
  • 项目类别:
    面上项目
基于物理信息神经网络的雷达回波资料反演蒸发波导算法研究
  • 批准号:
    42305048
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Previvors Recharge: A Resilience Program for Cancer Previvors
癌症预防者恢复活力计划:癌症预防者恢复力计划
  • 批准号:
    10698965
  • 财政年份:
    2023
  • 资助金额:
    $ 32.13万
  • 项目类别:
Previvors Recharge: A Resilience Program for Cancer Previvors
癌症预防者恢复活力计划:癌症预防者恢复力计划
  • 批准号:
    10698965
  • 财政年份:
    2023
  • 资助金额:
    $ 32.13万
  • 项目类别:
Data Core
数据核心
  • 批准号:
    10707551
  • 财政年份:
    2022
  • 资助金额:
    $ 32.13万
  • 项目类别:
Neurocognitive Fingerprints of Substance Use and Misuse in Adolescents
青少年药物使用和滥用的神经认知指纹
  • 批准号:
    10698046
  • 财政年份:
    2022
  • 资助金额:
    $ 32.13万
  • 项目类别:
Novel artificial intelligence-based approaches to understand the pathological and genetic drivers of primary tauopathies
基于人工智能的新方法来了解原发性 tau 蛋白病的病理和遗传驱动因素
  • 批准号:
    10525775
  • 财政年份:
    2022
  • 资助金额:
    $ 32.13万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了