Fast and flexible Bayesian phylogenetics via modern machine learning

通过现代机器学习快速灵活的贝叶斯系统发育学

基本信息

  • 批准号:
    10654594
  • 负责人:
  • 金额:
    $ 74.48万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2021
  • 资助国家:
    美国
  • 起止时间:
    2021-07-01 至 2026-06-30
  • 项目状态:
    未结题

项目摘要

Project Abstract/Summary The SARS-CoV-2 pandemic underlines both our susceptibility to and the toll of a global pathogen outbreak. Phylogenetic analysis of viral genomes provides key insight into disease pathophysiology, spread and po- tential control. However, if these methods are to be used in a viral control strategy they must reliably account for uncertainty and be able to perform inference on 1,000s of genomes in actionable time. Scaling Bayesian phylogenet- ics to meet this need is a grand challenge that is unlikely to be met by optimizing existing algorithms. We will meet this challenge with a radically new approach: Bayesian variational inference for phylogenet- ics (VIP) using flexible distributions on phylogenetic trees that are fit using gradient-based methods analogous to how one efficiently trains massive neural networks. By taking a variational approach we will also be able to integrate phylogenetic analysis into very powerful open-source modeling frameworks such as TensorFlow and PyTorch. This will open up new classes of models, such as neural network models, to integrate data such as sampling location and migration patterns with phylogenetic inference. These flexible models will inform strategies for viral control. In Aim 1 we will develop the theory necessary for scalable and reliable VIP, including subtree marginal- ization, local gradient updates needed for online algorithms, convergence diagnostics, and parameter support estimates. We will implement these algorithms in our C++ foundation library for VIP. In Aim 2 we will develop a flexible TensorFlow-based modeling platform for phylogenetics, enabling a whole new realm of phylogenetic models based on neural networks to learn phylodynamic heterogeneity with minimal program- ming effort. We will provide efficient gradients to this implementation via our C++ library. In Aim 3 we will use the fact that VIP posteriors are durable and extensible descriptions of the full data posterior to enable dynamic online computation of variational posteriors, including divide-and-conquer Bayesian phylogenetics. This work will enable a cloud-based viral phylogenetics solution to rapidly update our current estimate of the posterior distribution when new data arrive or the model is modified. 1
项目摘要/总结 SARS-CoV-2 大流行凸显了我们对全球病原体爆发的易感性和造成的损失。 病毒基因组的系统发育分析为疾病病理生理学、传播和传播提供了重要的见解。 然而,如果要在病毒控制策略中使用这些方法,它们必须可靠地考虑。 不确定性,并能够在可行的时间内对数千个基因组进行推断。 满足这一需求的集成电路是一项巨大的挑战,不可能通过优化现有算法来解决。 我们将用一种全新的方法来应对这一挑战:系统发育的贝叶斯变分推理 ics(VIP)在系统发育树上使用灵活的分布,该树使用基于梯度的类似方法进行拟合 通过采用变分方法,我们也将能够有效地训练大规模神经网络。 将系统发育分析集成到非常强大的开源建模框架(例如 TensorFlow)中 和 PyTorch,这将开辟新的模型类别,例如神经网络模型,以集成数据,例如 这些灵活的模型将提供系统发育推断的采样位置和迁移模式。 病毒控制策略。 在目标 1 中,我们将开发可扩展且可靠的 VIP 所需的理论,包括子树边际- 在线算法所需的局部梯度更新、收敛诊断和参数支持 估计我们将在我们的 VIP 的 C++ 基础库中实现这些算法。 开发一个灵活的基于 TensorFlow 的系统发育建模平台,实现一个全新的领域 基于神经网络的系统发育模型,以最小的程序学习系统动力学异质性 我们将通过我们的 C++ 库为该实现提供有效的梯度。 利用 VIP 后验是完整数据后验的持久且可扩展的描述这一事实来启用 变分后验的动态在线计算,包括分而治之的贝叶斯系统发育学。 这项工作将使基于云的病毒系统发育解决方案能够快速更新我们目前对病毒的估计 新数据到达或模型修改时的后验分布。 1

项目成果

期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Representing and extending ensembles of parsimonious evolutionary histories with a directed acyclic graph.
用有向无环图表示和扩展简约进化历史的集合。
  • DOI:
  • 发表时间:
    2023-10-25
  • 期刊:
  • 影响因子:
    1.9
  • 作者:
    Dumm, Will;Barker, Mary;Howard;DeWitt Iii, William S;Matsen Iv, Frederick A
  • 通讯作者:
    Matsen Iv, Frederick A
Learnable Topological Features for Phylogenetic Inference via Graph Neural Networks.
通过图神经网络进行系统发育推断的可学习拓扑特征。
  • DOI:
  • 发表时间:
    2023-02-17
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Zhang; Cheng
  • 通讯作者:
    Cheng
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Frederick Albert Matsen其他文献

Frederick Albert Matsen的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Frederick Albert Matsen', 18)}}的其他基金

Fast and flexible Bayesian phylogenetics via modern machine learning
通过现代机器学习快速灵活的贝叶斯系统发育学
  • 批准号:
    10434141
  • 财政年份:
    2021
  • 资助金额:
    $ 74.48万
  • 项目类别:
Fast and flexible Bayesian phylogenetics via modern machine learning
通过现代机器学习快速灵活的贝叶斯系统发育学
  • 批准号:
    10266670
  • 财政年份:
    2021
  • 资助金额:
    $ 74.48万
  • 项目类别:
Fast and flexible Bayesian phylogenetics via modern machine learning
通过现代机器学习快速灵活的贝叶斯系统发育学
  • 批准号:
    10593362
  • 财政年份:
    2021
  • 资助金额:
    $ 74.48万
  • 项目类别:
Blending deep learning with probabilistic mechanistic models to predict and understand the evolution and function of adaptive immune receptors
将深度学习与概率机制模型相结合,以预测和理解适应性免疫受体的进化和功能
  • 批准号:
    10593356
  • 财政年份:
    2019
  • 资助金额:
    $ 74.48万
  • 项目类别:
Blending deep learning with probabilistic mechanistic models to predict and understand the evolution and function of adaptive immune receptors
将深度学习与概率机制模型相结合,以预测和理解适应性免疫受体的进化和功能
  • 批准号:
    10159730
  • 财政年份:
    2019
  • 资助金额:
    $ 74.48万
  • 项目类别:
Blending deep learning with probabilistic mechanistic models to predict and understand the evolution and function of adaptive immune receptors
将深度学习与概率机制模型相结合,以预测和理解适应性免疫受体的进化和功能
  • 批准号:
    10415985
  • 财政年份:
    2019
  • 资助金额:
    $ 74.48万
  • 项目类别:
Leveraing deep sequencing data to understand antibody maturation
利用深度测序数据了解抗体成熟度
  • 批准号:
    8825760
  • 财政年份:
    2014
  • 资助金额:
    $ 74.48万
  • 项目类别:
Leveraging deep sequencing data to understand antibody maturation
利用深度测序数据了解抗体成熟度
  • 批准号:
    9119033
  • 财政年份:
    2014
  • 资助金额:
    $ 74.48万
  • 项目类别:
Leveraging deep sequencing data to understand antibody maturation
利用深度测序数据了解抗体成熟度
  • 批准号:
    9318527
  • 财政年份:
    2014
  • 资助金额:
    $ 74.48万
  • 项目类别:

相似海外基金

Addressing Algorithmic Unreliability and Dataset Shift in EHR-based Risk Prediction Models
解决基于 EHR 的风险预测模型中的算法不可靠性和数据集转移
  • 批准号:
    10679376
  • 财政年份:
    2023
  • 资助金额:
    $ 74.48万
  • 项目类别:
Leveraging Pathogen-Host Networks to Identify Virus-specific and Estradiol-regulated Mechanisms during Respiratory Infection
利用病原体宿主网络来识别呼吸道感染期间的病毒特异性和雌二醇调节机制
  • 批准号:
    10741119
  • 财政年份:
    2023
  • 资助金额:
    $ 74.48万
  • 项目类别:
Machine learning approaches for the detection of emergency department patients with opioid misuse
用于检测阿片类药物滥用的急诊科患者的机器学习方法
  • 批准号:
    10350200
  • 财政年份:
    2022
  • 资助金额:
    $ 74.48万
  • 项目类别:
Machine learning approaches for the detection of emergency department patients with opioid misuse
用于检测阿片类药物滥用的急诊科患者的机器学习方法
  • 批准号:
    10608099
  • 财政年份:
    2022
  • 资助金额:
    $ 74.48万
  • 项目类别:
Adaptive olfactory threshold testing in the clinical assessment of anosmia
自适应嗅觉阈值测试在嗅觉丧失临床评估中的应用
  • 批准号:
    10491037
  • 财政年份:
    2022
  • 资助金额:
    $ 74.48万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了