Biology-aware machine learning methods for characterizing microbiome genotype and phenotype

用于表征微生物组基因型和表型的生物学感知机器学习方法

基本信息

项目摘要

PROJECT SUMMARY The Mirarab laboratory designs computational methods for answering biological and biomedical questions, fo- cusing on scalability and accuracy. These methods span several areas (e.g., microbiome profiling, multiple sequence alignment, and phylogenomics), and a common thread among them is evolutionary modeling. More recently, many of the developed methods are based on machine learning. The lab has developed scalable and accurate methods for reconstructing evolutionary histories (i.e., phylogenies) and using these histories in down- stream biomedical applications. Methods developed by this lab (e.g., ASTRAL, SEPP, DEPP) are at the fore- fronts of modern genome-wide phylogenetics. While the lab has previously focused more on inferring species histories, through an MIRA grant, it has shifted its focus to developing methods for microbiome analyses, which pose their a unique set of challenges. As part of the MIRA application, the Mirarab lab will focus on designing, testing, and applying improved methods for statistical analyses of microbiome data. These methods will target two questions. (i) Profiling: What organisms constitute a given sample? (ii) Association: How are samples different in their organismal composition, and how do these differences connect to measurable characteristics of their environment? While both questions have been subject to considerable research, many computational challenges remain, providing an opportunity for better methods to make a significant impact. Instead of focusing solely on new algorithms, the lab will also work on building better reference datasets and combining data from multiple sources. Thus, the project aims to harness the unprecedented computational power, large available datasets, and recent advances in machine learning to improve state-of-the-art dramatically. The project will not use off-the-shelf machine learning methods in a black-box fashion. Instead, it develops methods that incorporate biological knowledge (e.g., of the evolutionary relationships) into machine learning methods in a principled biologically-motivated fashion. Within the context of the MIRA award, this supplementary request is to request support for an undergradu- ate student who is considering pursuing biomedical research career by providing research experiences in the intersection of mathematics/algorithmics and biology.
项目概要 Mirarab 实验室设计了用于回答生物学和生物医学问题的计算方法,例如 这些方法涉及多个领域(例如微生物组分析、多重分析)。 序列比对和系统基因组学),其中的共同点是进化建模。 最近,实验室开发的许多方法都是基于机器学习的。 重建进化历史(即系统发育)并在下游使用这些历史的准确方法 该实验室开发的方法(例如 ASTRAL、SEPP、DEPP)处于领先地位。 而该实验室此前更多地关注于推断物种。 历史上,通过 MIRA 拨款,它已将重点转向开发微生物组分析方法,该方法 提出他们独特的挑战。 作为 MIRA 应用的一部分,Mirarab 实验室将专注于设计、测试和应用改进的 微生物组数据统计分析的方法这些方法将针对两个问题: 给定样本由哪些生物体构成? (ii) 关联:样本在生物学方面有何不同? 组成,以及这些差异如何与其环境的可测量特征联系起来? 这两个问题都经过了大量的研究,但仍然存在许多计算挑战,提供 更好的方法产生重大影响的机会,而不是仅仅关注新算法。 该实验室还将致力于构建更好的参考数据集并结合多个来源的数据。 项目旨在利用前所未有的计算能力、大量可用数据集和最新进展 该项目将不使用现成的机器。 相反,它以黑盒方式学习方法,开发了融合生物学知识的方法。 (例如,进化关系)转化为有原则的生物驱动的机器学习方法 时尚。 在 MIRA 奖的背景下,此补充请求是请求对本科生的支持 正在考虑通过提供以下领域的研究经验来从事生物医学研究职业的学生 数学/算法和生物学的交叉点。

项目成果

期刊论文数量(10)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Distance-Based Phylogenetic Placement with Statistical Support.
  • DOI:
    10.3390/biology11081212
  • 发表时间:
    2022-08-12
  • 期刊:
  • 影响因子:
    4.2
  • 作者:
  • 通讯作者:
Quantifying the uncertainty of assembly-free genome-wide distance estimates and phylogenetic relationships using subsampling.
  • DOI:
    10.1016/j.cels.2022.06.007
  • 发表时间:
    2022-10-19
  • 期刊:
  • 影响因子:
    9.3
  • 作者:
  • 通讯作者:
DEPP: Deep Learning Enables Extending Species Trees using Single Genes
  • DOI:
    10.1093/sysbio/syac031
  • 发表时间:
    2022-04-29
  • 期刊:
  • 影响因子:
    6.5
  • 作者:
    Jiang, Yueyu;Balaban, Metin;Mirarab, Siavash
  • 通讯作者:
    Mirarab, Siavash
Learning Hyperbolic Embedding for Phylogenetic Tree Placement and Updates.
  • DOI:
    10.3390/biology11091256
  • 发表时间:
    2022-08-24
  • 期刊:
  • 影响因子:
    4.2
  • 作者:
  • 通讯作者:
Phylogenomic branch length estimation using quartets.
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Siavash Mir arabbaygi其他文献

Siavash Mir arabbaygi的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Siavash Mir arabbaygi', 18)}}的其他基金

Biology-aware machine learning methods for characterizing microbiome genotype and phenotype
用于表征微生物组基因型和表型的生物学感知机器学习方法
  • 批准号:
    10696960
  • 财政年份:
    2021
  • 资助金额:
    $ 1.48万
  • 项目类别:
Biology-aware machine learning methods for characterizing microbiome genotype and phenotype
用于表征微生物组基因型和表型的生物学感知机器学习方法
  • 批准号:
    10275055
  • 财政年份:
    2021
  • 资助金额:
    $ 1.48万
  • 项目类别:
Biology-aware machine learning methods for characterizing microbiome genotype and phenotype
用于表征微生物组基因型和表型的生物学感知机器学习方法
  • 批准号:
    10798957
  • 财政年份:
    2021
  • 资助金额:
    $ 1.48万
  • 项目类别:

相似国自然基金

面向二氧化碳封存的高可扩展时空并行区域分解算法及其大规模应用
  • 批准号:
    12371366
  • 批准年份:
    2023
  • 资助金额:
    43.5 万元
  • 项目类别:
    面上项目
无界区域中非局部Klein-Gordon-Schrödinger方程的保结构算法研究
  • 批准号:
    12301508
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于深度强化学习的约束多目标群智算法及多区域热电调度应用
  • 批准号:
    62303197
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
面向多区域单元化生产线协同调度问题的自动算法设计研究
  • 批准号:
    62303204
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
颜面缺损修复三维目标参照数据构建的区域权重非刚性配准算法研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    52 万元
  • 项目类别:
    面上项目

相似海外基金

Accelerating genomic analysis for time critical clinical applications
加速时间紧迫的临床应用的基因组分析
  • 批准号:
    10593480
  • 财政年份:
    2023
  • 资助金额:
    $ 1.48万
  • 项目类别:
Single viewpoint panoramic imaging technology for colonoscopy
肠镜单视点全景成像技术
  • 批准号:
    10580165
  • 财政年份:
    2023
  • 资助金额:
    $ 1.48万
  • 项目类别:
Biomarker-Guided Evaluation of Glycated Testing Modalities for Dysglycemia among Persons Living with HIV (BEGET)
HIV 感染者血糖异常的生物标志物引导糖化检测方式评估 (BEGET)
  • 批准号:
    10751444
  • 财政年份:
    2023
  • 资助金额:
    $ 1.48万
  • 项目类别:
Tele-Sox: A Tele-Medicine solution based on wearables and gamification to prevent Venous thromboembolism in Oncology Geriatric Patients
Tele-Sox:基于可穿戴设备和游戏化的远程医疗解决方案,用于预防肿瘤老年患者的静脉血栓栓塞
  • 批准号:
    10547300
  • 财政年份:
    2023
  • 资助金额:
    $ 1.48万
  • 项目类别:
Optimization and Validation of a Cost-effective Image-Guided Automated Extracapsular Extension Detection Framework through Interpretable Machine Learning in Head and Neck Cancer
通过可解释的机器学习在头颈癌中优化和验证具有成本效益的图像引导自动囊外扩展检测框架
  • 批准号:
    10648372
  • 财政年份:
    2023
  • 资助金额:
    $ 1.48万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了