Biology-aware machine learning methods for characterizing microbiome genotype and phenotype
用于表征微生物组基因型和表型的生物学感知机器学习方法
基本信息
- 批准号:10798957
- 负责人:
- 金额:$ 15.1万
- 依托单位:
- 依托单位国家:美国
- 项目类别:
- 财政年份:2021
- 资助国家:美国
- 起止时间:2021-09-15 至 2026-08-31
- 项目状态:未结题
- 来源:
- 关键词:AdoptedAlgorithmsAreaAwardAwarenessBiologicalBiologyCharacteristicsComputing MethodologiesDataData SetEnvironmentGenotypeGrantKnowledgeLaboratoriesMachine LearningMeasurableMethodsModelingModernizationOrganismPhenotypePhylogenetic AnalysisPhylogenyProcessRecording of previous eventsResearchSamplingSequence AlignmentServicesShapesStatistical MethodsTechniquesTestingTrainingWorkdesigngenome-widegenomic dataimprovedinterestlarge datasetsmachine learning methodmicrobiomemicrobiome analysismultiple data sourcesstatistics
项目摘要
PROJECT SUMMARY
The Mirarab laboratory designs computational methods for answering biological and biomedical questions, fo-
cusing on scalability and accuracy. These methods span several areas (e.g., microbiome profiling, multiple
sequence alignment, and phylogenomics), and a common thread among them is evolutionary modeling. More
recently, many of the developed methods are based on machine learning. The lab has developed scalable and
accurate methods for reconstructing evolutionary histories (i.e., phylogenies) and using these histories in down-
stream biomedical applications. Methods developed by this lab (e.g., ASTRAL, SEPP, DEPP) are at the fore-
fronts of modern genome-wide phylogenetics. While the lab has previously focused more on inferring species
histories, through an MIRA grant, it has shifted its focus to developing methods for microbiome analyses, which
pose their a unique set of challenges.
As part of the MIRA application, the Mirarab lab will focus on designing, testing, and applying improved
methods for statistical analyses of microbiome data. These methods will target two questions. (i) Profiling:
What organisms constitute a given sample? (ii) Association: How are samples different in their organismal
composition, and how do these differences connect to measurable characteristics of their environment? While
both questions have been subject to considerable research, many computational challenges remain, providing
an opportunity for better methods to make a significant impact. Instead of focusing solely on new algorithms,
the lab will also work on building better reference datasets and combining data from multiple sources. Thus, the
project aims to harness the unprecedented computational power, large available datasets, and recent advances
in machine learning to improve state-of-the-art dramatically. The project will not use off-the-shelf machine
learning methods in a black-box fashion. Instead, it develops methods that incorporate biological knowledge
(e.g., of the evolutionary relationships) into machine learning methods in a principled biologically-motivated
fashion.
Within the context of the MIRA award, this supplementary request is to purchase a computing server. The
server will enable the lab to take advantage of the unprecedented level of genomic data available today to build
machine learning methods that are trained on a much more representative set than existing methods. Thus,
the extra computational power will not be just in the service of making analyses faster: it will enable using large
datasets for training that could not be otherwise used.
项目概要
Mirarab 实验室设计了用于回答生物学和生物医学问题的计算方法,例如
这些方法涉及多个领域(例如微生物组分析、多重分析)。
序列比对和系统基因组学),其中的共同点是进化建模。
最近,实验室开发的许多方法都是基于机器学习的。
重建进化历史(即系统发育)并在下游使用这些历史的准确方法
该实验室开发的方法(例如 ASTRAL、SEPP、DEPP)处于领先地位。
而该实验室此前更多地关注于推断物种。
历史上,通过 MIRA 拨款,它已将重点转向开发微生物组分析方法,该方法
提出他们独特的挑战。
作为 MIRA 应用的一部分,Mirarab 实验室将专注于设计、测试和应用改进的
微生物组数据统计分析的方法这些方法将针对两个问题:
给定样本由哪些生物体构成? (ii) 关联:样本在生物学方面有何不同?
组成,以及这些差异如何与其环境的可测量特征联系起来?
这两个问题都经过了大量的研究,但仍然存在许多计算挑战,提供
更好的方法产生重大影响的机会,而不是仅仅关注新算法。
该实验室还将致力于构建更好的参考数据集并结合多个来源的数据。
项目旨在利用前所未有的计算能力、大量可用数据集和最新进展
该项目将不使用现成的机器。
相反,它以黑盒方式学习方法,开发了融合生物学知识的方法。
(例如,进化关系)转化为有原则的生物驱动的机器学习方法
时尚。
在 MIRA 奖项的背景下,该补充请求是购买一台计算服务器。
服务器将使实验室能够利用当今可用的前所未有的基因组数据水平来构建
机器学习方法是在比现有方法更具代表性的集合上进行训练的。
额外的计算能力不仅可以加快分析速度:它还可以使用大型
用于训练的数据集,无法以其他方式使用。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Siavash Mir arabbaygi其他文献
Siavash Mir arabbaygi的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Siavash Mir arabbaygi', 18)}}的其他基金
Biology-aware machine learning methods for characterizing microbiome genotype and phenotype
用于表征微生物组基因型和表型的生物学感知机器学习方法
- 批准号:
10696960 - 财政年份:2021
- 资助金额:
$ 15.1万 - 项目类别:
Biology-aware machine learning methods for characterizing microbiome genotype and phenotype
用于表征微生物组基因型和表型的生物学感知机器学习方法
- 批准号:
10275055 - 财政年份:2021
- 资助金额:
$ 15.1万 - 项目类别:
Biology-aware machine learning methods for characterizing microbiome genotype and phenotype
用于表征微生物组基因型和表型的生物学感知机器学习方法
- 批准号:
10810437 - 财政年份:2021
- 资助金额:
$ 15.1万 - 项目类别:
相似国自然基金
面向二氧化碳封存的高可扩展时空并行区域分解算法及其大规模应用
- 批准号:12371366
- 批准年份:2023
- 资助金额:43.5 万元
- 项目类别:面上项目
无界区域中非局部Klein-Gordon-Schrödinger方程的保结构算法研究
- 批准号:12301508
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于深度强化学习的约束多目标群智算法及多区域热电调度应用
- 批准号:62303197
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
面向多区域单元化生产线协同调度问题的自动算法设计研究
- 批准号:62303204
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
颜面缺损修复三维目标参照数据构建的区域权重非刚性配准算法研究
- 批准号:
- 批准年份:2022
- 资助金额:52 万元
- 项目类别:面上项目
相似海外基金
Accelerating genomic analysis for time critical clinical applications
加速时间紧迫的临床应用的基因组分析
- 批准号:
10593480 - 财政年份:2023
- 资助金额:
$ 15.1万 - 项目类别:
Single viewpoint panoramic imaging technology for colonoscopy
肠镜单视点全景成像技术
- 批准号:
10580165 - 财政年份:2023
- 资助金额:
$ 15.1万 - 项目类别:
Biomarker-Guided Evaluation of Glycated Testing Modalities for Dysglycemia among Persons Living with HIV (BEGET)
HIV 感染者血糖异常的生物标志物引导糖化检测方式评估 (BEGET)
- 批准号:
10751444 - 财政年份:2023
- 资助金额:
$ 15.1万 - 项目类别:
Tele-Sox: A Tele-Medicine solution based on wearables and gamification to prevent Venous thromboembolism in Oncology Geriatric Patients
Tele-Sox:基于可穿戴设备和游戏化的远程医疗解决方案,用于预防肿瘤老年患者的静脉血栓栓塞
- 批准号:
10547300 - 财政年份:2023
- 资助金额:
$ 15.1万 - 项目类别:
Optimization and Validation of a Cost-effective Image-Guided Automated Extracapsular Extension Detection Framework through Interpretable Machine Learning in Head and Neck Cancer
通过可解释的机器学习在头颈癌中优化和验证具有成本效益的图像引导自动囊外扩展检测框架
- 批准号:
10648372 - 财政年份:2023
- 资助金额:
$ 15.1万 - 项目类别: