Methods for Evolutionary Genomics Analysis

进化基因组学分析方法

基本信息

  • 批准号:
    10322021
  • 负责人:
  • 金额:
    $ 49.53万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2021
  • 资助国家:
    美国
  • 起止时间:
    2021-02-01 至 2026-01-31
  • 项目状态:
    未结题

项目摘要

Summary/Abstract Continuing advances in nucleotide sequencing have resulted in the assembly of datasets containing large numbers of species, genes, and genomic segments. Phylogenomic analyses of these data are essential to progress in understanding evolutionary patterns across the tree of life, and are finding increasing numbers of applications in practical analyses that require understanding of how patterns change over time. The sheer size of phylogenomic datasets limits the practical utility of available methods due to excessive time and memory requirements. We have developed many high impact methods and tools for comparative analysis of molecular sequences, a tradition we propose to continue through this MIRA project by developing innovative methods that address new challenges in phylogenomics. We will focus on pattern-based approaches of machine learning with sparsity constraint (SL) applied to phylogenomics, as a complement to traditional model-based methods in molecular evolution and phylogenetics. In the proposed SL in Phylogenomics (SLiP) framework, we will build models that best explain the biological trait or evolutionary hypothesis of interest, with genomic loci, such as genes, proteins, and genomic segments, serving as model parameters. Preliminary results from two example applications establish the premise and promise of a general SLiP framework. In one, SLiP successfully detected loci whose inclusion in a phylogenomic dataset overtakes a consistent and contrasting signal from hundreds of other loci when inferring phylogenetic relationships. In the other example, SLiP revealed loci and biological functional categories that harbor convergent sequence evolutionary patterns associated with the emergence of the same trait in distinct evolutionary lineages. In all of these analyses, SLiP required only a small fraction of the computational time and memory demanded by traditional methods, and it enabled better evolutionary contrasts with fewer assumptions. Consequently, the successful development of SLiP will improve the feasibility, rigor, and reproducibility of large-scale data analysis. It will also democratize big data analytics via shortened analysis time and a relatively small memory footprint, and encourage the development of a new class of methods for phylogenomic analysis. This framework will be accessed from a free library of SLiP functions, which will be directly useable via command line and available in a graphical interface through integration with the MEGA software.
摘要/摘要 核苷酸测序的持续进展导致了包含大的数据集组装 物种,基因和基因组段的数量。这些数据的系统基础分析对于 理解整个生命树的进化模式的进展,并正在发现越来越多的 在实践分析中的应用,需要了解模式如何随时间变化。纯粹的大小 系统基因组数据集限制了由于时间和记忆力过多而可用方法的实际实用性 要求。我们开发了许多高影响力和工具来比较分子 序列,我们建议通过开发创新方法来继续通过这个MIRA项目的传统 应对系统基因组学的新挑战。我们将专注于与机器学习的基于模式的方法 适用于系统基础学的稀疏性约束(SL),作为对传统基于模型的方法的补充 分子进化和系统发育学。在拟议的系统基因组学(SLIP)框架中,我们将建立 最能解释具有基因组基因座的生物学性状或进化假设的模型,例如 基因,蛋白质和基因组片段,用作模型参数。两个示例的初步结果 应用程序建立了通用滑移框架的前提和承诺。在一个中,滑倒成功检测到 在系统基因组数据集中的包含的基因座超过了数百个一致且对比的信号 推断系统发育关系时的其他基因座。在另一个示例中,滑移揭示了基因座和生物学 具有与出现有关的功能类别具有收敛序列进化模式 在不同的进化谱系中具有相同的特征。在所有这些分析中,滑移仅需要一小部分 传统方法所需的计算时间和记忆,它启用了更好的进化对比度 假设更少。因此,滑移的成功发展将改善可行性,严格性, 大规模数据分析的可重复性。它还将通过缩短分析来使大数据分析民主化 时间和相对较小的内存足迹,并鼓励开发新的方法 系统基因分析。该框架将从免费的滑动功能库中访问,这将是 可通过命令行直接使用,并在图形接口中通过与Mega集成 软件。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Sudhir Kumar其他文献

Sudhir Kumar的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Sudhir Kumar', 18)}}的其他基金

Methods for Evolutionary Genomics Analysis
进化基因组学分析方法
  • 批准号:
    10405153
  • 财政年份:
    2021
  • 资助金额:
    $ 49.53万
  • 项目类别:
Methods for Evolutionary Genomics Analysis
进化基因组学分析方法
  • 批准号:
    10565855
  • 财政年份:
    2021
  • 资助金额:
    $ 49.53万
  • 项目类别:
Bioinformatics of metastatic migration histories
转移迁移历史的生物信息学
  • 批准号:
    10159969
  • 财政年份:
    2020
  • 资助金额:
    $ 49.53万
  • 项目类别:
Bioinformatics of metastatic migration histories
转移迁移历史的生物信息学
  • 批准号:
    9981255
  • 财政年份:
    2020
  • 资助金额:
    $ 49.53万
  • 项目类别:
Bioinformatics of metastatic migration histories
转移迁移历史的生物信息学
  • 批准号:
    10558612
  • 财政年份:
    2020
  • 资助金额:
    $ 49.53万
  • 项目类别:
Computational Methods for Expression Image Analysis
表达图像分析的计算方法
  • 批准号:
    8318902
  • 财政年份:
    2011
  • 资助金额:
    $ 49.53万
  • 项目类别:
Computational Methods for Expression Image Analysis
表达图像分析的计算方法
  • 批准号:
    8051993
  • 财政年份:
    2011
  • 资助金额:
    $ 49.53万
  • 项目类别:
Evolutionary Bioinformatics of Human Mutations
人类突变的进化生物信息学
  • 批准号:
    7988546
  • 财政年份:
    2010
  • 资助金额:
    $ 49.53万
  • 项目类别:
Evolutionary Bioinformatics of Human Mutations
人类突变的进化生物信息学
  • 批准号:
    8323957
  • 财政年份:
    2010
  • 资助金额:
    $ 49.53万
  • 项目类别:
Evolutionary Bioinformatics of Human Mutations
人类突变的进化生物信息学
  • 批准号:
    8138588
  • 财政年份:
    2010
  • 资助金额:
    $ 49.53万
  • 项目类别:

相似国自然基金

类脑计算系统基准测试研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    190 万元
  • 项目类别:
    国际(地区)合作与交流项目
类脑计算系统基准测试研究
  • 批准号:
    62250006
  • 批准年份:
    2022
  • 资助金额:
    190.00 万元
  • 项目类别:
    国际(地区)合作与交流项目
高性能计算程序的基准测试程序自动生成方法
  • 批准号:
    62202441
  • 批准年份:
    2022
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目
高性能计算程序的基准测试程序自动生成方法
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于工作负载表征的类脑体系结构基准测试模型与自动映射方法研究
  • 批准号:
  • 批准年份:
    2019
  • 资助金额:
    60 万元
  • 项目类别:
    面上项目

相似海外基金

Personalized Risk Stratification in Atrial Fibrillation using Portable, Explainable Artificial Intelligence
使用便携式、可解释的人工智能对心房颤动进行个性化风险分层
  • 批准号:
    10905154
  • 财政年份:
    2023
  • 资助金额:
    $ 49.53万
  • 项目类别:
Clinical Core
临床核心
  • 批准号:
    10746569
  • 财政年份:
    2023
  • 资助金额:
    $ 49.53万
  • 项目类别:
Transporting treatment effects from clinical trials to real-world populations with co-occurring opioid and stimulant use disorders
将临床试验的治疗效果转移到同时发生阿片类药物和兴奋剂使用障碍的现实人群中
  • 批准号:
    10526149
  • 财政年份:
    2022
  • 资助金额:
    $ 49.53万
  • 项目类别:
Transporting treatment effects from clinical trials to real-world populations with co-occurring opioid and stimulant use disorders
将临床试验的治疗效果转移到同时发生阿片类药物和兴奋剂使用障碍的现实人群中
  • 批准号:
    10642922
  • 财政年份:
    2022
  • 资助金额:
    $ 49.53万
  • 项目类别:
Comprehensive tools and models for addressing exposure to mixtures during environmental emergency-related contamination events
用于解决环境紧急事件相关污染事件期间混合物暴露问题的综合工具和模型
  • 批准号:
    10349750
  • 财政年份:
    2022
  • 资助金额:
    $ 49.53万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了