Human Microbiome Compendium: large-scale curation and processing of human microbiome datasets

人类微生物组纲要:人类微生物组数据集的大规模管理和处理

基本信息

  • 批准号:
    10701823
  • 负责人:
  • 金额:
    $ 33.59万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2022
  • 资助国家:
    美国
  • 起止时间:
    2022-09-15 至 2026-07-31
  • 项目状态:
    未结题

项目摘要

ABSTRACT Mounting evidence shows the microbial communities living in (and on) the human body play a key role in the etiology of disease. A major obstacle in the field is the dearth of reliable methods for extracting meaningful signals from small, noisy, intercorrelated, and highly variable microbiome datasets. Enhancing the ability of researchers to generate robust characterizations of the complex relationship between microbiota and their hosts will support novel, more reliable diagnosis of disease and bring the field one step closer to finding the causal links underlying microbiome-based therapeutics. Until now, however, researchers have not had the huge volume of data required to draw these conclusions. Although microbiome data from hundreds of thousands of samples is available in the NCBI Sequence Read Archive (SRA), these datasets have not been leveraged at a large scale. To bridge this gap, we will build an automated pipeline to process and aggregate more than 750,000 samples of amplicon and shotgun metagenomics sequencing data from all publicly available human microbiome samples. We will build a platform, which we call "The Human Microbiome Compendium," for compiling collections of relevant samples that can be used by researchers to find ecological dynamics that have until now been hidden in the noise. The compendium will allow users to see relative abundances of microbial taxa in every sample, which will also be linked to NCBI metadata and annotations generated by a new tool that imputes a uniform set of descriptors for sample type, body site, and host traits. We will also use the compendium to train machine learning models for dimensionality reduction, which will improve the power of independent microbiome studies by incorporating insights from the compendium's collection of hundreds of thousands of samples. These data and tools will be distributed across multiple channels, including a web application where users will be able to upload data to be processed in real time by the dimensionality reduction tools. The proposed studies will generate the first comprehensive aggregation of the microbiome datasets available via the SRA, which will be used to provide characterizations of the human microbiome in unprecedented detail. The resulting compendium will encourage the use of publicly available data and inform new microbiome analysis tools that will help extract important associations in studies where it's impractical to acquire the sample sizes required by conventional techniques. Results from this study will be a starting point to identification of microbiome biomarkers for disease and the development of novel therapeutic approaches.
抽象的 越来越多的证据表明,生活在(和)人体中的微生物群落在 疾病病因。该领域的主要障碍是缺乏提取有意义信号的可靠方法 从小型,嘈杂,相互关联和高度可变的微生物组数据集。增强研究人员的能力 为了产生对微生物群和其宿主之间复杂关系的鲁棒特征 新颖的,更可靠的疾病诊断,使该领域更近一步,更接近寻找因果关系。 基于微生物组的治疗剂。但是,到目前为止,研究人员还没有拥有大量数据所需的数据 得出这些结论。尽管来自数十万个样本的微生物组数据在 NCBI序列读取存档(SRA),这些数据集并未大规模利用。桥接这个 差距,我们将建立一条自动管道,以处理和汇总75万以上的amplicon和 来自所有公开可用的人类微生物组样品的shot弹枪宏基因组学测序数据。我们将建立一个 我们称之为“人类微生物组纲要”的平台用于编译相关样品的集合 研究人员可以使用这种方法来找到迄今为止隐藏在噪音中的生态动力学。这 汇编将使用户可以在每个样本中看到微生物类群的相对丰度,这也将是 链接到NCBI元数据和由新工具生成的注释 样本类型,身体部位和主机特征。我们还将使用纲要来训练机器学习模型 减少维度,这将通过合并来提高独立微生物组研究的能力 Compendium收集了数十万个样本的见解。这些数据和工具将是 跨多个渠道分发,包括一个Web应用程序,用户将能够上传数据为 通过缩小维度工具实时处理。拟议的研究将产生第一个 通过SRA提供的微生物组数据集的全面聚合,该数据集将用于提供 人类微生物组的表征以前所未有的细节。由此产生的汇编将鼓励 使用可公开的数据并为新的微生物组分析工具提供信息,以帮助提取重要 在研究中获取常规技术要求的样本量是不切实际的研究的关联。 这项研究的结果将是鉴定疾病微生物组生物标志物和 新型治疗方法的发展。

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Ran Blekhman其他文献

Ran Blekhman的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Ran Blekhman', 18)}}的其他基金

Milk-Omics: Systems Biology of Human Milk and Its Links to Maternal and Infant Health
乳汁组学:母乳的系统生物学及其与母婴健康的联系
  • 批准号:
    10531465
  • 财政年份:
    2022
  • 资助金额:
    $ 33.59万
  • 项目类别:
Milk-Omics: Systems Biology of Human Milk and Its Links to Maternal and Infant Health
乳汁组学:母乳的系统生物学及其与母婴健康的联系
  • 批准号:
    10709555
  • 财政年份:
    2022
  • 资助金额:
    $ 33.59万
  • 项目类别:
Population Genomics of Host-Microbiome Interactions
宿主-微生物组相互作用的群体基因组学
  • 批准号:
    10679265
  • 财政年份:
    2022
  • 资助金额:
    $ 33.59万
  • 项目类别:
Human Microbiome Compendium: large-scale curation and processing of human microbiome datasets
人类微生物组纲要:人类微生物组数据集的大规模管理和处理
  • 批准号:
    10538341
  • 财政年份:
    2022
  • 资助金额:
    $ 33.59万
  • 项目类别:
Population Genomics of Host-Microbiome Interactions
宿主-微生物组相互作用的群体基因组学
  • 批准号:
    10227036
  • 财政年份:
    2018
  • 资助金额:
    $ 33.59万
  • 项目类别:
Population Genomics of Host-Microbiome Interactions
宿主-微生物组相互作用的群体基因组学
  • 批准号:
    9753291
  • 财政年份:
    2018
  • 资助金额:
    $ 33.59万
  • 项目类别:
Population Genomics of Host-Microbiome Interactions
宿主-微生物组相互作用的群体基因组学
  • 批准号:
    10289962
  • 财政年份:
    2018
  • 资助金额:
    $ 33.59万
  • 项目类别:
Population Genomics of Host-Microbiome Interactions
宿主-微生物组相互作用的群体基因组学
  • 批准号:
    10449442
  • 财政年份:
    2018
  • 资助金额:
    $ 33.59万
  • 项目类别:
Population Genomics of Host-Microbiome Interactions
宿主-微生物组相互作用的群体基因组学
  • 批准号:
    10622273
  • 财政年份:
    2018
  • 资助金额:
    $ 33.59万
  • 项目类别:

相似国自然基金

关于空间分辨转录组学的降维,自动注释,数据整合和空间解混问题的统计方法
  • 批准号:
    12371283
  • 批准年份:
    2023
  • 资助金额:
    43.5 万元
  • 项目类别:
    面上项目
参考图谱引导的罕见细胞类型自动化注释方法及生物信息学工具研究
  • 批准号:
    32370715
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
数据驱动的代码注释自动生成方法研究
  • 批准号:
    61902441
  • 批准年份:
    2019
  • 资助金额:
    29.0 万元
  • 项目类别:
    青年科学基金项目
基于支持向量聚类与深度学习的图像自动注释算法研究
  • 批准号:
    61402076
  • 批准年份:
    2014
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Machine learning-based methods for the analysis of microbial glycomes and proteomes in inflammatory bowel disease.
基于机器学习的方法,用于分析炎症性肠病中微生物糖组和蛋白质组。
  • 批准号:
    10591842
  • 财政年份:
    2023
  • 资助金额:
    $ 33.59万
  • 项目类别:
Human Microbiome Compendium: large-scale curation and processing of human microbiome datasets
人类微生物组纲要:人类微生物组数据集的大规模管理和处理
  • 批准号:
    10538341
  • 财政年份:
    2022
  • 资助金额:
    $ 33.59万
  • 项目类别:
Long-read assembly and annotation of rat genomes that are important models of complex genetic disease
大鼠基因组的长读组装和注释是复杂遗传疾病的重要模型
  • 批准号:
    10449388
  • 财政年份:
    2021
  • 资助金额:
    $ 33.59万
  • 项目类别:
Long-read assembly and annotation of rat genomes that are important models of complex genetic disease
大鼠基因组的长读组装和注释是复杂遗传疾病的重要模型
  • 批准号:
    10211748
  • 财政年份:
    2021
  • 资助金额:
    $ 33.59万
  • 项目类别:
Long-read assembly and annotation of rat genomes that are important models of complex genetic disease
大鼠基因组的长读组装和注释是复杂遗传疾病的重要模型
  • 批准号:
    10615135
  • 财政年份:
    2021
  • 资助金额:
    $ 33.59万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了