Bilateral NSF/BIO-BBSRC:A Metagenomics Exchange - enriching analysis by synergistic harmonisation of MG-RAST and the EBI Metagenomics Portal

双边 NSF/BIO-BBSRC:宏基因组学交流 - 通过 MG-RAST 和 EBI 宏基因组学门户的协同协调丰富分析

基本信息

  • 批准号:
    BB/N018354/1
  • 负责人:
  • 金额:
    $ 104.13万
  • 依托单位:
  • 依托单位国家:
    英国
  • 项目类别:
    Research Grant
  • 财政年份:
    2017
  • 资助国家:
    英国
  • 起止时间:
    2017 至 无数据
  • 项目状态:
    已结题

项目摘要

Micro-organisms are found in virtually all environments. Typically, they form the base of the food chain (such as plankton in the sea) and play essential roles in their ecosystems. There is often a complex interplay between different micro-organisms, with some organisms requiring that others be present in order for them to exist. When there is an imbalance within a community, this can lead to severe effects, such as disease in the human gut, or the inability for plants to grow efficiently in soil. An understanding of the composition and interplay within the communities allows us to potentially manipulate them. Thus, there is intense research into micro-organism communities in many different fields, such as improving livestock yields, the recovery from bacterial infections using fecal transplants and the efficient production of biofuels. Many of these communities also contain important proteins that could be useful to the biotechnological and pharmaceutical industries, such as enzymes involved in the production of antibiotics.Metagenomics is the study of these different micro-organism communities, which is achieved by isolating the DNA from the organisms within an environmental sample (e.g. water, soil, animal stool), sequencing the DNA, followed by the computational analysis to decode which organisms are present and the functions they might be performing. This computation is complicated: (1) there is a huge amount of data; (2) The sequence data is a jumbled mix of fragments from different organisms; (3) Decoding the DNA is hard - typically >90% of organisms within a sample are not well characterised.This proposal brings together three major resources within the field of metagenomics data archiving and analysis. The European Nucleotide Archive (ENA) is a repository of DNA sequence data. Importantly, ENA also captures metagenomic contextual data, such as where and when the sample was taken, how the DNA was extracted and sequenced. The EBI metagenomics portal (EMG, UK) and MG-RAST (MGR, US) are two metagenomics sequence analysis platforms. Uniquely, they represent the only free to use services, whereby researchers can upload sequence data and have it analysed without restriction. Despite the widespread use of metagenomics, currently the community lacks standards to ensure that metagenomics sequence data and the derived functional and taxonomic information are deposited within a database of record. Consequently, the navigation between metagenomics datasets is very difficult for even experienced users. As they offer slightly different, yet complementary, analysis services, there is often the desire to have a metagenomics dataset analysed by both resources. But, the number of equivalent datasets between the two resources is unknown. Unless a user has prior knowledge about equivalent projects, they remain disconnected. Also, sequence data submitted to MGR may not necessarily be deposited in ENA. We propose to set up a computational framework, termed Metagenomics Exchange (ME), to enable metagenomics datasets and the results of their analysis to be linked. All sequences will become available to the research community via ENA and analysis results we be automatically exchanged between EMG and EMR. The ME will be implemented to enable other metagenomics analysis providers to join, and so that it can be used by researchers wishing to perform large scale analyses. We will also investigate ways that our own pipelines can be enhanced through the use of the ME, sharing software and processing tasks, for example. This will lead to computational savings, increasing the capacity for metagenomics analysis. We will also generate a knowledge transfer forum, enabling the exchange of ideas on a range of topics, from hardware solutions to algorithms. Finally, we will undertake a research program to investigate the optimal combination of pipeline analysis components, and whether a single, unified analysis pipeline could be engineered.
微生物几乎存在于所有环境中。通常,它们构成食物链的基础(例如海洋中的浮游生物)并在其生态系统中发挥重要作用。不同微生物之间通常存在复杂的相互作用,某些微生物需要其他微生物的存在才能存在。当群落内存在不平衡时,可能会导致严重的影响,例如人类肠道疾病,或植物无法在土壤中有效生长。了解社区内的组成和相互作用使我们能够潜在地操纵它们。因此,许多不同领域都对微生物群落进行了深入的研究,例如提高牲畜产量、利用粪便移植从细菌感染中恢复以及生物燃料的高效生产。其中许多群落还含有对生物技术和制药工业有用的重要蛋白质,例如抗生素生产中涉及的酶。宏基因组学是对这些不同微生物群落的研究,它是通过从微生物群落中分离 DNA 来实现的。环境样本(例如水、土壤、动物粪便)中的生物体,对 DNA 进行测序,然后进行计算分析,以解码存在哪些生物体以及它们可能执行的功能。这种计算比较复杂:(1)数据量巨大; (2) 序列数据是来自不同生物体的片段的混乱组合; (3) 解码 DNA 很困难——通常样本中 90% 以上的生物体都没有得到很好的表征。该提案汇集了宏基因组数据归档和分析领域的三个主要资源。欧洲核苷酸档案库 (ENA) 是 DNA 序列数据的存储库。重要的是,ENA 还捕获宏基因组背景数据,例如样本采集地点和时间、DNA 提取和测序方式。 EBI 宏基因组学门户(EMG,英国)和 MG-RAST(MGR,美国)是两个宏基因组序列分析平台。独特的是,它们代表了唯一免费使用的服务,研究人员可以上传序列数据并不受限制地进行分析。尽管宏基因组学得到广泛使用,但目前业界缺乏标准来确保宏基因组序列数据以及衍生的功能和分类信息存储在记录数据库中。因此,即使对于有经验的用户来说,宏基因组数据集之间的导航也非常困难。由于它们提供略有不同但互补的分析服务,因此通常希望拥有由这两种资源分析的宏基因组数据集。但是,两个资源之间的等效数据集的数量未知。除非用户事先了解等效项目,否则他们将保持断开连接。此外,提交给 MGR 的序列数据不一定存放在 ENA 中。我们建议建立一个称为宏基因组交换(ME)的计算框架,以使宏基因组数据集及其分析结果能够链接起来。所有序列都将通过 ENA 提供给研究界,并且分析结果将在 EMG 和 EMR 之间自动交换。 ME 的实施将使其他宏基因组分析提供商能够加入,以便希望进行大规模分析的研究人员可以使用它。我们还将研究如何通过使用 ME、共享软件和处理任务等来增强我们自己的管道。这将节省计算量,提高宏基因组分析的能力。我们还将创建一个知识转移论坛,以便就从硬件解决方案到算法的一系列主题交流想法。最后,我们将开展一项研究计划,调查管道分析组件的最佳组合,以及是否可以设计一个单一的、统一的分析管道。

项目成果

期刊论文数量(10)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
A new genomic blueprint of the human gut microbiota.
人类肠道微生物群的新基因组蓝图。
  • DOI:
    http://dx.10.1038/s41586-019-0965-1
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    64.8
  • 作者:
    Almeida A
  • 通讯作者:
    Almeida A
A unified sequence catalogue of over 280,000 genomes obtained from the human gut microbiome
从人类肠道微生物组中获得的超过 280,000 个基因组的统一序列目录
  • DOI:
    10.1101/762682
  • 发表时间:
    2019-09-19
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Ale;re Almeida;re;Stephen Nayfach;M. Bol;F. Strozzi;Martin Beracochea;Z. Shi;K. Pollard;Donovan H. Parks;P. Hugenholtz;N. Segata;N. Kyrpides;R. Finn
  • 通讯作者:
    R. Finn
The European Nucleotide Archive in 2018.
2018 年欧洲核苷酸档案。
  • DOI:
    http://dx.10.1093/nar/gky1078
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    14.9
  • 作者:
    Harrison PW
  • 通讯作者:
    Harrison PW
Computational strategies to combat COVID-19: useful tools to accelerate SARS-CoV-2 and coronavirus research.
对抗 COVID-19 的计算策略:加速 SARS-CoV-2 和冠状病毒研究的有用工具。
  • DOI:
    http://dx.10.1093/bib/bbaa232
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    9.5
  • 作者:
    Hufsky F
  • 通讯作者:
    Hufsky F
Computational Strategies to Combat COVID-19: Useful Tools to Accelerate SARS-CoV-2 and Coronavirus Research
对抗 COVID-19 的计算策略:加速 SARS-CoV-2 和冠状病毒研究的有用工具
  • DOI:
    http://dx.10.20944/preprints202005.0376.v1
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Hufsky F
  • 通讯作者:
    Hufsky F
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Robert Finn其他文献

2-BLOCKS WITH MINIMAL NONABELIAN DEFECT GROUPS
具有最小非纳贝尔缺陷组的 2 块
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
    B. E. S. Ambale;F. A. M. Athematik;Paul Balmer;Robert Finn;Sorin Popa;Vyjayanthi Chari;Kefeng Liu;Jie Qing;Daryl Cooper;Jiang;Paul Yang;Silvio Levy
  • 通讯作者:
    Silvio Levy
The small GTPase Rab4A interacts with the central region of cytoplasmic dynein light intermediate chain-1.
小 GTP 酶 Rab4A 与细胞质动力蛋白轻中间链 1 的中心区域相互作用。
Atomistic study of Urbach tail energies in (Al,Ga)N quantum well systems
(Al,Ga)N 量子阱系统中乌尔巴赫尾能的原子研究
F Ur Mathematik in Den Naturwissenschaften Leipzig Singular Solutions of the Capillary Problem
莱比锡自然科学学院数学 毛细管问题的奇异解
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Robert Finn;Robert Weston Neel
  • 通讯作者:
    Robert Weston Neel
BAVARD’S DUALITY THEOREM ON CONJUGATION-INVARIANT NORMS
共轭不变范数的巴伐德对偶定理
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
    M. O. K. Awasaki;Paul Balmer;Robert Finn;Sorin Popa;Vyjayanthi Chari;Kefeng Liu;Igor Pak;Paul Yang;Daryl Cooper;Jiang;Jie Qing;Silvio Levy
  • 通讯作者:
    Silvio Levy

Robert Finn的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Robert Finn', 18)}}的其他基金

Enriching MGnify Genomes to capture the full spectrum of the microbiota and bolster taxonomic classifications
丰富 MGnify 基因组以捕获微生物群的全谱并支持分类学分类
  • 批准号:
    BB/V01868X/1
  • 财政年份:
    2022
  • 资助金额:
    $ 104.13万
  • 项目类别:
    Research Grant
2020BBSRC-NSF/BIO: REDEFINE - Development of efficient, large-scale metagenomics sequence comparison algorithms to facilitate novel genomic insights
2020BBSRC-NSF/BIO:REDEFINE - 开发高效、大规模的宏基因组序列比较算法,以促进新的基因组见解
  • 批准号:
    BB/W002965/1
  • 财政年份:
    2022
  • 资助金额:
    $ 104.13万
  • 项目类别:
    Research Grant
SENSE - Screening of ENvironmental SEquences to discover novel protein functions using informatics target selection and high-throughput validation
SENSE - 使用信息学目标选择和高通量验证筛选环境序列以发现新的蛋白质功能
  • 批准号:
    BB/T000902/1
  • 财政年份:
    2020
  • 资助金额:
    $ 104.13万
  • 项目类别:
    Research Grant
EMERALD - Enriching MEtagenomics Results using Artificial intelligence and Literature Data
EMERALD - 使用人工智能和文献数据丰富宏基因组学结果
  • 批准号:
    BB/S009043/1
  • 财政年份:
    2019
  • 资助金额:
    $ 104.13万
  • 项目类别:
    Research Grant
EBI Metagenomics - enabling the reconstruction of microbial populations
EBI 宏基因组学 - 实现微生物种群的重建
  • 批准号:
    BB/R015228/1
  • 财政年份:
    2018
  • 资助金额:
    $ 104.13万
  • 项目类别:
    Research Grant
Expanding Genome3D and disseminating the structural annotations via InterPro and PDBe
通过 InterPro 和 PDBe 扩展 Genome3D 并传播结构注释
  • 批准号:
    BB/N019172/1
  • 财政年份:
    2016
  • 资助金额:
    $ 104.13万
  • 项目类别:
    Research Grant
EBI Metagenomics Portal - Towards a better understanding of community metabolism
EBI 宏基因组学门户 - 更好地了解群落代谢
  • 批准号:
    BB/M011755/1
  • 财政年份:
    2015
  • 资助金额:
    $ 104.13万
  • 项目类别:
    Research Grant
14 NSFBIO:Towards detailed and consistent function prediction from protein family databases
14 NSFBIO:从蛋白质家族数据库进行详细且一致的功能预测
  • 批准号:
    BB/N00521X/1
  • 财政年份:
    2015
  • 资助金额:
    $ 104.13万
  • 项目类别:
    Research Grant
Collaborative Research: Capillary Interfaces
合作研究:毛细管接口
  • 批准号:
    0103954
  • 财政年份:
    2001
  • 资助金额:
    $ 104.13万
  • 项目类别:
    Standard Grant
Proposal for Exploratory Research
探索性研究提案
  • 批准号:
    9729817
  • 财政年份:
    1997
  • 资助金额:
    $ 104.13万
  • 项目类别:
    Standard Grant

相似国自然基金

SYNJ1蛋白片段通过促进突触蛋白NSF聚集在帕金森病发生中的机制研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
NSF蛋白亚硝基化修饰所介导的GluA2 containing-AMPA受体膜稳定性在卒中后抑郁中的作用及机制研究
  • 批准号:
    82071300
  • 批准年份:
    2020
  • 资助金额:
    55 万元
  • 项目类别:
    面上项目
参加中美(NSFC-NSF)生物多样性项目评审会
  • 批准号:
  • 批准年份:
    2019
  • 资助金额:
    2 万元
  • 项目类别:
    国际(地区)合作与交流项目
中美(NSFC-NSF)EEID联合评审会
  • 批准号:
  • 批准年份:
    2019
  • 资助金额:
    2.6 万元
  • 项目类别:
    国际(地区)合作与交流项目
中美(NSFC-NSF)EEID联合评审会
  • 批准号:
  • 批准年份:
    2019
  • 资助金额:
    1.2 万元
  • 项目类别:
    国际(地区)合作与交流项目

相似海外基金

Bilateral BBSRC-NSF/BIO: CIBR: Structural modeling of interactome to assess phenotypic effects of genetic variation.
双边 BBSRC-NSF/BIO:CIBR:相互作用组的结构模型,用于评估遗传变异的表型效应。
  • 批准号:
    1917263
  • 财政年份:
    2019
  • 资助金额:
    $ 104.13万
  • 项目类别:
    Standard Grant
Bilateral BBSRC-NSF/BIO: Bayesian Quantitative Proteomics
双边 BBSRC-NSF/BIO:贝叶斯定量蛋白质组学
  • 批准号:
    2016487
  • 财政年份:
    2019
  • 资助金额:
    $ 104.13万
  • 项目类别:
    Standard Grant
Bilateral BBSRC-NSF/BIO: Bayesian Quantitative Proteomics
双边 BBSRC-NSF/BIO:贝叶斯定量蛋白质组学
  • 批准号:
    2016487
  • 财政年份:
    2019
  • 资助金额:
    $ 104.13万
  • 项目类别:
    Standard Grant
Bilateral BBSRC-NSF/BIO Collaborative Research: ABI Development: A Critical Assessment of Protein Function Annotation
BBSRC-NSF/BIO 双边合作研究:ABI 开发:蛋白质功能注释的批判性评估
  • 批准号:
    1854685
  • 财政年份:
    2018
  • 资助金额:
    $ 104.13万
  • 项目类别:
    Standard Grant
Bilateral BBSRC-NSF/BIO: Asymmetric division and the temporal dynamics of cell motility
双边 BBSRC-NSF/BIO:不对称分裂和细胞运动的时间动态
  • 批准号:
    1758081
  • 财政年份:
    2017
  • 资助金额:
    $ 104.13万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了