Implementing the Genomic Data Science Analysis, Visualization, and Informatics Lab-space (AnVIL)

实施基因组数据科学分析、可视化和信息学实验室空间 (AnVIL)

基本信息

  • 批准号:
    10405959
  • 负责人:
  • 金额:
    $ 64.5万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2018
  • 资助国家:
    美国
  • 起止时间:
    2018-09-21 至 2023-06-30
  • 项目状态:
    已结题

项目摘要

Project Summary NIH-sponsored biomedical research is increasingly moving to cloud-based data storage and analysis systems. The NHGRI Genomic Data Science Analysis, Visualization, and Informatics Lab-space (AnVIL) powers the next generation of computational genomics research across the NHGRI using cloud-scale data and compute resources. The platform provides multiple entry points for data access and analysis, including data search with Gen3, workflows with Terra and Dockstore, notebook environments including Jupyter and RStudio, Bioconductor packages for analysis leveraging AnVIL APIs and services, and Galaxy instances for interactive analysis. By providing a unified environment for data management and compute, AnVIL eliminates the need for data movement, allows for controlled access to sensitive data, and provides elastic computing resources that can be acquired by researchers as needed. The NIH Cloud Platform Interoperability (NCPI) effort aims to address interoperability issues across NIH cloud systems, including AnVIL, by implementing key technologies and standards. We will work with NCPI working groups to define use cases and lead outreach as well as implement several major technologies within the AnVIL. First, we will enhance support for the NIH Researcher Auth Service (RAS) to enable researchers to establish their identity and access data they are authorized to use across Terra and Galaxy. Second, we will enhance support for the Global Alliance for Genomics and Health (GA4GH) Data Repository Service (DRS) so that data consumers can access data objects in a single, standard way. Third, we will enhance support in AnVIL for the Fast Healthcare Interoperability Resources (FHIR) standard. This will facilitate access to eMERGE and related projects by users in AnVIL and other NCPI platforms. Next, we will develop new resources and guides for budgeting for cloud computing. For this, we will identify the most commonly used tools and workflows run within Galaxy, and model the cost of these tools by varying data sets (e.g., sequencing coverage or number of genomes) and computational resources (e.g., number of CPUs, peak RAM). Statistical analysis of results will be published and serve as a tool to decrease cost as a barrier to cloud research and cloud interoperabily. Finally, interoperability of workflow generation is hampered by the fact that not all cloud platforms support the same sets of workflow languages. To address this, we will develop a Kubernetes- based computational engine to link workflows from multiple workflow languages. This work will initially focus on usage of Snakemake workflows, followed by extending development to support the workflow languages WDL, CWL and Galaxy workflows using their respective execution engines. This will simplify the transition from institutional HPC to the cloud and make it possible for researchers to seamlessly execute workflows across NCPI platforms.
项目摘要 NIH赞助的生物医学研究越来越多地转向基于云的数据存储和分析系统。 NHGRI基因组数据科学分析,可视化和信息学实验室空间(Anvil)为 使用云规模数据跨NHGRI的下一代计算基因组学研究并计算 资源。该平台为数据访问和分析提供了多个入口点,包括与数据搜索 Gen3,与Terra和Dockstore的工作流程,笔记本环境,包括Jupyter和Rstudio, 用于分析的生物处理套件利用砧座API和服务,以及银河系实例进行交互式 分析。通过为数据管理和计算提供统一的环境,Anvil消除了需求 对于数据移动,允许对敏感数据的控制访问,并提供弹性计算资源 研究人员可以根据需要获取。 NIH云平台互操作性(NCPI)努力旨在解决NIH的互操作性问题 通过实施关键技术和标准,包括铁砧在内的云系统。我们将与NCPI合作 工作组定义用例和领导外展,并在内部实施多种主要技术 砧。首先,我们将增强对NIH研究人员授课服务(RAS)的支持,以使研究人员能够 建立他们的身份和访问数据,被授权在Terra和Galaxy上使用。第二,我们会的 增强对全球基因组和健康联盟(GA4GH)数据存储库服务(DRS)的支持 数据消费者可以以单一的标准方式访问数据对象。第三,我们将增强支持 快速医疗保健互操作性资源(FHIR)标准的砧。这将有助于进入 用户在Anvil和其他NCPI平台中出现和相关项目。接下来,我们将开发新的 用于云计算预算的资源和指南。为此,我们将确定最常用的 工具和工作流程在银河系内运行,并通过改变数据集(例如, 测序覆盖范围或基因组数量)和计算资源(例如,CPU的数量,峰值RAM)。 结果的统计分析将发布,并作为降低成本作为云研究障碍的工具 和云室内。最后,工作流程的互操作性受到以下事实的阻碍 云平台支持相同的工作流语言集。为了解决这个问题,我们将开发一个Kubernetes- 基于从多种工作流语言链接工作流程的计算引擎。这项工作最初将 专注于使用Snakemake工作流程,然后扩展开发以支持工作流程 语言WDL,CWL和Galaxy Workflows使用各自的执行引擎。这将简化 从机构HPC过渡到云,使研究人员无缝执行 跨NCPI平台的工作流程。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Jeremy Goecks其他文献

Jeremy Goecks的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Jeremy Goecks', 18)}}的其他基金

Data Processing, Analysis and Modeling Unit
数据处理、分析和建模单元
  • 批准号:
    10902925
  • 财政年份:
    2023
  • 资助金额:
    $ 64.5万
  • 项目类别:
Scalable multi-mode education to increase use of ITCR tools by diverse analysts
可扩展的多模式教育,以增加不同分析师对 ITCR 工具的使用
  • 批准号:
    10669864
  • 财政年份:
    2020
  • 资助金额:
    $ 64.5万
  • 项目类别:
Scalable multi-mode education to increase use of ITCR tools by diverse analysts
可扩展的多模式教育,以增加不同分析师对 ITCR 工具的使用
  • 批准号:
    10250548
  • 财政年份:
    2020
  • 资助金额:
    $ 64.5万
  • 项目类别:
Scalable multi-mode education to increase use of ITCR tools by diverse analysts
可扩展的多模式教育,以增加不同分析师对 ITCR 工具的使用
  • 批准号:
    10075552
  • 财政年份:
    2020
  • 资助金额:
    $ 64.5万
  • 项目类别:
A Federated Galaxy for user-friendly large-scale cancer genomics research
用于用户友好的大规模癌症基因组学研究的联邦星系
  • 批准号:
    10245142
  • 财政年份:
    2018
  • 资助金额:
    $ 64.5万
  • 项目类别:
Data Processing, Analysis and Modeling Unit
数据处理、分析和建模单元
  • 批准号:
    10005918
  • 财政年份:
    2018
  • 资助金额:
    $ 64.5万
  • 项目类别:
A Federated Galaxy for user-friendly large-scale cancer genomics research
用于用户友好的大规模癌症基因组学研究的联邦星系
  • 批准号:
    10908030
  • 财政年份:
    2018
  • 资助金额:
    $ 64.5万
  • 项目类别:
Data Processing, Analysis and Modeling Unit
数据处理、分析和建模单元
  • 批准号:
    10246897
  • 财政年份:
    2018
  • 资助金额:
    $ 64.5万
  • 项目类别:
Implementing the Genomic Data Science Analysis, Visualization, and Informatics Lab-space (AnVIL)
实施基因组数据科学分析、可视化和信息学实验室空间 (AnVIL)
  • 批准号:
    10220581
  • 财政年份:
    2018
  • 资助金额:
    $ 64.5万
  • 项目类别:
A Federated Galaxy for user-friendly large-scale cancer genomics research
用于用户友好的大规模癌症基因组学研究的联邦星系
  • 批准号:
    10461143
  • 财政年份:
    2018
  • 资助金额:
    $ 64.5万
  • 项目类别:

相似国自然基金

半导体矿物-光合色素协同强化地表水体微生物光电产甲烷机制
  • 批准号:
    42307305
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
多通道半导体光电化学生物传感器的多重界面调和机制研究及其在抑郁症检测中的应用
  • 批准号:
    62301446
  • 批准年份:
    2023
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目
半导体纳米片锚定贵金属(Au、Ag、Cu)单原子SERS生物探针的可控制备和增强机制研究
  • 批准号:
    12374390
  • 批准年份:
    2023
  • 资助金额:
    53.00 万元
  • 项目类别:
    面上项目
用于光驱动化学品合成的半导体材料-微生物杂合体的生产策略研究
  • 批准号:
    32300065
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于原子层沉积半导体沟道的FET生物传感器构筑与性能调控
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Immuno-Oncology Translation Network: Data Management and Resource-Sharing Center at RPCI
免疫肿瘤学翻译网络:RPCI 的数据管理和资源共享中心
  • 批准号:
    10872397
  • 财政年份:
    2023
  • 资助金额:
    $ 64.5万
  • 项目类别:
Coordinating and Data Management Center for Acquired Resistance to Therapy Network
获得性治疗耐药网络协调和数据管理中心
  • 批准号:
    10516537
  • 财政年份:
    2022
  • 资助金额:
    $ 64.5万
  • 项目类别:
Coordinating and Data Management Center for Acquired Resistance to Therapy Network
获得性治疗耐药网络协调和数据管理中心
  • 批准号:
    10682495
  • 财政年份:
    2022
  • 资助金额:
    $ 64.5万
  • 项目类别:
Data and Resource Coordination Center for Cancer Prevention-Interception Targeted Agent Discovery Program
癌症预防拦截靶向药物发现计划数据和资源协调中心
  • 批准号:
    10796105
  • 财政年份:
    2022
  • 资助金额:
    $ 64.5万
  • 项目类别:
Statistical Methods for Integrative Analysis of Large Scale Neuroimaging Data
大规模神经影像数据综合分析的统计方法
  • 批准号:
    10647855
  • 财政年份:
    2021
  • 资助金额:
    $ 64.5万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了