Implementing the Genomic Data Science Analysis, Visualization, and Informatics Lab-space (AnVIL)
实施基因组数据科学分析、可视化和信息学实验室空间 (AnVIL)
基本信息
- 批准号:10220581
- 负责人:
- 金额:$ 40万
- 依托单位:
- 依托单位国家:美国
- 项目类别:
- 财政年份:2018
- 资助国家:美国
- 起止时间:2018-09-21 至 2023-06-30
- 项目状态:已结题
- 来源:
- 关键词:AddressBioconductorBiomedical ResearchDataData AnalysesData ScienceData Storage and RetrievalEcosystemElectronic Health RecordElementsEnsureEnvironmentFast Healthcare Interoperability ResourcesGalaxyGenomicsGenotype-Tissue Expression ProjectHealthcareIndividualInformaticsInstitutesMonitorMovementNational Human Genome Research InstitutePatientsRecordsResearchResearch PersonnelServicesSystemSystems AnalysisTechnologyThe Cancer Genome AtlasTrans-Omics for Precision MedicineUnited States National Institutes of HealthVisualizationWorkbasecloud basedcloud platformcomputational platformcomputing resourcesdata accessdata formatdata ingestiondata managementdata portaldata resourcedata sharingdata warehousegenomic datahealth datainteroperabilitymolecular phenotypenext generationphenotypic datatoolworking group
项目摘要
Project Summary
The NHGRI Genomic Data Science Analysis, Visualization, and Informatics Lab-space (AnVIL) powers the
next generation of computational genomics research using cloud-scale data and compute resources. The
platform is built on a set of established components, including the Terra computing platform and Dockstore
for standards-based sharing of containerized tools and workflows. It also provides multiple entry points for
data access and analysis, including batch workflows with Terra, notebook environments including Jupyter and
RStudio, Bioconductor packages for building analysis on top of AnVIL APIs and services, and will soon offer
Galaxy instances for interactive analysis. By providing a unified environment for data management and
compute, AnVIL eliminates the need for data movement, allows for controlled access to sensitive data and
monitoring, and provides elastic, shared computing resources that can be acquired by researchers as needed.
NIH-sponsored biomedical research is increasingly moving to cloud-based data storage and analysis systems,
with major cloud portals established for GTEx, Kids First, TOPMed, TCGA and several other major initiatives.
However, using these systems together is a challenge. The individual data portals enable researchers to browse
and query their own data but have limited functionality to share data or user registrations across portals or
with cloud based workspaces, like Terra and Galaxy. The recently established NIH Cloud Platform
Interoperability (NCPI) effort aims to address these issues by implementing key interoperability technologies
across multiple NIH institutes. Under this project, we will work the NCPI working groups to define the use
cases and standards for interoperability as well as implement three major technologies recommended by the
NCPI within the Galaxy and R/Bioconductor components of AnVIL. First, we will implement the NIH
Researcher Auth Service (RAS) to provide a common mechanism for researchers to establish their identity and
access data they are authorized to use across Terra and Galaxy. Second, we will implement the Global Alliance
for Genomics and Health (GA4GH) Data Repository Service (DRS) so that data consumers, including
workflow systems, can access data objects in a single, standard way regardless of where they are stored and
how they are managed. Finally, we will develop initial support in AnVIL for the Fast Healthcare
Interoperability Resources (FHIR) standard. This standard describes data formats, elements, and an API for
exchanging electronic health records (EHR), especially to ensure these records are available, discoverable, and
understandable as patients move around the healthcare ecosystem. FHIR support in AnVIL will facilitate
access to eMERGE and related projects by users once the data are ingested in AnVIL.
项目摘要
NHGRI基因组数据科学分析,可视化和信息学实验室空间(Anvil)为
使用云规模数据和计算资源的下一代计算基因组学研究。这
平台建立在一组已建立的组件上,包括Terra Computing平台和Dockstore
用于基于标准的集装箱工具和工作流程。它还为
数据访问和分析,包括带有Terra的批处理工作流程,笔记本电脑环境,包括Jupyter和
rstudio,用于砧座API和服务顶部建筑物分析的生物通用套件,并将很快提供
银河系实例进行互动分析。通过为数据管理提供统一的环境,
计算,铁砧消除了对数据移动的需求,可以控制访问敏感数据和
监视并提供可根据需要的研究人员获得的弹性,共享的计算资源。
NIH赞助的生物医学研究越来越多地转向基于云的数据存储和分析系统,
为GTEX建立了主要的云门户网站,First,Topmed,TCGA和其他几项主要举措。
但是,一起使用这些系统是一个挑战。个别数据门户使研究人员能够浏览
并查询自己的数据,但功能有限,可以在门户上共享数据或用户注册或
具有基于云的工作区,例如Terra和Galaxy。最近建立的NIH云平台
互操作性(NCPI)的工作旨在通过实施关键的互操作技术来解决这些问题
跨多个NIH机构。在这个项目下,我们将在NCPI工作组中工作以定义使用
互操作性的案例和标准,并实施三种主要技术
砧座的NCPI和r/bioconductor成分。首先,我们将实施NIH
研究人员授课服务(RAS)为研究人员提供了一种共同的机制,以建立其身份和
访问数据被授权在Terra和Galaxy上使用。其次,我们将实施全球联盟
用于基因组学和健康(GA4GH)数据存储库服务(DRS),以便数据消费者(包括
工作流系统,无论存储在哪里,都可以以单一的标准方式访问数据对象
它们的管理方式。最后,我们将在Anvil中为快速医疗保健提供初步支持
互操作资源(FHIR)标准。该标准描述了数据格式,元素和API
交换电子健康记录(EHR),特别是为了确保这些记录可用,可发现和
可以理解的是,患者围绕医疗保健生态系统移动。砧座的FHIR支持将有助于
一旦数据摄入砧,用户就可以访问Emerge和相关项目。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Jeremy Goecks其他文献
Jeremy Goecks的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Jeremy Goecks', 18)}}的其他基金
Scalable multi-mode education to increase use of ITCR tools by diverse analysts
可扩展的多模式教育,以增加不同分析师对 ITCR 工具的使用
- 批准号:
10669864 - 财政年份:2020
- 资助金额:
$ 40万 - 项目类别:
Scalable multi-mode education to increase use of ITCR tools by diverse analysts
可扩展的多模式教育,以增加不同分析师对 ITCR 工具的使用
- 批准号:
10250548 - 财政年份:2020
- 资助金额:
$ 40万 - 项目类别:
Scalable multi-mode education to increase use of ITCR tools by diverse analysts
可扩展的多模式教育,以增加不同分析师对 ITCR 工具的使用
- 批准号:
10075552 - 财政年份:2020
- 资助金额:
$ 40万 - 项目类别:
A Federated Galaxy for user-friendly large-scale cancer genomics research
用于用户友好的大规模癌症基因组学研究的联邦星系
- 批准号:
10245142 - 财政年份:2018
- 资助金额:
$ 40万 - 项目类别:
A Federated Galaxy for user-friendly large-scale cancer genomics research
用于用户友好的大规模癌症基因组学研究的联邦星系
- 批准号:
10908030 - 财政年份:2018
- 资助金额:
$ 40万 - 项目类别:
A Federated Galaxy for user-friendly large-scale cancer genomics research
用于用户友好的大规模癌症基因组学研究的联邦星系
- 批准号:
10461143 - 财政年份:2018
- 资助金额:
$ 40万 - 项目类别:
Implementing the Genomic Data Science Analysis, Visualization, and Informatics Lab-space (AnVIL)
实施基因组数据科学分析、可视化和信息学实验室空间 (AnVIL)
- 批准号:
10405959 - 财政年份:2018
- 资助金额:
$ 40万 - 项目类别:
相似国自然基金
半导体矿物-光合色素协同强化地表水体微生物光电产甲烷机制
- 批准号:42307305
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
多通道半导体光电化学生物传感器的多重界面调和机制研究及其在抑郁症检测中的应用
- 批准号:62301446
- 批准年份:2023
- 资助金额:30.00 万元
- 项目类别:青年科学基金项目
半导体纳米片锚定贵金属(Au、Ag、Cu)单原子SERS生物探针的可控制备和增强机制研究
- 批准号:12374390
- 批准年份:2023
- 资助金额:53.00 万元
- 项目类别:面上项目
用于光驱动化学品合成的半导体材料-微生物杂合体的生产策略研究
- 批准号:32300065
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于原子层沉积半导体沟道的FET生物传感器构筑与性能调控
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
相似海外基金
Immuno-Oncology Translation Network: Data Management and Resource-Sharing Center at RPCI
免疫肿瘤学翻译网络:RPCI 的数据管理和资源共享中心
- 批准号:
10872397 - 财政年份:2023
- 资助金额:
$ 40万 - 项目类别:
Coordinating and Data Management Center for Acquired Resistance to Therapy Network
获得性治疗耐药网络协调和数据管理中心
- 批准号:
10516537 - 财政年份:2022
- 资助金额:
$ 40万 - 项目类别:
Coordinating and Data Management Center for Acquired Resistance to Therapy Network
获得性治疗耐药网络协调和数据管理中心
- 批准号:
10682495 - 财政年份:2022
- 资助金额:
$ 40万 - 项目类别:
Data and Resource Coordination Center for Cancer Prevention-Interception Targeted Agent Discovery Program
癌症预防拦截靶向药物发现计划数据和资源协调中心
- 批准号:
10796105 - 财政年份:2022
- 资助金额:
$ 40万 - 项目类别:
Statistical Methods for Integrative Analysis of Large Scale Neuroimaging Data
大规模神经影像数据综合分析的统计方法
- 批准号:
10647855 - 财政年份:2021
- 资助金额:
$ 40万 - 项目类别: