The CFDE Workbench

CFDE 工作台

基本信息

  • 批准号:
    10851224
  • 负责人:
  • 金额:
    $ 150万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2023
  • 资助国家:
    美国
  • 起止时间:
    2023-09-18 至 2028-09-17
  • 项目状态:
    未结题

项目摘要

Abstract The NIH Common Fund (CF) programs have produced transformative datasets, databases, methods, bioinformatics tools and workflows that are significantly advancing biomedical research in the United States and worldwide. Currently, CF programs are mostly isolated. However, integrating data from across CF programs has the potential for synergistic discoveries. In addition, since CF programs have a time limit of 10 years, sustainability of the widely used CF digital resources after the programs expire is critical. To address these challenges, the NIH established the Common Fund Data Ecosystem (CFDE) program which has been recently approved to continue to its second new phase. For the second phase of the CFDE, this project will establish the Data Resource Center (DRC) and the Knowledge Center (KC). Our efforts will culminate in producing The CFDE Workbench which will be composed of three main products: the CFDE information portal, the CFDE data resource portal, and the CFDE knowledge portal. These three web portals will be full-stack web-based applications with a backend database and will be integrated into one public site. The CFDE information portal will be the entry point to the other two portals. It will contain information about the CFDE in a dedicated About page, information about each participating and non-participating CF program, information about each data coordination center (DCC), a link to a catalog of CF datasets, and a link to a catalog of CF tools and workflows, news, events, funding opportunities, standards and protocols, educational programs and opportunities, social media feeds, and publications. The CFDE data resource portal will contain metadata, data, workflows, and tools which are the products of the CF programs, and their data coordination centers (DDCs). We will adopt the C2M2 data model for storing information about metadata describing DCC datasets. We will also archive relatively small omics datasets that do not have a home in widely established repositories and do not require PHI protection. In addition, we will expand the cataloging to CF tools, APIs, and workflows. Importantly, we will develop a search engine that will index and present results from all these assembled digital assets. In addition, continuing the work established in the CFDE pilot phase, users of the data portal will be able to fetch identified datasets through links provided by the DCCs via the DRS protocol. This will include links to raw and processed data. The CFDE knowledge portal will provide access to CF programs processed data in various formats including: 1) knowledge graph assertions; 2) gene, drug, metabolite, and other set libraries; 3) data matrices ready for machine learning and other AI applications; 4) signatures; and 5) bipartite graphs. In addition, the extract, transform, and load (ETL) scripts to process the data into these formats will be provided. Since such processed data is relatively small, we will archive and serve this processed data, mint it with unique IDs, and serve it via APIs. In addition, we will develop workflows that will demonstrate how the processed data can be harmonized. At the same time, we will document APIs from all CF DCCs and provide example Jupyter Notebooks that demonstrate how these datasets can be accessed, processed, and combined for integrative omics analysis. For the knowledge portal we will also develop a library of tools that utilize these processed datasets. These tools will have some uniform requirements enabling a plug-and-play architecture. To achieve these goals, we will work collaboratively with the other CFDE newly established centers, the participating CFDE DCCs, the CFDE NIH team, and relevant external entities and potential consumers of these three software products. These interactions will be achieved via face-to-face meetings, virtual working groups meeting, one-on-one meetings, Slack, GitHub, project management software, and e-mail exchange. Via these interactions, we will establish standards, workstreams, feedback and mini projects towards accomplishing the goal of developing a lively and productive Common Fund Data Ecosystem.
抽象的 NIH 共同基金 (CF) 项目已经产生了变革性的数据集、数据库、 显着推进生物医学研究的方法、生物信息学工具和工作流程 在美国和世界各地。目前,CF程序大多是孤立的。然而, 整合来自多个 CF 项目的数据具有协同发现的潜力。此外, 由于CF程序有10年的期限,广泛使用的CF数字的可持续性 计划到期后的资源至关重要。为了应对这些挑战,美国国立卫生研究院 (NIH) 建立了 共同基金数据生态系统(CFDE)计划最近被批准用于 继续进入第二个新阶段。对于CFDE的第二阶段,该项目将建立 数据资源中心(DRC)和知识中心(KC)。我们的努力将达到顶峰 制作 CFDE 工作台,该工作台将由三个主要产品组成: CFDE 信息门户、CFDE数据资源门户、CFDE知识门户。这三个 网络门户将是带有后端数据库的基于网络的全栈应用程序,并且将 集成到一个公共站点。 CFDE 信息门户将成为其他两个门户的入口点。它将包含 关于 CFDE 的信息位于专门的“关于”页面,每个参与方的信息以及 非参与 CF 计划、有关每个数据协调中心 (DCC) 的信息、指向 CF 数据集目录,以及 CF 工具和工作流程、新闻、事件、资金目录的链接 机会、标准和协议、教育计划和机会、社交媒体 提要和出版物。 CFDE 数据资源门户将包含元数据、数据、工作流程和工具,这些是 CF 计划的产品及其数据协调中心 (DDC)。我们将采用C2M2 用于存储有关描述 DCC 数据集的元数据的信息的数据模型。我们也会存档 相对较小的组学数据集,在广泛建立的存储库中没有家,并且 不需要 PHI 保护。此外,我们还将目录扩展到 CF 工具、API 和 工作流程。重要的是,我们将开发一个搜索引擎,它将索引并呈现结果 所有这些组合的数字资产。此外,继续开展 CFDE 试点工作 阶段,数据门户的用户将能够通过以下提供的链接获取已识别的数据集: 通过 DRS 协议的 DCC。这将包括原始数据和处理后数据的链接。 CFDE 知识门户将提供对各种 CF 程序处理数据的访问 格式包括:1)知识图断言; 2) 基因、药物、代谢物等集合 图书馆; 3)为机器学习和其他人工智能应用做好准备的数据矩阵; 4)签名;和 5)二分图。此外,用于处理数据的提取、转换和加载 (ETL) 脚本 将提供这些格式。由于此类处理后的数据比较小,我们将存档 并提供处理后的数据,为其创建唯一的 ID,并通过 API 提供服务。此外,我们将 开发工作流程来演示如何协调处理后的数据。同时 到时候,我们将记录所有 CF DCC 的 API,并提供示例 Jupyter Notebooks 演示如何访问、处理和组合这些数据集以进行集成 组学分析。对于知识门户,我们还将开发一个利用这些知识的工具库 处理后的数据集。这些工具将有一些统一的要求,以实现即插即用 建筑学。 为了实现这些目标,我们将与其他新成立的 CFDE 合作 中心、参与的 CFDE DCC、CFDE NIH 团队以及相关外部实体和 这三种软件产品的潜在消费者。这些交互将通过以下方式实现 面对面会议、虚拟工作组会议、一对一会议、Slack、GitHub、 项目管理软件和电子邮件交换。通过这些互动,我们将建立 标准、工作流程、反馈和小型项目,以实现以下目标 开发一个活跃且富有成效的共同基金数据生态系统。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Avi Ma'ayan其他文献

Avi Ma'ayan的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Avi Ma'ayan', 18)}}的其他基金

Proteogenomic translator for cancer biomarker discovery towards precision medicine
用于癌症生物标志物发现和精准医学的蛋白质基因组翻译
  • 批准号:
    10442088
  • 财政年份:
    2022
  • 资助金额:
    $ 150万
  • 项目类别:
ARCHS4: Massive Mining of Publicly Available RNA Sequencing Data
ARCHS4:大规模挖掘公开的 RNA 测序数据
  • 批准号:
    10814654
  • 财政年份:
    2022
  • 资助金额:
    $ 150万
  • 项目类别:
ARCHS4: Massive Mining of Publicly Available RNA Sequencing Data
ARCHS4:大规模挖掘公开的 RNA 测序数据
  • 批准号:
    10527721
  • 财政年份:
    2022
  • 资助金额:
    $ 150万
  • 项目类别:
ARCHS4: Massive Mining of Publicly Available RNA Sequencing Data
ARCHS4:大规模挖掘公开的 RNA 测序数据
  • 批准号:
    10693339
  • 财政年份:
    2022
  • 资助金额:
    $ 150万
  • 项目类别:
Proteogenomic translator for cancer biomarker discovery towards precision medicine
用于癌症生物标志物发现和精准医学的蛋白质基因组翻译
  • 批准号:
    10655588
  • 财政年份:
    2022
  • 资助金额:
    $ 150万
  • 项目类别:
Proteogenomic translator for cancer biomarker discovery towards precision medicine
用于癌症生物标志物发现和精准医学的蛋白质基因组翻译
  • 批准号:
    10442088
  • 财政年份:
    2022
  • 资助金额:
    $ 150万
  • 项目类别:
The LINCS DCIC Engagement Plan with the CFDE
LINCS DCIC 与 CFDE 的合作计划
  • 批准号:
    10444350
  • 财政年份:
    2020
  • 资助金额:
    $ 150万
  • 项目类别:
The LINCS DCIC Engagement Plan with the CFDE
LINCS DCIC 与 CFDE 的合作计划
  • 批准号:
    10682935
  • 财政年份:
    2020
  • 资助金额:
    $ 150万
  • 项目类别:
The LINCS DCIC Engagement Plan with the CFDE
LINCS DCIC 与 CFDE 的合作计划
  • 批准号:
    10468520
  • 财政年份:
    2020
  • 资助金额:
    $ 150万
  • 项目类别:
The LINCS DCIC Engagement Plan with the CFDE
LINCS DCIC 与 CFDE 的合作计划
  • 批准号:
    10837964
  • 财政年份:
    2020
  • 资助金额:
    $ 150万
  • 项目类别:

相似国自然基金

适当冷暴露通过肠道菌群调控心脏免疫微环境改善心梗后心室重构和心力衰竭的作用与机制
  • 批准号:
    82330014
  • 批准年份:
    2023
  • 资助金额:
    220 万元
  • 项目类别:
    重点项目
SIRT1通过TXNIP/NLRP3通路促进巨噬细胞自噬在烟曲霉感染中的作用及机制研究
  • 批准号:
    82360624
  • 批准年份:
    2023
  • 资助金额:
    32 万元
  • 项目类别:
    地区科学基金项目
心外膜细胞中BRD4通过促进MEOX-1表达激活TGF-β信号通路参与糖尿病心肌病纤维化形成的分子机制研究
  • 批准号:
    82300398
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
红毛藻多糖通过增加肠道鼠乳杆菌丰度双向调节免疫功能机制研究
  • 批准号:
    32302098
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
腺相关病毒载体介导的circ_12952基因治疗通过激活结直肠癌抗肿瘤免疫增强PD-1抗体疗效的机制研究及临床探索
  • 批准号:
    82303073
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Volumetric analysis of epithelial morphogenesis with high spatiotemporal resolution
高时空分辨率上皮形态发生的体积分析
  • 批准号:
    10586534
  • 财政年份:
    2023
  • 资助金额:
    $ 150万
  • 项目类别:
Developing a robust native extracellular matrix to improve islet function with attenuated immunogenicity for transplantation
开发强大的天然细胞外基质,以改善胰岛功能,并减弱移植的免疫原性
  • 批准号:
    10596047
  • 财政年份:
    2023
  • 资助金额:
    $ 150万
  • 项目类别:
Binding Kinetics in Transcription Activation and Repression
转录激活和抑制中的结合动力学
  • 批准号:
    10638937
  • 财政年份:
    2023
  • 资助金额:
    $ 150万
  • 项目类别:
Pharmacogenomics Workflow: Identifying Biomarkers and Treatment Options
药物基因组学工作流程:识别生物标志物和治疗方案
  • 批准号:
    10819933
  • 财政年份:
    2023
  • 资助金额:
    $ 150万
  • 项目类别:
Elucidating the distinct roles of T cell-polarized microglia in glioblastoma suppression and progression
阐明 T 细胞极化小胶质细胞在胶质母细胞瘤抑制和进展中的独特作用
  • 批准号:
    10752583
  • 财政年份:
    2023
  • 资助金额:
    $ 150万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了