The CFDE Workbench
CFDE 工作台
基本信息
- 批准号:10851224
- 负责人:
- 金额:$ 150万
- 依托单位:
- 依托单位国家:美国
- 项目类别:
- 财政年份:2023
- 资助国家:美国
- 起止时间:2023-09-18 至 2028-09-17
- 项目状态:未结题
- 来源:
- 关键词:AddressAdoptedArchitectureArchivesBenchmarkingBiological AssayBiomedical ResearchCatalogingCatalogsComplexComputer softwareDataData Coordinating CenterData SetDatabasesDedicationsEcosystemEducationEducation and OutreachElectronic MailElementsEventFeedbackFeedsFundingFunding OpportunitiesGenesGenus MenthaGoalsGraphGroup MeetingsHomeIngestionKnowledgeKnowledge PortalLearningLibrariesLinkLinkedInMachine LearningMetadataMethodsPharmaceutical PreparationsPhasePlayProcessProductivityProtocols documentationPublicationsPublishingResearch PersonnelResourcesSiteSocial NetworkSystemTimeTwitterUnited StatesUnited States National Institutes of HealthVisualizationWorkbioinformatics toolcell typechatbotcostdata analysis pipelinedata ecosystemdata ingestiondata integrationdata modelingdata portaldata resourcedata toolsdesigndigitalexperienceindexingknowledge graphmeetingsnewspreservationprogramsrepositorysearch enginesocial mediatooltranscriptome sequencingvirtualweb appweb portalworking group
项目摘要
Abstract
The NIH Common Fund (CF) programs have produced transformative datasets, databases,
methods, bioinformatics tools and workflows that are significantly advancing biomedical research
in the United States and worldwide. Currently, CF programs are mostly isolated. However,
integrating data from across CF programs has the potential for synergistic discoveries. In addition,
since CF programs have a time limit of 10 years, sustainability of the widely used CF digital
resources after the programs expire is critical. To address these challenges, the NIH established
the Common Fund Data Ecosystem (CFDE) program which has been recently approved to
continue to its second new phase. For the second phase of the CFDE, this project will establish
the Data Resource Center (DRC) and the Knowledge Center (KC). Our efforts will culminate in
producing The CFDE Workbench which will be composed of three main products: the CFDE
information portal, the CFDE data resource portal, and the CFDE knowledge portal. These three
web portals will be full-stack web-based applications with a backend database and will be
integrated into one public site.
The CFDE information portal will be the entry point to the other two portals. It will contain
information about the CFDE in a dedicated About page, information about each participating and
non-participating CF program, information about each data coordination center (DCC), a link to a
catalog of CF datasets, and a link to a catalog of CF tools and workflows, news, events, funding
opportunities, standards and protocols, educational programs and opportunities, social media
feeds, and publications.
The CFDE data resource portal will contain metadata, data, workflows, and tools which are the
products of the CF programs, and their data coordination centers (DDCs). We will adopt the C2M2
data model for storing information about metadata describing DCC datasets. We will also archive
relatively small omics datasets that do not have a home in widely established repositories and do
not require PHI protection. In addition, we will expand the cataloging to CF tools, APIs, and
workflows. Importantly, we will develop a search engine that will index and present results from
all these assembled digital assets. In addition, continuing the work established in the CFDE pilot
phase, users of the data portal will be able to fetch identified datasets through links provided by
the DCCs via the DRS protocol. This will include links to raw and processed data.
The CFDE knowledge portal will provide access to CF programs processed data in various
formats including: 1) knowledge graph assertions; 2) gene, drug, metabolite, and other set
libraries; 3) data matrices ready for machine learning and other AI applications; 4) signatures; and
5) bipartite graphs. In addition, the extract, transform, and load (ETL) scripts to process the data
into these formats will be provided. Since such processed data is relatively small, we will archive
and serve this processed data, mint it with unique IDs, and serve it via APIs. In addition, we will
develop workflows that will demonstrate how the processed data can be harmonized. At the same
time, we will document APIs from all CF DCCs and provide example Jupyter Notebooks that
demonstrate how these datasets can be accessed, processed, and combined for integrative
omics analysis. For the knowledge portal we will also develop a library of tools that utilize these
processed datasets. These tools will have some uniform requirements enabling a plug-and-play
architecture.
To achieve these goals, we will work collaboratively with the other CFDE newly established
centers, the participating CFDE DCCs, the CFDE NIH team, and relevant external entities and
potential consumers of these three software products. These interactions will be achieved via
face-to-face meetings, virtual working groups meeting, one-on-one meetings, Slack, GitHub,
project management software, and e-mail exchange. Via these interactions, we will establish
standards, workstreams, feedback and mini projects towards accomplishing the goal of
developing a lively and productive Common Fund Data Ecosystem.
抽象的
NIH 共同基金 (CF) 项目已经产生了变革性的数据集、数据库、
显着推进生物医学研究的方法、生物信息学工具和工作流程
在美国和世界各地。目前,CF程序大多是孤立的。然而,
整合来自多个 CF 项目的数据具有协同发现的潜力。此外,
由于CF程序有10年的期限,广泛使用的CF数字的可持续性
计划到期后的资源至关重要。为了应对这些挑战,美国国立卫生研究院 (NIH) 建立了
共同基金数据生态系统(CFDE)计划最近被批准用于
继续进入第二个新阶段。对于CFDE的第二阶段,该项目将建立
数据资源中心(DRC)和知识中心(KC)。我们的努力将达到顶峰
制作 CFDE 工作台,该工作台将由三个主要产品组成: CFDE
信息门户、CFDE数据资源门户、CFDE知识门户。这三个
网络门户将是带有后端数据库的基于网络的全栈应用程序,并且将
集成到一个公共站点。
CFDE 信息门户将成为其他两个门户的入口点。它将包含
关于 CFDE 的信息位于专门的“关于”页面,每个参与方的信息以及
非参与 CF 计划、有关每个数据协调中心 (DCC) 的信息、指向
CF 数据集目录,以及 CF 工具和工作流程、新闻、事件、资金目录的链接
机会、标准和协议、教育计划和机会、社交媒体
提要和出版物。
CFDE 数据资源门户将包含元数据、数据、工作流程和工具,这些是
CF 计划的产品及其数据协调中心 (DDC)。我们将采用C2M2
用于存储有关描述 DCC 数据集的元数据的信息的数据模型。我们也会存档
相对较小的组学数据集,在广泛建立的存储库中没有家,并且
不需要 PHI 保护。此外,我们还将目录扩展到 CF 工具、API 和
工作流程。重要的是,我们将开发一个搜索引擎,它将索引并呈现结果
所有这些组合的数字资产。此外,继续开展 CFDE 试点工作
阶段,数据门户的用户将能够通过以下提供的链接获取已识别的数据集:
通过 DRS 协议的 DCC。这将包括原始数据和处理后数据的链接。
CFDE 知识门户将提供对各种 CF 程序处理数据的访问
格式包括:1)知识图断言; 2) 基因、药物、代谢物等集合
图书馆; 3)为机器学习和其他人工智能应用做好准备的数据矩阵; 4)签名;和
5)二分图。此外,用于处理数据的提取、转换和加载 (ETL) 脚本
将提供这些格式。由于此类处理后的数据比较小,我们将存档
并提供处理后的数据,为其创建唯一的 ID,并通过 API 提供服务。此外,我们将
开发工作流程来演示如何协调处理后的数据。同时
到时候,我们将记录所有 CF DCC 的 API,并提供示例 Jupyter Notebooks
演示如何访问、处理和组合这些数据集以进行集成
组学分析。对于知识门户,我们还将开发一个利用这些知识的工具库
处理后的数据集。这些工具将有一些统一的要求,以实现即插即用
建筑学。
为了实现这些目标,我们将与其他新成立的 CFDE 合作
中心、参与的 CFDE DCC、CFDE NIH 团队以及相关外部实体和
这三种软件产品的潜在消费者。这些交互将通过以下方式实现
面对面会议、虚拟工作组会议、一对一会议、Slack、GitHub、
项目管理软件和电子邮件交换。通过这些互动,我们将建立
标准、工作流程、反馈和小型项目,以实现以下目标
开发一个活跃且富有成效的共同基金数据生态系统。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Avi Ma'ayan其他文献
Avi Ma'ayan的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Avi Ma'ayan', 18)}}的其他基金
Proteogenomic translator for cancer biomarker discovery towards precision medicine
用于癌症生物标志物发现和精准医学的蛋白质基因组翻译
- 批准号:
10442088 - 财政年份:2022
- 资助金额:
$ 150万 - 项目类别:
ARCHS4: Massive Mining of Publicly Available RNA Sequencing Data
ARCHS4:大规模挖掘公开的 RNA 测序数据
- 批准号:
10814654 - 财政年份:2022
- 资助金额:
$ 150万 - 项目类别:
ARCHS4: Massive Mining of Publicly Available RNA Sequencing Data
ARCHS4:大规模挖掘公开的 RNA 测序数据
- 批准号:
10527721 - 财政年份:2022
- 资助金额:
$ 150万 - 项目类别:
ARCHS4: Massive Mining of Publicly Available RNA Sequencing Data
ARCHS4:大规模挖掘公开的 RNA 测序数据
- 批准号:
10693339 - 财政年份:2022
- 资助金额:
$ 150万 - 项目类别:
Proteogenomic translator for cancer biomarker discovery towards precision medicine
用于癌症生物标志物发现和精准医学的蛋白质基因组翻译
- 批准号:
10655588 - 财政年份:2022
- 资助金额:
$ 150万 - 项目类别:
Proteogenomic translator for cancer biomarker discovery towards precision medicine
用于癌症生物标志物发现和精准医学的蛋白质基因组翻译
- 批准号:
10442088 - 财政年份:2022
- 资助金额:
$ 150万 - 项目类别:
The LINCS DCIC Engagement Plan with the CFDE
LINCS DCIC 与 CFDE 的合作计划
- 批准号:
10444350 - 财政年份:2020
- 资助金额:
$ 150万 - 项目类别:
The LINCS DCIC Engagement Plan with the CFDE
LINCS DCIC 与 CFDE 的合作计划
- 批准号:
10682935 - 财政年份:2020
- 资助金额:
$ 150万 - 项目类别:
The LINCS DCIC Engagement Plan with the CFDE
LINCS DCIC 与 CFDE 的合作计划
- 批准号:
10468520 - 财政年份:2020
- 资助金额:
$ 150万 - 项目类别:
The LINCS DCIC Engagement Plan with the CFDE
LINCS DCIC 与 CFDE 的合作计划
- 批准号:
10837964 - 财政年份:2020
- 资助金额:
$ 150万 - 项目类别:
相似国自然基金
适当冷暴露通过肠道菌群调控心脏免疫微环境改善心梗后心室重构和心力衰竭的作用与机制
- 批准号:82330014
- 批准年份:2023
- 资助金额:220 万元
- 项目类别:重点项目
SIRT1通过TXNIP/NLRP3通路促进巨噬细胞自噬在烟曲霉感染中的作用及机制研究
- 批准号:82360624
- 批准年份:2023
- 资助金额:32 万元
- 项目类别:地区科学基金项目
心外膜细胞中BRD4通过促进MEOX-1表达激活TGF-β信号通路参与糖尿病心肌病纤维化形成的分子机制研究
- 批准号:82300398
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
红毛藻多糖通过增加肠道鼠乳杆菌丰度双向调节免疫功能机制研究
- 批准号:32302098
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
腺相关病毒载体介导的circ_12952基因治疗通过激活结直肠癌抗肿瘤免疫增强PD-1抗体疗效的机制研究及临床探索
- 批准号:82303073
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
相似海外基金
Volumetric analysis of epithelial morphogenesis with high spatiotemporal resolution
高时空分辨率上皮形态发生的体积分析
- 批准号:
10586534 - 财政年份:2023
- 资助金额:
$ 150万 - 项目类别:
Developing a robust native extracellular matrix to improve islet function with attenuated immunogenicity for transplantation
开发强大的天然细胞外基质,以改善胰岛功能,并减弱移植的免疫原性
- 批准号:
10596047 - 财政年份:2023
- 资助金额:
$ 150万 - 项目类别:
Binding Kinetics in Transcription Activation and Repression
转录激活和抑制中的结合动力学
- 批准号:
10638937 - 财政年份:2023
- 资助金额:
$ 150万 - 项目类别:
Pharmacogenomics Workflow: Identifying Biomarkers and Treatment Options
药物基因组学工作流程:识别生物标志物和治疗方案
- 批准号:
10819933 - 财政年份:2023
- 资助金额:
$ 150万 - 项目类别:
Elucidating the distinct roles of T cell-polarized microglia in glioblastoma suppression and progression
阐明 T 细胞极化小胶质细胞在胶质母细胞瘤抑制和进展中的独特作用
- 批准号:
10752583 - 财政年份:2023
- 资助金额:
$ 150万 - 项目类别: