SciDAP: Scientific Data Analysis Platform
SciDAP:科学数据分析平台
基本信息
- 批准号:10622562
- 负责人:
- 金额:$ 77.96万
- 依托单位:
- 依托单位国家:美国
- 项目类别:
- 财政年份:2020
- 资助国家:美国
- 起止时间:2020-09-14 至 2025-05-31
- 项目状态:未结题
- 来源:
- 关键词:ATAC-seqAccelerationAdoptedBiologyChIP-seqChromatinChromatin StructureCodeCollaborationsCommunitiesComputer AnalysisComputer softwareCouplingDNA-Protein InteractionDataData AnalysesData SourcesDevelopmentDiseaseEnsureEnvironmentFriendsGene Expression ProfilingHealthHuman ResourcesIndividualInnovation CorpsInstitutionInstructionInterviewLanguageLearningLifeLinuxMapsMarketingMethodsMicroRNAsMutation DetectionOutputPhasePrivatizationProcessProliferatingPythonsReproducibilityResearchResearch PersonnelRespondentScientistSmall Business Technology Transfer ResearchSomatic MutationStreamSystemTechniquesUnited States National Institutes of HealthUniversitiesVisualizationWorkanalysis pipelinebioinformatics toolbiomedical scientistbisulfite sequencingchromatin proteincommercializationcomputational pipelinescomputerized data processingcostexomeexperimental studyflexibilitygenome browsergenomic datagraphical user interfacehuman diseaseimprovedinsightmultiple omicsnext generation sequencingnovelopen sourceportabilityprogramsprototyperesearch and developmentsingle-cell RNA sequencingsoftware developmenttooltranscriptome sequencingusabilityuser-friendlyweb interfacewhole genome
项目摘要
The recent proliferation of next-generation sequencing (NGS) - based methods for the analysis of expression,
chromatin and protein-DNA interactions has created tremendous opportunities for gaining insights into biology,
health, and disease. However, analysis of the data requires computational expertise that many biologists do not
possess. Hence, when dealing with genomics data, majority of biologists require the help of bioinformaticians
even for simple tasks. This places these exciting methods beyond the reach of the majority of life scientists.
This phase II proposal from DATIRIUM, LLC, a start-up from Cincinnati, OH follows phase I project that
resulted in the development of a prototype (MVP) of SciDAP (Scientific Data Analysis Platform), a novel multi-
omics user-friendly data analysis platform that allows biologists to analyze the data and enables collaboration
with bioinformaticians. The current phase II proposal describes a plan to continue SciDAP development.
The key problem for creating user-friendly data analysis packages is the difficulty in adding new or modifying
existing pipelines: due to the tight coupling between pipeline and user interface this required changes at all levels
of software. Unfortunately, the same limitation exists for all user-friendly bioinformatics tools. Given that there
are more than 150 NGS-based methods and many ways to process the data, this explains why a universal and
user-friendly data analysis platform does not yet exist.
We hypothesized that we can create a data analysis platform that is both universal and user-friendly by
including interface instructions into computational pipelines. Platform will use these instructions to create a
graphical interface. Specifically, we are using containerized pipelines developed using Common Workflow
Language (CWL) making our pipelines both portable and reproducible. On top of CWL, Datirium developed a
system of CWL extensions that allows to describe the inputs and outputs visualizations within the CWL
workflows. Importantly, our platform will increase the rigor of computational analysis by (i) making the analysis
reproducible and auditable by bioinformaticians due to CWL pipeline portability and recording each step of the
analysis as Research Objects; (ii) enabling collaboration between experimentalists and computational biologists
by providing bioinformaticians with a way to direct analysis flow and biologists with the convenience of GUI; (iii)
Including out of the box pipelines with optimized parameters and actionable QC metrics that flag possible issues.
In the first aim of this proposal we will develop a version of SciDAP for use on academic clusters and
commercial clouds. In the second aim, in collaboration with Dr. Salomonis at CCHMC, we will adopt pipelines
miRNA, WGS/WXS and scMultiome data analysis. In the third, we will develop improvements to SciDAP
interface that will increase SciDAP flexibility and usability for bioinformaticians and experimentalists.
Successful completion of this project will provide the research community with a cutting edge, flexible and
biologist-friendly data analysis platform.
最近基于下一代测序(NGS)的表达分析方法的激增,
染色质和蛋白质-DNA 相互作用为深入了解生物学创造了巨大的机会,
健康和疾病。然而,数据分析需要计算专业知识,而许多生物学家并不具备这些知识
具有。因此,在处理基因组数据时,大多数生物学家需要生物信息学家的帮助
即使是简单的任务。这使得这些令人兴奋的方法超出了大多数生命科学家的能力范围。
DATIRIUM, LLC(一家来自俄亥俄州辛辛那提的初创企业)提出的第二阶段提案遵循第一阶段项目:
导致了 SciDAP(科学数据分析平台)原型(MVP)的开发,这是一种新颖的多
omics 用户友好的数据分析平台,允许生物学家分析数据并实现协作
与生物信息学家。当前的第二阶段提案描述了继续 SciDAP 开发的计划。
创建用户友好的数据分析包的关键问题是添加新的或修改的困难
现有管道:由于管道和用户界面之间的紧密耦合,这需要在各个级别进行更改
软件的。不幸的是,所有用户友好的生物信息学工具都存在同样的限制。鉴于有
超过 150 种基于 NGS 的方法和多种数据处理方法,这解释了为什么通用和
用户友好的数据分析平台尚不存在。
我们假设我们可以创建一个通用且用户友好的数据分析平台
将接口指令包含到计算管道中。平台将使用这些指令来创建
图形界面。具体来说,我们正在使用使用 Common Workflow 开发的容器化管道
语言(CWL)使我们的管道既可移植又可复制。在 CWL 之上,Datirium 开发了
CWL 扩展系统,允许描述 CWL 内的输入和输出可视化
工作流程。重要的是,我们的平台将通过(i)进行分析来提高计算分析的严谨性
由于 CWL 管道的可移植性和记录的每个步骤,生物信息学家可以重现和审核
作为研究对象进行分析; (ii) 促进实验学家和计算生物学家之间的合作
为生物信息学家提供一种指导分析流程的方法,为生物学家提供方便的 GUI; (三)
包括具有优化参数和标记可能问题的可操作质量控制指标的开箱即用管道。
在本提案的第一个目标中,我们将开发一个 SciDAP 版本,用于学术集群和
商业云。在第二个目标中,我们将与 CCHMC 的 Salomonis 博士合作,采用管道
miRNA、WGS/WXS 和 scMultiome 数据分析。第三,我们将对 SciDAP 进行改进
界面将提高生物信息学家和实验学家的 SciDAP 灵活性和可用性。
该项目的成功完成将为研究界提供前沿、灵活和
生物学家友好的数据分析平台。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Artem Barski其他文献
Artem Barski的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Artem Barski', 18)}}的其他基金
Epigenetic mechanisms of disrupted neurodevelopment in Menke-Hennekam syndrome
Menke-Hennekam 综合征神经发育障碍的表观遗传机制
- 批准号:
10816703 - 财政年份:2023
- 资助金额:
$ 77.96万 - 项目类别:
An experimentally-refined, dynamic gene regulatory network model of T-cell memory
经过实验改进的 T 细胞记忆动态基因调控网络模型
- 批准号:
10576265 - 财政年份:2021
- 资助金额:
$ 77.96万 - 项目类别:
An experimentally-refined, dynamic gene regulatory network model of T-cell memory
经过实验改进的 T 细胞记忆动态基因调控网络模型
- 批准号:
10210685 - 财政年份:2021
- 资助金额:
$ 77.96万 - 项目类别:
An experimentally-refined, dynamic gene regulatory network model of T-cell memory
经过实验改进的 T 细胞记忆动态基因调控网络模型
- 批准号:
10368121 - 财政年份:2021
- 资助金额:
$ 77.96万 - 项目类别:
Commercialization of SciDAP, a next generation universal platform for collaborative data analysis
SciDAP 的商业化,下一代协作数据分析通用平台
- 批准号:
10338010 - 财政年份:2021
- 资助金额:
$ 77.96万 - 项目类别:
An experimentally-refined, dynamic gene regulatory network model of T-cell memory
经过实验改进的 T 细胞记忆动态基因调控网络模型
- 批准号:
10213550 - 财政年份:2020
- 资助金额:
$ 77.96万 - 项目类别:
SciDAP: a next generation universal platform for collaborative data analysis
SciDAP:下一代协作数据分析通用平台
- 批准号:
10081764 - 财政年份:2020
- 资助金额:
$ 77.96万 - 项目类别:
Death-Seq, a Method for Genome-wide Identification of Functional Silencer Elements
Death-Seq,一种全基因组识别功能性沉默元件的方法
- 批准号:
9979291 - 财政年份:2020
- 资助金额:
$ 77.96万 - 项目类别:
相似国自然基金
衰老成纤维细胞通过逃逸巨噬细胞免疫监视加速皮肤衰老的机制研究
- 批准号:82373462
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
高血糖通过激活核糖激酶促进血红蛋白核糖基化加速糖尿病微血管病变的机制研究
- 批准号:82360165
- 批准年份:2023
- 资助金额:32 万元
- 项目类别:地区科学基金项目
M2 TAMs分泌的OGT通过促进糖酵解过程加速肝细胞癌恶性生物学行为的机制研究
- 批准号:82360529
- 批准年份:2023
- 资助金额:32 万元
- 项目类别:地区科学基金项目
尿毒症毒素通过激活环境感应器受体AhR抑制线粒体生物发生加速肾脏衰老和功能减退的机制研究
- 批准号:82370695
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
微囊藻毒素通过Hippo/YAP途径干扰谷氨酰胺代谢加速干细胞衰老致青春期骨发育迟缓的机制研究
- 批准号:32301416
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
相似海外基金
Creation of a knowledgebase of high quality assertions of the clinical actionability of somatic variants in cancer
创建癌症体细胞变异临床可行性的高质量断言知识库
- 批准号:
10555024 - 财政年份:2023
- 资助金额:
$ 77.96万 - 项目类别:
High-Performance Gradient Coil for 7 Tesla MRI
用于 7 特斯拉 MRI 的高性能梯度线圈
- 批准号:
10630533 - 财政年份:2023
- 资助金额:
$ 77.96万 - 项目类别:
Unified, Scalable, and Reproducible Neurostatistical Software
统一、可扩展且可重复的神经统计软件
- 批准号:
10725500 - 财政年份:2023
- 资助金额:
$ 77.96万 - 项目类别:
A platform to identify in vivo targets of covalent cancer drugs in 3D tissues
识别 3D 组织中共价癌症药物体内靶标的平台
- 批准号:
10714543 - 财政年份:2023
- 资助金额:
$ 77.96万 - 项目类别: