ARCHS4: Massive Mining of Publicly Available RNA Sequencing Data
ARCHS4:大规模挖掘公开的 RNA 测序数据
基本信息
- 批准号:10693339
- 负责人:
- 金额:$ 77.51万
- 依托单位:
- 依托单位国家:美国
- 项目类别:
- 财政年份:2022
- 资助国家:美国
- 起止时间:2022-09-01 至 2027-08-31
- 项目状态:未结题
- 来源:
- 关键词:AddressAlgorithmsAtlasesBenchmarkingBiological ProcessCancer cell lineCase StudyCell LineCellsChIP-seqClassificationCommunicationCommunitiesCompanionsComplexComputer softwareDataData AnalysesDevelopmentDiseaseEducational workshopFAIR principlesFarGoFrequenciesGene ExpressionGene Expression ProcessGene Expression ProfileGenerationsGenesGoalsHumanInfrastructureLaboratoriesMalignant NeoplasmsManualsMetadataMethodsMiningMolecularMolecular EvolutionMutationNamesNatural Language ProcessingNormal tissue morphologyOnline SystemsOrganismPathogen detectionPathogenicityPerformancePharmaceutical PreparationsPhenotypeProcessPublishingPythonsQuantitative Trait LociReadabilityResearch PersonnelResourcesSamplingServicesSingle Nucleotide PolymorphismSourceSupervisionTechnologyTissuesTrainingTranscriptTumor SubtypeTumor TissueUntranslated RNAUpdateVariantWorkanticancer researchapplication programming interfacecell typecloud basedcomputational pipelinescomputerized data processingcostcost effectivecrowdsourcingdata formatdata integrationdata miningdata portaldata repositorydata reusedata visualizationdeep learningexperimental studyfile formatgene functiongenome analysisgraphical user interfacehuman RNA sequencingimprovedinsertion/deletion mutationinteroperabilityneoplastic cellnovelopen dataoutreachrepositorysingle-cell RNA sequencingsmall moleculetranscriptome sequencingtranscriptomicstumorvirtual
项目摘要
SUMMARY
Many cancer-related independent studies that employ bulk and single cell RNA-seq remain under reused due to
their lower findability, accessibility, interoperability, and reusability. The data from these studies can be found in
the Gene Expression Omnibus (GEO) but it is provided mostly as raw FASTQ files with non-uniform metadata
annotations. While some studies provide aligned reads files, these are processed non-uniformly. This
shortcoming makes it difficult to query and integrate this data across studies and with additional external data.
To bridge the gap that currently exists between RNA-seq data generation and RNA-seq data processing and
reuse, we developed the resource All RNA-seq and ChIP-Seq Sample and Signature Search (ARCHS4).
ARCHS4 provides processed RNA-seq data from GEO to support retrospective data analyses and reuse.
ARCHS4 caters to users with different levels of computational expertise and has been already employed for
many post-hoc analyses and projects. The goals go far beyond just providing cancer researchers with direct
access to RNA-seq data through a web-based user interface. We plan to transform other transcriptomics data
into RNA-seq-like profiles with Deep Learning, identify pathogenic sequences in human RNA-seq samples,
identify short variants from RNA-seq reads, predict gene function from co-expression data including ways to
modulate the expression of long non-coding RNAs with small molecules, and most importantly, using the
ARCHS4 cost-effective infrastructure, continue to provide a free FASTQ alignment service to the community.
概括
许多采用大量和单细胞RNA-seq的与癌症相关的独立研究由于
它们较低的可发现性,可访问性,互操作性和可重复性。这些研究的数据可以在
基因表达综合(GEO),但主要作为具有不均匀元数据的RAW FASTQ文件提供
注释。虽然一些研究提供了对齐的读取文件,但它们是不均匀处理的。这
缺点使得难以查询和集成在研究中以及其他外部数据的数据。
弥合RNA-seq数据生成和RNA-seq数据处理和
重用,我们开发了所有RNA-Seq和Chip-Seq样本和签名搜索(Archs4)的资源。
ArchS4提供了从GEO中处理的RNA-SEQ数据,以支持回顾性数据分析和重复使用。
ArchS4迎合具有不同计算专业知识的用户,并且已经被用过
许多事后分析和项目。目标远远超出了为癌症研究人员提供直接的
通过基于Web的用户界面访问RNA-Seq数据。我们计划改变其他转录组学数据
进入具有深度学习的RNA-Seq样轮廓,鉴定人RNA-Seq样品中的致病序列,
从RNA-seq读取中确定短变体,从共表达数据中预测基因函数,包括通往的方法
使用小分子调节长的非编码RNA的表达,最重要的是,使用
ArchS4具有成本效益的基础设施,继续为社区提供免费的FASTQ对齐服务。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Avi Ma'ayan其他文献
Avi Ma'ayan的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Avi Ma'ayan', 18)}}的其他基金
Proteogenomic translator for cancer biomarker discovery towards precision medicine
用于癌症生物标志物发现和精准医学的蛋白质基因组翻译
- 批准号:
10442088 - 财政年份:2022
- 资助金额:
$ 77.51万 - 项目类别:
ARCHS4: Massive Mining of Publicly Available RNA Sequencing Data
ARCHS4:大规模挖掘公开的 RNA 测序数据
- 批准号:
10527721 - 财政年份:2022
- 资助金额:
$ 77.51万 - 项目类别:
ARCHS4: Massive Mining of Publicly Available RNA Sequencing Data
ARCHS4:大规模挖掘公开的 RNA 测序数据
- 批准号:
10814654 - 财政年份:2022
- 资助金额:
$ 77.51万 - 项目类别:
Proteogenomic translator for cancer biomarker discovery towards precision medicine
用于癌症生物标志物发现和精准医学的蛋白质基因组翻译
- 批准号:
10655588 - 财政年份:2022
- 资助金额:
$ 77.51万 - 项目类别:
The LINCS DCIC Engagement Plan with the CFDE
LINCS DCIC 与 CFDE 的合作计划
- 批准号:
10837964 - 财政年份:2020
- 资助金额:
$ 77.51万 - 项目类别:
The LINCS DCIC Engagement Plan with the CFDE
LINCS DCIC 与 CFDE 的合作计划
- 批准号:
10468520 - 财政年份:2020
- 资助金额:
$ 77.51万 - 项目类别:
The LINCS DCIC Engagement Plan with the CFDE
LINCS DCIC 与 CFDE 的合作计划
- 批准号:
10444350 - 财政年份:2020
- 资助金额:
$ 77.51万 - 项目类别:
The LINCS DCIC Engagement Plan with the CFDE
LINCS DCIC 与 CFDE 的合作计划
- 批准号:
10682935 - 财政年份:2020
- 资助金额:
$ 77.51万 - 项目类别:
Knowledge Management Center for Illuminating the Druggable Genome
阐明可药物基因组的知识管理中心
- 批准号:
10560469 - 财政年份:2018
- 资助金额:
$ 77.51万 - 项目类别:
相似国自然基金
分布式非凸非光滑优化问题的凸松弛及高低阶加速算法研究
- 批准号:12371308
- 批准年份:2023
- 资助金额:43.5 万元
- 项目类别:面上项目
资源受限下集成学习算法设计与硬件实现研究
- 批准号:62372198
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
基于物理信息神经网络的电磁场快速算法研究
- 批准号:52377005
- 批准年份:2023
- 资助金额:52 万元
- 项目类别:面上项目
考虑桩-土-水耦合效应的饱和砂土变形与流动问题的SPH模型与高效算法研究
- 批准号:12302257
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
面向高维不平衡数据的分类集成算法研究
- 批准号:62306119
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
相似海外基金
Fluency from Flesh to Filament: Collation, Representation, and Analysis of Multi-Scale Neuroimaging data to Characterize and Diagnose Alzheimer's Disease
从肉体到细丝的流畅性:多尺度神经影像数据的整理、表示和分析,以表征和诊断阿尔茨海默病
- 批准号:
10462257 - 财政年份:2023
- 资助金额:
$ 77.51万 - 项目类别:
An acquisition and analysis pipeline for integrating MRI and neuropathology in TBI-related dementia and VCID
用于将 MRI 和神经病理学整合到 TBI 相关痴呆和 VCID 中的采集和分析流程
- 批准号:
10810913 - 财政年份:2023
- 资助金额:
$ 77.51万 - 项目类别:
Edited Magnetic Resonance Spectroscopy of the Pediatric Brain
儿科大脑磁共振波谱编辑
- 批准号:
10583752 - 财政年份:2023
- 资助金额:
$ 77.51万 - 项目类别:
Early detection and risk of head and neck cancer through immune based spatial omics
通过基于免疫的空间组学早期发现头颈癌并降低风险
- 批准号:
10766467 - 财政年份:2023
- 资助金额:
$ 77.51万 - 项目类别:
A visualization interface for BRAIN single cell data, integrating transcriptomics, epigenomics and spatial assays
BRAIN 单细胞数据的可视化界面,集成转录组学、表观基因组学和空间分析
- 批准号:
10643313 - 财政年份:2023
- 资助金额:
$ 77.51万 - 项目类别: