ARCHS4: Massive Mining of Publicly Available RNA Sequencing Data
ARCHS4:大规模挖掘公开的 RNA 测序数据
基本信息
- 批准号:10693339
- 负责人:
- 金额:$ 77.51万
- 依托单位:
- 依托单位国家:美国
- 项目类别:
- 财政年份:2022
- 资助国家:美国
- 起止时间:2022-09-01 至 2027-08-31
- 项目状态:未结题
- 来源:
- 关键词:AddressAlgorithmsAtlasesBenchmarkingBiological ProcessCancer cell lineCase StudyCell LineCellsChIP-seqClassificationCommunicationCommunitiesCompanionsComplexComputer softwareDataData AnalysesDevelopmentDiseaseEducational workshopFAIR principlesFarGoFrequenciesGene ExpressionGene Expression ProcessGene Expression ProfileGenerationsGenesGoalsHumanInfrastructureLaboratoriesMalignant NeoplasmsManualsMetadataMethodsMiningMolecularMolecular EvolutionMutationNamesNatural Language ProcessingNormal tissue morphologyOnline SystemsOrganismPathogen detectionPathogenicityPerformancePharmaceutical PreparationsPhenotypeProcessPublishingPythonsQuantitative Trait LociReadabilityResearch PersonnelResourcesSamplingServicesSingle Nucleotide PolymorphismSourceSupervisionTechnologyTissuesTrainingTranscriptTumor SubtypeTumor TissueUntranslated RNAUpdateVariantWorkanticancer researchapplication programming interfacecell typecloud basedcomputational pipelinescomputerized data processingcostcost effectivecrowdsourcingdata formatdata integrationdata miningdata portaldata repositorydata reusedata visualizationdeep learningexperimental studyfile formatgene functiongenome analysisgraphical user interfacehuman RNA sequencingimprovedinsertion/deletion mutationinteroperabilityneoplastic cellnovelopen dataoutreachrepositorysingle-cell RNA sequencingsmall moleculetranscriptome sequencingtranscriptomicstumorvirtual
项目摘要
SUMMARY
Many cancer-related independent studies that employ bulk and single cell RNA-seq remain under reused due to
their lower findability, accessibility, interoperability, and reusability. The data from these studies can be found in
the Gene Expression Omnibus (GEO) but it is provided mostly as raw FASTQ files with non-uniform metadata
annotations. While some studies provide aligned reads files, these are processed non-uniformly. This
shortcoming makes it difficult to query and integrate this data across studies and with additional external data.
To bridge the gap that currently exists between RNA-seq data generation and RNA-seq data processing and
reuse, we developed the resource All RNA-seq and ChIP-Seq Sample and Signature Search (ARCHS4).
ARCHS4 provides processed RNA-seq data from GEO to support retrospective data analyses and reuse.
ARCHS4 caters to users with different levels of computational expertise and has been already employed for
many post-hoc analyses and projects. The goals go far beyond just providing cancer researchers with direct
access to RNA-seq data through a web-based user interface. We plan to transform other transcriptomics data
into RNA-seq-like profiles with Deep Learning, identify pathogenic sequences in human RNA-seq samples,
identify short variants from RNA-seq reads, predict gene function from co-expression data including ways to
modulate the expression of long non-coding RNAs with small molecules, and most importantly, using the
ARCHS4 cost-effective infrastructure, continue to provide a free FASTQ alignment service to the community.
概括
许多采用批量和单细胞 RNA-seq 的癌症相关独立研究由于以下原因仍未被重复使用:
它们的可发现性、可访问性、互操作性和可重用性较低。这些研究的数据可以在
基因表达综合 (GEO),但它主要作为具有非统一元数据的原始 FASTQ 文件提供
注释。虽然一些研究提供了对齐的读取文件,但这些文件的处理不均匀。这
缺点使得跨研究和其他外部数据查询和整合这些数据变得困难。
弥合目前 RNA-seq 数据生成和 RNA-seq 数据处理之间存在的差距
为了重复利用,我们开发了资源 All RNA-seq and ChIP-Seq Sample and Signature Search (ARCHS4)。
ARCHS4 提供来自 GEO 的经过处理的 RNA-seq 数据,以支持回顾性数据分析和重用。
ARCHS4 迎合了具有不同计算专业知识水平的用户,并已被用于
许多事后分析和项目。这些目标不仅仅是为癌症研究人员提供直接的
通过基于网络的用户界面访问 RNA-seq 数据。我们计划转换其他转录组数据
通过深度学习转化为类似 RNA-seq 的图谱,识别人类 RNA-seq 样本中的致病序列,
从 RNA-seq 读取中识别短变异,从共表达数据中预测基因功能,包括
用小分子调节长非编码 RNA 的表达,最重要的是,使用
ARCHS4高性价比的基础设施,继续向社区提供免费的FASTQ对齐服务。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Avi Ma'ayan其他文献
Avi Ma'ayan的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Avi Ma'ayan', 18)}}的其他基金
Proteogenomic translator for cancer biomarker discovery towards precision medicine
用于癌症生物标志物发现和精准医学的蛋白质基因组翻译
- 批准号:
10442088 - 财政年份:2022
- 资助金额:
$ 77.51万 - 项目类别:
ARCHS4: Massive Mining of Publicly Available RNA Sequencing Data
ARCHS4:大规模挖掘公开的 RNA 测序数据
- 批准号:
10814654 - 财政年份:2022
- 资助金额:
$ 77.51万 - 项目类别:
ARCHS4: Massive Mining of Publicly Available RNA Sequencing Data
ARCHS4:大规模挖掘公开的 RNA 测序数据
- 批准号:
10527721 - 财政年份:2022
- 资助金额:
$ 77.51万 - 项目类别:
Proteogenomic translator for cancer biomarker discovery towards precision medicine
用于癌症生物标志物发现和精准医学的蛋白质基因组翻译
- 批准号:
10655588 - 财政年份:2022
- 资助金额:
$ 77.51万 - 项目类别:
Proteogenomic translator for cancer biomarker discovery towards precision medicine
用于癌症生物标志物发现和精准医学的蛋白质基因组翻译
- 批准号:
10442088 - 财政年份:2022
- 资助金额:
$ 77.51万 - 项目类别:
The LINCS DCIC Engagement Plan with the CFDE
LINCS DCIC 与 CFDE 的合作计划
- 批准号:
10444350 - 财政年份:2020
- 资助金额:
$ 77.51万 - 项目类别:
The LINCS DCIC Engagement Plan with the CFDE
LINCS DCIC 与 CFDE 的合作计划
- 批准号:
10682935 - 财政年份:2020
- 资助金额:
$ 77.51万 - 项目类别:
The LINCS DCIC Engagement Plan with the CFDE
LINCS DCIC 与 CFDE 的合作计划
- 批准号:
10468520 - 财政年份:2020
- 资助金额:
$ 77.51万 - 项目类别:
The LINCS DCIC Engagement Plan with the CFDE
LINCS DCIC 与 CFDE 的合作计划
- 批准号:
10837964 - 财政年份:2020
- 资助金额:
$ 77.51万 - 项目类别:
相似国自然基金
基于肿瘤病理图片的靶向药物敏感生物标志物识别及统计算法的研究
- 批准号:82304250
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
多模态高层语义驱动的深度伪造检测算法研究
- 批准号:62306090
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
高精度海表反照率遥感算法研究
- 批准号:42376173
- 批准年份:2023
- 资助金额:51 万元
- 项目类别:面上项目
基于新型深度学习算法和多组学研究策略鉴定非编码区剪接突变在肌萎缩侧索硬化症中的分子机制
- 批准号:82371878
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
基于深度学习与水平集方法的心脏MR图像精准分割算法研究
- 批准号:62371156
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
相似海外基金
Early detection and risk of head and neck cancer through immune based spatial omics
通过基于免疫的空间组学早期发现头颈癌并降低风险
- 批准号:
10766467 - 财政年份:2023
- 资助金额:
$ 77.51万 - 项目类别:
Precision Medicine Digital Twins for Alzheimer’s Target and Drug Discovery and Longevity
用于阿尔茨海默氏症靶点和药物发现及长寿的精准医学数字孪生
- 批准号:
10727793 - 财政年份:2023
- 资助金额:
$ 77.51万 - 项目类别:
A visualization interface for BRAIN single cell data, integrating transcriptomics, epigenomics and spatial assays
BRAIN 单细胞数据的可视化界面,集成转录组学、表观基因组学和空间分析
- 批准号:
10643313 - 财政年份:2023
- 资助金额:
$ 77.51万 - 项目类别:
An acquisition and analysis pipeline for integrating MRI and neuropathology in TBI-related dementia and VCID
用于将 MRI 和神经病理学整合到 TBI 相关痴呆和 VCID 中的采集和分析流程
- 批准号:
10810913 - 财政年份:2023
- 资助金额:
$ 77.51万 - 项目类别: