ARCHS4: Massive Mining of Publicly Available RNA Sequencing Data
ARCHS4:大规模挖掘公开的 RNA 测序数据
基本信息
- 批准号:10527721
- 负责人:
- 金额:$ 79.09万
- 依托单位:
- 依托单位国家:美国
- 项目类别:
- 财政年份:2022
- 资助国家:美国
- 起止时间:2022-09-01 至 2027-08-31
- 项目状态:未结题
- 来源:
- 关键词:AddressAlgorithmic SoftwareAlgorithmsAtlasesBenchmarkingBiological ProcessCancer cell lineCase StudyCell LineCellsChIP-seqClassificationCommunitiesCompanionsComplexDataData AnalysesDevelopmentDiseaseEducational workshopFAIR principlesFarGoFelis catusFrequenciesGene ExpressionGene Expression ProcessGene Expression ProfileGenerationsGenesGoalsHumanInfrastructureLaboratoriesMalignant NeoplasmsManualsMetadataMethodsMiningMolecularMolecular EvolutionMutationNamesNatural Language ProcessingNormal tissue morphologyOnline SystemsOrganismPathogenicityPerformancePharmaceutical PreparationsProcessPublishingPythonsQuantitative Trait LociReadabilityResearch PersonnelResourcesSamplingServicesSingle Nucleotide PolymorphismSourceSupervisionTechnologyTissuesTrainingTranscriptTumor SubtypeTumor TissueUntranslated RNAUpdateVariantWorkanticancer researchapplication programming interfacebasecell typecloud basedcomputational pipelinescomputerized data processingcostcost effectivecrowdsourcingdata formatdata miningdata portaldata repositorydata reusedata visualizationdeep learningdisease phenotypeexperimental studyfile formatgene functiongenome analysisgraphical user interfacehuman RNA sequencingimprovedinsertion/deletion mutationinteroperabilityneoplastic cellnovelopen dataoutreachpathogenrepositorysingle-cell RNA sequencingsmall moleculetranscriptome sequencingtranscriptomicstumorvirtual
项目摘要
SUMMARY
Many cancer-related independent studies that employ bulk and single cell RNA-seq remain under reused due to
their lower findability, accessibility, interoperability, and reusability. The data from these studies can be found in
the Gene Expression Omnibus (GEO) but it is provided mostly as raw FASTQ files with non-uniform metadata
annotations. While some studies provide aligned reads files, these are processed non-uniformly. This
shortcoming makes it difficult to query and integrate this data across studies and with additional external data.
To bridge the gap that currently exists between RNA-seq data generation and RNA-seq data processing and
reuse, we developed the resource All RNA-seq and ChIP-Seq Sample and Signature Search (ARCHS4).
ARCHS4 provides processed RNA-seq data from GEO to support retrospective data analyses and reuse.
ARCHS4 caters to users with different levels of computational expertise and has been already employed for
many post-hoc analyses and projects. The goals go far beyond just providing cancer researchers with direct
access to RNA-seq data through a web-based user interface. We plan to transform other transcriptomics data
into RNA-seq-like profiles with Deep Learning, identify pathogenic sequences in human RNA-seq samples,
identify short variants from RNA-seq reads, predict gene function from co-expression data including ways to
modulate the expression of long non-coding RNAs with small molecules, and most importantly, using the
ARCHS4 cost-effective infrastructure, continue to provide a free FASTQ alignment service to the community.
概括
许多采用大量和单细胞RNA-seq的与癌症相关的独立研究由于
它们较低的可发现性,可访问性,互操作性和可重复性。这些研究的数据可以在
基因表达综合(GEO),但主要作为具有不均匀元数据的RAW FASTQ文件提供
注释。虽然一些研究提供了对齐的读取文件,但它们是不均匀处理的。这
缺点使得难以查询和集成在研究中以及其他外部数据的数据。
弥合RNA-seq数据生成和RNA-seq数据处理和
重用,我们开发了所有RNA-Seq和Chip-Seq样本和签名搜索(Archs4)的资源。
ArchS4提供了从GEO中处理的RNA-SEQ数据,以支持回顾性数据分析和重复使用。
ArchS4迎合具有不同计算专业知识的用户,并且已经被用过
许多事后分析和项目。目标远远超出了为癌症研究人员提供直接的
通过基于Web的用户界面访问RNA-Seq数据。我们计划改变其他转录组学数据
进入具有深度学习的RNA-Seq样轮廓,鉴定人RNA-Seq样品中的致病序列,
从RNA-seq读取中确定短变体,从共表达数据中预测基因函数,包括通往的方法
使用小分子调节长的非编码RNA的表达,最重要的是,使用
ArchS4具有成本效益的基础设施,继续为社区提供免费的FASTQ对齐服务。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Avi Ma'ayan其他文献
Avi Ma'ayan的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Avi Ma'ayan', 18)}}的其他基金
ARCHS4: Massive Mining of Publicly Available RNA Sequencing Data
ARCHS4:大规模挖掘公开的 RNA 测序数据
- 批准号:
10693339 - 财政年份:2022
- 资助金额:
$ 79.09万 - 项目类别:
Proteogenomic translator for cancer biomarker discovery towards precision medicine
用于癌症生物标志物发现和精准医学的蛋白质基因组翻译
- 批准号:
10442088 - 财政年份:2022
- 资助金额:
$ 79.09万 - 项目类别:
ARCHS4: Massive Mining of Publicly Available RNA Sequencing Data
ARCHS4:大规模挖掘公开的 RNA 测序数据
- 批准号:
10814654 - 财政年份:2022
- 资助金额:
$ 79.09万 - 项目类别:
Proteogenomic translator for cancer biomarker discovery towards precision medicine
用于癌症生物标志物发现和精准医学的蛋白质基因组翻译
- 批准号:
10655588 - 财政年份:2022
- 资助金额:
$ 79.09万 - 项目类别:
The LINCS DCIC Engagement Plan with the CFDE
LINCS DCIC 与 CFDE 的合作计划
- 批准号:
10837964 - 财政年份:2020
- 资助金额:
$ 79.09万 - 项目类别:
The LINCS DCIC Engagement Plan with the CFDE
LINCS DCIC 与 CFDE 的合作计划
- 批准号:
10468520 - 财政年份:2020
- 资助金额:
$ 79.09万 - 项目类别:
The LINCS DCIC Engagement Plan with the CFDE
LINCS DCIC 与 CFDE 的合作计划
- 批准号:
10444350 - 财政年份:2020
- 资助金额:
$ 79.09万 - 项目类别:
The LINCS DCIC Engagement Plan with the CFDE
LINCS DCIC 与 CFDE 的合作计划
- 批准号:
10682935 - 财政年份:2020
- 资助金额:
$ 79.09万 - 项目类别:
Knowledge Management Center for Illuminating the Druggable Genome
阐明可药物基因组的知识管理中心
- 批准号:
10560469 - 财政年份:2018
- 资助金额:
$ 79.09万 - 项目类别:
相似国自然基金
高吞吐低时延的多元LDPC码译码算法及其软件架构研究
- 批准号:62301029
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
深度学习中的流形优化问题:算法设计与求解软件包的开发
- 批准号:12301408
- 批准年份:2023
- 资助金额:30.00 万元
- 项目类别:青年科学基金项目
能量一阶导数的GPU算法和异构并行计算:WESP软件的发展和向国产异构平台的移植
- 批准号:22373112
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
机理与数据耦合驱动的AI赋能工业软件理论与算法
- 批准号:52335001
- 批准年份:2023
- 资助金额:230 万元
- 项目类别:重点项目
面向量子模拟算法的量子软件优化技术研究
- 批准号:62302395
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
相似海外基金
Brain Digital Slide Archive: An Open Source Platform for data sharing and analysis of digital neuropathology
Brain Digital Slide Archive:数字神经病理学数据共享和分析的开源平台
- 批准号:
10735564 - 财政年份:2023
- 资助金额:
$ 79.09万 - 项目类别:
An acquisition and analysis pipeline for integrating MRI and neuropathology in TBI-related dementia and VCID
用于将 MRI 和神经病理学整合到 TBI 相关痴呆和 VCID 中的采集和分析流程
- 批准号:
10810913 - 财政年份:2023
- 资助金额:
$ 79.09万 - 项目类别:
Wearable Wireless Respiratory Monitoring System that Detects and Predicts Opioid Induced Respiratory Depression
可穿戴无线呼吸监测系统,可检测和预测阿片类药物引起的呼吸抑制
- 批准号:
10784983 - 财政年份:2023
- 资助金额:
$ 79.09万 - 项目类别:
Leveraging artificial intelligence/machine learning-based technology to overcome specialized training and technology barriers for the diagnosis and prognostication of colorectal cancer in Africa
利用基于人工智能/机器学习的技术克服非洲结直肠癌诊断和预测的专业培训和技术障碍
- 批准号:
10712793 - 财政年份:2023
- 资助金额:
$ 79.09万 - 项目类别:
A visualization interface for BRAIN single cell data, integrating transcriptomics, epigenomics and spatial assays
BRAIN 单细胞数据的可视化界面,集成转录组学、表观基因组学和空间分析
- 批准号:
10643313 - 财政年份:2023
- 资助金额:
$ 79.09万 - 项目类别: