ARCHS4: Massive Mining of Publicly Available RNA Sequencing Data

ARCHS4:大规模挖掘公开的 RNA 测序数据

基本信息

  • 批准号:
    10527721
  • 负责人:
  • 金额:
    $ 79.09万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2022
  • 资助国家:
    美国
  • 起止时间:
    2022-09-01 至 2027-08-31
  • 项目状态:
    未结题

项目摘要

SUMMARY Many cancer-related independent studies that employ bulk and single cell RNA-seq remain under reused due to their lower findability, accessibility, interoperability, and reusability. The data from these studies can be found in the Gene Expression Omnibus (GEO) but it is provided mostly as raw FASTQ files with non-uniform metadata annotations. While some studies provide aligned reads files, these are processed non-uniformly. This shortcoming makes it difficult to query and integrate this data across studies and with additional external data. To bridge the gap that currently exists between RNA-seq data generation and RNA-seq data processing and reuse, we developed the resource All RNA-seq and ChIP-Seq Sample and Signature Search (ARCHS4). ARCHS4 provides processed RNA-seq data from GEO to support retrospective data analyses and reuse. ARCHS4 caters to users with different levels of computational expertise and has been already employed for many post-hoc analyses and projects. The goals go far beyond just providing cancer researchers with direct access to RNA-seq data through a web-based user interface. We plan to transform other transcriptomics data into RNA-seq-like profiles with Deep Learning, identify pathogenic sequences in human RNA-seq samples, identify short variants from RNA-seq reads, predict gene function from co-expression data including ways to modulate the expression of long non-coding RNAs with small molecules, and most importantly, using the ARCHS4 cost-effective infrastructure, continue to provide a free FASTQ alignment service to the community.
概括 许多采用批量和单细胞 RNA-seq 的癌症相关独立研究由于以下原因仍未被重复使用: 它们的可发现性、可访问性、互操作性和可重用性较低。这些研究的数据可以在 基因表达综合 (GEO),但它主要作为具有非统一元数据的原始 FASTQ 文件提供 注释。虽然一些研究提供了对齐的读取文件,但这些文件的处理不均匀。这 缺点使得跨研究和其他外部数据查询和整合这些数据变得困难。 弥合目前 RNA-seq 数据生成和 RNA-seq 数据处理之间存在的差距 为了重复利用,我们开发了资源 All RNA-seq and ChIP-Seq Sample and Signature Search (ARCHS4)。 ARCHS4 提供来自 GEO 的经过处理的 RNA-seq 数据,以支持回顾性数据分析和重用。 ARCHS4 迎合了具有不同计算专业知识水平的用户,并已被用于 许多事后分析和项目。这些目标不仅仅是为癌症研究人员提供直接的 通过基于网络的用户界面访问 RNA-seq 数据。我们计划转换其他转录组数据 通过深度学习转化为类似 RNA-seq 的图谱,识别人类 RNA-seq 样本中的致病序列, 从 RNA-seq 读取中识别短变异,从共表达数据中预测基因功能,包括 用小分子调节长非编码 RNA 的表达,最重要的是,使用 ARCHS4高性价比的基础设施,继续向社区提供免费的FASTQ对齐服务。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Avi Ma'ayan其他文献

Avi Ma'ayan的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Avi Ma'ayan', 18)}}的其他基金

The CFDE Workbench
CFDE 工作台
  • 批准号:
    10851224
  • 财政年份:
    2023
  • 资助金额:
    $ 79.09万
  • 项目类别:
Proteogenomic translator for cancer biomarker discovery towards precision medicine
用于癌症生物标志物发现和精准医学的蛋白质基因组翻译
  • 批准号:
    10442088
  • 财政年份:
    2022
  • 资助金额:
    $ 79.09万
  • 项目类别:
ARCHS4: Massive Mining of Publicly Available RNA Sequencing Data
ARCHS4:大规模挖掘公开的 RNA 测序数据
  • 批准号:
    10814654
  • 财政年份:
    2022
  • 资助金额:
    $ 79.09万
  • 项目类别:
ARCHS4: Massive Mining of Publicly Available RNA Sequencing Data
ARCHS4:大规模挖掘公开的 RNA 测序数据
  • 批准号:
    10693339
  • 财政年份:
    2022
  • 资助金额:
    $ 79.09万
  • 项目类别:
Proteogenomic translator for cancer biomarker discovery towards precision medicine
用于癌症生物标志物发现和精准医学的蛋白质基因组翻译
  • 批准号:
    10655588
  • 财政年份:
    2022
  • 资助金额:
    $ 79.09万
  • 项目类别:
Proteogenomic translator for cancer biomarker discovery towards precision medicine
用于癌症生物标志物发现和精准医学的蛋白质基因组翻译
  • 批准号:
    10442088
  • 财政年份:
    2022
  • 资助金额:
    $ 79.09万
  • 项目类别:
The LINCS DCIC Engagement Plan with the CFDE
LINCS DCIC 与 CFDE 的合作计划
  • 批准号:
    10444350
  • 财政年份:
    2020
  • 资助金额:
    $ 79.09万
  • 项目类别:
The LINCS DCIC Engagement Plan with the CFDE
LINCS DCIC 与 CFDE 的合作计划
  • 批准号:
    10682935
  • 财政年份:
    2020
  • 资助金额:
    $ 79.09万
  • 项目类别:
The LINCS DCIC Engagement Plan with the CFDE
LINCS DCIC 与 CFDE 的合作计划
  • 批准号:
    10468520
  • 财政年份:
    2020
  • 资助金额:
    $ 79.09万
  • 项目类别:
The LINCS DCIC Engagement Plan with the CFDE
LINCS DCIC 与 CFDE 的合作计划
  • 批准号:
    10837964
  • 财政年份:
    2020
  • 资助金额:
    $ 79.09万
  • 项目类别:

相似国自然基金

能量一阶导数的GPU算法和异构并行计算:WESP软件的发展和向国产异构平台的移植
  • 批准号:
    22373112
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
机理与数据耦合驱动的AI赋能工业软件理论与算法
  • 批准号:
    52335001
  • 批准年份:
    2023
  • 资助金额:
    230 万元
  • 项目类别:
    重点项目
面向量子模拟算法的量子软件优化技术研究
  • 批准号:
    62302395
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
高吞吐低时延的多元LDPC码译码算法及其软件架构研究
  • 批准号:
    62301029
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
针对单序列/多域蛋白质的蛋白质结构从头预测算法研究与软件研制
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    54 万元
  • 项目类别:
    面上项目

相似海外基金

Wearable Wireless Respiratory Monitoring System that Detects and Predicts Opioid Induced Respiratory Depression
可穿戴无线呼吸监测系统,可检测和预测阿片类药物引起的呼吸抑制
  • 批准号:
    10784983
  • 财政年份:
    2023
  • 资助金额:
    $ 79.09万
  • 项目类别:
Real time relapse risk scoring for Opioid Use Disorder (OUD) from clinical trial datasets
根据临床试验数据集对阿片类药物使用障碍 (OUD) 进行实时复发风险评分
  • 批准号:
    10585452
  • 财政年份:
    2023
  • 资助金额:
    $ 79.09万
  • 项目类别:
A visualization interface for BRAIN single cell data, integrating transcriptomics, epigenomics and spatial assays
BRAIN 单细胞数据的可视化界面,集成转录组学、表观基因组学和空间分析
  • 批准号:
    10643313
  • 财政年份:
    2023
  • 资助金额:
    $ 79.09万
  • 项目类别:
An acquisition and analysis pipeline for integrating MRI and neuropathology in TBI-related dementia and VCID
用于将 MRI 和神经病理学整合到 TBI 相关痴呆和 VCID 中的采集和分析流程
  • 批准号:
    10810913
  • 财政年份:
    2023
  • 资助金额:
    $ 79.09万
  • 项目类别:
A deep learning algorithm to detect signs of cognitive impairment in electronic health records
用于检测电子健康记录中认知障碍迹象的深度学习算法
  • 批准号:
    10900991
  • 财政年份:
    2023
  • 资助金额:
    $ 79.09万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了