A Modular Framework for Accurate, Efficient, and Reproducible Analysis of RNA-Seq Data

用于准确、高效和可重复分析 RNA-Seq 数据的模块化框架

基本信息

  • 批准号:
    10440402
  • 负责人:
  • 金额:
    $ 29.5万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2020
  • 资助国家:
    美国
  • 起止时间:
    2020-03-12 至 2024-06-30
  • 项目状态:
    已结题

项目摘要

PROJECT SUMMARY / ABSTRACT We propose to develop improved, modular pipelines for more accurate and reproducible RNA-seq analyses. RNA- seq experiments are widely used in biological and biomedical sciences to determine the expression level of all genes and isoforms across multiple samples. Raw RNA-seq data must be pre-processed to determine abundances of RNA molecules. State-of-the-art tools for quantifying RNA abundances are fast and efficient, model and correct for common technical biases, and provide estimates of the uncertainty of the abundances. Downstream tools for visualization and statistical testing of abundance ideally should incorporate uncertainty of abundance estimates from the quantification step, take into account the sampling variability inherent in observations in all sequencing experiments, and estimate, for each transcript, the underlying biological variation in abundances across samples. While isolated tools fulfill a subset of the above characteristics, we propose to develop a pipeline which addresses all of these, while at the same time leveraging the powerful existing infrastructure for gene expression analysis. Our modular approach to improving the current RNA-seq analysis pipelines will also seek to make use of the best downstream tools for gene set analysis and dynamic report generation. Current RNA-seq computational pipelines do not keep track of critical pieces of metadata throughout the analysis, including genome and transcriptome version, such that final results cannot reliably be repro- duced or put in the correct genomic context as the information about annotation provenance may be lost. While fast and lightweight tools have been quickly adopted for gene- and transcript-level quantification, they are not yet optimized for certain RNA-seq analysis tasks such as quantification of allele specific expression. We have developed a set of top performing tools for abundance quantification and downstream inference. We propose to formalize our existing tools into a pipeline, and build additional tools and infrastructure, which optimally estimates and propagates uncertainty from abundance estimation (described in Aim 1), and which stores critical provenance metadata automatically on the user's behalf — this metadata tagging and propagation will be integrated with community resources (described in Aim 2). Furthermore, we propose building out the capabilities of our existing quantification infrastructure to allow for improved mapping accuracy and more robust and accurate allelic expression estimation (described in Aim 3).
项目概要/摘要 我们建议开发改进的模块化流程,以实现更准确和可重复的 RNA-seq 分析。 seq实验广泛应用于生物和生物医学科学中以确定所有基因的表达水平 必须对多个样本的原始 RNA-seq 数据进行预处理以确定 RNA 的丰度。 用于定量 RNA 丰度的最先进的工具快速高效,对常见的情况进行建模和校正。 技术偏差,并提供下游丰度工具的可视化和不确定性估计。 理想情况下,丰度的统计测试应包含定量中丰度估计的不确定性 步骤,考虑所有测序实验中观察结果固有的采样变异性,并估计, 每个转录本都揭示了样本间丰度的潜在生物学差异,而孤立的工具则满足了一个子集。 鉴于上述特征,我们建议开发一个解决所有这些问题的管道,同时 利用我们强大的现有基础设施进行基因表达分析。 当前的RNA-seq分析管道还将寻求利用最好的下游工具进行基因组分析和 动态报告生成。当前的 RNA-seq 计算流程不跟踪元数据的关键部分。 整个分析过程,包括基因组和转录组版本,因此最终结果无法可靠地重现 诱导或放入正确的基因组环境中,因为有关注释来源的信息可能会丢失。 轻量级工具已迅速用于基因和转录水平定量,但尚未优化 对于某些 RNA-seq 分析任务,例如等位基因特异性表达的量化,我们开发了一套顶级工具。 我们建议将现有工具形式化。 进入管道,并构建额外的工具和基础设施,以最佳方式估计和传播不确定性 来自丰度估计(目标 1 中描述),并且自动将关键来源元数据存储在 代表用户——元数据标记和传播将与社区资源集成(描述 在目标 2)中,我们建议构建现有的量化基础设施的能力,以允许 提高作图准确性和更稳健、更准确的等位基因表达估计(目标 3 中所述)。

项目成果

期刊论文数量(25)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Context-aware transcript quantification from long-read RNA-seq data with Bambu.
使用 Bambu 对长读 RNA-seq 数据进行上下文感知转录本定量。
  • DOI:
  • 发表时间:
    2023-08
  • 期刊:
  • 影响因子:
    48
  • 作者:
    Chen, Ying;Sim, Andre;Wan, Yuk Kei;Yeo, Keith;Lee, Joseph Jing Xian;Ling, Min Hao;Love, Michael I;Göke, Jonathan
  • 通讯作者:
    Göke, Jonathan
A Bayesian framework for inter-cellular information sharing improves dscRNA-seq quantification.
用于细胞间信息共享的贝叶斯框架改进了 dscRNA-seq 定量。
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Srivastava, Avi;Malik, Laraib;Sarkar, Hirak;Patro, Rob
  • 通讯作者:
    Patro, Rob
Algorithms meet sequencing technologies - 10th edition of the RECOMB-Seq workshop.
算法与测序技术的结合 - RECOMB-Seq 研讨会第十版。
  • DOI:
  • 发表时间:
    2021-01-22
  • 期刊:
  • 影响因子:
    5.8
  • 作者:
    Patro, Rob;Salmela, Leena
  • 通讯作者:
    Salmela, Leena
Tree-based differential testing using inferential uncertainty for RNA-Seq.
使用 RNA-Seq 的推断不确定性进行基于树的差异测试。
  • DOI:
  • 发表时间:
    2023-12-25
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Singh, Noor Pratap;Wu, Euphy Y;Fan, Jason;Love, Michael I;Patro, Rob
  • 通讯作者:
    Patro, Rob
Fulgor: A fast and compact k-mer index for large-scale matching and color queries.
Fulgor:一种快速、紧凑的 k-mer 索引,用于大规模匹配和颜色查询。
  • DOI:
  • 发表时间:
    2023-05-20
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Fan, Jason;Singh, Noor Pratap;Khan, Jamshed;Pibiri, Giulio Ermanno;Patro, Rob
  • 通讯作者:
    Patro, Rob
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Michael Isaiah Love其他文献

Michael Isaiah Love的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Michael Isaiah Love', 18)}}的其他基金

Systematic in vivo characterization of disease-associated regulatory variants
疾病相关调控变异的系统体内表征
  • 批准号:
    10472058
  • 财政年份:
    2021
  • 资助金额:
    $ 29.5万
  • 项目类别:
Systematic in vivo characterization of disease-associated regulatory variants
疾病相关调控变异的系统体内表征
  • 批准号:
    10472058
  • 财政年份:
    2021
  • 资助金额:
    $ 29.5万
  • 项目类别:
Systematic in vivo characterization of disease-associated regulatory variants
疾病相关调控变异的系统体内表征
  • 批准号:
    10296745
  • 财政年份:
    2021
  • 资助金额:
    $ 29.5万
  • 项目类别:
Systematic in vivo characterization of disease-associated regulatory variants
疾病相关调控变异的系统体内表征
  • 批准号:
    10631225
  • 财政年份:
    2021
  • 资助金额:
    $ 29.5万
  • 项目类别:
A Modular Framework for Accurate, Efficient, and Reproducible Analysis of RNA-Seq Data
用于准确、高效和可重复分析 RNA-Seq 数据的模块化框架
  • 批准号:
    10170579
  • 财政年份:
    2020
  • 资助金额:
    $ 29.5万
  • 项目类别:
A Modular Framework for Accurate, Efficient, and Reproducible Analysis of RNA-Seq Data
用于准确、高效和可重复分析 RNA-Seq 数据的模块化框架
  • 批准号:
    10238765
  • 财政年份:
    2020
  • 资助金额:
    $ 29.5万
  • 项目类别:
pathQTL: Integrative Multi-Omics Causal Inference of Molecular Mechanisms Leading to Neuropsychiatric Illness
pathQTL:导致神经精神疾病的分子机制的综合多组学因果推断
  • 批准号:
    10550143
  • 财政年份:
    2018
  • 资助金额:
    $ 29.5万
  • 项目类别:
pathQTL: Integrative Multi-Omics Causal Inference of Molecular Mechanisms Leading to Neuropsychiatric Illness
pathQTL:导致神经精神疾病的分子机制的综合多组学因果推断
  • 批准号:
    10066367
  • 财政年份:
    2018
  • 资助金额:
    $ 29.5万
  • 项目类别:
pathQTL: Integrative Multi-Omics Causal Inference of Molecular Mechanisms Leading to Neuropsychiatric Illness
pathQTL:导致神经精神疾病的分子机制的综合多组学因果推断
  • 批准号:
    10318952
  • 财政年份:
    2018
  • 资助金额:
    $ 29.5万
  • 项目类别:

相似国自然基金

血管内皮细胞通过E2F1/NF-kB/IL-6轴调控巨噬细胞活化在眼眶静脉畸形中的作用及机制研究
  • 批准号:
    82301257
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
睡眠剥夺通过上调BMAL1/IL-17轴促进三级淋巴结构形成加重哮喘的研究
  • 批准号:
    82300039
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
S100A6通过调控ZNF750组蛋白甲基化促进糖尿病角质形成细胞分化障碍的机制研究
  • 批准号:
    82302802
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
肿瘤相关成纤维细胞通过CCL5/CCR5轴促进神经内分泌前列腺癌顺铂耐药的机制研究
  • 批准号:
    82373358
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
鼻腔共生表皮葡萄球菌通过抗菌肽-moDC-CCL17通路抑制过敏性鼻炎的分子机制
  • 批准号:
    82302595
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Implementation of Innovative Treatment for Moral Injury Syndrome: A Hybrid Type 2 Study
道德伤害综合症创新治疗的实施:2 型混合研究
  • 批准号:
    10752930
  • 财政年份:
    2024
  • 资助金额:
    $ 29.5万
  • 项目类别:
Implementation Science and Equity
实施科学与公平
  • 批准号:
    10557509
  • 财政年份:
    2023
  • 资助金额:
    $ 29.5万
  • 项目类别:
Improving Diagnosis in Gastrointestinal Cancer: Integrating Prediction Models into Routine Clinical Care
改善胃肠癌的诊断:将预测模型纳入常规临床护理
  • 批准号:
    10641060
  • 财政年份:
    2023
  • 资助金额:
    $ 29.5万
  • 项目类别:
Dissemination of the Human Neocortical Neurosolver (HNN) software for circuit level interpretation of human MEG/EEG
传播用于人类 MEG/EEG 电路级解释的人类新皮质神经解算器 (HNN) 软件
  • 批准号:
    10726032
  • 财政年份:
    2023
  • 资助金额:
    $ 29.5万
  • 项目类别:
Crossroads: Using decision making strategies to develop high impact content for training in rigor and transparency.
十字路口:使用决策策略来开发高影响力的内容,以进行严格和透明的培训。
  • 批准号:
    10722510
  • 财政年份:
    2023
  • 资助金额:
    $ 29.5万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了