Big Data Methods for Decoding Gene Regulation

解码基因调控的大数据方法

基本信息

  • 批准号:
    9762143
  • 负责人:
  • 金额:
    $ 42.08万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2018
  • 资助国家:
    美国
  • 起止时间:
    2018-08-10 至 2022-05-31
  • 项目状态:
    已结题

项目摘要

Project Summary A comprehensive understanding of how genes' activities are controlled temporally and spatially is crucial for studying human development and diseases. Transcription factors (TFs) are an important class of regulatory proteins that can control genes' transcriptional activities by binding to target genes' regulatory DNA sequences called cis-regulatory elements (CREs). A map of genome-wide activities of CREs, or “regulome”, in all cell types and biological conditions will provide a foundation for investigating the basic operating rules of biology, interpreting how genetic variants cause diseases, and guiding the development of disease treatment strategies. Unfortunately, existing experimental regulome mapping technologies cannot analyze a large number of samples efficiently. Thus far, they have only been applied to map regulomes in a small fraction of all biological contexts. As a result, today a comprehensive map of human regulatory landscape is still lacking. This study aims to develop a solution to mapping regulomes in a massive number of biological samples from diverse cell types and conditions by leveraging publicly available functional genomic data. We will use the rich gene expression and regulome data generated by the Encyclopedia of DNA Elements (ENCODE) project to develop a new prediction approach that predicts a biological sample's regulome using its transcriptome (Aim 1). We will then apply the trained prediction models to 290,000+ publicly available human gene expression samples in the Gene Expression Omnibus (GEO) database to create a regulome map that covers hundreds of thousands more biological contexts than existing regulome data (Aim 2). We will also develop a method to help researchers explore the massive datasets to gain biological insights into gene regulation by projecting the data to their low- dimensional structure reflecting their developmental trajectory (Aim 3). Our research will create new analytical methods for predicting ultra-high-dimensional outcomes using ultra- high-dimensional predictors, making cross-platform predictions when the training and application data are gener- ated by different technological platforms with systematic platform differences, and retrieving the low-dimensional spanning tree structure from a massive dataset. Applying these new methods to the vast amounts of publicly available gene expression data will allow us to address a major challenge in regulome mapping that cannot be solved using existing experimental technologies. By enabling fast and cost-efficient mapping and analysis of human gene regulatory landscape, the proposed research can have a major impact on future studies of human development and diseases.
项目摘要 对基因活动如何临时和空间控制的全面了解对于 研究人类发展和疾病。转录因子(TF)是一类重要的调节 可以通过与靶基因调节DNA序列结合来控制基因转录活性的蛋白质 称为顺式调节元件(CRE)。在所有细胞中,CRE或“调节型”的全基因组活动图 类型和生物条件将为研究生物学基本操作规则提供基础, 解释遗传变异如何引起疾病,并指导疾病治疗策略的发展。 不幸的是,现有的实验调节映射技术无法分析大量样品 有效。这远,它们仅应用于在所有生物环境中的一小部分中绘制调节器。 结果,如今仍缺乏人类监管格局的全面地图。 这项研究旨在开发一种解决方案,以绘制来自大量生物样品的调节 通过利用公开可用的功能基因组数据来多样化的细胞类型和条件。我们将使用富人 DNA元素百科全书(编码)项目生成的基因表达和调节数据 开发一种新的预测方法,该方法使用其转录组来预测生物样品的调节组(AIM 1)。 然后,我们将将经过训练的预测模型应用于290,000多个公开的人类基因表达样本 在基因表达综合(GEO)数据库中,创建一个覆盖数十万的调节图 比现有调节数据的生物环境更多(AIM 2)。我们还将开发一种方法来帮助研究人员 探索大量数据集,以通过将数据投射到其低 - 尺寸结构反映其发育轨迹(AIM 3)。 我们的研究将创建新的分析方法,用于使用超高维结局使用超高维结局 高维预测变量,当培训和应用数据是生成时,进行跨平台预测 由具有系统平台差异的不同技术平台的ATED,并检索低维 从大量数据集中跨越树结构。将这些新方法应用于大量公开 可用的基因表达数据将使我们能够解决调节映射中的重大挑战 使用现有的实验技术解决。通过启用快速,成本效益的映射和分析 人类基因调节局势,拟议的研究可能对人类的未来研究产生重大影响 发展和疾病。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

暂无数据

数据更新时间:2024-06-01

Hongkai Ji的其他基金

Immune Development Across the Life Course: Integrating Exposures and Multi-Omics in the Boston Birth Cohort
整个生命过程中的免疫发展:在波士顿出生队列中整合暴露和多组学
  • 批准号:
    10418079
    10418079
  • 财政年份:
    2022
  • 资助金额:
    $ 42.08万
    $ 42.08万
  • 项目类别:
Immune Development Across the Life Course: Integrating Exposures and Multi-Omics in the Boston Birth Cohort
整个生命过程中的免疫发展:在波士顿出生队列中整合暴露和多组学
  • 批准号:
    10704536
    10704536
  • 财政年份:
    2022
  • 资助金额:
    $ 42.08万
    $ 42.08万
  • 项目类别:
Computational tools for regulome mapping using single-cell genomic data
使用单细胞基因组数据进行调节组图谱的计算工具
  • 批准号:
    10205134
    10205134
  • 财政年份:
    2019
  • 资助金额:
    $ 42.08万
    $ 42.08万
  • 项目类别:
Computational tools for regulome mapping using single-cell genomic data
使用单细胞基因组数据进行调节组图谱的计算工具
  • 批准号:
    10443743
    10443743
  • 财政年份:
    2019
  • 资助金额:
    $ 42.08万
    $ 42.08万
  • 项目类别:
Computational tools for regulome mapping using single-cell genomic data
使用单细胞基因组数据进行调节组图谱的计算工具
  • 批准号:
    10001077
    10001077
  • 财政年份:
    2019
  • 资助金额:
    $ 42.08万
    $ 42.08万
  • 项目类别:
Big Data Methods for Decoding Gene Regulation
解码基因调控的大数据方法
  • 批准号:
    10171879
    10171879
  • 财政年份:
    2018
  • 资助金额:
    $ 42.08万
    $ 42.08万
  • 项目类别:
Computational Tools for Mining Large Amounts of ChIP and Gene Expression Data
用于挖掘大量 ChIP 和基因表达数据的计算工具
  • 批准号:
    8516554
    8516554
  • 财政年份:
    2012
  • 资助金额:
    $ 42.08万
    $ 42.08万
  • 项目类别:
Computational Tools for Mining Large Amounts of ChIP and Gene Expression Data
用于挖掘大量 ChIP 和基因表达数据的计算工具
  • 批准号:
    8372529
    8372529
  • 财政年份:
    2012
  • 资助金额:
    $ 42.08万
    $ 42.08万
  • 项目类别:
Statistical and Computational Tools for Next-generation ChIP-seq Applications
用于下一代 ChIP-seq 应用的统计和计算工具
  • 批准号:
    8342445
    8342445
  • 财政年份:
    2012
  • 资助金额:
    $ 42.08万
    $ 42.08万
  • 项目类别:
Statistical and Computational Tools for Next-generation ChIP-seq Applications
用于下一代 ChIP-seq 应用的统计和计算工具
  • 批准号:
    8543753
    8543753
  • 财政年份:
    2012
  • 资助金额:
    $ 42.08万
    $ 42.08万
  • 项目类别:

相似国自然基金

基于整合多组学大数据并优化回归模型中收缩函数的奶牛基因组选择新方法研究
  • 批准号:
    32302711
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
大数据驱动的机器嗅觉关键技术和复杂气味多参数智能分析方法研究
  • 批准号:
    62376096
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
教育大数据背景下的个性化教育资源精准分发方法研究
  • 批准号:
    62307008
  • 批准年份:
    2023
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目
基于多源大数据多域特征融合的中长期风电功率鲁棒预测方法研究
  • 批准号:
    72301102
  • 批准年份:
    2023
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目
基于肿瘤大数据的ecDNA检测方法与消化系统肿瘤免疫治疗生物标志物研究
  • 批准号:
    82303953
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Accessing and Expanding Natural Products Chemical Diversity by Big-data Analysis and Biosynthetic Investigation
通过大数据分析和生物合成研究获取和扩大天然产物化学多样性
  • 批准号:
    10714466
    10714466
  • 财政年份:
    2023
  • 资助金额:
    $ 42.08万
    $ 42.08万
  • 项目类别:
Predictive modeling of mammalian cell fate transitions over time and space with single-cell genomics
利用单细胞基因组学预测哺乳动物细胞命运随时间和空间转变的模型
  • 批准号:
    10572855
    10572855
  • 财政年份:
    2023
  • 资助金额:
    $ 42.08万
    $ 42.08万
  • 项目类别:
Understanding Risk Heterogeneity Following Child Maltreatment: An Integrative Data Analysis Approach.
了解虐待儿童后的风险异质性:综合数据分析方法。
  • 批准号:
    10721233
    10721233
  • 财政年份:
    2023
  • 资助金额:
    $ 42.08万
    $ 42.08万
  • 项目类别:
PTSD and Autoimmune Disease: Towards Causal Effects, Risk Factors, and Mitigators
创伤后应激障碍 (PTSD) 和自身免疫性疾病:因果效应、危险因素和缓解措施
  • 批准号:
    10696671
    10696671
  • 财政年份:
    2023
  • 资助金额:
    $ 42.08万
    $ 42.08万
  • 项目类别:
Identifying and addressing missingness and bias to enhance discovery from multimodal health data
识别和解决缺失和偏见,以增强多模式健康数据的发现
  • 批准号:
    10637391
    10637391
  • 财政年份:
    2023
  • 资助金额:
    $ 42.08万
    $ 42.08万
  • 项目类别: