Computational Tools for Mining Large Amounts of ChIP and Gene Expression Data

用于挖掘大量 ChIP 和基因表达数据的计算工具

基本信息

  • 批准号:
    8516554
  • 负责人:
  • 金额:
    $ 38.58万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2012
  • 资助国家:
    美国
  • 起止时间:
    2012-07-25 至 2017-04-30
  • 项目状态:
    已结题

项目摘要

DESCRIPTION (provided by applicant): ChIP-seq and ChIP-chip, hereinafter referred to as ChIPx, are powerful technologies to map genome-wide protein-DNA interactions (PDIs). Microarray, exon array and RNA-seq, on the other hand, are widely used to measure gene expression. Integrating ChIPx and gene expression data provides a powerful approach to study gene regulation both during development and in diseases. Traditionally, ChIPx and gene expression experiments conducted by a single laboratory are mainly used to study a specific biological system. The collective efforts of many labs have resulted in a large volume of data representing diverse biological systems. Jointly, these data contain enormous amounts of information that have not been fully utilized by each individual lab. This proposal aims to develop a coordinated set of computational, statistical and software tools to allow scientists to synthesize information in 3000+ publicly available ChIPx samples and 60,000+ gene expression profiles in human and mouse to make new discoveries. The project will turn these heterogeneous data into a tool for high-throughput discovery of biological contexts (i.e., cell types, tissues and diseases) associated with gene regulatory pathway activities. First, a statistical method named Gene Set Context Analysis (GSCA) will be developed. GSCA utilizes large amounts of public gene expression data to infer biological contexts and diseases in which one or more gene sets (i.e., groups of genes) are coordinately activated or inactivated. Second, based on the GSCA, a method called Transcription Factor Context Analysis (TFCA) will be developed. TFCA discovers novel functional contexts of transcription factors (TFs) and gene regulatory pathways. This method first classifies target genes of a TF into different functional categories by integrating one's own ChIPx and gene expression data with public ChIPx and Gene Ontology data. It then uses GSCA to systematically discover biological contexts (including diseases) associated with the function of each category. Collectively, GSCA and TFCA will establish a new paradigm for analyzing ChIPx and gene expression data. The conventional approach analyzes data tied to a particular system. In the new approach, one also leverages the rich information in public ChIPx and gene expression data to extend findings in one system to other biological systems. By allowing one to make novel discoveries beyond the scope of the original experiments and connect gene regulatory pathways to diseases, the new approach will significantly increase the value of both new and existing data. Applying GSCA and TFCA, 3000+ ChIPx samples and 60,000+ gene expression samples in human and mouse will be analyzed together to systematically map TF functions and ChIPx defined regulatory pathway activ- ities to diseases. Some new predictions will be validated experimentally. In addition to creating new knowledge about a variety of diseases, this research will provide urgently needed data integration and data mining tools to help scientists to translate the rich information in the publicly available ChIPx and gene expression data into new discoveries, and identify promising new areas of biomedical research.
描述(由申请人提供):以下称为CHIPX的ChIP-Seq和Chip-Chip是绘制全基因组蛋白DNA相互作用(PDIS)的强大技术。另一方面,微阵列,外显子阵列和RNA-seq被广泛用于测量基因表达。整合CHIPX和基因表达数据提供了一种强大的方法来研究在发育和疾病期间的基因调节。传统上,单个实验室进行的CHIPX和基因表达实验主要用于研究特定的生物系统。许多实验室的集体努力导致了大量代表不同生物系统的数据。共同的数据包含每个实验室尚未完全利用的大量信息。 该建议旨在开发一组协调的计算,统计和软件工具,以允许科学家在人和鼠标中综合3000多个公开可用的chipx样本中的信息,以及人和鼠标中的60,000多个基因表达概况,以做出新的发现。该项目将将这些异质数据变成与基因调节途径活动相关的生物学环境(即细胞类型,组织和疾病)的高通量发现(即细胞类型,组织和疾病)的工具。首先,将开发一种名为基因集上下文分析(GSCA)的统计方法。 GSCA利用大量的公共基因表达数据来推断生物学环境和疾病,其中一个或多个基因集(即基因组)被协同激活或灭活。其次,基于GSCA,将开发一种称为转录因子上下文分析(TFCA)的方法。 TFCA发现了转录因子(TFS)和基因调节途径的新型功能背景。该方法首先通过将自己的chipx和基因表达数据与公共chipx和基因本体学数据整合在一起,将TF的靶基因分类为不同的功能类别。然后,它使用GSCA系统地发现与每个类别功能相关的生物学环境(包括疾病)。总体而言,GSCA和TFCA将建立一个用于分析CHIPX和基因表达数据的新范式。常规方法分析与特定系统相关的数据。在新方法中,人们还利用公共chipx和基因表达数据中的丰富信息将一种系统中的发现扩展到其他生物系统。通过允许人们在原始实验范围之外进行新发现并将基因调节途径与疾病联系起来,新方法将显着增加新数据和现有数据的价值。 在人和小鼠中应用GSCA和TFCA,3000多个CHIPX样品以及60,000多个基因表达样品将共同分析,以系统地映射TF功能,并将CHIPX定义的调节途径激活为疾病。一些新的预测将通过实验验证。除了创建有关各种疾病的新知识外,这项研究还将提供急需的数据集成和数据挖掘工具,以帮助科学家将公开可用的chipx和基因表达数据中的丰富信息转化为新发现,并确定生物医学研究的新领域。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Hongkai Ji其他文献

Hongkai Ji的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Hongkai Ji', 18)}}的其他基金

Immune Development Across the Life Course: Integrating Exposures and Multi-Omics in the Boston Birth Cohort
整个生命过程中的免疫发展:在波士顿出生队列中整合暴露和多组学
  • 批准号:
    10418079
  • 财政年份:
    2022
  • 资助金额:
    $ 38.58万
  • 项目类别:
Immune Development Across the Life Course: Integrating Exposures and Multi-Omics in the Boston Birth Cohort
整个生命过程中的免疫发展:在波士顿出生队列中整合暴露和多组学
  • 批准号:
    10704536
  • 财政年份:
    2022
  • 资助金额:
    $ 38.58万
  • 项目类别:
Computational tools for regulome mapping using single-cell genomic data
使用单细胞基因组数据进行调节组图谱的计算工具
  • 批准号:
    10205134
  • 财政年份:
    2019
  • 资助金额:
    $ 38.58万
  • 项目类别:
Computational tools for regulome mapping using single-cell genomic data
使用单细胞基因组数据进行调节组图谱的计算工具
  • 批准号:
    10443743
  • 财政年份:
    2019
  • 资助金额:
    $ 38.58万
  • 项目类别:
Computational tools for regulome mapping using single-cell genomic data
使用单细胞基因组数据进行调节组图谱的计算工具
  • 批准号:
    10001077
  • 财政年份:
    2019
  • 资助金额:
    $ 38.58万
  • 项目类别:
Big Data Methods for Decoding Gene Regulation
解码基因调控的大数据方法
  • 批准号:
    10171879
  • 财政年份:
    2018
  • 资助金额:
    $ 38.58万
  • 项目类别:
Big Data Methods for Decoding Gene Regulation
解码基因调控的大数据方法
  • 批准号:
    9762143
  • 财政年份:
    2018
  • 资助金额:
    $ 38.58万
  • 项目类别:
Computational Tools for Mining Large Amounts of ChIP and Gene Expression Data
用于挖掘大量 ChIP 和基因表达数据的计算工具
  • 批准号:
    8372529
  • 财政年份:
    2012
  • 资助金额:
    $ 38.58万
  • 项目类别:
Statistical and Computational Tools for Next-generation ChIP-seq Applications
用于下一代 ChIP-seq 应用的统计和计算工具
  • 批准号:
    8342445
  • 财政年份:
    2012
  • 资助金额:
    $ 38.58万
  • 项目类别:
Statistical and Computational Tools for Next-generation ChIP-seq Applications
用于下一代 ChIP-seq 应用的统计和计算工具
  • 批准号:
    8543753
  • 财政年份:
    2012
  • 资助金额:
    $ 38.58万
  • 项目类别:

相似国自然基金

生物质燃烧区域复杂形貌含碳气溶胶偏振光学遥感模型研究
  • 批准号:
    42305148
  • 批准年份:
    2023
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目
青藏高原不同区域冰川中微生物类脂物GDGTs的分布特征及其气候环境意义
  • 批准号:
    42371155
  • 批准年份:
    2023
  • 资助金额:
    52 万元
  • 项目类别:
    面上项目
基于机器学习的中国近岸区域鱼类砷累积与转化机制研究
  • 批准号:
    42307361
  • 批准年份:
    2023
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目
南海周边生物质燃烧与区域气候及社会经济相互作用研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    55 万元
  • 项目类别:
    面上项目
基于物质代谢的区域生物天然气供应链系统集成方法及资源环境效应研究
  • 批准号:
    52270184
  • 批准年份:
    2022
  • 资助金额:
    53.00 万元
  • 项目类别:
    面上项目

相似海外基金

Executive functions in urban Hispanic/Latino youth: exposure to mixture of arsenic and pesticides during childhood
城市西班牙裔/拉丁裔青年的执行功能:童年时期接触砷和农药的混合物
  • 批准号:
    10751106
  • 财政年份:
    2024
  • 资助金额:
    $ 38.58万
  • 项目类别:
Fluency from Flesh to Filament: Collation, Representation, and Analysis of Multi-Scale Neuroimaging data to Characterize and Diagnose Alzheimer's Disease
从肉体到细丝的流畅性:多尺度神经影像数据的整理、表示和分析,以表征和诊断阿尔茨海默病
  • 批准号:
    10462257
  • 财政年份:
    2023
  • 资助金额:
    $ 38.58万
  • 项目类别:
University of Wisconsin Prostate SPORE
威斯康星大学前列腺孢子
  • 批准号:
    10555398
  • 财政年份:
    2023
  • 资助金额:
    $ 38.58万
  • 项目类别:
Iron deficits and their relationship with symptoms and cognition in Psychotic Spectrum Disorders
铁缺乏及其与精神病谱系障碍症状和认知的关系
  • 批准号:
    10595270
  • 财政年份:
    2023
  • 资助金额:
    $ 38.58万
  • 项目类别:
A place-based approach to geographic disparities in lung transplant
基于地点的肺移植地理差异方法
  • 批准号:
    10655779
  • 财政年份:
    2023
  • 资助金额:
    $ 38.58万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了