Computational Tools for Mining Large Amounts of ChIP and Gene Expression Data

用于挖掘大量 ChIP 和基因表达数据的计算工具

基本信息

  • 批准号:
    8660318
  • 负责人:
  • 金额:
    $ 39.59万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2012
  • 资助国家:
    美国
  • 起止时间:
    2012-07-25 至 2017-04-30
  • 项目状态:
    已结题

项目摘要

DESCRIPTION (provided by applicant): ChIP-seq and ChIP-chip, hereinafter referred to as ChIPx, are powerful technologies to map genome-wide protein-DNA interactions (PDIs). Microarray, exon array and RNA-seq, on the other hand, are widely used to measure gene expression. Integrating ChIPx and gene expression data provides a powerful approach to study gene regulation both during development and in diseases. Traditionally, ChIPx and gene expression experiments conducted by a single laboratory are mainly used to study a specific biological system. The collective efforts of many labs have resulted in a large volume of data representing diverse biological systems. Jointly, these data contain enormous amounts of information that have not been fully utilized by each individual lab. This proposal aims to develop a coordinated set of computational, statistical and software tools to allow scientists to synthesize information in 3000+ publicly available ChIPx samples and 60,000+ gene expression profiles in human and mouse to make new discoveries. The project will turn these heterogeneous data into a tool for high-throughput discovery of biological contexts (i.e., cell types, tissues and diseases) associated with gene regulatory pathway activities. First, a statistical method named Gene Set Context Analysis (GSCA) will be developed. GSCA utilizes large amounts of public gene expression data to infer biological contexts and diseases in which one or more gene sets (i.e., groups of genes) are coordinately activated or inactivated. Second, based on the GSCA, a method called Transcription Factor Context Analysis (TFCA) will be developed. TFCA discovers novel functional contexts of transcription factors (TFs) and gene regulatory pathways. This method first classifies target genes of a TF into different functional categories by integrating one's own ChIPx and gene expression data with public ChIPx and Gene Ontology data. It then uses GSCA to systematically discover biological contexts (including diseases) associated with the function of each category. Collectively, GSCA and TFCA will establish a new paradigm for analyzing ChIPx and gene expression data. The conventional approach analyzes data tied to a particular system. In the new approach, one also leverages the rich information in public ChIPx and gene expression data to extend findings in one system to other biological systems. By allowing one to make novel discoveries beyond the scope of the original experiments and connect gene regulatory pathways to diseases, the new approach will significantly increase the value of both new and existing data. Applying GSCA and TFCA, 3000+ ChIPx samples and 60,000+ gene expression samples in human and mouse will be analyzed together to systematically map TF functions and ChIPx defined regulatory pathway activ- ities to diseases. Some new predictions will be validated experimentally. In addition to creating new knowledge about a variety of diseases, this research will provide urgently needed data integration and data mining tools to help scientists to translate the rich information in the publicly available ChIPx and gene expression data into new discoveries, and identify promising new areas of biomedical research.
描述(由申请人提供):ChIP-seq 和 ChIP-chip(以下简称 ChIPx)是绘制全基因组蛋白质-DNA 相互作用(PDI)的强大技术。另一方面,微阵列、外显子阵列和RNA-seq被广泛用于测量基因表达。 ChIPx 和基因表达数据的整合为研究发育过程和疾病中的基因调控提供了一种强大的方法。传统上,由单个实验室进行的 ChIPx 和基因表达实验主要用于研究特定的生物系统。许多实验室的集体努力产生了代表不同生物系统的大量数据。这些数据共同包含大量尚未被每个实验室充分利用的信息。 该提案旨在开发一套协调一致的计算、统计和软件工具,使科学家能够综合 3000 多个公开的 ChIPx 样本以及 60,000 多个人类和小鼠基因表达谱中的信息,从而做出新的发现。该项目将把这些异质数据转化为高通量发现与基因调控途径活动相关的生物背景(即细胞类型、组织和疾病)的工具。首先,将开发一种名为基因集背景分析(GSCA)的统计方法。 GSCA 利用大量公共基因表达数据来推断一个或多个基因集(即基因组)协同激活或失活的生物学背景和疾病。其次,基于 GSCA,将开发一种称为转录因子上下文分析(TFCA)的方法。 TFCA 发现了转录因子 (TF) 和基因调控途径的新功能背景。该方法首先通过将自己的 ChIPx 和基因表达数据与公共 ChIPx 和基因本体数据相结合,将 TF 的目标基因分为不同的功能类别。然后,它使用 GSCA 系统地发现与每个类别的功能相关的生物学背景(包括疾病)。 GSCA 和 TFCA 将共同建立一个分析 ChIPx 和基因表达数据的新范例。传统方法分析与特定系统相关的数据。在新方法中,人们还利用公共 ChIPx 和基因表达数据中的丰富信息,将一个系统中的发现扩展到其他生物系统。通过允许人们做出超出原始实验范围的新发现并将基因调控途径与疾病联系起来,新方法将显着增加新数据和现有数据的价值。 应用 GSCA 和 TFCA,将一起分析 3000 多个 ChIPx 样本和 60,000 多个人类和小鼠基因表达样本,以系统地绘制 TF 功能和 ChIPx 定义的疾病调节途径活性。一些新的预测将通过实验得到验证。除了创造有关多种疾病的新知识外,该研究还将提供急需的数据集成和数据挖掘工具,帮助科学家将公开的 ChIPx 和基因表达数据中的丰富信息转化为新发现,并识别有前景的新领域的生物医学研究。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Hongkai Ji其他文献

Hongkai Ji的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Hongkai Ji', 18)}}的其他基金

Immune Development Across the Life Course: Integrating Exposures and Multi-Omics in the Boston Birth Cohort
整个生命过程中的免疫发展:在波士顿出生队列中整合暴露和多组学
  • 批准号:
    10704536
  • 财政年份:
    2022
  • 资助金额:
    $ 39.59万
  • 项目类别:
Immune Development Across the Life Course: Integrating Exposures and Multi-Omics in the Boston Birth Cohort
整个生命过程中的免疫发展:在波士顿出生队列中整合暴露和多组学
  • 批准号:
    10704536
  • 财政年份:
    2022
  • 资助金额:
    $ 39.59万
  • 项目类别:
Immune Development Across the Life Course: Integrating Exposures and Multi-Omics in the Boston Birth Cohort
整个生命过程中的免疫发展:在波士顿出生队列中整合暴露和多组学
  • 批准号:
    10418079
  • 财政年份:
    2022
  • 资助金额:
    $ 39.59万
  • 项目类别:
Computational tools for regulome mapping using single-cell genomic data
使用单细胞基因组数据进行调节组图谱的计算工具
  • 批准号:
    10205134
  • 财政年份:
    2019
  • 资助金额:
    $ 39.59万
  • 项目类别:
Computational tools for regulome mapping using single-cell genomic data
使用单细胞基因组数据进行调节组图谱的计算工具
  • 批准号:
    10443743
  • 财政年份:
    2019
  • 资助金额:
    $ 39.59万
  • 项目类别:
Computational tools for regulome mapping using single-cell genomic data
使用单细胞基因组数据进行调节组图谱的计算工具
  • 批准号:
    10001077
  • 财政年份:
    2019
  • 资助金额:
    $ 39.59万
  • 项目类别:
Big Data Methods for Decoding Gene Regulation
解码基因调控的大数据方法
  • 批准号:
    10171879
  • 财政年份:
    2018
  • 资助金额:
    $ 39.59万
  • 项目类别:
Big Data Methods for Decoding Gene Regulation
解码基因调控的大数据方法
  • 批准号:
    9762143
  • 财政年份:
    2018
  • 资助金额:
    $ 39.59万
  • 项目类别:
Statistical and Computational Tools for Next-generation ChIP-seq Applications
用于下一代 ChIP-seq 应用的统计和计算工具
  • 批准号:
    8666661
  • 财政年份:
    2012
  • 资助金额:
    $ 39.59万
  • 项目类别:
Computational Tools for Mining Large Amounts of ChIP and Gene Expression Data
用于挖掘大量 ChIP 和基因表达数据的计算工具
  • 批准号:
    8372529
  • 财政年份:
    2012
  • 资助金额:
    $ 39.59万
  • 项目类别:

相似国自然基金

青藏高原不同区域冰川中微生物类脂物GDGTs的分布特征及其气候环境意义
  • 批准号:
    42371155
  • 批准年份:
    2023
  • 资助金额:
    52 万元
  • 项目类别:
    面上项目
南海周边生物质燃烧与区域气候及社会经济相互作用研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    55 万元
  • 项目类别:
    面上项目
内蒙古高原生态系统生物源挥发性有机物排放量对区域环境臭氧浓度影响
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    33 万元
  • 项目类别:
    地区科学基金项目
区域稻田镉生物有效性差异关键机制与定量预测
  • 批准号:
    42277385
  • 批准年份:
    2022
  • 资助金额:
    53 万元
  • 项目类别:
    面上项目
基于物质代谢的区域生物天然气供应链系统集成方法及资源环境效应研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    53 万元
  • 项目类别:
    面上项目

相似海外基金

Executive functions in urban Hispanic/Latino youth: exposure to mixture of arsenic and pesticides during childhood
城市西班牙裔/拉丁裔青年的执行功能:童年时期接触砷和农药的混合物
  • 批准号:
    10751106
  • 财政年份:
    2024
  • 资助金额:
    $ 39.59万
  • 项目类别:
University of Wisconsin Prostate SPORE
威斯康星大学前列腺孢子
  • 批准号:
    10555398
  • 财政年份:
    2023
  • 资助金额:
    $ 39.59万
  • 项目类别:
Developing Autophagy-Targeting Chimeras and Optimizing Cell Penetration of Large-Molecule Therapeutics
开发自噬靶向嵌合体并优化大分子治疗的细胞渗透
  • 批准号:
    10558145
  • 财政年份:
    2023
  • 资助金额:
    $ 39.59万
  • 项目类别:
Translational genomics in gout: From GWAS signal to mechanism
痛风的转化基因组学:从 GWAS 信号到机制
  • 批准号:
    10735151
  • 财政年份:
    2023
  • 资助金额:
    $ 39.59万
  • 项目类别:
Incorporating residential histories into assessment of cancer risk in a predominantly low-income and racially diverse population
将居住史纳入以低收入和种族多元化为主的人群的癌症风险评估中
  • 批准号:
    10735164
  • 财政年份:
    2023
  • 资助金额:
    $ 39.59万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了