Statistical and Computational Tools for Next-generation ChIP-seq Applications

用于下一代 ChIP-seq 应用的统计和计算工具

基本信息

  • 批准号:
    8342445
  • 负责人:
  • 金额:
    $ 32.4万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2012
  • 资助国家:
    美国
  • 起止时间:
    2012-09-12 至 2015-05-31
  • 项目状态:
    已结题

项目摘要

DESCRIPTION (provided by applicant): ChIP-seq is a powerful technology to map genome-wide protein-DNA interactions (PDIs). It is increasingly used by scientists worldwide to study how gene activities are controlled in normal cells and why they are disrupted in diseases. Applying ChIP-seq to study gene regulation faces three major challenges: (1) how to analyze large ChIP-seq data sets to discover dynamic changes of gene regulation across different biological contexts, (2) how to infer global regulatory programs under the practical constraint that it is not feasible to conduct ChIP-seq for all transcription factors (TFs), and (3) how to analyze allele-specific events given the small amount of data at heterozygote SNPs which cause low statistical power. This study investigates novel statistical and computational solutions to address the challenges above. First, a new method will be developed to discover and characterize dynamic changes of gene regulation across different biological contexts. This method, Generalized Differential Principal Component Analysis (dPCA/GDPCA), integrates unsupervised pattern discovery, dimension reduction and statistical inference into a single statistical framework. It provides a systematic solution to analyze quantitative and curve shape changes in large ChIP-seq data sets involving multiple proteins. It is expected to have a wide range of applications. Second, a computational framework will be developed to predict global gene regulation dynamics, i.e., dynamic changes of downstream regulatory events of all TFs for which DNA binding motif information is available. The analysis integrates the dynamic changes of histone modification ChIP-seq, DNase-seq, and FAIRE-seq data with DNA sequences, public ChIP-seq, and public gene expression data. It will provide a practical, affordable, and reasonably accurate solution to utilizing ChIP-seq to study many TFs simultaneously. A systematic benchmark study will also be con- ducted to evaluate the impact of technologies, data types and analytical methods on prediction performance. This benchmark study will provide guidelines for designing informative future experiments. Third, a method for detecting allele-specific protein-DNA binding (ASB) will be developed. The method is able to integrate information from multiple ChIP-seq data sets and completely phased genome sequences to significantly improve the statistical power of ASB inference. Various sources of biases will also be handled. Guidelines and new analytical tools generated by this study will allow one to design informative ChIP-seq experiments in the future such that by collecting one set of ChIP-seq data, one can not only identify locations of PDIs, but also infer global dynamic changes of TF binding sites across different biological contexts, and, if genotype data are available, robustly analyze allele-specific gene regulation. This will make ChIP-seq a low-cost high-reward experiment that serves multiple purposes. By significantly expanding the utility and increasing the power of ChIP-seq, our computational infrastructure is expected to have a major impact on advancing future studies of gene regulation and dissections of regulatory mechanisms behind human diseases. PUBLIC HEALTH RELEVANCE: ChIP-seq is a powerful technology to analyze how genes' activities are controlled in normal cells and diseases. This proposal develops statistical and computational tools urgently needed by scientists to analyze large and complex ChIP-seq data sets. By allowing one to examine dynamic changes of global gene regulatory programs across different biological contexts, the new computational technologies developed in this proposal are expected to have a major impact on advancing future studies of regulatory mechanisms behind human diseases.
描述(由申请人提供):CHIP-SEQ是绘制全基因组蛋白-DNA相互作用(PDIS)的强大技术。它越来越多地被全世界的科学家使用,以研究如何在正常细胞中控制基因活性,以及​​为什么它们在疾病中受到破坏。应用CHIP-SEQ研究基因调节面临三个主要挑战:(1)如何分析大型芯片seq数据集,以发现不同生物学环境中基因调节的动态变化,(2)如何在实际约束下推断全球监管程序,以至于对所有转录因素进行chip-serce shore(tfs andece shore)(tfs and)(tfs and tfs andece shore shore)(3)和(tfs a tfs sy)(tfs and)(tfs)(3)(3),以及(3)。杂合子SNP会导致低统计功率。 这项研究研究了新型的统计和计算解决方案 解决上述挑战。首先,将开发一种新方法,以发现和表征不同生物学环境中基因调节的动态变化。该方法是广义差异主成分分析(DPCA/GDPCA),将无监督的模式发现,降低维度和统计推断整合到一个单个统计框架中。它提供了一个系统的解决方案,以分析涉及多种蛋白质的大型芯片序列数据集中的定量和曲线形状变化。预计它将具有广泛的应用。其次,将开发一个计算框架来预测全局基因调控动力学,即所有TFS的下游调节事件的动态变化,其中DNA结合基序信息可获得。该分析将组蛋白修饰芯片seq,dnase-seq和faire-seq数据与DNA序列,公共芯片seq和公共基因表达数据的动态变化集成在一起。它将提供一种实用,负担得起且合理准确的解决方案,以同时利用CHIP-SEQ研究许多TF。还将进行一项系统的基准研究,以评估技术,数据类型和分析方法对预测性能的影响。这项基准研究将为设计信息丰富的未来实验提供指南。第三,将开发一种检测等位基因特异性蛋白-DNA结合(ASB)的方法。该方法能够整合来自多个CHIP-SEQ数据集的信息和完全分阶段的基因组序列,以显着提高ASB推断的统计能力。也将处理各种偏见来源。 这项研究生成的指南和新的分析工具将使人们可以在将来设计信息丰富的芯片seq实验,以便通过收集一组芯片seq数据,不仅可以识别PDI的位置,而且可以推断出在不同生物学上下文中的TF结合站点的全球动态变化,以及基因观念跨基因型数据的可用性,可以很好地分析基因型数据。这将使Chip-Seq成为具有多种用途的低成本高回报实验。通过显着扩大效用并提高芯片序列的力量,我们的计算基础设施有望对推进人类疾病背后的监管机制的未来研究和解剖学的研究产生重大影响。 公共卫生相关性:CHIP-SEQ是一项强大的技术,可以分析在正常细胞和疾病中如何控制基因活动。该建议开发了科学家迫切需要的统计和计算工具,以分析大型且复杂的芯片seq数据集。通过允许一个人在不同的生物环境中检查全球基因调节计划的动态变化,预计该提案中开发的新计算技术将对推进人类疾病背后的监管机制的未来研究产生重大影响。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Hongkai Ji其他文献

Hongkai Ji的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Hongkai Ji', 18)}}的其他基金

Immune Development Across the Life Course: Integrating Exposures and Multi-Omics in the Boston Birth Cohort
整个生命过程中的免疫发展:在波士顿出生队列中整合暴露和多组学
  • 批准号:
    10418079
  • 财政年份:
    2022
  • 资助金额:
    $ 32.4万
  • 项目类别:
Immune Development Across the Life Course: Integrating Exposures and Multi-Omics in the Boston Birth Cohort
整个生命过程中的免疫发展:在波士顿出生队列中整合暴露和多组学
  • 批准号:
    10704536
  • 财政年份:
    2022
  • 资助金额:
    $ 32.4万
  • 项目类别:
Computational tools for regulome mapping using single-cell genomic data
使用单细胞基因组数据进行调节组图谱的计算工具
  • 批准号:
    10205134
  • 财政年份:
    2019
  • 资助金额:
    $ 32.4万
  • 项目类别:
Computational tools for regulome mapping using single-cell genomic data
使用单细胞基因组数据进行调节组图谱的计算工具
  • 批准号:
    10443743
  • 财政年份:
    2019
  • 资助金额:
    $ 32.4万
  • 项目类别:
Computational tools for regulome mapping using single-cell genomic data
使用单细胞基因组数据进行调节组图谱的计算工具
  • 批准号:
    10001077
  • 财政年份:
    2019
  • 资助金额:
    $ 32.4万
  • 项目类别:
Big Data Methods for Decoding Gene Regulation
解码基因调控的大数据方法
  • 批准号:
    10171879
  • 财政年份:
    2018
  • 资助金额:
    $ 32.4万
  • 项目类别:
Big Data Methods for Decoding Gene Regulation
解码基因调控的大数据方法
  • 批准号:
    9762143
  • 财政年份:
    2018
  • 资助金额:
    $ 32.4万
  • 项目类别:
Computational Tools for Mining Large Amounts of ChIP and Gene Expression Data
用于挖掘大量 ChIP 和基因表达数据的计算工具
  • 批准号:
    8516554
  • 财政年份:
    2012
  • 资助金额:
    $ 32.4万
  • 项目类别:
Computational Tools for Mining Large Amounts of ChIP and Gene Expression Data
用于挖掘大量 ChIP 和基因表达数据的计算工具
  • 批准号:
    8372529
  • 财政年份:
    2012
  • 资助金额:
    $ 32.4万
  • 项目类别:
Statistical and Computational Tools for Next-generation ChIP-seq Applications
用于下一代 ChIP-seq 应用的统计和计算工具
  • 批准号:
    8543753
  • 财政年份:
    2012
  • 资助金额:
    $ 32.4万
  • 项目类别:

相似国自然基金

时空序列驱动的神经形态视觉目标识别算法研究
  • 批准号:
    61906126
  • 批准年份:
    2019
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
本体驱动的地址数据空间语义建模与地址匹配方法
  • 批准号:
    41901325
  • 批准年份:
    2019
  • 资助金额:
    22.0 万元
  • 项目类别:
    青年科学基金项目
大容量固态硬盘地址映射表优化设计与访存优化研究
  • 批准号:
    61802133
  • 批准年份:
    2018
  • 资助金额:
    23.0 万元
  • 项目类别:
    青年科学基金项目
IP地址驱动的多径路由及流量传输控制研究
  • 批准号:
    61872252
  • 批准年份:
    2018
  • 资助金额:
    64.0 万元
  • 项目类别:
    面上项目
针对内存攻击对象的内存安全防御技术研究
  • 批准号:
    61802432
  • 批准年份:
    2018
  • 资助金额:
    25.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Identification of gene variants mediating the behavioral and physiological response to THC
鉴定介导 THC 行为和生理反应的基因变异
  • 批准号:
    10660808
  • 财政年份:
    2023
  • 资助金额:
    $ 32.4万
  • 项目类别:
Genetic and Environmental Influences on Individual Sweet Preference Across Ancestry Groups in the U.S.
遗传和环境对美国不同血统群体个体甜味偏好的影响
  • 批准号:
    10709381
  • 财政年份:
    2023
  • 资助金额:
    $ 32.4万
  • 项目类别:
Elucidating the ancestry-specific genetic and environmental architecture of cardiometabolic traits across All of Us ethnic groups
阐明我们所有种族群体心脏代谢特征的祖先特异性遗传和环境结构
  • 批准号:
    10796028
  • 财政年份:
    2023
  • 资助金额:
    $ 32.4万
  • 项目类别:
Identification of components and mechanisms regulating expanded CUG-repeat RNP complexes in Myotonic Dystrophy Type 1 muscle cells
强直性肌营养不良 1 型肌细胞中调节扩展 CUG 重复 RNP 复合物的成分和机制的鉴定
  • 批准号:
    10667708
  • 财政年份:
    2023
  • 资助金额:
    $ 32.4万
  • 项目类别:
Extracellular Matrix Remodeling and the Control of Invasive Lobular Carcinoma Progression
细胞外基质重塑和侵袭性小叶癌进展的控制
  • 批准号:
    10677993
  • 财政年份:
    2023
  • 资助金额:
    $ 32.4万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了