SVM-based Analysis of the Fine Scale Structure of Regulatory Elements

基于支持向量机的监管要素精细尺度结构分析

基本信息

  • 批准号:
    9304811
  • 负责人:
  • 金额:
    $ 46.97万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2013
  • 资助国家:
    美国
  • 起止时间:
    2013-09-13 至 2019-06-30
  • 项目状态:
    已结题

项目摘要

DESCRIPTION (provided by applicant): The ENCODE projects have generated large high-quality functional genomic datasets which have the potential to dramatically impact our understanding of the specific mechanisms and general principles of the function of cell-specific regulatory elements. We propose to develop an SVM-based computational model to predict enhancers from these datsets and resolve their fine- scale structure. We will utilize an integrative approach to investigate these fine scale features which combines novel computational development, statistical analysis of ENCODE datasets, systematic scoring of human sequence variation, and high throughput validation to improve our understanding of how DNA sequence features and variation contribute to regulatory function. Based on our previous work using k-mer features to predict mammalian enhancers from genomic DNA sequence, we propose improvements in the treatment of sequence features which facilitate statistically robust estimation of long k-mer features and improved spatial resolution. This approach does not rely on previous biological knowledge, and uncovers the sets of novel TFs and cofactors which specify their cell-specific activity. We will train this model on ENCODE DNase-seq and ChIP-seq data and catalogue the regulatory elements in the available human cell-line and mouse datasets. In addition, this model makes specific predictions of the contributions of individual features to enhancer activity, so we propose to experimentally test this set of predictions by directly quantifying the impact of mutation of these elements in a luciferase reporter system. Finally we will evaluate and experimentally assess the predicted impact of specific human SNPs in a set of targeted cell lines. This project should contribute significantly toward a predictive model of regulatory element function and an understanding of how sequence variation impacts disease.
描述(由申请人提供):编码项目已经生成了大型高质量功能基因组数据集,这些数据集有可能极大地影响我们对细胞特定调节元素功能的特定机制和一般原理的理解。我们建议开发一个基于SVM的计算模型,以预测这些数据集中的增强子并解决其精细规模结构。我们将利用一种综合方法来研究这些精细的规模特征,这些特征结合了新的计算发展,编码数据集的统计分析,对人类序列变化的系统评分以及高吞吐量验证,以提高我们对DNA序列特征和变异如何有助于调节功能的理解。基于我们以前使用K-MER特征来预测基因组DNA序列的哺乳动物增强子的工作,我们提出改进序列特征的处理,以促进对长K-MER特征的统计稳定估计和改善的空间分辨率。这种方法不依赖以前的生物学知识,并揭示了指定其细胞特异性活性的新型TF和辅助因子的集合。我们将在编码DNase-Seq和Chip-Seq数据上训练该模型,并在可用的人类细胞线和鼠标数据集中对调节元素进行分类。此外,该模型对单个特征对增强活性的贡献进行了具体预测,因此我们建议通过直接量化这些元素在荧光素酶报告基因系统中这些元素的突变的影响来实验测试这一预测。最后,我们将评估并实验评估特定人类SNP在一组靶向细胞系中的预测影响。该项目应对调节元件功能的预测模型产生重大贡献,并了解序列变异如何影响疾病。

项目成果

期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Identification of Predictive Cis-Regulatory Elements Using a Discriminative Objective Function and a Dynamic Search Space.
  • DOI:
    10.1371/journal.pone.0140557
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    3.7
  • 作者:
    Karnik R;Beer MA
  • 通讯作者:
    Beer MA
Enhanced regulatory sequence prediction using gapped k-mer features.
  • DOI:
    10.1371/journal.pcbi.1003711
  • 发表时间:
    2014-07
  • 期刊:
  • 影响因子:
    4.3
  • 作者:
    Ghandi M;Lee D;Mohammad-Noori M;Beer MA
  • 通讯作者:
    Beer MA
共 2 条
  • 1
前往

Michael A Beer其他文献

Machine Learning Sequence Modeling Identifies Gene Regulatory Responses to Bone Marrow Stromal Interactions in Multiple Myeloma
  • DOI:
    10.1182/blood-2023-186981
    10.1182/blood-2023-186981
  • 发表时间:
    2023-11-02
    2023-11-02
  • 期刊:
  • 影响因子:
  • 作者:
    Milad Razavi-Mohseni;Dustin Shigaki;Michael A Beer
    Milad Razavi-Mohseni;Dustin Shigaki;Michael A Beer
  • 通讯作者:
    Michael A Beer
    Michael A Beer
共 1 条
  • 1
前往

Michael A Beer的其他基金

Sequence-based Machine Learning for Inference of Dynamic Cell State Gene Network Models
基于序列的机器学习用于动态细胞状态基因网络模型的推理
  • 批准号:
    10665735
    10665735
  • 财政年份:
    2022
  • 资助金额:
    $ 46.97万
    $ 46.97万
  • 项目类别:
Genomic control of gene regulatory networks governing early human lineage decisions
控制早期人类谱系决策的基因调控网络的基因组控制
  • 批准号:
    10297375
    10297375
  • 财政年份:
    2021
  • 资助金额:
    $ 46.97万
    $ 46.97万
  • 项目类别:
Genomic control of gene regulatory networks governing early human lineagedecisions
控制早期人类谱系决定的基因调控网络的基因组控制
  • 批准号:
    10833813
    10833813
  • 财政年份:
    2021
  • 资助金额:
    $ 46.97万
    $ 46.97万
  • 项目类别:
Genomic control of gene regulatory networks governing early human lineage decisions
控制早期人类谱系决策的基因调控网络的基因组控制
  • 批准号:
    10471939
    10471939
  • 财政年份:
    2021
  • 资助金额:
    $ 46.97万
    $ 46.97万
  • 项目类别:
Genomic control of gene regulatory networks governing early human lineagedecisions
控制早期人类谱系决定的基因调控网络的基因组控制
  • 批准号:
    10840531
    10840531
  • 财政年份:
    2021
  • 资助金额:
    $ 46.97万
    $ 46.97万
  • 项目类别:
Genomic control of gene regulatory networks governing early human lineage decisions
控制早期人类谱系决策的基因调控网络的基因组控制
  • 批准号:
    10630157
    10630157
  • 财政年份:
    2021
  • 资助金额:
    $ 46.97万
    $ 46.97万
  • 项目类别:
Systematic Identification of Core Regulatory Circuitry from ENCODE Data
从 ENCODE 数据系统识别核心监管电路
  • 批准号:
    10238262
    10238262
  • 财政年份:
    2017
  • 资助金额:
    $ 46.97万
    $ 46.97万
  • 项目类别:
SVM-based Analysis of the Fine Scale Structure of Regulatory Elements
基于支持向量机的监管要素精细尺度结构分析
  • 批准号:
    9097757
    9097757
  • 财政年份:
    2013
  • 资助金额:
    $ 46.97万
    $ 46.97万
  • 项目类别:
SVM-based Analysis of the Fine Scale Structure of Regulatory Elements
基于支持向量机的监管要素精细尺度结构分析
  • 批准号:
    8556758
    8556758
  • 财政年份:
    2013
  • 资助金额:
    $ 46.97万
    $ 46.97万
  • 项目类别:
SVM-based Analysis of the Fine Scale Structure of Regulatory Elements
基于支持向量机的监管要素精细尺度结构分析
  • 批准号:
    8889287
    8889287
  • 财政年份:
    2013
  • 资助金额:
    $ 46.97万
    $ 46.97万
  • 项目类别:

相似国自然基金

基于三维结构表征学习的RNA结合蛋白绑定位点预测算法研究
  • 批准号:
    62202152
  • 批准年份:
    2022
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目
基于三维结构表征学习的RNA结合蛋白绑定位点预测算法研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于深度学习的转录因子绑定位点预测方法研究
  • 批准号:
    62002266
  • 批准年份:
    2020
  • 资助金额:
    24 万元
  • 项目类别:
    青年科学基金项目
海量多源互补蛋白质数据的配体绑定位点预测研究
  • 批准号:
    61902352
  • 批准年份:
    2019
  • 资助金额:
    27.0 万元
  • 项目类别:
    青年科学基金项目
用dsDNA微阵列筛选NF-κB DNA靶点及靶基因
  • 批准号:
    60871014
  • 批准年份:
    2008
  • 资助金额:
    35.0 万元
  • 项目类别:
    面上项目

相似海外基金

Small Molecule Degraders of Tryptophan 2,3-Dioxygenase Enzyme (TDO) as Novel Treatments for Neurodegenerative Disease
色氨酸 2,3-双加氧酶 (TDO) 的小分子降解剂作为神经退行性疾病的新疗法
  • 批准号:
    10752555
    10752555
  • 财政年份:
    2024
  • 资助金额:
    $ 46.97万
    $ 46.97万
  • 项目类别:
A role for cardiomyocyte pannexin 1 in non-ischemic heart failure
心肌细胞pannexin 1在非缺血性心力衰竭中的作用
  • 批准号:
    10680109
    10680109
  • 财政年份:
    2023
  • 资助金额:
    $ 46.97万
    $ 46.97万
  • 项目类别:
Investigating the Formation and Function of Subgenomic Flavivirus RNAs During Flavivirus Infection of the Mosquito Vector
研究蚊子载体黄病毒感染过程中亚基因组黄病毒 RNA 的形成和功能
  • 批准号:
    10677398
    10677398
  • 财政年份:
    2023
  • 资助金额:
    $ 46.97万
    $ 46.97万
  • 项目类别:
Biology the initiator: Harnessing Reactive Oxygen Species for Biocompatible Polymerization
生物学引发者:利用活性氧进行生物相容性聚合
  • 批准号:
    10667740
    10667740
  • 财政年份:
    2023
  • 资助金额:
    $ 46.97万
    $ 46.97万
  • 项目类别:
Biophysical, Structural, and Cellular Dissection of COPI-Dependent Retrograde Trafficking Using a Coronavirus Toolkit
使用冠状病毒工具包对 COPI 依赖性逆行贩运进行生物物理、结构和细胞解剖
  • 批准号:
    10646999
    10646999
  • 财政年份:
    2023
  • 资助金额:
    $ 46.97万
    $ 46.97万
  • 项目类别: