Machine learning methods to impute and annotate epigenomic maps

用于估算和注释表观基因组图谱的机器学习方法

基本信息

  • 批准号:
    8814095
  • 负责人:
  • 金额:
    $ 28.51万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2014
  • 资助国家:
    美国
  • 起止时间:
    2014-09-10 至 2016-08-31
  • 项目状态:
    已结题

项目摘要

DESCRIPTION (provided by applicant): The NIH Roadmap Epigenomics Program has produced reference epigenomic maps derived from a variety of human primary cells and tissues, including pluripotent cell types and in vitro differentiated forms, highly purified primar cells, and a range of fetal and adult tissues. The goal of the proposed project is to develop, validate and apply unsupervised machine learning methods to the joint analysis of these epigenomic maps along with (1) data generated by the NIH ENCODE Consortium, (2) a variety of publicly available data sets that characterize the three-dimensional structure of DNA in the nucleus, and (3) information about evolutionary conservation, represented by cross-species DNA alignments. The first aim of the project will use data imputation methods to carry out virtual functional genomics experiments. The proposed method is based on techniques developed in the context of recommender systems, but is extended to model dependencies along the genomic axis. By simultaneously analyzing the pattern of biochemical activity across a range of cell types and assay types, the proposed imputation method will accurately predict the results of an assay, such as ChIP-seq for a particular histone modification in a particular cell type, that has not yet been carried out. We will systematically apply this method to Roadmap Epigenomics and ENCODE data, filling in missing experiments in the matrix of cell types and assay types. The remaining three specific aims extend and apply our existing system for semi-automated genome annotation, Segway, which integrates a wide variety of functional genomics data into a human interpretable labeling of genomic elements. These analyses will be performed on real data as well as the virtual experiments from Aim 1. We propose a novel, graph-based regularization scheme and show how, using this approach, we can use Segway to perform integrated analysis of data across cell types and integrate 3D genome architecture information from assays such as Hi-C. We also propose a post-processing method to exploit patterns of evolutionary conservation to identify functionally important labels in the resulting annotations. The primary deliverables will include novel software for imputation and annotation, as well as publicly available sets of virtual experiments and genome annotations.
描述(由申请人提供):NIH路线图表观基因组学计划已产生了来自各种人类原代细胞和组织(包括多能细胞类型和体外分化形式),高度纯化的原始细胞以及一系列胎儿和成人组织的参考表观基因组图。拟议项目的目的是开发,验证和应用无监督的机器学习方法对这些表观基因组图的联合分析以及(1)由NIH编码协会生成的(1)数据,(2)多种可公开可用的数据集,这些数据集表征了核中DNA的三维结构的多种多样的数据集,并以交叉保护为代表的信息,代表了crossectians ander nna,代表了crossectians contecties contecies nna。该项目的第一个目的将使用数据插补方法进行虚拟功能基因组学实验。提出的方法基于在推荐系统的背景下开发的技术,但扩展到沿基因组轴的模型依赖性。通过同时分析各种细胞类型和测定类型的生化活性模式,提出的插补方法将准确预测测定的结果,例如在特定细胞类型中特定组蛋白修饰的chip-seq,尚未进行。我们将系统地将此方法应用于路线图表观基因组学和编码数据,并填充细胞类型和测定类型的矩阵中缺少的实验。其余的三个特定目的扩展并应用了我们现有的系统进行半自动基因组注释Segway,该系统将各种功能基因组数据集成到人类的基因组元素的可解释标记中。这些分析将在实际数据以及AIM 1的虚拟实验上进行。我们提出了一种基于图形的新颖正则化方案,并显示如何使用这种方法使用SEGWAY对跨单元类型进行数据进行集成分析,并从HI-C等测定中集成了3D基因组体系结构信息。我们还提出了一种后处理方法,以利用进化保守的模式,以识别所得注释中功能上重要的标签。主要的可交付成果将包括用于插补和注释的新型软件,以及可公开可用的虚拟实验和基因组注释。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

William Stafford Noble其他文献

A biologist ’ s introduction to support vector machines
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    William Stafford Noble
  • 通讯作者:
    William Stafford Noble
Learning a latent representation of human genomics using Avocado
使用鳄梨学习人类基因组学的潜在表示
  • DOI:
    10.1101/2020.06.18.159756
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Jacob M. Schreiber;William Stafford Noble
  • 通讯作者:
    William Stafford Noble
Self‐Reports about Tinnitus and about Cochlear Implants
关于耳鸣和人工耳蜗的自我报告
  • DOI:
    10.1097/00003446-200008001-00007
  • 发表时间:
    2000
  • 期刊:
  • 影响因子:
    3.7
  • 作者:
    William Stafford Noble
  • 通讯作者:
    William Stafford Noble
A COMPARATIVE ANALYSIS OF THE CLINICAL AND FUNCTIONAL OUTCOME OF HIGH FLEXION AND STANDARD TOTAL KNEE REPLACEMENT PROSTHESIS
高屈度与标准全膝关节置换假肢临床及功能结果的比较分析
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    T. Pramila;Wei Wu;William Stafford Noble;L. Breeden
  • 通讯作者:
    L. Breeden
Cohesin interacts with a panoply of splicing factors required for cell cycle progression and genomic organization
粘连蛋白与细胞周期进程和基因组组织所需的一系列剪接因子相互作用
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Jung‐Sik Kim;Xiaoyuan He;Jie Liu;Z. Duan;Taeyeon Kim;J. Gerard;Brian S. Kim;William Arbuthnot Sir Lane;William Stafford Noble;B. Budnik;T. Waldman
  • 通讯作者:
    T. Waldman

William Stafford Noble的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('William Stafford Noble', 18)}}的其他基金

Deep tensor genomic imputation
深度张量基因组插补
  • 批准号:
    10557916
  • 财政年份:
    2021
  • 资助金额:
    $ 28.51万
  • 项目类别:
Deep tensor genomic imputation
深度张量基因组插补
  • 批准号:
    10096947
  • 财政年份:
    2021
  • 资助金额:
    $ 28.51万
  • 项目类别:
Optimization and joint modeling for peptide detection by tandem mass spectrometry
串联质谱肽检测的优化和联合建模
  • 批准号:
    9214942
  • 财政年份:
    2017
  • 资助金额:
    $ 28.51万
  • 项目类别:
Project 2: UW-CNOF Data Analysis and Modeling
项目 2:UW-CNOF 数据分析和建模
  • 批准号:
    9021413
  • 财政年份:
    2015
  • 资助金额:
    $ 28.51万
  • 项目类别:
University of Washington Center for Nuclear Organization and Function
华盛顿大学核组织与功能中心
  • 批准号:
    9983850
  • 财政年份:
    2015
  • 资助金额:
    $ 28.51万
  • 项目类别:
University of Washington Center for Nuclear Organization and Function
华盛顿大学核组织与功能中心
  • 批准号:
    9353379
  • 财政年份:
    2015
  • 资助金额:
    $ 28.51万
  • 项目类别:
University of Washington Center for Nuclear Organization and Function
华盛顿大学核组织与功能中心
  • 批准号:
    9916567
  • 财政年份:
    2015
  • 资助金额:
    $ 28.51万
  • 项目类别:
Machine learning methods to impute and annotate epigenomic maps
用于估算和注释表观基因组图谱的机器学习方法
  • 批准号:
    8925082
  • 财政年份:
    2014
  • 资助金额:
    $ 28.51万
  • 项目类别:
BIGDATA: DA: Interpreting massive genomic data sets via summarization
BIGDATA:DA:通过汇总解释海量基因组数据集
  • 批准号:
    8642168
  • 财政年份:
    2013
  • 资助金额:
    $ 28.51万
  • 项目类别:
BIGDATA: DA: Interpreting massive genomic data sets via summarization
BIGDATA:DA:通过汇总解释海量基因组数据集
  • 批准号:
    8840551
  • 财政年份:
    2013
  • 资助金额:
    $ 28.51万
  • 项目类别:

相似国自然基金

成人型弥漫性胶质瘤患者语言功能可塑性研究
  • 批准号:
    82303926
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
MRI融合多组学特征量化高级别成人型弥漫性脑胶质瘤免疫微环境并预测术后复发风险的研究
  • 批准号:
    82302160
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
SMC4/FoxO3a介导的CD38+HLA-DR+CD8+T细胞增殖在成人斯蒂尔病MAS发病中的作用研究
  • 批准号:
    82302025
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
融合多源异构数据应用深度学习预测成人肺部感染病原体研究
  • 批准号:
    82302311
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Integrating Genomic Risk Assessment for Chronic Disease Management in a Diverse Population
整合基因组风险评估以进行不同人群的慢性病管理
  • 批准号:
    10852376
  • 财政年份:
    2023
  • 资助金额:
    $ 28.51万
  • 项目类别:
Genetics and epigenetics of pediatric germ cell tumors
儿童生殖细胞肿瘤的遗传学和表观遗传学
  • 批准号:
    10364222
  • 财政年份:
    2022
  • 资助金额:
    $ 28.51万
  • 项目类别:
Outcomes for Children with Asthma on Medicaid: Elucidating Key Determinants at the Policy, Plan, Neighborhood, and Person Levels to Address Disparities.
哮喘儿童医疗补助的结果:阐明政策、计划、社区和个人层面的关键决定因素,以解决差异。
  • 批准号:
    10609527
  • 财政年份:
    2022
  • 资助金额:
    $ 28.51万
  • 项目类别:
Outcomes for Children with Asthma on Medicaid: Elucidating Key Determinants at the Policy, Plan, Neighborhood, and Person Levels to Address Disparities.
哮喘儿童医疗补助的结果:阐明政策、计划、社区和个人层面的关键决定因素,以解决差异。
  • 批准号:
    10429507
  • 财政年份:
    2022
  • 资助金额:
    $ 28.51万
  • 项目类别:
Computational Imaging of Renal Structures for Diagnosing DiabeticNephropathy
用于诊断糖尿病肾病的肾脏结构计算成像
  • 批准号:
    10665182
  • 财政年份:
    2022
  • 资助金额:
    $ 28.51万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了