Integrated Analysis for Genetic Association and Prediction

遗传关联与预测的综合分析

基本信息

项目摘要

ABSTRACT The overall goal of this project is to develop novel statistical methods for integrative analysis of genomic data in cancer research. We propose to develop analytical tools that can integrate data from multiple genomic platforms and incorporate external omic information from publically available databases. These tools will be applicable to both etiological studies geared toward causal discovery and to clinical and translational studies geared toward predictive modeling. Advances in high-throughput molecular technologies have enabled large-scale omic projects (e.g. Encode, The Cancer Genome Atlas, Epigenome Roadmap) to generate vast amounts of information on the structure, function and regulation of the genome. In addition to this publically available data, individual studies are increasingly generating multiplatform genomic profiles (e.g. genotypes, gene expression, methylation copy number variation, miRNA) to elucidate the complex mechanisms of cancer development and progression, and investigate determinants and predictors of health and clinical outcomes. Integration across these multiple genomic “dimensions” and incorporation of the available external information can increase the ability to discovery causal relationships (e.g. Cancer-SNP associations), enhance prediction and prognosis modeling (e.g. cancer aggressiveness), and provide insights into biological mechanisms. We propose two analytic approaches aimed at addressing the challenges to effective integration across multiplatform genomic data and incorporation of external information from omic projects. The first approach (Aim 1) is a Bayesian regression and feature selection method that can integrate prior omic information in a very flexible manner allowing the data to `speak for itself' to determine which pieces of external information are relevant for the problem at hand. The method works with individual-level data and also with meta-analytic summaries, making it well suited for analyzing data from large multi-study consortia. The second approach (Aim 2) is a regularized regression and feature selection method for integrating multiplatform genomic features measured on the same set of individuals. The method is designed to scale to the very large numbers of features typical of genomewide platforms, to account for the different properties of each genomic data type, and to incorporate relevant external information to increase efficiency. Both approaches can be applied for causal discovery and for developing predictive and prognostic models. We will apply our methods to search for novel risk variants in the CORECT consortium of genome association studies, and to construct a prognostic model of CRC recurrence based on genomewide expression methylation data in the ColoCare consortium cohort of CRC patients. This work will provide new tools for analyzing high-dimensional multi-platform genomic that can take advantage of available external information.
抽象的 该项目的总体目标是开发新颖的统计方法,以整合基因组数据的综合分析 癌症研究。我们建议开发可以从多个基因组中整合数据的分析工具 平台并包含来自公开可用数据库的外部OMIC信息。这些工具将是 适用于两种旨在因果发现以及临床和转化研究的病因研究 面向预测建模。 高通量分子技术的进步已经实现了大规模的OMIC项目(例如编码, 癌症基因组图集,表观基因组路线图),以产生有关该结构的大量信息, 基因组的功能和调节。除了这些公开可用的数据外,个别研究是 越来越多地产生乘数基因组谱(例如基因型,基因表达,甲基化拷贝 数量变化,miRNA),以阐明癌症发展和进展的复杂机制,以及 调查确定和预测健康和临床结果。这些倍数的集成 基因组“维度”和可用外部信息的结合可以增加 发现因果关系(例如癌症-SNP关联),增强预测和预后建模 (例如,癌症的侵略性),并提供了对生物学机制的见解。我们提出了两个分析 旨在应对跨乘数基因组数据和有效整合的挑战的方法 从OMIC项目中纳入外部信息。第一种方法(AIM 1)是贝叶斯回归 和特征选择方法,可以以非常灵活的方式集成先前的OMIC信息,从而允许 数据以“自言自语”,以确定哪些外部信息与当前的问题有关。 该方法可与单个级别的数据以及荟萃分析摘要一起使用,使其非常适合 分析来自大型多研究联盟的数据。第二种方法(AIM 2)是正规化回归, 用于整合在同一集中测量的乘数基因组特征的特征选择方法 个人。该方法旨在扩展到基因组的典型特征 平台,以说明每种基因组数据类型的不同属性,并结合相关 外部信息以提高效率。两种方法都可以用于因果发现和 开发预测和预后模型。我们将应用我们的方法来搜索新颖的风险变体 基因组关联研究的Corect联盟,并构建了CRC复发的预后模型 基于CRC患者的Colocare联盟队列中的全基因组表达甲基化数据。这 工作将为分析的高维多平台基因组提供新的工具,可以采用 可用外部信息的优势。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Juan Pablo Lewinger其他文献

Juan Pablo Lewinger的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Juan Pablo Lewinger', 18)}}的其他基金

LA’s Biostatistics and Data Science Training Program (LA’s BeST)
洛杉矶生物统计学和数据科学培训计划 (LAâs BeST)
  • 批准号:
    10368449
  • 财政年份:
    2022
  • 资助金额:
    $ 38.98万
  • 项目类别:
LA’s Biostatistics and Data Science Training Program (LA’s BeST)
洛杉矶生物统计学和数据科学培训计划 (LAâs BeST)
  • 批准号:
    10590701
  • 财政年份:
    2022
  • 资助金额:
    $ 38.98万
  • 项目类别:
LA’s Biostatistics Education Summer Training Program (LA’s BEST @USC)
洛杉矶生物统计教育暑期培训计划(洛杉矶 BEST @USC)
  • 批准号:
    9894852
  • 财政年份:
    2019
  • 资助金额:
    $ 38.98万
  • 项目类别:
High-Dimensional Regression for Data Integration
数据集成的高维回归
  • 批准号:
    10707448
  • 财政年份:
    2016
  • 资助金额:
    $ 38.98万
  • 项目类别:
High-Dimensional Regression for Data Integration
数据集成的高维回归
  • 批准号:
    10411239
  • 财政年份:
    2016
  • 资助金额:
    $ 38.98万
  • 项目类别:

相似国自然基金

基于机器学习算法的针刺干预偏头痛预后差异生物学机制和临床-多组学预测模型构建研究
  • 批准号:
    82374572
  • 批准年份:
    2023
  • 资助金额:
    48 万元
  • 项目类别:
    面上项目
微生物生态系统共性规律探索及其对扰动响应的预测算法研究
  • 批准号:
    32300078
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于耦合矩阵-张量分解算法开发环境微生物标志物挖掘工具
  • 批准号:
    42377106
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
基于生成式人工智能的易合成与高生物活性的分子三维结构设计
  • 批准号:
    22373085
  • 批准年份:
    2023
  • 资助金额:
    50.00 万元
  • 项目类别:
    面上项目
面向可信虹膜识别的脉冲表达学习
  • 批准号:
    62306307
  • 批准年份:
    2023
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Fluency from Flesh to Filament: Collation, Representation, and Analysis of Multi-Scale Neuroimaging data to Characterize and Diagnose Alzheimer's Disease
从肉体到细丝的流畅性:多尺度神经影像数据的整理、表示和分析,以表征和诊断阿尔茨海默病
  • 批准号:
    10462257
  • 财政年份:
    2023
  • 资助金额:
    $ 38.98万
  • 项目类别:
New Algorithms for Cryogenic Electron Microscopy
低温电子显微镜的新算法
  • 批准号:
    10543569
  • 财政年份:
    2023
  • 资助金额:
    $ 38.98万
  • 项目类别:
Discovery-Driven Mathematics and Artificial Intelligence for Biosciences and Drug Discovery
用于生物科学和药物发现的发现驱动数学和人工智能
  • 批准号:
    10551576
  • 财政年份:
    2023
  • 资助金额:
    $ 38.98万
  • 项目类别:
Biomarkers for Brain Resetting as an Assistive Tool in the Treatment of Status Epilepticus
大脑重置生物标志物作为治疗癫痫持续状态的辅助工具
  • 批准号:
    10698969
  • 财政年份:
    2023
  • 资助金额:
    $ 38.98万
  • 项目类别:
A computational model for prediction of morphology, patterning, and strength in bone regeneration
用于预测骨再生形态、图案和强度的计算模型
  • 批准号:
    10727940
  • 财政年份:
    2023
  • 资助金额:
    $ 38.98万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了