Integrated Analysis for Genetic Association and Prediction

遗传关联与预测的综合分析

基本信息

项目摘要

ABSTRACT The overall goal of this project is to develop novel statistical methods for integrative analysis of genomic data in cancer research. We propose to develop analytical tools that can integrate data from multiple genomic platforms and incorporate external omic information from publically available databases. These tools will be applicable to both etiological studies geared toward causal discovery and to clinical and translational studies geared toward predictive modeling. Advances in high-throughput molecular technologies have enabled large-scale omic projects (e.g. Encode, The Cancer Genome Atlas, Epigenome Roadmap) to generate vast amounts of information on the structure, function and regulation of the genome. In addition to this publically available data, individual studies are increasingly generating multiplatform genomic profiles (e.g. genotypes, gene expression, methylation copy number variation, miRNA) to elucidate the complex mechanisms of cancer development and progression, and investigate determinants and predictors of health and clinical outcomes. Integration across these multiple genomic “dimensions” and incorporation of the available external information can increase the ability to discovery causal relationships (e.g. Cancer-SNP associations), enhance prediction and prognosis modeling (e.g. cancer aggressiveness), and provide insights into biological mechanisms. We propose two analytic approaches aimed at addressing the challenges to effective integration across multiplatform genomic data and incorporation of external information from omic projects. The first approach (Aim 1) is a Bayesian regression and feature selection method that can integrate prior omic information in a very flexible manner allowing the data to `speak for itself' to determine which pieces of external information are relevant for the problem at hand. The method works with individual-level data and also with meta-analytic summaries, making it well suited for analyzing data from large multi-study consortia. The second approach (Aim 2) is a regularized regression and feature selection method for integrating multiplatform genomic features measured on the same set of individuals. The method is designed to scale to the very large numbers of features typical of genomewide platforms, to account for the different properties of each genomic data type, and to incorporate relevant external information to increase efficiency. Both approaches can be applied for causal discovery and for developing predictive and prognostic models. We will apply our methods to search for novel risk variants in the CORECT consortium of genome association studies, and to construct a prognostic model of CRC recurrence based on genomewide expression methylation data in the ColoCare consortium cohort of CRC patients. This work will provide new tools for analyzing high-dimensional multi-platform genomic that can take advantage of available external information.
抽象的 该项目的总体目标是开发新的统计方法,用于基因组数据的综合分析 我们建议开发可以整合多个基因组数据的分析工具。 这些工具将整合来自公开数据库的外部组学信息。 适用于旨在发现因果关系的病因学研究以及临床和转化研究 面向预测建模。 高通量分子技术的进步使得大规模组学项目成为可能(例如 Encode、The 癌症基因组图谱、表观基因组路线图)生成大量有关结构的信息, 除了这些公开数据外,还进行了个别研究。 越来越多地生成多平台基因组图谱(例如基因型、基因表达、甲基化拷贝 数量变异,miRNA)来阐明癌症发生和进展的复杂机制,以及 研究健康和临床结果的决定因素和预测因素。 基因组“维度”和可用外部信息的结合可以提高 发现因果关系(例如癌症-SNP 关联),增强预测和预后建模 (例如癌症侵袭性),并提供了对生物学机制的见解。 旨在解决跨多平台基因组数据有效集成的挑战的方法 第一种方法(目标 1)是贝叶斯回归。 和特征选择方法,可以以非常灵活的方式整合先验组学信息,从而允许 数据“不言而喻”,以确定哪些外部信息与当前问题相关。 该方法适用于个人级别的数据以及元分析摘要,使其非常适合 分析来自大型多研究联盟的数据。第二种方法(目标 2)是正则化回归和 用于集成在同一组上测量的多平台基因组特征的特征选择方法 该方法旨在扩展到全基因组的大量典型特征。 平台,以考虑每种基因组数据类型的不同属性,并纳入相关的 外部信息以提高效率。这两种方法都可以应用于因果发现和 我们将应用我们的方法来寻找新的风险变异。 CORECT 基因组关联研究联盟,构建 CRC 复发的预后模型 基于 ColoCare 联盟 CRC 患者队列的全基因组表达甲基化数据。 这项工作将为分析高维多平台基因组提供新工具 利用可用的外部信息。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Juan Pablo Lewinger其他文献

Juan Pablo Lewinger的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Juan Pablo Lewinger', 18)}}的其他基金

LA’s Biostatistics and Data Science Training Program (LA’s BeST)
洛杉矶生物统计学和数据科学培训计划 (LAâs BeST)
  • 批准号:
    10368449
  • 财政年份:
    2022
  • 资助金额:
    $ 38.98万
  • 项目类别:
LA’s Biostatistics and Data Science Training Program (LA’s BeST)
洛杉矶生物统计学和数据科学培训计划 (LAâs BeST)
  • 批准号:
    10590701
  • 财政年份:
    2022
  • 资助金额:
    $ 38.98万
  • 项目类别:
LA’s Biostatistics Education Summer Training Program (LA’s BEST @USC)
洛杉矶生物统计教育暑期培训计划(洛杉矶 BEST @USC)
  • 批准号:
    9894852
  • 财政年份:
    2019
  • 资助金额:
    $ 38.98万
  • 项目类别:
High-Dimensional Regression for Data Integration
数据集成的高维回归
  • 批准号:
    10707448
  • 财政年份:
    2016
  • 资助金额:
    $ 38.98万
  • 项目类别:
High-Dimensional Regression for Data Integration
数据集成的高维回归
  • 批准号:
    10411239
  • 财政年份:
    2016
  • 资助金额:
    $ 38.98万
  • 项目类别:

相似国自然基金

微生物生态系统共性规律探索及其对扰动响应的预测算法研究
  • 批准号:
    32300078
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于机器学习算法的针刺干预偏头痛预后差异生物学机制和临床-多组学预测模型构建研究
  • 批准号:
    82374572
  • 批准年份:
    2023
  • 资助金额:
    48 万元
  • 项目类别:
    面上项目
基于肿瘤病理图片的靶向药物敏感生物标志物识别及统计算法的研究
  • 批准号:
    82304250
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
探索多种鉴识性微生物标记联合XGBoost集成学习算法的体液(斑)TsD精准推断研究
  • 批准号:
    82302123
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于耦合矩阵-张量分解算法开发环境微生物标志物挖掘工具
  • 批准号:
    42377106
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目

相似海外基金

Fluency from Flesh to Filament: Collation, Representation, and Analysis of Multi-Scale Neuroimaging data to Characterize and Diagnose Alzheimer's Disease
从肉体到细丝的流畅性:多尺度神经影像数据的整理、表示和分析,以表征和诊断阿尔茨海默病
  • 批准号:
    10462257
  • 财政年份:
    2023
  • 资助金额:
    $ 38.98万
  • 项目类别:
New Algorithms for Cryogenic Electron Microscopy
低温电子显微镜的新算法
  • 批准号:
    10543569
  • 财政年份:
    2023
  • 资助金额:
    $ 38.98万
  • 项目类别:
Discovery-Driven Mathematics and Artificial Intelligence for Biosciences and Drug Discovery
用于生物科学和药物发现的发现驱动数学和人工智能
  • 批准号:
    10551576
  • 财政年份:
    2023
  • 资助金额:
    $ 38.98万
  • 项目类别:
Investigating the Protective Efficacy of SIV/HIV T and B cell Immunity Induced by RNA Replicons
研究 RNA 复制子诱导的 SIV/HIV T 和 B 细胞免疫的保护功效
  • 批准号:
    10673223
  • 财政年份:
    2023
  • 资助金额:
    $ 38.98万
  • 项目类别:
A Novel VpreB1 Anti-body Drug Conjugate for the Treatment of B-Lineage Acute Lymphoblastic Leukemia/Lymphoma
一种用于治疗 B 系急性淋巴细胞白血病/淋巴瘤的新型 VpreB1 抗体药物偶联物
  • 批准号:
    10651082
  • 财政年份:
    2023
  • 资助金额:
    $ 38.98万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了