A statistical framework to systematically characterize cancer driver mutations in noncoding genomic regions

系统地表征非编码基因组区域中癌症驱动突变的统计框架

基本信息

  • 批准号:
    10260680
  • 负责人:
  • 金额:
    $ 17.7万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2019
  • 资助国家:
    美国
  • 起止时间:
    2019-07-01 至 2021-12-31
  • 项目状态:
    已结题

项目摘要

PROJECT SUMMARY Cancer genomes typically harbor a substantial number of somatic mutations. Relatively few driver mutations actually alter the function of proteins in tumor cells, whereas most mutations are considered to be functionally neutral passenger mutations. Over the past decade, the search for cancer driver mutations has focused on coding regions and several mutational significance algorithms have been developed for coding mutations. The contribution of mutations in noncoding regulatory regions to tumor formation largely remains unknown and current mutational significance algorithms are not designed to detect driver mutations in noncoding regions, due to biological differences between coding and noncoding mutations. The emerging availability of large whole- genome sequencing datasets (e.g. PCAWG and HMF datasets) creates an ample opportunity to develop new mutational significance algorithms that are particularly designed for the interpretation of noncoding regions. Recently, we have developed a new statistical approach that identifies driver mutations in coding regions based on the nucleotide context. Critically, consideration of the nucleotide context around mutations does not require prior knowledge for functional consequences associated with these mutations. Hence, we hypothesize that generalizing our nucleotide context model to noncoding regions will uncover novel noncoding driver mutations that cannot be detected using the mutational significance approaches currently available. For this purpose, we will develop a statistical framework that incorporates the biological differences between coding and noncoding mutations and that is specifically designed to detect driver mutations in noncoding regions. Specifically, we will consider the context-dependent distribution of passenger mutations, modeling of the background mutation rate, accurately partition the background mutation rate, model the sequence composition of the reference genome, and account for coverage fluctuation. We will then combine these statistical components by computing an independent product of their underlying probabilities. We will derive a significance p-value using a Monte-Carlo simulation approach, and use FDR for multiple hypothesis test correction. This strategy will allow us to accurately estimate the significance of somatic mutations in noncoding genomic regions. We will next apply this statistical framework to whole-genome sequencing data of 5,523 tumor patients, thereby deriving a comprehensive list of candidate driver mutations in noncoding regions. Finally, we will investigate whether noncoding mutations are overrepresented in transcription factor binding sites, regulate gene expression levels, induce alternative splicing, or affect epigenomic states. Upon the completion of this project, we will have developed and applied a statistical framework for discovery of significant somatic mutations in noncoding regions, and defined the mutational landscape of the non-coding cancer genome. All aspects of the methods developed and applied in this project will be made open source and developed in an online platform.
项目概要 癌症基因组通常含有大量体细胞突变。驱动突变相对较少 实际上改变了肿瘤细胞中蛋白质的功能,而大多数突变被认为是功能性的 中性乘客突变。在过去的十年中,对癌症驱动突变的研究主要集中在 已经开发了编码区域和几种突变显着性算法来编码突变。这 非编码调控区突变对肿瘤形成的贡献在很大程度上仍然未知, 当前的突变显着性算法并非旨在检测非编码区域中的驱动突变,因为 编码和非编码突变之间的生物学差异。大型整体的新兴可用性 基因组测序数据集(例如 PCAWG 和 HMF 数据集)创造了充足的机会来开发新的 专为解释非编码区域而设计的突变显着性算法。 最近,我们开发了一种新的统计方法,可以根据编码区识别驱动突变 关于核苷酸背景。至关重要的是,考虑突变周围的核苷酸背景不需要 与这些突变相关的功能后果的先验知识。因此,我们假设 将我们的核苷酸上下文模型推广到非编码区域将发现新的非编码驱动因素 使用目前可用的突变显着性方法无法检测到的突变。为了 为此,我们将开发一个统计框架,其中包含编码之间的生物学差异 和非编码突变,专门设计用于检测非编码区域的驱动突变。 具体来说,我们将考虑乘客突变的上下文相关分布、模型 背景突变率,准确划分背景突变率,对序列组成进行建模 参考基因组,并解释覆盖度波动。然后我们将结合这些统计数据 通过计算其基本概率的独立乘积来划分组件。我们将得出一个意义 p值使用蒙特卡罗模拟方法,并使用FDR进行多重假设检验校正。这 该策略将使我们能够准确估计非编码基因组区域体细胞突变的重要性。 接下来我们将把这个统计框架应用到5523名肿瘤患者的全基因组测序数据中,从而 得出非编码区域候选驱动突变的综合列表。最后,我们将调查 非编码突变是否在转录因子结合位点中过度表达,调节基因表达 水平,诱导选择性剪接,或影响表观基因组状态。该项目完成后,我们将拥有 开发并应用了一个统计框架来发现非编​​码中的显着体细胞突变 区域,并定义了非编码癌症基因组的突变景观。方法的各个方面 本项目中开发和应用的项目将开源并在在线平台上开发。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Eliezer M Van Allen其他文献

Eliezer M Van Allen的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Eliezer M Van Allen', 18)}}的其他基金

Molecular origins and evolution to chemoresistance in germ cell tumors
生殖细胞肿瘤中化学耐药性的分子起源和进化
  • 批准号:
    10443070
  • 财政年份:
    2023
  • 资助金额:
    $ 17.7万
  • 项目类别:
Molecular Origins and Evolution to Chemoresistance in Germ Cell Tumors
生殖细胞肿瘤化疗耐药的分子起源和进化
  • 批准号:
    10773483
  • 财政年份:
    2023
  • 资助金额:
    $ 17.7万
  • 项目类别:
The Cellular Geography of Therapeutic Resistance in Cancer
癌症治疗耐药的细胞地理学
  • 批准号:
    10819853
  • 财政年份:
    2023
  • 资助金额:
    $ 17.7万
  • 项目类别:
Dissecting and Predicting Lethal Prostate Cancer using Biologically Informed Artificial Intelligence
使用生物学信息人工智能剖析和预测致命性前列腺癌
  • 批准号:
    10628274
  • 财政年份:
    2023
  • 资助金额:
    $ 17.7万
  • 项目类别:
Integrative Somatic and Germline Computational Biology to Redefine Clinical Actionability in Solid Tumors
综合体细胞和种系计算生物学重新定义实体瘤的临床可操作性
  • 批准号:
    9913487
  • 财政年份:
    2018
  • 资助金额:
    $ 17.7万
  • 项目类别:
Molecular origins and evolution to chemoresistance in germ cell tumors
生殖细胞肿瘤中化学耐药性的分子起源和进化
  • 批准号:
    10379230
  • 财政年份:
    2018
  • 资助金额:
    $ 17.7万
  • 项目类别:
Molecular origins and evolution to chemoresistance in germ cell tumors
生殖细胞肿瘤中化学耐药性的分子起源和进化
  • 批准号:
    10084830
  • 财政年份:
    2018
  • 资助金额:
    $ 17.7万
  • 项目类别:
Integrative Somatic and Germline Computational Biology to Redefine Clinical Actionability in Solid Tumors
综合体细胞和种系计算生物学重新定义实体瘤的临床可操作性
  • 批准号:
    10160834
  • 财政年份:
    2018
  • 资助金额:
    $ 17.7万
  • 项目类别:
Integrative Somatic and Germline Computational Biology to Redefine Clinical Actionability in Solid Tumors
综合体细胞和种系计算生物学重新定义实体瘤的临床可操作性
  • 批准号:
    9517271
  • 财政年份:
    2018
  • 资助金额:
    $ 17.7万
  • 项目类别:
Integrative Somatic and Germline Computational Biology to Redefine Clinical Actionability in Solid Tumors
综合体细胞和种系计算生物学重新定义实体瘤的临床可操作性
  • 批准号:
    10396664
  • 财政年份:
    2018
  • 资助金额:
    $ 17.7万
  • 项目类别:

相似国自然基金

员工算法规避行为的内涵结构、量表开发及多层次影响机制:基于大(小)数据研究方法整合视角
  • 批准号:
    72372021
  • 批准年份:
    2023
  • 资助金额:
    40 万元
  • 项目类别:
    面上项目
算法鸿沟影响因素与作用机制研究
  • 批准号:
    72304017
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
算法规范对知识型零工在客户沟通中情感表达的动态影响调查:规范焦点理论视角
  • 批准号:
    72302005
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于先进算法和行为分析的江南传统村落微气候的评价方法、影响机理及优化策略研究
  • 批准号:
    52378011
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
算法人力资源管理对员工算法应对行为和工作绩效的影响:基于员工认知与情感的路径研究
  • 批准号:
    72372070
  • 批准年份:
    2023
  • 资助金额:
    40 万元
  • 项目类别:
    面上项目

相似海外基金

Fluency from Flesh to Filament: Collation, Representation, and Analysis of Multi-Scale Neuroimaging data to Characterize and Diagnose Alzheimer's Disease
从肉体到细丝的流畅性:多尺度神经影像数据的整理、表示和分析,以表征和诊断阿尔茨海默病
  • 批准号:
    10462257
  • 财政年份:
    2023
  • 资助金额:
    $ 17.7万
  • 项目类别:
New Algorithms for Cryogenic Electron Microscopy
低温电子显微镜的新算法
  • 批准号:
    10543569
  • 财政年份:
    2023
  • 资助金额:
    $ 17.7万
  • 项目类别:
Move and Snooze: Adding insomnia treatment to an exercise program to improve pain outcomes in older adults with knee osteoarthritis
活动和小睡:在锻炼计划中添加失眠治疗,以改善患有膝骨关节炎的老年人的疼痛结果
  • 批准号:
    10797056
  • 财政年份:
    2023
  • 资助金额:
    $ 17.7万
  • 项目类别:
Elucidating causal mechanisms of ethanol-induced analgesia in BXD recombinant inbred mouse lines
阐明 BXD 重组近交系小鼠乙醇诱导镇痛的因果机制
  • 批准号:
    10825737
  • 财政年份:
    2023
  • 资助金额:
    $ 17.7万
  • 项目类别:
High-throughput thermodynamic and kinetic measurements for variant effects prediction in a major protein superfamily
用于预测主要蛋白质超家族变异效应的高通量热力学和动力学测量
  • 批准号:
    10752370
  • 财政年份:
    2023
  • 资助金额:
    $ 17.7万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了