基于人群的生物医学多层面数据整合方法及肿瘤风险预测研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    81530088
  • 项目类别:
    重点项目
  • 资助金额:
    274.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    H3011.流行病学方法与卫生统计
  • 结题年份:
    2020
  • 批准年份:
    2015
  • 项目状态:
    已结题
  • 起止时间:
    2016-01-01 至2020-12-31

项目摘要

The biomedical big data (BBD), generated from a variety of sources and multiple layers, include personal-level exposure data, population-level environmental exposure information, high-resolution medical images, electronic health records, as well as data from high-throughput genomic platforms such as DNA sequencing, DNA methylation, gene expression, et al.. Most of previous studies only focused on the dataset from a single layer, ignoring the association among the multiple layers in BBD. In this study, we aim to develop more effective statistical methods for BBD integration to improve understanding of and provide insights into biomedical big data. Following strategy will be applied in the study: a) Preliminary fast screening of the risk factors; b) Fine evaluation of the risk factors; c) Building risk prediction model; d) Validation in independent populations. To further understand the sophisticated association among factors and risk of cancers, we will propose entropy based weighted information gain (WIG) method to efficiently enrich the genes carrying main effects, interactions within a single layer, interactions among multiple layers, as well as interactions with environment. Majority advantage of WIG method is utilizing the prior biological information into subsequencing analysis, such as molecular processes and regulatory relationships. Further, we will propose a Bayesian sequential method to integrate data from multi-layers to provide a better prediction of cancer risk. Furthermore, we will use the improved causal mediation analysis to explore the potential causal pathways. The proposed methods will be applied to lung cancer and gastric cancer. Risk factors and prediction models will also be explored and validated in large-scale cohorts.
生物医学数据来源广泛,涉及个体、群体环境暴露、遗传变异、DNA甲基化、基因表达等多个层面。常规研究往往仅利用某一层面单个完全数据集进行分析,忽视了多层面数据间的关系。本课题拟采用“初步筛选→再次筛选→精细建模→人群验证”的分析思路,利用大数据思维,对基于人群的生物医学多层面数据进行整合分析,探索肺癌、胃癌等常见肿瘤的复杂关联因素,建立风险预测模型,提高预测精度。拟充分考虑各层面间的结构、调控关系等生物先验信息,提出加权信息熵法,快速富集具有主效应或层面内、跨层面基因-基因、基因-环境交互作用信息的基因;提出Bayes序贯分析法,逐层整合数据,更高效地筛选预测因素;改进因果中介分析模型,探索多层面因素的作用方式及强度;将所建方法尝试应用于肺癌、胃癌的关联分析及风险预测模型的建立,并基于大规模人群队列进行验证。

结项摘要

复杂疾病由外环境暴露和内环境失衡共同作用所致。从外到内多个维度探寻疾病发生、发展的原因,是疾病预防、诊断、治疗的关键,对实现“健康中国”具有重要科学意义。多组学数据整合分析可以系统地、深入地鉴定疾病相关生物标志物;识别驱动疾病的复杂关联模式,包括:疾病因果链,基因与环境之间、之内的交互作用,疾病风险及预后预测模型。然而,多组学数据的“块缺失结构缺陷”、“高维灾难”、“复杂关联模式”等特点对数据挖掘提出了巨大的技术挑战。为此,我们从5个方面开展多组学数据的理论方法与临床研究:.i. 缺失处理。现实研究中,多组学数据有典型的“块缺失”结构缺陷。我们提出“填补”和“架桥”两种解决方案。与传统方法相比,我们构建的TOBMI填补算法具备填补精度高,有效维持原数据结构的特点。此外,两种“架桥”算法:全信息极大似然法和配对删除法,估计精度也优于传统方法。.ii. 降维策略。高维度的多组学数据具有信噪比低,分析耗时长的问题。我们提出ERB降维策略:基于信息熵(Entropy),提取特征值;基于随机森林(Random forest),按重要性筛选生物标志物;基于贝叶斯(Bayes),利用先验信息,大规模并行筛选重要靶点。模拟实验与实例研究表明:上述降维策略可有效降低数据维度,聚焦重要标志物。.iii. 精细挖掘。复杂疾病由因素间复杂的关联模式所驱动。一方面,从因果推断角度,发展并运用孟德尔随机化、中介分析的方法,控制未知混杂因素,估计真实关联效应;探索因果关系,识别致病因子。另一方面,从交互作用角度,探索基因与环境之间、之内的复杂关联模式。.iv. 预测模型。复杂疾病由宏观、微观多个层面因素所决定。我们整合多维度指标,基于“初步筛选→再次筛选→精细建模→人群验证”的分析策略,构建了多个高精度的肿瘤预后预测模型。.v. 平台开发。获批国家版权局软件著作权5件,开发了2个交互式可视化平台,使得复杂的整合分析策略及方法变得操作便捷、易于实现。

项目成果

期刊论文数量(51)
专著数量(0)
科研奖励数量(1)
会议论文数量(2)
专利数量(0)
Epigenome-wide gene-age interaction analysis reveals reversed effects of PRODH DNA methylation on survival between young and elderly early-stage NSCLC patients
全表观基因组基因年龄相互作用分析揭示 PRODH DNA 甲基化对年轻和老年早期 NSCLC 患者生存的逆转影响
  • DOI:
    10.18632/aging.103284
  • 发表时间:
    2020
  • 期刊:
    Aging (Albany NY)
  • 影响因子:
    --
  • 作者:
    Chen Chao;Wei Yongyue;Wei Liangmin;Chen Jiajin;Chen Xin;Dong Xuesi;He Jieyu;Lin Lijuan;Zhu Ying;Huang Hui;You Dongfang;Lai Linjing;Shen Sipeng;Duan Weiwei;Su Li;Andrea Shafer;Thomas Fleischer;Maria Moksnes Bjaanæs;Anna Karlsson;Maria Planck;Wang Rui;Johan
  • 通讯作者:
    Johan
孟德尔随机化方法在观察性研究因果推断中的应用
  • DOI:
    10.1016/j.placenta.2018.10.010
  • 发表时间:
    2019-04
  • 期刊:
    中华预防医学杂志
  • 影响因子:
    --
  • 作者:
    Slator P;Aughwane R;Cade G;Taylor D;David AL;Lewis R;Jauniaux E;Desjardins A;Salomon LJ;Millischer AE;Tsatsaris V;Rutherford M;Johnstone ED;Melbourne A;participants of the workshop
  • 通讯作者:
    participants of the workshop
Seven-CpG-based prognostic signature coupled with gene expression predicts survival of oral squamous cell carcinoma.
基于七 CpG 的预后特征与基因表达相结合可预测口腔鳞状细胞癌的生存。
  • DOI:
    10.1186/s13148-017-0392-9
  • 发表时间:
    2017
  • 期刊:
    Clin Epigenetics
  • 影响因子:
    5.7
  • 作者:
    Shen S;Wang G;Shi Q;Zhang R;Zhao Y;Wei Y;Chen F;Christiani DC
  • 通讯作者:
    Christiani DC
存在混杂时高维数据的随机森林分析
  • DOI:
    10.7655/nydxbns20180720
  • 发表时间:
    2018
  • 期刊:
    南京医科大学学报(自然科学版)
  • 影响因子:
    --
  • 作者:
    尤东方;魏永越;张汝阳;陈峰;赵杨
  • 通讯作者:
    赵杨
Development and validation of an immune gene-set based Prognostic signature in ovarian cancer.
基于免疫基因集的卵巢癌预后特征的开发和验证。
  • DOI:
    10.1002/ange.202009704
  • 发表时间:
    2019
  • 期刊:
    EBioMedicine
  • 影响因子:
    11.1
  • 作者:
    Shen Sipeng;Wang Guanrong;Zhang Ruyang;Zhao Yang;Yu Hao;Wei Yongyue;Chen Feng
  • 通讯作者:
    Chen Feng

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

肿瘤内异质性及其对肿瘤治疗的影响
  • DOI:
    10.1016/j.jcs.2018.04.013
  • 发表时间:
    2016
  • 期刊:
    国际遗传学杂志
  • 影响因子:
    --
  • 作者:
    翁远波;李春香;孟祥宁;陈峰
  • 通讯作者:
    陈峰
天山山区树轮气候研究若干进展
  • DOI:
    10.1111/imig.12537
  • 发表时间:
    2016
  • 期刊:
    沙漠与绿洲气象
  • 影响因子:
    --
  • 作者:
    张瑞波;袁玉江;魏文寿;勾晓华;喻树龙;尚华明;张同文;陈峰;秦莉
  • 通讯作者:
    秦莉
树轮记录的酒泉近240a来6~9月气温变化
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    干旱区研究
  • 影响因子:
    --
  • 作者:
    陈峰;袁玉江;魏文寿;范子昂;喻树龙;张瑞波;张同文;尚华明
  • 通讯作者:
    尚华明
黄酮类化合物组织分布研究进展
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    中国药房
  • 影响因子:
    --
  • 作者:
    张俊清;袁媛;陈峰;李泽友;任守忠;符乃光
  • 通讯作者:
    符乃光
树轮灰度与树轮密度的对比分析及其对气候要素的响应
  • DOI:
    10.1007/978-3-642-17819-1_6
  • 发表时间:
    --
  • 期刊:
    Acta Ecologica Sinica
  • 影响因子:
    --
  • 作者:
    张同文;袁玉江;喻树龙;魏文寿;尚华明;张瑞波;陈峰;范子昂
  • 通讯作者:
    范子昂

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

陈峰的其他基金

基于贝叶斯因果网络的中欧肺癌风险预测模型构建与大型前瞻性人群队列评估研究
  • 批准号:
    82220108002
  • 批准年份:
    2022
  • 资助金额:
    252 万元
  • 项目类别:
    国际(地区)合作与交流项目
基于微纳探针与材料的胶质瘤早期诊断及相关检测研究
  • 批准号:
    82041024
  • 批准年份:
    2020
  • 资助金额:
    24 万元
  • 项目类别:
    青年科学基金项目
新型冠状病毒感染流行趋势研究:基于大数据的跨地域开放系统随机动力学模型
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    150 万元
  • 项目类别:
法医学
  • 批准号:
    81922041
  • 批准年份:
    2019
  • 资助金额:
    130 万元
  • 项目类别:
    优秀青年科学基金项目
Cav-1/Nox1/STIM1信号通路参与百草枯心肺损害机理研究及中毒标志物筛选
  • 批准号:
    81772020
  • 批准年份:
    2017
  • 资助金额:
    55.0 万元
  • 项目类别:
    面上项目
PAH血管重塑新靶点半乳凝素-3在肺血管平滑肌细胞中的功能及其作用机制研究
  • 批准号:
    81570378
  • 批准年份:
    2015
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
血管外膜氧应激参与PAH血管重塑的表观遗传学机制
  • 批准号:
    81400033
  • 批准年份:
    2014
  • 资助金额:
    23.0 万元
  • 项目类别:
    青年科学基金项目
全基因组关联研究中基因-基因、基因-环境交互作用统计分析方法研究
  • 批准号:
    81473070
  • 批准年份:
    2014
  • 资助金额:
    80.0 万元
  • 项目类别:
    面上项目
全基因组关联研究中的降维策略和统计分析方法研究
  • 批准号:
    81072389
  • 批准年份:
    2010
  • 资助金额:
    32.0 万元
  • 项目类别:
    面上项目
非传统病例-对照设计的统计分析方法研究与评价
  • 批准号:
    30571619
  • 批准年份:
    2005
  • 资助金额:
    23.0 万元
  • 项目类别:
    面上项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码