基于RF模型和半监督分析算法的肿瘤分子亚组模式识别方法研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    81773551
  • 项目类别:
    面上项目
  • 资助金额:
    65.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    H3011.流行病学方法与卫生统计
  • 结题年份:
    2021
  • 批准年份:
    2017
  • 项目状态:
    已结题
  • 起止时间:
    2018-01-01 至2021-12-31

项目摘要

Recently, histopathological method has been regarded as the gold standard for cancer diagnosis and subgroup analysis in clinical practice. However, due to the molecular heterogeneity and complexity of cancer tissues, cancer subtype has different pathological structure characteristics and grading standards, which would increase the difficulty of diagnosis in practice. In regard to these problems, this study aims at identifying the cancer subgroups based on multi-omics molecular information to improve the diagnosis accuracy and therapy and prognosis. To identify molecular subgroups of cancer, it is necessary to select significant biomarkers for each subgroup and then build up the prediction model. However, for some subgourp identification, only a small number of samples have complete and accurate labels in practice. In this study, we propose to combine labeled and unlabeled samples, analyze the data with random forest model and semi-supervised analysis algorithm, select biomarkers and establish prediction model. The main research contents include semi-supervised model for subgroup identification, multi-stage algorithm for semi-supervised analysis, semi-supervised Boosting algorithm based on weight obtained from samples, variable selection method for semi-supervised analysis, molecular subgroup prediction model, and so on. This study intends to combine the method of theoretical derivation, simulation studies and real example analysis with data from colorectal cancer.
目前恶性肿瘤的诊断与亚组分型,主要使用病理组织学方法,作为临床诊断的“金标准”。然而,由于肿瘤组织结构的复杂性和分子异质性,不同类型的肿瘤具有不同的病理组织结构特征和分级标准,实际中经常难以诊断。本课题研究如何在多组学分子层面上对肿瘤进行亚组鉴别,使其与临床诊断、治疗和预后的目标相一致。对肿瘤分子亚组模式识别,需要筛选出不同亚组的生物标志物,进而得到预测模型。然而,对于有些亚组识别问题,实际中可能只有少量的样品存在亚型标签。本研究提出一种新方法,将有标签和无标签的数据混合在一起,使用随机森林(RF)模型和半监督分析算法对数据进行分析,筛选亚组生物标记物和建立预测模型。研究的主要内容:亚组识别的半监督分析模型、半监督分析的多阶段算法、基于样品权重的半监督Boosting算法、半监督分析的变量筛选方法、分子亚组预测模型等。研究拟使用理论推导、模拟实验和结直肠癌亚组实际数据分析相结合的方法进行。

结项摘要

本课题主要研究如何在多组学分子层面上对肿瘤进行亚组鉴别,使其与临床诊断、治疗和预后的目标相一致。项目针对如何将有标签和无标签的数据混合在一起分析的问题,展开了多方面的研究,主要给出了使用随机森林(RF)模型对数据进行一致性聚类和分型分析方法;提出一种新的基于分层图随机神经网络(HiRAND)的半监督特征选择和分类预测的策略,用于解决具有小样本标签(如)的标志物筛选和分类预测问题。研究给出了相应的算法和计算程序,模拟实验和实例表明其可以有效地用于分子分型、变量筛选和分类预测。同时,在肿瘤分子亚组识别关联方法研究和应用方面,对多种高维组学方法进行了研究,并实际给出了多个具有潜在生物学意义的标志物,为实验科学提供了多项有意义的结果,已按期完成课题的计划。研究的主要成果:以通讯作者(共同)发表相关论文25篇(标注基金号),其中发表SCI论文17篇,中国核心期刊发表8篇;完成了新算法的多组学分析软件平台的研制。同时,培养博士研究生5名、硕士研究生8名,参加国内学术会议21人次,国际会议2人次。目前,相关的研究工作继续深入开展,课题组在2020年获得1项国家自然科学基金项目,同时2021年作为合作单位承担科技部重大项目子课题1项。

项目成果

期刊论文数量(25)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Plasma metabolomic profiling distinguishes right-sided from left-sided colon cancer
血浆代谢组学分析可区分右侧和左侧结肠癌
  • DOI:
    10.1016/j.cca.2018.10.010
  • 发表时间:
    2018-12-01
  • 期刊:
    CLINICA CHIMICA ACTA
  • 影响因子:
    5
  • 作者:
    Deng, Kui;Han, Peng;Li, Kang
  • 通讯作者:
    Li, Kang
Development of a Correlative Strategy To Discover Colorectal Tumor Tissue Derived Metabolite Biomarkers in Plasma Using Untargeted Metabolomics
使用非靶向代谢组学开发血浆中结直肠肿瘤组织衍生的代谢生物标志物的相关策略
  • DOI:
    10.1021/acs.analchem.8b05177
  • 发表时间:
    2019
  • 期刊:
    Analytical Chemistry
  • 影响因子:
    7.4
  • 作者:
    Wang Zhuozhong;Cui Binbin;Zhang Fan;Yang Yue;Shen Xiaotao;Li Zhong;Zhao Weiwei;Zhang Yuanyuan;Deng Kui;Rong Zhiwei;Yang Kai;Yu Xiwen;Li Kang;Han Peng;Zhu Zheng-Jiang
  • 通讯作者:
    Zhu Zheng-Jiang
The Prevalence and associated Factors for Liver Metastases, Development and Prognosis in newly diagnosed Epithelial Ovarian Cancer: A large Population-Based Study from the SEER Database.
新诊断的上皮性卵巢癌肝转移的患病率和相关因素、发展和预后:来自 SEER 数据库的一项大型人群研究。
  • DOI:
    10.7150/jca.40590
  • 发表时间:
    2020
  • 期刊:
    Journal of Cancer
  • 影响因子:
    3.9
  • 作者:
    Hussain Iftikhar;Xu Jiaqin;Deng Kui;Noor-Ul-Amin;Wang Ce;Huang Yue;Li Shuang;Li Kang
  • 通讯作者:
    Li Kang
XGBoost算法在二分类非平衡高维数据分析中的应用
  • DOI:
    --
  • 发表时间:
    2021
  • 期刊:
    中国卫生统计
  • 影响因子:
    --
  • 作者:
    卢娅欣;黄月;李康
  • 通讯作者:
    李康
WaveICA: A novel algorithm to remove batch effects for large-scale untargeted metabolomics data based on wavelet analysis
WaveICA:一种基于小波分析的消除大规模非目标代谢组学数据批次效应的新算法
  • DOI:
    10.1016/j.aca.2019.02.010
  • 发表时间:
    2019-07-11
  • 期刊:
    ANALYTICA CHIMICA ACTA
  • 影响因子:
    6.2
  • 作者:
    Deng, Kui;Zhang, Fan;Li, Kang
  • 通讯作者:
    Li, Kang

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

中国外部财富的估值效应研究
  • DOI:
    10.13680/j.cnki.ibr.2015.06.003
  • 发表时间:
    2015
  • 期刊:
    国际商务研究
  • 影响因子:
    --
  • 作者:
    那明;李康
  • 通讯作者:
    李康
空气电晕放电发展过程的特征发射光谱分析与放电识别
  • DOI:
    10.3964/j.issn.1000-0593(2022)09-2956-07
  • 发表时间:
    2022
  • 期刊:
    光谱学与光谱分析
  • 影响因子:
    --
  • 作者:
    李彦飞;韩冬;邱宗甲;李康;赵义焜;万留杰;张国强
  • 通讯作者:
    张国强
秦陵文物数字化及虚拟复原研究综述
  • DOI:
    10.16152/j.cnki.xdxbzr.2021-05-001
  • 发表时间:
    2021
  • 期刊:
    西北大学学报. 自然科学版
  • 影响因子:
    --
  • 作者:
    耿国华;冯龙;李康;周明全;王小凤
  • 通讯作者:
    王小凤
云计算技术在大规模基准站网中的应用
  • DOI:
    10.16547/j.cnki.10-1096.20200205
  • 发表时间:
    2020
  • 期刊:
    导航定位学报
  • 影响因子:
    --
  • 作者:
    陈雄川;程传录;蒋光伟;马新莹;李康;孙洋洋
  • 通讯作者:
    孙洋洋
浊点萃取-HPLC法测定陈皮中橙皮苷和川陈皮素的含量
  • DOI:
    10.13863/j.issn1001-4454.2017.09.029
  • 发表时间:
    2017
  • 期刊:
    中药材
  • 影响因子:
    --
  • 作者:
    邱烺;吴晓玲;谢子婷;冯佩怡;郭忠辉;李康
  • 通讯作者:
    李康

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

李康的其他基金

基于单细胞转录组测序的抗肿瘤药物敏感特征及统计分析方法研究
  • 批准号:
    82273734
  • 批准年份:
    2022
  • 资助金额:
    52 万元
  • 项目类别:
    面上项目
基于通路分析和深度学习算法的肿瘤靶向药物组学标志物及预测模型的研究
  • 批准号:
    81973149
  • 批准年份:
    2019
  • 资助金额:
    55 万元
  • 项目类别:
    面上项目
基于网络解卷积和贝叶斯模型的组学数据融合分析方法及应用研究
  • 批准号:
    81473072
  • 批准年份:
    2014
  • 资助金额:
    75.0 万元
  • 项目类别:
    面上项目
基于多种群遗传算法的卵巢癌代谢组生物标志物筛选研究
  • 批准号:
    81172767
  • 批准年份:
    2011
  • 资助金额:
    50.0 万元
  • 项目类别:
    面上项目
代谢组动态指纹图谱的统计特征提取及数据分析方法研究
  • 批准号:
    30872185
  • 批准年份:
    2008
  • 资助金额:
    33.0 万元
  • 项目类别:
    面上项目
基于小波变换理论的基因表达谱分析方法的研究
  • 批准号:
    30371253
  • 批准年份:
    2003
  • 资助金额:
    21.0 万元
  • 项目类别:
    面上项目
临床诊断数据评价的多变量ROC统计模型
  • 批准号:
    30040039
  • 批准年份:
    2000
  • 资助金额:
    5.0 万元
  • 项目类别:
    专项基金项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码