基于血清蛋白组表达谱分析模型的癌症分期预测研究
项目介绍
AI项目解读
基本信息
- 批准号:61772027
- 项目类别:面上项目
- 资助金额:50.0万
- 负责人:
- 依托单位:
- 学科分类:F0213.生物信息计算与数字健康
- 结题年份:2021
- 批准年份:2017
- 项目状态:已结题
- 起止时间:2018-01-01 至2021-12-31
- 项目参与者:丁先锋; 陈海波; 王敏芝; 陶红; 朱正阳; 黄嘉禾; 方贤; 徐慧;
- 关键词:
项目摘要
Cancer presents high mortality and morbidity globally, largely due to its complex and heterogeneous nature as well as the lack of effective biomarkers. Thus, identification of clinically relevant biomarkers from serum proteomic profiling for detecting cancer type and stage is a fundamental work in bioinformatics..In this project, our researches will focus on serum proteomic profiling data of human. Using regularization models and algorithms, we standardize human serum proteomic profiling data. And then the "spectrum" model of serum proteomic spectra expression profile data will be suggested to character quantitatively the information of these data. Some methods will be introduced to identify biomarker protein, which can distinguish early-stage and late-stage cancer patients from disease-free individuals..Furthermore, applying the fuzzy theory and matrix factorization, we will suggest some mathematical descriptions corresponding to information related to tumor diagnosis. Based on the information mining, phylogeny analysis, and statistical method, the information of serum proteomic profiling data, related to cancer early and late stages, of tumor biomarker protein expression level are extracted. We will construct the comparison and cluster models of "spectrum graph" to classify normal human’s, early-stage, and late-stage cancer patients’ serum protein expression profile data. .In addition, we will design the multivariate statistical algorithm and the mixed model to improve the existing tumor biomarker prediction model. Based on the support vector machine and other machine learning model, the prediction algorithm of biomarker protein related to tumor stages, types, and grades will be developed. .This project has important scientific significance for diagnosis and theoretical researches of cancer.
由于恶性肿瘤的复杂性而且缺乏有效的生物标记,从血清蛋白表达谱数据获取与肿瘤分期、分类相关的生物标志是一个重要的基础性研究。.本项目从人的血清蛋白组表达谱数据出发,利用正则化模型和算法对血清蛋白组表达谱数据的信息度量标准化,研究人的血清蛋白表达谱数据的“谱图”模型与定量化描述,寻找血清蛋白组中与肿瘤早期、癌变期相关的标志物,改进已有肿瘤标志物预测模型;利用模糊理论和矩阵分解构造血清蛋白表达谱中与肿瘤诊断相关信息对应的数学描述,建立基于血清蛋白质组表达谱信息的系统发育分析及其统计校验方法,提取肿瘤发生-发展与标志物表达水平的关系信息,构造正常人、早期、癌变期血清蛋白组表达谱数据的“谱图”比较与分类模型;构造多元统计算法以及混合模型,基于支持向量机、随机森林等机器学习方法设计恶性肿瘤的分期、分类、分级预测以及与其相关肿瘤标志物预测算法。.此项目对恶性肿瘤的诊断和理论研究都有重要的科学意义。
结项摘要
恶性肿瘤是当今全世界发病率和病死率增长最快的疾病,已成为我国乃至全球的主要公共卫生问题。肿瘤的早期发现、早期诊断、早期治疗是患者获得长期生存的最主要途径。本项目以肿瘤早期检测诊断为核心,从人的血清蛋白组质谱数据、肿瘤细胞的转录组数据以及癌症的发病率数据等作为研究的出发点,围绕与恶性肿瘤发生发展机制相关的各类生物标志物识别开展研究。取得一系列成果。主要研究内容如下:.(1) 构造新的数学模型对肿瘤的发病率和发病风险以及与肿瘤发生和发展相关的激素、生长因子的临床数据和表达数据进行数值模拟,预测与相应癌症发生和发展相关的激素、生长因子和代谢因素; .(2) 将统计模型引入肿瘤转录组数据的分析模型,应用统计检验、富集分析和蛋白互作网络构造分析与免疫基因相对应的分期RNA表达数据,推断胃肠道肿瘤不同分期免疫系统的变化。寻找与胃肠道癌症密切相关的免疫靶向基因,预测与胃肠道肿瘤发生、发展相关的生物标志物。.(3) 通过疾病、基因、miRNA、LncRNA的相似性数学模型构造相似性网络,基于它们的相关性数据构建异构网络,设计异构网络上的重启游走算法,预测与疾病相关的非编码RNA、基因等。.(4) 构造各类图的拓扑指标设计特征提取算法挖掘卵巢癌病人血清蛋白质组质谱数据中具有样本差异的标志物和样本之间差异的特征构建恶性卵巢癌的早期诊断模型,为卵巢癌的早期诊断提供计算工具。.(5) 应用各种数学手段构造生物序列的数值刻画模型,构建计算模型分析海量的生物序列数据实现其信息的准确识别,将其应用到蛋白的亚细胞定位、基因岛预测等。.我们的研究丰富了肿瘤生物信息学研究的思路和手段,特别是用数学的方法研究与相应癌症发生和发展相关的激素、生长因子和代谢因素为进一步研究肿瘤的分期、分级、分类相关的生物标志物提供了新的手段和工具。结果显示通过清除血液循环中的癌症所需的生长信号来治疗癌症的现实可能性,有望为肿瘤的诊断和治疗提供帮助。
项目成果
期刊论文数量(16)
专著数量(0)
科研奖励数量(1)
会议论文数量(1)
专利数量(0)
Understanding the unimodal distributions of cancer occurrence rates: it takes two factors for a cancer to occur.
了解癌症发生率的单峰分布:癌症的发生需要两个因素。
- DOI:10.1093/bib/bbaa349
- 发表时间:2021-07-20
- 期刊:Briefings in bioinformatics
- 影响因子:9.5
- 作者:Qiu S;An Z;Tan R;He PA;Jing J;Li H;Wu S;Xu Y
- 通讯作者:Xu Y
基于GWAS的多元关联分析在精神类疾病遗传相关性分析中的应用
- DOI:--
- 发表时间:2020
- 期刊:浙江理工大学学报(自然科学版)
- 影响因子:--
- 作者:侯龙傲;贺平安
- 通讯作者:贺平安
An efficient genomic signature ranking method for genomic island prediction from a single genome
一种有效的基因组特征排序方法,用于从单个基因组预测基因组岛
- DOI:10.1016/j.jtbi.2019.02.008
- 发表时间:2019
- 期刊:Journal of Theoretical Biology
- 影响因子:2
- 作者:Tao Jin;Liu Xiaoqing;Yang Siqian;Bao Chaohui;He Pingan;Dai Qi
- 通讯作者:Dai Qi
Prediction of lncRNA-disease association based on a Laplace normalized random walk with restart algorithm on heterogeneous networks.
基于异构网络上拉普拉斯归一化随机游走和重启算法的 lncRNA-疾病关联预测。
- DOI:10.1186/s12859-021-04538-1
- 发表时间:2022-01-04
- 期刊:BMC bioinformatics
- 影响因子:3
- 作者:Wang L;Shang M;Dai Q;He PA
- 通讯作者:He PA
基于密码子特征的蛋白质序列图形表示
- DOI:--
- 发表时间:2018
- 期刊:浙江理工大学学报(自然科学版)
- 影响因子:--
- 作者:朱正阳;贺平安
- 通讯作者:贺平安
共 15 条
- 1
- 2
- 3
其他文献
家蚕核糖体蛋白L7基因cDNA序列的克隆和分析
- DOI:--
- 发表时间:--
- 期刊:中国生物化学与分子生物学报
- 影响因子:--
- 作者:王丹;张耀洲;聂作明;陈健;龙晓辉;吕正兵;贺平安
- 通讯作者:贺平安
共 2 条
- 1
贺平安的其他基金
基于蛋白序列图形表示的膜蛋白结构与功能预测研究
- 批准号:61170110
- 批准年份:2011
- 资助金额:55.0 万元
- 项目类别:面上项目