化学计量学在基因表达定量解析及临床预测模型构建中的应用研究
项目介绍
AI项目解读
基本信息
- 批准号:21205085
- 项目类别:青年科学基金项目
- 资助金额:25.0万
- 负责人:
- 依托单位:
- 学科分类:B0310.化学信息学与人工智能
- 结题年份:2015
- 批准年份:2012
- 项目状态:已结题
- 起止时间:2013-01-01 至2015-12-31
- 项目参与者:闫冰; 杨刚; 张丽芳; 张娟; 吴镝;
- 关键词:
项目摘要
The prognosis for a cancer includes the expected duration and the likely outcomes of this kind of disease, and is a hotspot in bioinformatics researches. Since Brown and his colleagues developed microarray system in 1995, researchers can monitor the expression of thousands of genes simultaneously. Different biological events in cell are closely associated with gene expression. Therefore, Gene expression profiling (GEP) becomes a powerful technique for exploring global expression patterns of cells, and is widely applied to seek biomarkers of cancers for well understanding the pathogenetic mechanism at molecular level. Therefore, it is important to create the prediction models for cancer prognosis and improve the prediction accuracy of them based on gene expression data. MAQC-II project, which was launched by U.S. Food and Drug Administration, investigated more than 30,000 predictive models generated by 36 independent research groups and found that the prediction accuracy is not satisfied for some complex cancers. For example, the AUC of predicting the overall survival of multiple myeloma patients was only 0.615. .The complexity of clinical cancer samples will greatly impact the detection results of microarray gene chip and will also lower the prediction ability of the models. In this project, we will separate the gene expression profiles of cancer cells from the clinical samples by using multivariate calibration and resolution methods at the first step. Then, the differentially expressed genes related with cancers will be enriched by biological statistics and the analysis of gene function. Finally, the prediction models for the prognosis of three complex cancers, which were selected in MAQC project, were rebuilt with the gene lists highly related with cancers. We expected these new models to achieve the better outcomes.
癌症的预后是针对癌症可能的病程及治疗结果的预测,是近年来生物信息学的研究热点。微阵列基因芯片技术的问世,为各类癌症分子水平的研究提供了有效的方法,因此,建立基于基因表达的癌症预后模型及提高模型的预测能力是亟待解决的关键问题。美国食品和药物管理局发起的MAQC-II项目,对基于基因表达谱的共30,000多个预测模型进行考察,发现对于一些复杂癌症,模型预测能力不足,例如对多发性骨髓瘤病人存活率预测结果的AUC值仅为0.615。.癌症样本的复杂性对基因表达谱的检测结果有很大的影响,进而干扰模型的预测能力。本项目拟采用多元分辨与校正的方法,对于不同类别癌症,分别从其复杂样本基因表达数据中对肿瘤细胞表达谱进行分离,降低非肿瘤细胞造成的干扰;进而结合生物统计方法与基因功能分析,筛选对应类别癌症的特征基因;最后利用模式识别的方法,重建预测模型,以期提高MAQC项目中三类复杂癌症的预后结果。
结项摘要
微阵列芯片技术已被广泛用于癌症可能的病程及治疗结果的预测(及癌症预后)当中,为各类癌症分子水平的研究提供了有力工具。因此,建立基于基因表达的预测模型用于各类癌症预后的预测以及如何提高模型的预测能力,成为了亟待解决的问题。有效解决该类问题,有助于推动基因组学技术在临床医学转化中的应用以及个性化医疗的进程。本项目主要针对由临床癌症样本的复杂性所引起的模型预测能力不足问题,展开如下研究:1)探索由于样本中混合细胞类型引起的模型预测能力降低问题;2)探索由于特征基因集中包含过多“假阳性”基因引起的模型稳健性降低问题;3)探索在癌变过程中引起基因表达改变的原因。.针对临床组织样本的混合细胞中特定细胞类型基因表达谱的分离问题,项目组通过筛选,发现非负矩阵分解算法能够很好的从混合细胞基因表达谱中分离出各组织细胞的纯基因表达谱。该方法对来自大鼠脑、肝脏及肺部三类组织的混合样本基因表达谱数据进行分解,所提取的单个组织的基因表达谱与实验测定的纯组织表达谱进行比较,相关系数均高于0.97。在临床样本的分析中,该方法通过对肾脏移植病人全血样本基因表达谱的分解,分别计算出样本中5类主要细胞的纯基因表达谱,随后分别比较这5类细胞在两类病人样本中的基因表达的差异,找到了一系列差异性表达基因,最后通过基因功能分析,发现这些基因与肾脏移植急性排斥确实存在显著关联,从而提高了临床分析的准确性。在去除“假阳性”基因方面,项目组分别尝试了基于基因相似性、网络算法以及非参数变量筛选的方法对特征基因集中的基因进行筛选,发现基于网络的方法以及基于非参数变量筛选的方法能有效地减少特征基因集中的基因的数目,有利于提高模型的稳健性,并且确了最终用于建模的基因与病症有显著的关联。最后的预测结果亦表明,模型的预测能力有了明显的提高。在探索癌变过程中引起基因表达改变的原因方面,项目组通过对12个与乳腺癌、脑瘤、糖尿病等疾病相关的基因组关联分析数据集的统计分析,发现了286个与疾病相关的单核苷酸突变位点,即这些突变出现在与miRNA结合区域有可能使得该基因与某类疾病的产生或发展相关联。与此同时,项目组还发现采用不同的统计方法对找到的基因功能进行分析,得到的结果不尽相同,为了确保临床分析的准确性,我们进一步探讨了不同的统计方法对于基因功能分析结果的影响。此外,项目组在方法的拓展应用上亦作了初步的探索。
项目成果
期刊论文数量(11)
专著数量(0)
科研奖励数量(0)
会议论文数量(9)
专利数量(0)
Improving the prediction of chemotherapeutic sensitivity of tumors in breast cancer via optimizing the selection of candidate genes
通过优化候选基因的选择提高乳腺癌肿瘤化疗敏感性的预测
- DOI:10.1016/j.compbiolchem.2013.12.002
- 发表时间:2014-04-01
- 期刊:COMPUTATIONAL BIOLOGY AND CHEMISTRY
- 影响因子:3.1
- 作者:Jiang, Lina;Huang, Liqiu;He, Li
- 通讯作者:He, Li
Investigating the concordance of Gene Ontology terms reveals the intra- and inter-platform reproducibility of enrichment analysis.
调查基因本体术语的一致性揭示了富集分析的平台内和平台间可重复性
- DOI:10.1186/1471-2105-14-143
- 发表时间:2013-04-29
- 期刊:BMC bioinformatics
- 影响因子:3
- 作者:Zhang L;Zhang J;Yang G;Wu D;Jiang L;Wen Z;Li M
- 通讯作者:Li M
Identifying oncogenes as features for clinical cancer prognosis by Bayesian nonparametric variable selection algorithm
通过贝叶斯非参数变量选择算法将癌基因识别为临床癌症预后的特征
- DOI:10.1016/j.chemolab.2015.07.004
- 发表时间:2015-08
- 期刊:Chemometrics and Intelligent Laboratory Systems
- 影响因子:3.9
- 作者:Yongning Yang;Keqin Liu;Menglong Li;Zhining Wen
- 通讯作者:Zhining Wen
Characteristic wavenumbers of Raman spectra reveal the molecular mechanisms of oral leukoplakia and can help to improve the performance of diagnostic models
拉曼光谱特征波数揭示口腔白斑的分子机制,有助于提高诊断模型的性能
- DOI:10.1039/c4ay02318h
- 发表时间:2015-01
- 期刊:Analytical Methods
- 影响因子:3.1
- 作者:Xuemei Pu;Menglong Li;Zhining wen;Yi Li
- 通讯作者:Yi Li
Genome-wide association study combined with biological context can reveal more disease-related SNPs altering microRNA target seed sites.
全基因组关联研究结合生物学背景可以揭示更多改变 microRNA 目标种子位点的疾病相关 SNP。
- DOI:10.1186/1471-2164-15-669
- 发表时间:2014-08-08
- 期刊:BMC genomics
- 影响因子:4.4
- 作者:Wu D;Yang G;Zhang L;Xue J;Wen Z;Li M
- 通讯作者:Li M
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
支持向量回归预测蛋白质残基的B因子
- DOI:--
- 发表时间:--
- 期刊:计算机与应用化学
- 影响因子:--
- 作者:尹辉;敬闰宇;李益洲;文志宁;李梦龙
- 通讯作者:李梦龙
基于复杂网络的随机森林算法预测氨基酸突变对蛋白质稳定性的影响(英文)
- DOI:--
- 发表时间:--
- 期刊:化学研究与应用
- 影响因子:--
- 作者:方正;李益洲;肖嘉敏;李功兵;文志宁;李梦龙
- 通讯作者:李梦龙
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
文志宁的其他基金
基于转录组学大数据的临床复杂样本单类细胞定量解析方法研究
- 批准号:21575094
- 批准年份:2015
- 资助金额:65.0 万元
- 项目类别:面上项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}