基于集成学习的高维癌症基因微阵列数据分析方法研究
项目介绍
AI项目解读
基本信息
- 批准号:61100106
- 项目类别:青年科学基金项目
- 资助金额:22.0万
- 负责人:
- 依托单位:
- 学科分类:F0213.生物信息计算与数字健康
- 结题年份:2014
- 批准年份:2011
- 项目状态:已结题
- 起止时间:2012-01-01 至2014-12-31
- 项目参与者:吴清锋; 刘国彦; 谢书童; 吴清强; 王美红; 苏淑文; 童牧晨玄; 王文杰; 张才东;
- 关键词:
项目摘要
肿瘤是一种目前还未明确发病机理的严重危害人类生命健康的分子疾病,而基因微阵列技术为从分子水平上研究其发病机理与临床诊断方法提供了强有力的手段。本课题重点研究基于肿瘤基因表达谱的数据分析方法,针对基因数据高维小样本的特点,设计基于多重编码进化计算的多分类器集成学习系统,分析完备基因数据集,挖掘具有最高分类性能的最小基因子集,并判定癌症类型,为肿瘤分类模型构建、致癌基因分析与调控通路分析提供基础。拟构造基于特征的差异度测度,结合与分类器无关的特征选择算法理论,并针对样本数不均衡问题设计算子,从而搜索与分类界面无关的可靠基因表达模式组合,进而深入探讨致癌基因的相互调控作用。并将结合流形学习等非线性降维方法,实现数据的可视化分析,以此为基础设计系统仿真诊断软件,从而为促进肿瘤基因组学和药物基因组学的进一步研究打下基础。
结项摘要
本项目主要围绕针对癌症基因微阵列数据的高维小样本特点,结合进化算法,设计并实现了多个集成学习算法框架,实现有效的数据分析;此外还对相关医学领域进行了跨学科领域的探讨,主要的成果为:1、基于最高得分基因对(Top Score Pairwise)方法,设计了基于遗传算法的支持向量机集成选择算法(GA-ESP)系统框架,可以有效对基因数据进行关键基因筛选与类别判定,具有良好的推广能力。2、基于厦门市中山医院的癌症病例样本进行组织芯片数据分析,使用不同特征选择方法,针对不同癌症患者样本的肿瘤瘤内与瘤旁基因表达差异进行挖掘,总结出TP53基因在不同癌症中的调控作用。3、设计了一种局部线性表示Fisher的流形学习方法(LLRFC),分别从不同类癌症基因数据抽取k近邻数据构建类间图、同类基因抽取k近邻数据构建类内图,之后用局部最小线性重构方法优化两个图的权重,并用Fisher判决条件搜索一个低维子空间,同时最小化类内图与类外图的重构错误率,从而获得较理想的降维效果。4、设计了基于遗传规划的集成学习系统构造方法,并以此为基础对决策树进行了集成,形成GPES集成学习系统。在基于两类与多类基因微阵列数据分析的实验中发现该算法与一些经典的集成学习算法相比,如随机森林、旋转森林等,具有更好的推广能力和稳健性。5、设计了两种算法对传统ECOC编码方法进行多级集成,构建了E-ECOC集成学习系统,用以癌症基因微阵列数据进行了分类判别,分析基因在多种癌症之间的差异进行分析。设计了基于输出纠错编码差异度分析的测度,用于指导生成具有高差异度的集成学习系统。经过改进的ECOC编码应用与基因数据分析上能取得较好的识别率。此外,在其余领域取得的成果包括:1、基于随机森林设计了一种混合集成学习模型,对白血病研究的相关论文文献情况进行分析,构造了具有克服不均衡样本问题,对文献的分类获得了理想效果。2、基于模糊聚类算法进行了改进,设计了一种基于模糊空间聚类的算法,对实际的石油地震数据与人工空间数据进行聚类,与传统计算方法相比降低了算法复杂度,同时有效提升了聚类效果。3、提出了一种基于局部混合层集方法构建3D血管模型,结合了局部区域信息与边界信息,用于血管边缘分割,从而实现微细血管结构的精确抽取。4、引入局部适应二进制能量方程实现混合层集合算法框架,有效实现局部信息的抽取,更好的实现了不均衡分布的血管图像分割。
项目成果
期刊论文数量(9)
专著数量(0)
科研奖励数量(0)
会议论文数量(6)
专利数量(0)
A New Spatial Fuzzy C-Means for Spatial Clustering
一种用于空间聚类的新空间模糊C均值方法
- DOI:--
- 发表时间:--
- 期刊:WSEAS Transactions on Computers
- 影响因子:--
- 作者:Yingdi Guo;Kunhong Liu;Qingqiang Wu;Qingqi Hong;Haiying Zhang
- 通讯作者:Haiying Zhang
An ensemble of SVM classifiers based on gene pairs
基于基因对的 SVM 分类器集合
- DOI:10.1016/j.compbiomed.2013.03.010
- 发表时间:2013
- 期刊:Computers in Biology and Medicine
- 影响因子:7.7
- 作者:Muchenxuan Tong;Kun-Hong Liu;Chungui Xu;Wenbin Ju
- 通讯作者:Wenbin Ju
3D vasculature segmentation using localized hybrid level-set method
使用局部混合水平集方法进行 3D 脉管系统分割
- DOI:10.1186/1475-925x-13-169
- 发表时间:2014-12-16
- 期刊:BioMedical Engineering Online
- 影响因子:--
- 作者:Hong Q;Li Q;Wang B;Li Y;Yao J;Liu K;Wu Q
- 通讯作者:Wu Q
Mixed-sampling approach to unbalanced data distributions: A case study involving Leukemia's document profiling
不平衡数据分布的混合抽样方法:涉及白血病的案例研究
- DOI:--
- 发表时间:2011
- 期刊:WSEAS Transactions on Information Science and Applications
- 影响因子:--
- 作者:Wu QingQiang;Liu Hua;Liu Kun-Hong
- 通讯作者:Liu Kun-Hong
Novel cancerization marker, TP53, and its role in distinguishing normal tissue adjacent to cancerous tissue from normal tissue adjacent to benign tissue
新型癌化标记物 TP53 及其在区分癌组织邻近正常组织和良性组织邻近正常组织中的作用
- DOI:10.1186/1477-7819-10-252
- 发表时间:2012-11-21
- 期刊:World Journal of Surgical Oncology
- 影响因子:3.2
- 作者:Liu GY;Liu KH;Li Y;Pan C;Su JQ;Liao HF;Yv RX;Li ZH;Yuan L;Zhang HJ;Tzeng CM;Xiong B
- 通讯作者:Xiong B
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
基于迭代延长纠错输出编码的微阵列数据多分类方法
- DOI:--
- 发表时间:2018
- 期刊:厦门大学学报(自然科学版)
- 影响因子:--
- 作者:钟天云;刘昆宏;王备战
- 通讯作者:王备战
基于形态学的车辆遮挡检测与分割
- DOI:--
- 发表时间:2015
- 期刊:Journal of Information and computational science
- 影响因子:--
- 作者:张海英;郑慧翔;刘昆宏
- 通讯作者:刘昆宏
用于癌症分类的多类别微阵列数据的分层集成ECOC方法
- DOI:--
- 发表时间:2016
- 期刊:Information sciences
- 影响因子:8.1
- 作者:刘昆宏;曾志浩;Vincent To Yee Ng
- 通讯作者:Vincent To Yee Ng
基于遗传算法的微阵列数据分类集成系统
- DOI:--
- 发表时间:2015
- 期刊:compitational and mathematical methods in medicine
- 影响因子:--
- 作者:刘昆宏;Muchenxuan Tong;Shu-Tong Xie;Vincent To Yee Ng2
- 通讯作者:Vincent To Yee Ng2
Feature extraction using constrained maximum variance mapping
使用约束最大方差映射进行特征提取
- DOI:--
- 发表时间:--
- 期刊:Pattern Recognition
- 影响因子:8
- 作者:李波;王超;刘昆宏;黄德双
- 通讯作者:黄德双
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
刘昆宏的其他基金
基于输出纠错编码的开集多类数据挖掘算法研究
- 批准号:61772023
- 批准年份:2017
- 资助金额:48.0 万元
- 项目类别:面上项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}