基因表达谱缺失数据的填补融合方法及策略研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    81273178
  • 项目类别:
    面上项目
  • 资助金额:
    55.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    H3011.流行病学方法与卫生统计
  • 结题年份:
    2016
  • 批准年份:
    2012
  • 项目状态:
    已结题
  • 起止时间:
    2013-01-01 至2016-12-31

项目摘要

How to analyze the gene expression data with missing value is the key and difficult topic in biological data analysis. In view of the limitations of simple imputation methods at parent, such as zero (row) average method, particular value method, regression analysis method, K-nearest Neighbor, etc. and the shortage of specific imputation strategy research. We will put forward a kind of new fusion method of nonparametric multiple imputation based on support vector regression (SVR-NPMI) to estimates the missing value of gene expression profile, which organically fuses in together with multiple imputation, support vector machine (SVM) based on of choice kernel function and regression analysis. Through the analysis and application validation of public datasets and the experimental datasets, we emphasis on discuss and set up the missing imputation strategies for different series datasets, different analysis purposes, different missing rate, and further clarify the biological impact on the subsequent analysis of gene expression patterns of missing imputation and it's extent. The successful implementation of this project will have obvious promoting role for solving some puzzles of genomics research in life sciences and developing new methods of bioinformatics technology analysis, which establish an important theoretical and practical basis for its application.
如何分析有缺失值的基因表达谱数据,是生物数据分析中的重点和难点,针对目前通行的零(行)均值法、特定值法、回归分析、K邻近法等单一填补法存在的局限,和缺少具体填补策略研究方面的不足;本项目提出一种将多重填补、基于核函数选择的支持向量机和回归分析有机地融合在一起的新的缺失填补融合方法- - 基于支持向量回归的非参多重填补(SVR-NPMI)法,对基因表达谱缺失数据进行估计与填充;通过对公开数据集和自实验数据集的分析与应用验证,重点探讨并建立不同序列数据集、不同分析目的、不同缺失率情况下的缺失填补策略,以进一步阐明缺失填补方法对基因表达谱后续不同分析目的的生物学影响及其程度。本项目的成功实施,将对解决生命科学中的基因组学研究难题及发展生物信息学技术分析的新方法产生明显的促进作用,为其实际应用打下重要的理论与实际基础。

结项摘要

研究背景:基因表达谱缺失数据的大量存在,严重影响后续分析结果的客观性和正确性;如何根据已有数据信息的特征进行缺失值的有效估计、填补策略构建和填补方法对基因表达谱后续不同分析目的影响评估是极具重要科学意义的研究内容,也是统计学和生物信息学中数据分析研究领域的重难点。.研究方法:采用统计学、数学、计算机科学和生物医学等多个交叉学科的理论研究方法和文献研究方法,对项目的主要内容进行探究与证实。. 研究内容:探讨了基于支持向量回归的非参多重填补(SVR-NPMI)新融合方法和非参缺失森林填补(MissForest-non-parametric)法对基因表达谱缺失数据进行估计,构建了不同序列数据集、不同缺失产生机制、不同缺失比例情况下的填补策略,阐明了填补方法对基因表达谱后续不同分析目的的生物学影响。. 重要结果:(1)基于SAM-WT方法不仅可以更加灵活有效地筛选差异表达基因,而且同时达到降低假阳性率大小的目的,为大规模差异表达基因的有效筛选提供一种新的思路和方法;(2)首次将MissForest-non-parametric法应用于基因表达谱缺失数据的估计,取得了不错的填补效果;(3)通过理论研究、模拟和实际数据的应用验证,证实了SVR-NPMI新融合方法对基因表达谱缺失数据填补的有效性和可靠性;(4)构建了不同序列数据集、不同缺失比例等情况下的填补策略,具体可以根据数据集分布、维度大小和填补方法特性等选择恰当的填补方法;(5)通过对多个基因表达谱数据集的分析,证实了填补方法对差异表达基因筛选和基因功能聚类等分析目的生物学影响;(6)开发的《基因表达谱缺失数据填补分析系统》软件,可以使用多种填补方法对基因表达谱缺失数据进行填补,并对其填补效果进行评估。. 科学意义:项目提出的SVR-NPMI新融合方法和MissForest-non-parametric法发展和丰富了基因表达谱缺失数据的填补模型,推动了生物信息学技术分析领域中新方法的发展,为生物医学等领域大数据的分析提供方法学的借鉴和参考,具有重要的学术理论价值。首次构建的缺失填补分析策略和开发的《基因表达谱缺失数据填补分析系统》软件,可以帮助研究者更好更快的确定适合其数据集的填补方式,更为方便快捷地进行数据分析,提供参考与服务。

项目成果

期刊论文数量(7)
专著数量(0)
科研奖励数量(1)
会议论文数量(6)
专利数量(0)
Identification of differentially expressed genes using multi-resolution wavelet transformation analysis combined with SAM
多分辨率小波变换分析结合SAM鉴定差异表达基因
  • DOI:
    --
  • 发表时间:
    2012
  • 期刊:
    Gene
  • 影响因子:
    3.5
  • 作者:
    Zhang, Ling;Liu, Ling;Zhang, Yanqi;Yi, Dong
  • 通讯作者:
    Yi, Dong
Attitudes of Medical Graduate and Undergraduate Students toward the Learning and Application of Medical Statistics
医学研究生和本科生对医学统计学学习和应用的态度
  • DOI:
    10.1080/00219266.2014.923487
  • 发表时间:
    2015-07
  • 期刊:
    Journal of Biological Education
  • 影响因子:
    1.1
  • 作者:
    Liu, Ling;Zhang, Yanqi;Liu, Xiaoyu;Yi, Dong
  • 通讯作者:
    Yi, Dong
Cognition of and Demand for Education and Teaching in Medical Statistics in China: A Systematic Review and Meta-Analysis.
我国医学统计学教育教学的认知与需求:系统回顾与荟萃分析
  • DOI:
    10.1371/journal.pone.0128721
  • 发表时间:
    2015
  • 期刊:
    PloS one
  • 影响因子:
    3.7
  • 作者:
    Wu Y;Zhou L;Li G;Yi D;Wu X;Liu X;Zhang Y;Liu L;Yi D
  • 通讯作者:
    Yi D
A comparative study of different covariance structure models for the analysis of repeated measurement data
不同协方差结构模型重复测量数据分析的比较研究
  • DOI:
    10.1142/s1793524517500073
  • 发表时间:
    2017
  • 期刊:
    International Journal of Biomathematics
  • 影响因子:
    2.2
  • 作者:
    Yazhou Wu;Ling Zhang;Liang Zhou;Xiaoyu Liu;Ling Liu;Yanqi Zhang;Dong Yi
  • 通讯作者:
    Dong Yi
基因表达谱缺失数据填补估计方法的研究进展与探讨
  • DOI:
    --
  • 发表时间:
    2014
  • 期刊:
    重庆医学
  • 影响因子:
    --
  • 作者:
    伍亚舟;易东
  • 通讯作者:
    易东

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

25-羟维生素D及甲状旁腺素与高血压发病关系:剂量反应Meta分析
  • DOI:
    10.13406/j.cnki.cyxb.001295
  • 发表时间:
    2017
  • 期刊:
    重庆医科大学学报
  • 影响因子:
    --
  • 作者:
    黄艳红;周亮;陈虹汝;易大莉;张彦琦;伍亚舟;刘岭;易东
  • 通讯作者:
    易东
小波多尺度在基因表达芯片分析中的应用研究
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    European Biophysics Journal
  • 影响因子:
    --
  • 作者:
    伍亚舟;易东
  • 通讯作者:
    易东
重庆市2006-2012年艾滋病高危人群HIV/AIDS流行情况分析
  • DOI:
    --
  • 发表时间:
    2015
  • 期刊:
    第三军医大学学报
  • 影响因子:
    --
  • 作者:
    刘小钰;伍亚舟;易大莉;易东
  • 通讯作者:
    易东
中国高血压患者并发脑卒中风险的Rothman-Keller模型研究
  • DOI:
    10.16016/j.1000-5404.201703161
  • 发表时间:
    2017
  • 期刊:
    第三军医大学学报
  • 影响因子:
    --
  • 作者:
    黄艳红;周亮;陈虹汝;易大莉;张彦琦;伍亚舟;刘岭;易东
  • 通讯作者:
    易东
重庆市社区老年人代谢综合征患病率及相关因素分析
  • DOI:
    --
  • 发表时间:
    2012
  • 期刊:
    中国健康教育
  • 影响因子:
    --
  • 作者:
    伍亚舟;易东;李媛;石凯
  • 通讯作者:
    石凯

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

伍亚舟的其他基金

基于多组学数据癌症分型的增量深度集成学习整合方法及分析策略研究
  • 批准号:
    82173621
  • 批准年份:
    2021
  • 资助金额:
    55.00 万元
  • 项目类别:
    面上项目
基于多组学数据癌症分型的增量深度集成学习整合方法及分析策略研究
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    55 万元
  • 项目类别:
    面上项目
基于影像组学异构多模态数据的深度迁移学习混合模型方法研究
  • 批准号:
    81872716
  • 批准年份:
    2018
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
多元纵向数据的统计联合建模方法及其分析策略研究
  • 批准号:
    81573254
  • 批准年份:
    2015
  • 资助金额:
    55.0 万元
  • 项目类别:
    面上项目
基于SNP交互作用网络高可信度预测分析的数学模型建立与评估研究
  • 批准号:
    30901242
  • 批准年份:
    2009
  • 资助金额:
    19.0 万元
  • 项目类别:
    青年科学基金项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码