基于偏最小二乘和贝叶斯理论的代谢组学数据挖掘的新算法研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    31601070
  • 项目类别:
    青年科学基金项目
  • 资助金额:
    17.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    C0608.生物数据资源与分析方法
  • 结题年份:
    2019
  • 批准年份:
    2016
  • 项目状态:
    已结题
  • 起止时间:
    2017-01-01 至2019-12-31

项目摘要

Based on previous investigation, it is found that current implementation of partial least square (PLS) algorithm was not optimized based on the definition of its criterion. In this project, we will investigate the optimization rule of the PLS criterion, based on which, a novel multivariate analysis algorithm will be developed. The superiority of the new optimization rule will be theoretically justified. Both the new and current PLS algorithms will be applied to metabolomics datasets to evaluate their advantages and disadvantages. Furthermore, the analyzation of complex metabolomics NMR spectra is time consuming even with the well-developed BATMAN (Bayesian AuTomated Metabolite Analyser for NMR spectra) software. As the sampling process for parameters in Bayesian modeling is an iterative process with large number of loops, the analysis is not efficient with high resolution NMR spectra. In this project, we will propose to incorporate the hybrid independent component analysis (ICA) method as a pre-process step for Bayesian model to give a better starting point for its parameters, hence to improve its processing speed and accuracy. More efficient metabolomics data analyzing algorithms should provide a better understanding of the data, promote its further application and eventually integrate with other omics research in system biology applications.
基于前期研究发现,目前常用的偏最小二乘(PLS)算法并不是其目标定义的最优化结果。本课题将基于PLS定义推导出最优化准则,并开发出更加优化的进行多变量分析的新算法。本课题将从理论上证明新算法的优越性,并将新算法应用于代谢组学数据中。对比目前的PLS算法,解释和检验在理论和实践中的两种算法各自的优势和特点。另一方面,申请人开发的BATMAN软件成功的实现了代谢组学核磁共振(NMR)谱数据谱峰拟合分析的自动化。但是由于贝叶斯模型中含有多个参数需要进行大量的循环迭代运算采样,因此其在分析高分辨率NMR谱时运算效率不高。本课题将探索使用申请人前期提出的混合独立成分分析技术改进BATMAN算法的迭代初始值的设定,从而提高算法的运算效率和准确性。为代谢组学更广泛的应用提供更有效的数据分析工具,促进代谢组学在系统生物学研究中,以及与其他组学间更多的结合与应用。

结项摘要

代谢组学是继基因组学,转录组学和蛋白质组学之后,组学家族中日趋成熟的一员。代谢组学与其他组学的结合,也是目前大规模系统性研究各类疾病的趋势。由于各组学间采集数据本质的差异,意味着他们可以提供互补的生物信息。对生物体的全局功能的了解需要多组学的整合来实现,但这同时也增加了整个数据集的复杂性。随着多组学大型检验中心,大型数据库等的不断建立和发展,以及各种数据采集仪器的不断精进,更多信息含量的,高度复杂的组学大数据正迅速积累。高通量代谢组学数据与其他组学数据相结合的实际需求对数据分析处理技术提出了更高的要求。高通量大数据中干扰后续分析的各种噪声信号变量和技术噪声等,会直接影响分类聚类结果以及代谢标志物的发现。大数据中含有有效信息的变量数量常常大大少于噪声信息的变量数量,被大量无用信息覆盖下的有效信息,即使在各种带监督和无监督机器学习的算法下也常常难以表征。而目前对于大数据去除干扰的方法,多停留在主观选择去除条件的方法上。基于上述问题,我们提出了一种基于样本数据统计学特性的自适应无监督去噪算法。此阈值与数据统计特性密切相关,去除了主观去噪方法中可能存在的问题,大大提高了可分类别趋势和数目以及生物标志物的类目。对比目前已有算法分析结果,相同的几组数据都拿到了更多更锐利的聚类结果,或者与已发表文章不同的生物标志物。BATMAN软件成功的实现了代谢组学核磁共振(NMR)谱数据谱峰拟合分析的自动化。但是由于贝叶斯模型中含有多个参数需要进行大量的循环迭代运算采样,因此其在分析高分辨率NMR谱时运算效率不高。在复杂模型的实际实现中,坐标上升方法中广泛使用蒙特卡罗方法估算期望值,而导数驱动方法则多用梯度估算。我们提出了蒙特卡洛坐标上升变异推理 (Monte Carlo Co-ordinate Ascent VI(MC-CAVI))算法,在计算坐标上升变异推理 (CAVI)所需的期望值时使用马尔科夫链蒙特卡罗 (MCMC) 方法。我们讨论并显示了在模拟和真实的例子中,MC-CAVI适用于具有硬性约束条件的模型。我们比较了在分析代谢组学核磁共振 (NMR)谱的BATMAN复杂模型分析中,MC-CAVI 和MCMC的性能。

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(3)
Optimal Gene Filtering for Single-Cell data (OGFSC)—a gene filtering algorithm for single-cell RNA-seq data
单细胞数据最优基因过滤 (OGFSC) – 用于单细胞 RNA-seq 数据的基因过滤算法
  • DOI:
    10.1093/bioinformatics/bty1016
  • 发表时间:
    2018
  • 期刊:
    Bioinformatics
  • 影响因子:
    5.8
  • 作者:
    Jie Hao
  • 通讯作者:
    Jie Hao

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

非晶软磁合金带材斜喷工艺模拟仿真
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    稀 有 金 属
  • 影响因子:
    --
  • 作者:
    郝洁;黄敬晖;丁昂;张延松;宋瑞银;张泽强;纪松
  • 通讯作者:
    纪松
The Relationship between Organizational Justice and Job Satisfaction----Evidence from China
组织公正与工作满意度的关系——来自中国的证据
  • DOI:
    10.1016/j.aqpro.2016.06.010
  • 发表时间:
    --
  • 期刊:
    Personnel Review
  • 影响因子:
    3.9
  • 作者:
    郝云宏;郝洁;王晓辰
  • 通讯作者:
    王晓辰
区域气候情景Delta-DCSI降尺度方法
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    Journal of Sichuan University(engineering Science Edition)
  • 影响因子:
    --
  • 作者:
    郝振纯;李丽;徐毅;鞠琴;严杰;罗键;王加虎;郝洁
  • 通讯作者:
    郝洁
基于点触任务的可变形臂逆运动学求解
  • DOI:
    --
  • 发表时间:
    2017
  • 期刊:
    机器人
  • 影响因子:
    --
  • 作者:
    许杉;李高峰;刘景泰;郝洁
  • 通讯作者:
    郝洁
基于自适应能量阈值的按需节能组播路由协议
  • DOI:
    --
  • 发表时间:
    2014
  • 期刊:
    中国科学院大学学报
  • 影响因子:
    --
  • 作者:
    段国建;郝洁;姚郑;张宝贤
  • 通讯作者:
    张宝贤

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

郝洁的其他基金

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码