面向可变剪接异构体功能预测的数据整合方法研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61872300
  • 项目类别:
    面上项目
  • 资助金额:
    63.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0213.生物信息计算与数字健康
  • 结题年份:
    2022
  • 批准年份:
    2018
  • 项目状态:
    已结题
  • 起止时间:
    2019-01-01 至2022-12-31

项目摘要

Existing researches of gene function prediction are still at the gene-level, they do not differentially annotate the functions of alternative splicing isoforms of the same gene and the consequent proteoforms, but functional annotations in the isoform-level are more significant for biology and medical research. To address the issues of scarce functional annotations of isoforms, large scale biological data, limited related computational researches, limitations in fusing data types and granularity, our project targets to efficiently fuse multi-level heterogeneous biological data to precisely annotate the functions of isoforms. The project firstly constructs and optimizes a biological network composed with multi-level molecules to integrative encode and represent heterogeneous data, which have direct or indirect connections with isoforms. Based on this network, to address the specific difficulties and demands of isoform function prediction, the project separately designs predictive models based on personalized random walks, weakly supervised multi-view multi-instance learning, and blocked-matrices collaborative factorization, and thus to drive gene function prediction research from gene-level toward the more fined isoform-level. In the end, this project plans to develop a system based on the above research, and applies it to annotate Silkworm isoforms and to visually uncover the biological network pattern of representative complex diseases at the isoform-level. This project has significant meanings in boosting the research and application of machine learning for large scale heterogeneous data integrative analysis.
现有基因功能预测研究仍停留在基因水平,并未区分标注同一基因受不同剪接方式产生的多个可变剪接异构体及对应多个蛋白亚型的功能,亚型水平的功能标注信息更具有生命医学指导意义。本项目针对剪接异构体功能标注信息缺乏、数据规模大、计算研究成果少、整合数据的类型和粒度有限等困难,以高效集成多层次异构生物数据,精准预测剪接异构体功能为目标。首先构建多层次生物分子网络对与剪接异构体直接或间接相关的数据进行集成表示与优化;在此基础上围绕剪接异构体功能预测的特有困难和需求,从不同角度出发分别设计基于个性化随机游走、弱监督多视图多示例学习、矩阵分块协同分解的预测模型,将基因功能预测研究向更精细的亚型水平推进;最后基于上述研究开发系统,并应用于亚型水平的家蚕剪接异构体功能标注和典型复杂疾病的多层次生物分子网络模式分析与可视化。本项目在促进面向大规模异构数据整合分析的机器学习理论和应用研究等方面均具有重要意义。

结项摘要

现有基因功能预测研究仍停留在基因水平,并未区分标注同一基因受不同剪接方式产生的多个可变剪接异构体及对应多个蛋白亚型的功能,亚型水平的功能标注信息更具有生命医学指导意义。本项目针对剪接异构体功能标注信息缺乏、数据规模大、计算研究成果少、整合数据的类型和粒度有限等困难,聚焦高效集成多层次异构生物数据,精准预测剪接异构体功能。首先构建多层次生物分子网络对与剪接异构体相关的多层次组学数据进行集成表示与联合建模;其次聚焦剪接异构体功能预测的特有困难和需求,针对剪接异构体、基因本体等组成的异质网络构建了异步多示例随机游走、矩阵协同分解、深度多示例学习和组织特异性的功能预测方法体系,证明了这些建模方法在可变剪接异构体功能预测中的先进性和有效性,解决了大规模剪接异构体功能预测难题;进一步研究大规模可变剪接异构体互作网络构建方法和剪接异构体与疾病关联预测技术,均获得了比当前方法最优的精度和可解释性,实现了从功能预测-网络构建-疾病关联识别的研究链条。与此同时,提炼上述生物数据挖掘问题为开放环境下的弱监督学习问题并设计了相应的弱监督学习方法体系,推动了弱监督学习科研与应用的开拓性发展。最后整合上述理论和方法研究成果,集成研发了可变剪接异构体数据库和功能预测平台并上线www.sdu-idea.cn/IsoformDB,将有力支撑可变剪接异构体更深入的研究与应用。.项目执行期共计发表(录用)学术论文71篇,其中中国计算机学会推荐A类期刊和会议14篇,B类期刊和会议41篇,最高影响因子19.118。共享相关30余个算法代码和数据集给国内外同行使用。项目执行期获重庆市自然科学奖1项,培养硕士生18人,3名研究生获重庆市优秀毕业生,20余人次获国家奖学金和省部级科技奖励。本项目对现实世界中典型的多示例、多标记、多视图和异质弱关联数据的智能融合挖掘方法和技术研究具有指导意义,深化并拓展面向上述复杂数据分析的机器学习研究。

项目成果

期刊论文数量(43)
专著数量(0)
科研奖励数量(0)
会议论文数量(28)
专利数量(0)
Isoform function prediction based on bi-random walks on a heterogeneous network
基于异构网络双随机游走的同种型函数预测
  • DOI:
    10.1093/bioinformatics/btz535
  • 发表时间:
    2020
  • 期刊:
    Bioinformatics
  • 影响因子:
    5.8
  • 作者:
    Yu Guoxian;Wang Keyao;Domeniconi Carlotta;Guo Maozu;Wang Jun
  • 通讯作者:
    Wang Jun
Differentiating isoform functions with collaborative matrix factorization
通过协作矩阵分解区分异构体功能
  • DOI:
    10.1093/bioinformatics/btz847
  • 发表时间:
    2020
  • 期刊:
    Bioinformatics
  • 影响因子:
    5.8
  • 作者:
    Wang Keyao;Wang Jun;Domeniconi Carlotta;Zhang Xiangliang;Yu Guoxian
  • 通讯作者:
    Yu Guoxian
Cooperative driver pathway discovery via fusion of multi-relational data of genes, miRNAs and pathways
通过融合基因、miRNA 和通路的多关系数据来发现合作驱动通路
  • DOI:
    10.1093/bib/bbz167
  • 发表时间:
    2021
  • 期刊:
    Briefings in Bioinformatics
  • 影响因子:
    9.5
  • 作者:
    Wang Jun;Yang Ziying;Domeniconi Carlotta;Zhang Xiangliang;Yu Guoxian
  • 通讯作者:
    Yu Guoxian
基于网络约束双聚类的癌症亚型分类
  • DOI:
    --
  • 发表时间:
    2019
  • 期刊:
    计算机学报
  • 影响因子:
    --
  • 作者:
    王星;王峻;余国先;郭茂祖
  • 通讯作者:
    郭茂祖
Personalized federated few-shot learning
个性化联合小样本学习
  • DOI:
    10.1109/tnnls.2022.3190359
  • 发表时间:
    2022
  • 期刊:
    IEEE Transactions on Neural Networks and Learning Systems
  • 影响因子:
    10.4
  • 作者:
    Zhao Yunfeng;Yu Guoxian;Wang Jun;Domeniconi Carlotta;Guo Maozu;Zhang Xiangliang;Cui Lizhen
  • 通讯作者:
    Cui Lizhen

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

基于网络约束双聚类的癌症亚型分类
  • DOI:
    --
  • 发表时间:
    2019
  • 期刊:
    计算机学报
  • 影响因子:
    --
  • 作者:
    王星;王峻;余国先;郭茂祖
  • 通讯作者:
    郭茂祖
基于正负样例的蛋白质功能预测
  • DOI:
    10.7544/issn1000-1239.2016.20160196
  • 发表时间:
    2016
  • 期刊:
    计算机研究与发展
  • 影响因子:
    --
  • 作者:
    傅广垣;余国先;王峻;郭茂祖
  • 通讯作者:
    郭茂祖
基于稀疏语义的蛋白质噪声功能标注识别
  • DOI:
    --
  • 发表时间:
    2017
  • 期刊:
    中国科学-信息科学
  • 影响因子:
    --
  • 作者:
    路畅;陈霞;王峻;余国先;余志文
  • 通讯作者:
    余志文
基于多网络数据协同矩阵分解预测蛋白质功能
  • DOI:
    --
  • 发表时间:
    2017
  • 期刊:
    计算机研究与发展
  • 影响因子:
    --
  • 作者:
    余国先;王可尧;傅广垣;王峻;曾安
  • 通讯作者:
    曾安
基于 0-1 矩阵分解的蛋白质功能预测
  • DOI:
    --
  • 发表时间:
    2019
  • 期刊:
    中国科学:信息科学
  • 影响因子:
    --
  • 作者:
    赵颖闻;王峻;郭茂祖;张自力;余国先
  • 通讯作者:
    余国先

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码