基于深度学习的功能性长非编码RNA相关预测问题研究
项目介绍
AI项目解读
基本信息
- 批准号:61873202
- 项目类别:面上项目
- 资助金额:66.0万
- 负责人:
- 依托单位:
- 学科分类:F0305.生物、医学信息系统与技术
- 结题年份:2022
- 批准年份:2018
- 项目状态:已结题
- 起止时间:2019-01-01 至2022-12-31
- 项目参与者:樊校楠; 刘丽丽; 井方; 张腾; 李岩; 杨丽英; 王雅; 张希希; 何常润;
- 关键词:
项目摘要
LncRNAs (long non-coding RNAs) play critical roles in many biological processes such as cell differentiation, chromatin modification, transcriptional and post- transcriptional regulation, most of which require the interactions with other molecules (e.g., proteins, miRNAs). The dysregulation of lncRNAs is often associated with many human diseases. Discovering the lncRNA-protein interactions and lncRNA-disease associations can help to elucidate the function of lncRNAs, their regulatory mechanism, their pathological mechanisms in complex diseases, and provide guidance for more effective therapeutic intervention to complex diseases. Numerous computational methods have been developed for predicting new lncRNAs, lncRNA-protein interactions and lncRNA-disease associations, however, most existing methods are limited by using the hand-crafted features depended on the biological knowledge and experiences. Based on the powerful performance of automatically learning features of deep learning, the goal of this project is to develop the effective models and algorithms for to enable 1) accurate recognition of lncRNAs, 2) accurate prediction of lncRNA-protein interactions, 3) accurate identification of protein-binding nucleotide on the lncRNA sequences, 4) accurate prediction of lncRNA-disease association. According to the advantages of convolutional neural network (CNN), long short term memory network (LSTM) and stacked autoencoder network (SAE) due to different deep learning architectures (e.g., CNN is more appropriate for sequences data, LSTM has memory characteristic and SAE can effectively extract the important features from high-dimension input feature vector), and the biological characteristics of lncRNAs, lncRNA-protein interactions and lncRNA-disease associations, we will investigate the coding schemes of RNA sequences and their secondary structural unit sequences, protein sequences and their secondary structural unit and structural domain unit sequences, the feature extraction approaches of lncRNAs and diseases, and develop series of multi-modal hybrid deep learning models with CNN, LSTM and SAE to accurately distinguish lncRNAs and mRNAs, effectively predict lncRNA-protein interactions, precisely identify protein-associated nucleotide on the lncRNA sequences, exactly predict lncRNA-disease association. Particularly efforts are also planned to develop the software and user-friendly tools to facilitate the functional lncRNAs research for biologists and computational scientists.
LncRNA在众多细胞生理活动中扮演重要角色,其异常表达与人类重大疾病密切相关。lncRNA-蛋白质互作用、lncRNA-疾病相关性研究有助于揭示lncRNA调控功能机制,有效指导复杂疾病干预治疗。本项目将对功能性lncRNA相关预测问题进行深入研究,基于深度学习的强大自动特征提取及表达能力,发展有效的lncRNA相关预测算法。根据不同深度学习网络的结构特点,如深度卷积神经网络能够有效处理长度不等的序列数据、长短期记忆网络模型的记忆特性、栈氏自动编码器有效捕获输入特征向量中的重要特征,及lncRNA相关预测问题的生物学特性,研究RNA序列及其二级结构单元序列、蛋白质序列及其二级结构和结构域单元序列的编码方式,提出系列多模态深度学习混合模型算法,高精度识别lncRNA、预测lncRNA-蛋白质作用关系、确定lncRNA链上靶蛋白结合位点、预测lncRNA-疾病相关性,开发预测软件工具。
结项摘要
lncRNA-蛋白质互作用、lncRNA-疾病相关性研究有助于揭示lncRNA调控功能机制,有效指导复杂疾病干预治疗。本项目严格按照项目计划书要求开展研究工作,提出了lncRNA识别算法、lncRNA-蛋白质相互作用预测算法、lncRNA-蛋白质结合位点预测算法、转录因子结合位点预测算法、lncRNA-疾病关联关系预测算法,并在m6A甲基化功能基因识别、癌症驱动基因识别算法、药物-药物互作用预测、细胞通信网络重构等方面开展了研究工作,取得了以下主要研究成果:1、针对现有 lncRNA 识别算法多采用手工特征,而手工特征适应性和通用性较差问题,提出了基于多模态深度学习的lncRNA预测算法。2、针对深度学习模型结构复杂、参数数量庞大,及CNN模型要求输入固定长度序列问题,分别提出了基于宽度学习和基于拷贝策略CNN的lncRNA-蛋白质互作用关系预测算法。3、针对目前LncRNA-蛋白质结合位点预测算法遗漏RNA序列碱基间关联关系、预测精度有待改善问题,提出了基于卷积神经网络的多碱基编码lncRNA-蛋白质结合位点预测算法。4、针对目前LncRNA -疾病关联关系预测算法一般利用少量已知关联信息的LncRNA和疾病信息源,不能预测新lncRNA的潜在关联疾病,且遗漏分子网络拓扑结构中的深层嵌入特征问题,分别提出了基于多源信息融合和基于网络嵌入的LncRNA -疾病关联关系预测算法。5、分别提出了COSE、ACNN、TFBS_MLCNN转录因子结合位点预测算法,实现不同场景下的转录因子结合位点高精度预测。6、分别提出了FunDMDeep-m6A、m6Acancer-Net、m6A-express、m6Aexpress-Reader、m6Aexpress-BHM 和Hot-m6A-Dis算法,高精度识别m6A甲基化功能基因及其与疾病的关联关系,发现m6A甲基化表达基因的调控模式。7、分别提出了DGMP、PDGPCS、IMCDriver、PNC驱动基因识别算法,有效识别个体化或稀有突变癌症驱动基因。8、分别提出了DPDDI、GNN-DDI、deepMDDI、CPGD药物互作用预测方法,实现药物互作用关系和组合药物的高精度预测,并解释药物互作用机制。9、提出生物系统弹性函数重构算法,有效识别癌症状态转换临界点。10、提出IRRG细胞通信网络构建方法,挖掘细胞通信模式。
项目成果
期刊论文数量(42)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
LPI-CNNCP: Prediction of lncRNA-protein interactions by using convolutional neural network with the copy-padding trick
LPI-CNNCP:通过使用卷积神经网络和复制填充技巧来预测 lncRNA-蛋白质相互作用
- DOI:10.1016/j.ab.2020.113767
- 发表时间:2020
- 期刊:Analytical Biochemistry
- 影响因子:2.9
- 作者:Shao-Wu Zhang;Xi-Xi Zhang;Xiao-Nan Fan;Wei-Na Li
- 通讯作者:Wei-Na Li
LPI-BLS: Predicting lncRNA-protein interactions with a broad learning system-based stacked ensemble classifier
LPI-BLS:使用基于广泛学习系统的堆叠集成分类器预测 lncRNA-蛋白质相互作用
- DOI:10.1016/j.neucom.2019.08.084
- 发表时间:2019-12-22
- 期刊:NEUROCOMPUTING
- 影响因子:6
- 作者:Fan, Xiao-Nan;Zhang, Shao-Wu
- 通讯作者:Zhang, Shao-Wu
A novel network control model for identifying personalized driver genes in cancer
一种用于识别癌症个性化驱动基因的新型网络控制模型
- DOI:10.1371/journal.pcbi.1007520
- 发表时间:2019-11-01
- 期刊:PLOS COMPUTATIONAL BIOLOGY
- 影响因子:4.3
- 作者:Guo, WeiFeng;Zhang, Shao-Wu;Chen, Luonan
- 通讯作者:Chen, Luonan
Global analysis of N6-methyladenosine functions and its disease association using deep learning and network-based methods
使用深度学习和基于网络的方法对 N6-甲基腺苷功能及其疾病关联进行全局分析
- DOI:10.1371/journal.pcbi.1006663
- 发表时间:2019-01-01
- 期刊:PLOS COMPUTATIONAL BIOLOGY
- 影响因子:4.3
- 作者:Zhang, Song-Yao;Zhang, Shao-Wu;Huang, Yufei
- 通讯作者:Huang, Yufei
m6Acancer-Net: Identification of m6A-mediated cancer driver genes from gene-site heterogeneous network
m6Acancer-Net:从基因位点异质网络中鉴定 m6A 介导的癌症驱动基因
- DOI:10.1016/j.ymeth.2022.04.002
- 发表时间:2022-05-27
- 期刊:METHODS
- 影响因子:4.8
- 作者:Ma,Qianqian;Zhang,Shao-Wu;Zhang,Song-Yao
- 通讯作者:Zhang,Song-Yao
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
基于两阶段注意力机制的立场检测方法
- DOI:10.16088/j.issn.1001-6600.2019.01.005
- 发表时间:2019
- 期刊:广西师范大学学报(自然科学版)
- 影响因子:--
- 作者:岳天驰;张绍武;杨亮;林鸿飞;于凯
- 通讯作者:于凯
网络用户行为信用评估方法研究
- DOI:10.11871/j.issn.1674-9480.2015.04.010
- 发表时间:2015
- 期刊:科研信息化技术与应用
- 影响因子:--
- 作者:张绍武;马建伟
- 通讯作者:马建伟
冲突再分配 DSmT 及解决证据间矛盾的新方法
- DOI:--
- 发表时间:--
- 期刊:控制与决策
- 影响因子:--
- 作者:梁彦;程咏梅;潘泉;张绍武;曲圣杰
- 通讯作者:曲圣杰
基于扩展起始节点和加权融合策略预测肺癌风险致病基因
- DOI:10.16476/j.pibb.2015.0380
- 发表时间:2016
- 期刊:生物化学与生物物理进展
- 影响因子:--
- 作者:王一斌;程咏梅;张绍武
- 通讯作者:张绍武
基于语境歧义词的句子情感倾向性分析
- DOI:--
- 发表时间:--
- 期刊:中文信息学报
- 影响因子:--
- 作者:宋艳雪;张绍武;林鸿飞
- 通讯作者:林鸿飞
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
张绍武的其他基金
基于网络结构可控性的个性化癌症驱动基因识别与增效药物组合筛选
- 批准号:62173271
- 批准年份:2021
- 资助金额:58 万元
- 项目类别:面上项目
太空舱内微生物种群结构及功能分析相关计算方法
- 批准号:91430111
- 批准年份:2014
- 资助金额:70.0 万元
- 项目类别:重大研究计划
mRNA甲基化检测概率图模型
- 批准号:61473232
- 批准年份:2014
- 资助金额:83.0 万元
- 项目类别:面上项目
基于复杂网络的海洋微生物种群多样性研究
- 批准号:61170134
- 批准年份:2011
- 资助金额:60.0 万元
- 项目类别:面上项目
基于多源信息融合的蛋白质相互作用预测研究
- 批准号:60775012
- 批准年份:2007
- 资助金额:28.0 万元
- 项目类别:面上项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}