基于多源信息融合的蛋白质亚细胞定位预测算法研究
项目介绍
AI项目解读
基本信息
- 批准号:61272312
- 项目类别:面上项目
- 资助金额:80.0万
- 负责人:
- 依托单位:
- 学科分类:F0214.新型计算及其应用基础
- 结题年份:2016
- 批准年份:2012
- 项目状态:已结题
- 起止时间:2013-01-01 至2016-12-31
- 项目参与者:贺平安; 聂作明; 南旭莹; 李晓芳; 魏进周; 孔芬; 韩建宁; 石卓兴;
- 关键词:
项目摘要
Protein subcellular localization prediction is important to study protein function, protein interaction and their regulation mechanism. This project aims at problems related to protein information extraction, selection and integration, and focuses on how to extract protein sequence and structure information, to select key information, search for the effective predict strategy. The main contents include: with comprehensive utilization of multivariate statistics, the LemZiv algorithm and computational geometry method, we effectively extract multiple information including protein conserved information, complexity information, component information and global information; As for protein structure information, we introduce the multi variables thought and design an effective statistical algorithm to obtain a comprehensive protein structure information; with the characteristics of multi-source information in mind, we select the protein core information with help of random forest method; Using fuzzy neural network classification strategy, we integrate the multiple features to improve the prediction accuracy. This research is based on the existing test data, and has abundant stable, independent data to validate. The research results of this project not only contribute to protein properties and functional studies, but also to the study of protein-protein interactions and the development of new drugs. Besides, this project can offer new ideas for Proteome information analysis and algorithm design.
蛋白质亚细胞定位预测对蛋白质的功能、相互作用及调控机制的研究具有重要意义。本项目针对定位预测中信息的提取、挑选及融合等问题展开,重点研究如何充分提取蛋白质序列及结构信息,挑选核心信息,寻找预测策略的有效建模方法。主要内容包括:综合利用多元统计、LemZiv算法及计算几何方法,有效地提取包含蛋白质保守信息、复杂度信息、组分信息和全局信息的多重信息;在蛋白质结构信息获取中引入多变量的思想,寻找有效的统计算法,获取全面的蛋白质结构信息;针对多源信息的特点,结合随机森林方法,挑选蛋白质的核心信息;基于模糊神经网络的分类策略研究,更好地融合多个层次的特征,提高定位预测的准确率。本项目研究基于现有的测试数据展开,同时拥有充足、稳定的独立数据加以验证。本项目的研究成果将有助于蛋白质性质和功能的研究,可对蛋白质相互作用研究及新药物的开发提供借鉴和参考,还可为蛋白质的信息分析和应用算法设计提供新的思路。
结项摘要
蛋白质亚细胞定位的研究与阐述各种细胞过程的功能密切相关,对一些疾病机制和发展新型药物也有着重要的作用。传统的生物化学实验方法周期长、成本高,因此基于机器学习的蛋白质亚细胞定位预测成为了当前生物信息学的重要研究内容之一。本项目针对定位预测中信息的提取、挑选及融合等问题展开,重点研究如何充分提取蛋白质序列及结构信息,挑选核心信息,寻找预测策略的有效建模方法。..主要内容包括:综合利用AAindex数据库挖掘、基于PSI-BLAST同源比对、基于蛋白序列黄金比例分段、氨基酸的进化保守信息、蛋白质序列的共有序列组分信息和基因本体论信息、蛋白质序列Gapped k-mer的信息,有效地提取包含蛋白质保守信息、复杂度信息、组分信息和全局信息的多重信息;在蛋白质结构信息获取中引入多变量的思想,寻找有效的统计算法,获取全面的蛋白质结构信息;针对多源信息的特点,结合随机森林方法,挑选蛋白质的核心信息;基于模糊神经网络和支持向量机的分类策略,更好地融合多个层次的特征,显著提高了定位预测的准确率。..本项目研究基于现有的测试数据展开,同时拥有充足、稳定的独立数据加以验证。本项目的研究成果将有助于蛋白质性质和功能的研究,可对蛋白质相互作用研究及新药物的开发提供借鉴和参考,还可为蛋白质的信息分析和应用算法设计提供新的思路。
项目成果
期刊论文数量(17)
专著数量(0)
科研奖励数量(0)
会议论文数量(1)
专利数量(0)
A New Method for the Similarity Analysis of Proteins
蛋白质相似性分析的新方法
- DOI:10.1166/jctn.2015.4371
- 发表时间:2015-11
- 期刊:Journal of Computational and Theoretical Nanoscience
- 影响因子:--
- 作者:Fen Kong;Qi Dai;Ping-an He;Yu-hua Yao
- 通讯作者:Yu-hua Yao
Similarity/Dissimilarity analysis of protein sequences based on a new spectrum-like graphical representation.
基于新的类谱图形表示的蛋白质序列的相似性/相异性分析
- DOI:10.4137/ebo.s14713
- 发表时间:2014
- 期刊:Evolutionary bioinformatics online
- 影响因子:--
- 作者:Yao Y;Yan S;Xu H;Han J;Nan X;He PA;Dai Q
- 通讯作者:Dai Q
Recent Advances on Predictionof Protein Subcellular Localization
蛋白质亚细胞定位预测的最新进展
- DOI:--
- 发表时间:2015
- 期刊:Mini-Reviews in Organic Chemistry
- 影响因子:2.3
- 作者:Yuhua Yao;Huimin Xu;Pingan He;Qi Dai
- 通讯作者:Qi Dai
Number of distinct sequence alignments with k-match and match sections
与 k 匹配和匹配部分的不同序列比对的数量。
- DOI:10.1016/j.compbiomed.2015.02.017
- 发表时间:2015-08-01
- 期刊:COMPUTERS IN BIOLOGY AND MEDICINE
- 影响因子:7.7
- 作者:Liu, Xiaoqing;Yang, Xiaohua;Dai, Qi
- 通讯作者:Dai, Qi
A generalization of CGR representation for analyzing and comparing protein sequences
用于分析和比较蛋白质序列的 CGR 表示的推广
- DOI:10.1002/qua.25068
- 发表时间:2016-03-15
- 期刊:INTERNATIONAL JOURNAL OF QUANTUM CHEMISTRY
- 影响因子:2.2
- 作者:He, Ping-An;Xu, Suning;Yao, Yuhua
- 通讯作者:Yao, Yuhua
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
Constraining the cosmic ray propagation halo thickness using Fermi-LAT observations of high-latitude clouds
利用高纬度云的费米-LAT 观测限制宇宙射线传播晕厚度
- DOI:10.1088/1674-1137/ac1064
- 发表时间:2021-03
- 期刊:Chinese Physics C
- 影响因子:3.6
- 作者:姚玉华;乔冰强;刘伟;袁强;胡红波;毕效军;杨朝文;郭义庆
- 通讯作者:郭义庆
HADAR 实验对活动星系核伽马射线 辐射观测的预期研究
- DOI:10.7498/aps.72.20221976
- 发表时间:2023
- 期刊:物理学报
- 影响因子:--
- 作者:钱祥利;孙惠英;陈天禄;单增罗布;冯有亮;高启;苟全补;郭义庆;胡红波;康明铭;厉海金;刘成;刘茂元;刘伟;乔冰强;王旭;王振;辛广广;姚玉华;袁强;张毅
- 通讯作者:张毅
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}

内容获取失败,请点击重试

查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图

请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}