基于不同类型基因组蛋白质编码基因共性信息挖掘的微生物基因组重注释
项目介绍
AI项目解读
基本信息
- 批准号:61302186
- 项目类别:青年科学基金项目
- 资助金额:25.0万
- 负责人:
- 依托单位:
- 学科分类:F0124.生物电子学与生物信息处理
- 结题年份:2016
- 批准年份:2013
- 项目状态:已结题
- 起止时间:2014-01-01 至2016-12-31
- 项目参与者:王红梅; 齐立省; 王春玲; 刘磊; 梁国营; 武恩斯; 王洪波; 毕胜男;
- 关键词:
项目摘要
How to extract the intrinsic feature of protein-coding gene sequences is the core of gene prediction algorithm, which is also one of the most important basis for genome annotation. With the development of genome related researches, more and more studies indicate that the discription of the specific feature of protein-coding genes is not complete still, and the prediction results obtained by different gene finding methods vary greatly, which causes the serious problem of protein-coding gene annotation errors in microbial genomes. The accumulation of such errors in public databases may have the potential for propagation effect, which will decrease greatly the value of public databases and even cause false scientific conclusions. Therefore, how to improve the quality of protein-coding gene annotation is an important task. Aiming to this problem, the main works of this project include: (1) Recent research that some genomes with different G+C content exhibit highly universal properties of protein-coding gene. To reveal the biological mechanisms of such common properties, we design filtering algorithm and construct the data set composed of genomes with high common protein-coding properties, based on which we perform genes composition analysis. To display the universal sequence feature of protein-coding genes, we attempt to propose graphical representation and statistical methods to display the specific sequence features, such as polynucleotides, sequence order, long-range correlations at multiple sites. (2) Based on comprehensive mining of the common sequence feature of protein-coding genes, we will outline universal algorithms for detecting the missing genes. On the other hand, by combining the physiochemical properties of amino acids with graphical representation, we will develop novel approaches for protein sequences analysis, based on which we can derive efficient feature parameters to design hypothetical gene function prediction algorithms. (3) To objectively evaluate the efficiency and reliability of the reannotating algorithms proposed in this project, we perform genome reannotation on some model microognisms, and use molecular biologics experiments and bioinformatcs resources to analyze the predicting results. Then, this project can provide practical methods for improving the annotation quality of microbial genomes.
蛋白质编码基因序列的有效信息挖掘是基因预测算法的核心,也是基因组注释的基础。近期研究表明目前对基因序列信息描述还不全,不同基因预测算法得到的结果具有较大差异,导致微生物基因组基因错误注释不断积累,影响了数据库使用质量及研究结果的准确性。针对该问题,本课题研究重点:1、以有些具有不同G+C含量基因组展现出很高的蛋白编码基因共性特征为契机,设计基因组筛选算法,构建数据集,发展有效刻画序列多聚体组成、排列及多位点长程相关等重要特征的几何模型和数理统计方法,揭示基因共性特征的生物机理及信息编码规律,为今后基因预测提供新思路。2、基于对基因共性信息的充分挖掘,并针对蛋白序列将几何分析模型与氨基酸理化特性有机融合,提取特征参数,发展准确、可靠的欠注释基因和基因功能预测算法。3、将发展的重注释算法应用于重要模式微生物,利用分子生物学实验进行预测结果可靠性验证分析,为提高基因组注释质量提供有力技术保障。
结项摘要
快速发展的基因组测序技术为生命科学带来了巨大的机遇和挑战。在目前已完成测序的基因组中有超过90%为原核生物,因而对原核生物基因组的准确注释成为当前生命科学的重要课题。本项目针对目前数据库中普遍存在的原核生物基因组错误注释问题,深入研究了不同类型原核生物基因组中蛋白质编码基因序列异同特征,重点针对不同类型原核生物中大、小染色体及质粒之间蛋白质编码基因的异同序列进化特征、多拷贝基因组成及生物机理等问题进行了系统研究。在此基础上,发展了系列核酸及蛋白质序列分析及特征挖掘新方法来定量刻画蛋白质编码基因及相应蛋白序列组成、排列等固有特征,进而提出一套完善的原核生物基因组蛋白质编码基因重注释算法。同时,本项目将理论预测与实验研究结合,开展了分子生物学实验及转录组测序工作,在一些重要细菌基因组中发现了一批新基因,并充分利用生物信息学工具,从不同角度初步完成了相关基因及其产物的功能分析工作。本项目可为今后基因组分析及注释提供可靠的理论和方法保障。
项目成果
期刊论文数量(9)
专著数量(0)
科研奖励数量(4)
会议论文数量(0)
专利数量(0)
Classification of Ordered/Disordered Regions of Intrinsically Disordered Proteins Based on Comprehensive Sequence Analysis and Chou’s Pseudo Amino Acid Composition Method
基于综合序列分析和周氏伪氨基酸组成法的本质无序蛋白质有序/无序区域分类
- DOI:--
- 发表时间:2016
- 期刊:MATCH Communications in Mathematical and in Computer Chemistry
- 影响因子:--
- 作者:En-Si Wu;Chun-Ling Wang;Hong-Mei Wang;Ji-Hua Wang
- 通讯作者:Ji-Hua Wang
基于同义密码子使用的原核生物基因组大、小染色体及质粒进化特征分析
- DOI:--
- 发表时间:2015
- 期刊:生物物理学报
- 影响因子:--
- 作者:毕胜男;于家峰;任景;王吉华
- 通讯作者:王吉华
A hybrid strategy for comprehensive annotation of the protein coding genes in prokaryotic genome
原核基因组中蛋白质编码基因综合注释的混合策略
- DOI:10.1007/s13258-014-0263-0
- 发表时间:2015-01
- 期刊:Genes & Genomics
- 影响因子:2.1
- 作者:Ke Xiao;Qing-Li Chen;Ji-Hua Wang;Xiao Sun
- 通讯作者:Xiao Sun
Natural protein sequences are more intrinsically disordered than random sequences.
天然蛋白质序列本质上比随机序列更无序
- DOI:10.1007/s00018-016-2138-9
- 发表时间:2016-08
- 期刊:Cellular and molecular life sciences : CMLS
- 影响因子:--
- 作者:Yu JF;Cao Z;Yang Y;Wang CL;Su ZD;Zhao YW;Wang JH;Zhou Y
- 通讯作者:Zhou Y
组蛋白H1序列固有无序特性分析
- DOI:--
- 发表时间:2016
- 期刊:原子与分子物理学报
- 影响因子:--
- 作者:王春玲;于家峰;王红梅;王吉华
- 通讯作者:王吉华
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
原核生物基因组肽编码 sORFs 分布及功能特征
- DOI:--
- 发表时间:2018
- 期刊:生物化学与生物物理进展
- 影响因子:--
- 作者:陈宜亭;张凤;赵佳;于家峰;沙玉杰;王吉华
- 通讯作者:王吉华
密码子偏好角度对比研究不同物种肽编码sORFs异同特征
- DOI:--
- 发表时间:2022
- 期刊:德州学院学报
- 影响因子:--
- 作者:钱博文;王瑞萍;姜雯雯;夏道良;郭丽;于家峰
- 通讯作者:于家峰
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}

内容获取失败,请点击重试

查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图

请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
于家峰的其他基金
淡水溶藻菌群体感应相关基因挖掘及其功能机理研究
- 批准号:62011530044
- 批准年份:2020
- 资助金额:14.9 万元
- 项目类别:国际(地区)合作与交流项目
融合多组学数据的原核基因组肽编码sORFs多维特征挖掘及预测
- 批准号:61771093
- 批准年份:2017
- 资助金额:65.0 万元
- 项目类别:面上项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}