基于不同类型基因组蛋白质编码基因共性信息挖掘的微生物基因组重注释

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61302186
  • 项目类别:
    青年科学基金项目
  • 资助金额:
    25.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0124.生物电子学与生物信息处理
  • 结题年份:
    2016
  • 批准年份:
    2013
  • 项目状态:
    已结题
  • 起止时间:
    2014-01-01 至2016-12-31

项目摘要

How to extract the intrinsic feature of protein-coding gene sequences is the core of gene prediction algorithm, which is also one of the most important basis for genome annotation. With the development of genome related researches, more and more studies indicate that the discription of the specific feature of protein-coding genes is not complete still, and the prediction results obtained by different gene finding methods vary greatly, which causes the serious problem of protein-coding gene annotation errors in microbial genomes. The accumulation of such errors in public databases may have the potential for propagation effect, which will decrease greatly the value of public databases and even cause false scientific conclusions. Therefore, how to improve the quality of protein-coding gene annotation is an important task. Aiming to this problem, the main works of this project include: (1) Recent research that some genomes with different G+C content exhibit highly universal properties of protein-coding gene. To reveal the biological mechanisms of such common properties, we design filtering algorithm and construct the data set composed of genomes with high common protein-coding properties, based on which we perform genes composition analysis. To display the universal sequence feature of protein-coding genes, we attempt to propose graphical representation and statistical methods to display the specific sequence features, such as polynucleotides, sequence order, long-range correlations at multiple sites. (2) Based on comprehensive mining of the common sequence feature of protein-coding genes, we will outline universal algorithms for detecting the missing genes. On the other hand, by combining the physiochemical properties of amino acids with graphical representation, we will develop novel approaches for protein sequences analysis, based on which we can derive efficient feature parameters to design hypothetical gene function prediction algorithms. (3) To objectively evaluate the efficiency and reliability of the reannotating algorithms proposed in this project, we perform genome reannotation on some model microognisms, and use molecular biologics experiments and bioinformatcs resources to analyze the predicting results. Then, this project can provide practical methods for improving the annotation quality of microbial genomes.
蛋白质编码基因序列的有效信息挖掘是基因预测算法的核心,也是基因组注释的基础。近期研究表明目前对基因序列信息描述还不全,不同基因预测算法得到的结果具有较大差异,导致微生物基因组基因错误注释不断积累,影响了数据库使用质量及研究结果的准确性。针对该问题,本课题研究重点:1、以有些具有不同G+C含量基因组展现出很高的蛋白编码基因共性特征为契机,设计基因组筛选算法,构建数据集,发展有效刻画序列多聚体组成、排列及多位点长程相关等重要特征的几何模型和数理统计方法,揭示基因共性特征的生物机理及信息编码规律,为今后基因预测提供新思路。2、基于对基因共性信息的充分挖掘,并针对蛋白序列将几何分析模型与氨基酸理化特性有机融合,提取特征参数,发展准确、可靠的欠注释基因和基因功能预测算法。3、将发展的重注释算法应用于重要模式微生物,利用分子生物学实验进行预测结果可靠性验证分析,为提高基因组注释质量提供有力技术保障。

结项摘要

快速发展的基因组测序技术为生命科学带来了巨大的机遇和挑战。在目前已完成测序的基因组中有超过90%为原核生物,因而对原核生物基因组的准确注释成为当前生命科学的重要课题。本项目针对目前数据库中普遍存在的原核生物基因组错误注释问题,深入研究了不同类型原核生物基因组中蛋白质编码基因序列异同特征,重点针对不同类型原核生物中大、小染色体及质粒之间蛋白质编码基因的异同序列进化特征、多拷贝基因组成及生物机理等问题进行了系统研究。在此基础上,发展了系列核酸及蛋白质序列分析及特征挖掘新方法来定量刻画蛋白质编码基因及相应蛋白序列组成、排列等固有特征,进而提出一套完善的原核生物基因组蛋白质编码基因重注释算法。同时,本项目将理论预测与实验研究结合,开展了分子生物学实验及转录组测序工作,在一些重要细菌基因组中发现了一批新基因,并充分利用生物信息学工具,从不同角度初步完成了相关基因及其产物的功能分析工作。本项目可为今后基因组分析及注释提供可靠的理论和方法保障。

项目成果

期刊论文数量(9)
专著数量(0)
科研奖励数量(4)
会议论文数量(0)
专利数量(0)
Classification of Ordered/Disordered Regions of Intrinsically Disordered Proteins Based on Comprehensive Sequence Analysis and Chou’s Pseudo Amino Acid Composition Method
基于综合序列分析和周氏伪氨基酸组成法的本质无序蛋白质有序/无序区域分类
  • DOI:
    --
  • 发表时间:
    2016
  • 期刊:
    MATCH Communications in Mathematical and in Computer Chemistry
  • 影响因子:
    --
  • 作者:
    En-Si Wu;Chun-Ling Wang;Hong-Mei Wang;Ji-Hua Wang
  • 通讯作者:
    Ji-Hua Wang
基于同义密码子使用的原核生物基因组大、小染色体及质粒进化特征分析
  • DOI:
    --
  • 发表时间:
    2015
  • 期刊:
    生物物理学报
  • 影响因子:
    --
  • 作者:
    毕胜男;于家峰;任景;王吉华
  • 通讯作者:
    王吉华
A hybrid strategy for comprehensive annotation of the protein coding genes in prokaryotic genome
原核基因组中蛋白质编码基因综合注释的混合策略
  • DOI:
    10.1007/s13258-014-0263-0
  • 发表时间:
    2015-01
  • 期刊:
    Genes & Genomics
  • 影响因子:
    2.1
  • 作者:
    Ke Xiao;Qing-Li Chen;Ji-Hua Wang;Xiao Sun
  • 通讯作者:
    Xiao Sun
Natural protein sequences are more intrinsically disordered than random sequences.
天然蛋白质序列本质上比随机序列更无序
  • DOI:
    10.1007/s00018-016-2138-9
  • 发表时间:
    2016-08
  • 期刊:
    Cellular and molecular life sciences : CMLS
  • 影响因子:
    --
  • 作者:
    Yu JF;Cao Z;Yang Y;Wang CL;Su ZD;Zhao YW;Wang JH;Zhou Y
  • 通讯作者:
    Zhou Y
组蛋白H1序列固有无序特性分析
  • DOI:
    --
  • 发表时间:
    2016
  • 期刊:
    原子与分子物理学报
  • 影响因子:
    --
  • 作者:
    王春玲;于家峰;王红梅;王吉华
  • 通讯作者:
    王吉华

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

原核生物基因组肽编码 sORFs 分布及功能特征
  • DOI:
    --
  • 发表时间:
    2018
  • 期刊:
    生物化学与生物物理进展
  • 影响因子:
    --
  • 作者:
    陈宜亭;张凤;赵佳;于家峰;沙玉杰;王吉华
  • 通讯作者:
    王吉华
密码子偏好角度对比研究不同物种肽编码sORFs异同特征
  • DOI:
    --
  • 发表时间:
    2022
  • 期刊:
    德州学院学报
  • 影响因子:
    --
  • 作者:
    钱博文;王瑞萍;姜雯雯;夏道良;郭丽;于家峰
  • 通讯作者:
    于家峰

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

于家峰的其他基金

淡水溶藻菌群体感应相关基因挖掘及其功能机理研究
  • 批准号:
    62011530044
  • 批准年份:
    2020
  • 资助金额:
    14.9 万元
  • 项目类别:
    国际(地区)合作与交流项目
融合多组学数据的原核基因组肽编码sORFs多维特征挖掘及预测
  • 批准号:
    61771093
  • 批准年份:
    2017
  • 资助金额:
    65.0 万元
  • 项目类别:
    面上项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码