Sequence alignment-free method for phylogenetic and functional prediction and its application to molecular evolutionary studies

系统发育和功能预测的免序列比对方法及其在分子进化研究中的应用

基本信息

项目摘要

The homology search of base and amino acid sequences has become a basic tool in the bioinformatics field, which is essential not only for analyzing the evolution and phylogeny of genes and proteins but also for estimating the function of each protein gene in sequenced genomes. While sequence homology search is obviously useful, this method cannot estimate protein functions for almost half of genes in newly sequenced genomes, especially of novel species. To complement the sequence homology search, it is urgently required to establish methods for estimating protein functions based on different principles. By applying the BLSOM (Batch-learning SOM) method to amino-acid sequences of proteins, we established a function estimation method that utilizes clustering based on the similarity of oligopeptides frequencies. The BL-SOM for oligonucleotide frequencies could recognize genome-specific characteristics of oligonucleotide frequencies in individual genomes, permitting classification (self-organization) of genomic fragment sequences according to species without the need for species information during the calculation. We applied the BLSOMs to phylogenetic and functional prediction of a massive amount of environmental genomic sequences obtained by metagenomic analyses.
对碱基和氨基酸序列的同源性搜索已成为生物信息学领域中的基本工具,这不仅对于分析基因和蛋白质的进化和系统发育至关重要,而且对于估计了测序基因组中每个蛋白质基因的功能。虽然序列同源性搜索显然很有用,但该方法无法估计新测序基因组中几乎一半基因的蛋白质功能,尤其是新型物种的蛋白质功能。为了补充序列同源性搜索,迫切需要建立基于不同原理估算蛋白质功能的方法。通过将BLSOM(批处理学习SOM)方法应用于蛋白质的氨基酸序列,我们建立了一种函数估计方法,该方法根据寡肽频率的相似性利用聚类。寡核苷酸频率的BL-SOM可以识别单个基因组中寡核苷酸频率的基因组特异性特征,从而允许根据物种对物种进行基因组片段序列的分类(自组织),而无需在计算过程中进行物种信息。我们将BLSOM应用于系统发育和功能性预测,以通过元基因组分析获得的大量环境基因组序列。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Self-Organizing Map (SOM) unveils and visualizes hidden sequence characteristics of a wide range of eukaryote genomes
  • DOI:
    10.1016/j.gene.2005.09.040
  • 发表时间:
    2006-01-03
  • 期刊:
  • 影响因子:
    3.5
  • 作者:
    Abe, T;Sugawara, H;Ikemura, T
  • 通讯作者:
    Ikemura, T
Establishment of an informatics method that enables a comprehensive understanding of genome signatures and utilizing the signatures for phylogenetic classification of a massive amount of environmental sequences obtained by metagenome analyses by utilizing
建立一种信息学方法,能够全面理解基因组特征,并利用特征对宏基因组分析获得的大量环境序列进行系统发育分类
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Abe;T.;Kanaya;S.;Ikemura;T.
  • 通讯作者:
    T.
ゲノム配列情報からの効率的な知識発見のための情報学的手法の確立
建立从基因组序列信息中高效发现知识的信息学方法
持続可能型社会への貢献遺伝子データベース〜膨大な環境由来メタゲノム配列からの有用遺伝子探索
基因数据库为可持续社会做出贡献 - 从大量环境衍生的宏基因组序列中寻找有用的基因
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    上原 啓史;棚橋 佳世;阿部 貴志;池村 淑道
  • 通讯作者:
    池村 淑道
データベースに蓄積の著しい機能未知のタンパク質類の機能推定のための一括学習型の自己組織化マップ法
批量学习自组织作图方法估计数据库中大量积累的未知功能蛋白质的功能
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    阿部 貴志;金谷 重彦;池村 淑道
  • 通讯作者:
    池村 淑道
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

IKEMURA Toshimichi其他文献

IKEMURA Toshimichi的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('IKEMURA Toshimichi', 18)}}的其他基金

Genomic sequence studies of zoonotic disease viruses including influenza viruses with a novel bioinformatics method
利用新型生物信息学方法研究包括流感病毒在内的人畜共患疾病病毒的基因组序列
  • 批准号:
    23500371
  • 财政年份:
    2011
  • 资助金额:
    $ 2.57万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Function prediction of poorly-characterized protein genes found in genome sequences with high-performance supercomputers and its publication
利用高性能超级计算机对基因组序列中特征较差的蛋白质基因进行功能预测及其发表
  • 批准号:
    20510194
  • 财政年份:
    2008
  • 资助金额:
    $ 2.57万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Bioinformatics strategy for unveiling hidden genome signatures and biodiversity
揭示隐藏基因组特征和生物多样性的生物信息学策略
  • 批准号:
    16570190
  • 财政年份:
    2004
  • 资助金额:
    $ 2.57万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Creation of a mouse with human MHC by Chromosomal- and Developmental-engineering methods
通过染色体和发育工程方法创建具有人类 MHC 的小鼠
  • 批准号:
    12554036
  • 财政年份:
    2000
  • 资助金额:
    $ 2.57万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Molecular mecbanism for determination ofdynamics and positioning in nucleus of vertebrates
确定脊椎动物细胞核动力学和定位的分子机制
  • 批准号:
    12440212
  • 财政年份:
    2000
  • 资助金额:
    $ 2.57万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Structures and functions of band boundaries of mammalian chromosomes
哺乳动物染色体带边界的结构和功能
  • 批准号:
    09640740
  • 财政年份:
    1997
  • 资助金额:
    $ 2.57万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Methods to analyze nuclear organizition of mammalian chromosomes in interphase nuclei
分析间期细胞核中哺乳动物染色体核组织的方法
  • 批准号:
    08554033
  • 财政年份:
    1996
  • 资助金额:
    $ 2.57万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
Structure and function of chromosome band boundaries of warm-blooded vertebrates
温血脊椎动物染色体带边界的结构和功能
  • 批准号:
    07454207
  • 财政年份:
    1995
  • 资助金额:
    $ 2.57万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Study on ECM tenascin-family proteins by gene knockout
ECM腱蛋白家族蛋白基因敲除研究
  • 批准号:
    07044209
  • 财政年份:
    1995
  • 资助金额:
    $ 2.57万
  • 项目类别:
    Grant-in-Aid for international Scientific Research
Chromosome bands and giant G+C% mosaic structures of higher vertebrates genome
染色体%20bands%20and%20giant%20G+C%%20马赛克%20结构%20of%20higher%20脊椎动物%20基因组
  • 批准号:
    04640598
  • 财政年份:
    1992
  • 资助金额:
    $ 2.57万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)

相似国自然基金

土壤环境中四溴双酚A及其衍生物的微生物转化过程及机制研究
  • 批准号:
    42377386
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目
河口悬浮颗粒中微生物驱动的N2O产生过程及其环境响应机制
  • 批准号:
    32300109
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
肠道和环境微生物厌氧降解间苯三酚的代谢通路及其分子机制研究
  • 批准号:
    32370024
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
基于大规模环境微生物宏基因组/宏转录组数据识别全球主要城市的病毒
  • 批准号:
    32370720
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
氮肥和除草剂输入对黄河滩涂土壤微生物群落结构及环境变化的影响机制
  • 批准号:
    42377484
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目

相似海外基金

Challenge to control environmental microorganisms based on analysis of dissolved organic matter in water
基于水中溶解有机物分析控制环境微生物的挑战
  • 批准号:
    23K17329
  • 财政年份:
    2023
  • 资助金额:
    $ 2.57万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Pioneering)
CECAM - Chamber for Environmental Control of Airborne Microorganisms
CECAM - 空气微生物环境控制室
  • 批准号:
    EP/W006375/1
  • 财政年份:
    2021
  • 资助金额:
    $ 2.57万
  • 项目类别:
    Research Grant
Culturing strategies for uncultivated environmental microorganisms based on genome and medium information
基于基因组和培养基信息的未培养环境微生物的培养策略
  • 批准号:
    21K19841
  • 财政年份:
    2021
  • 资助金额:
    $ 2.57万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
Quantifying the impacts of environmental stress on marine microorganisms
量化环境压力对海洋微生物的影响
  • 批准号:
    DP200100790
  • 财政年份:
    2020
  • 资助金额:
    $ 2.57万
  • 项目类别:
    Discovery Projects
Effects of environmental factors on specific growth rates of individual microorganisms in bioprocess using microbial consortia
使用微生物群落的生物过程中环境因素对单个微生物比生长率的影响
  • 批准号:
    20K05225
  • 财政年份:
    2020
  • 资助金额:
    $ 2.57万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了