Prediction and analysis of intrinsically disordered regions in membrane proteins

膜蛋白本质无序区域的预测和分析

基本信息

  • 批准号:
    17F17050
  • 负责人:
  • 金额:
    $ 1.41万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2017
  • 资助国家:
    日本
  • 起止时间:
    2017-10-13 至 2020-03-31
  • 项目状态:
    已结题

项目摘要

MoRFs(molecular recognition features)は、他分子との結合により、天然変性状態から非天然変性状態に遷移する領域で、細胞の分子相互作用ネットワークにおいて重要な役割を果たし、多くのヒトの疾患に関与する天然変性タンパク質(IDP)の重要な機能領域である。MoRFsの予測の大きな問題は、「明確な配列特徴がない」という点で、これに対しては、アミノ酸残基の特性に対して因子分析を適用するなど、特徴量の設計を工夫し、さらに深層学習を適用することで高感度の特徴の検出と高い予測精度の達成を目指した。我々は、まず、深層学習のCNN(convolutional neural network)を用いて、天然変性領域のアミノ酸配列からMoRFsを同定するシステムを開発した。学習する特徴量としては、PSSMと13種のAA Indexを用いた。MoRFsを含む421チェインと負例データからデータセットに対してAUC値で0.778という、従来のシステムより高い予測結果を得た。次に、集団学習を用いてMoRFsの予測精度のさらなる向上を図った。2つのCNNによる予測器(一つは、PSSMと22種の残基属性、もう一つは、PSSMと13種のAA indexを特徴量とする)、1次元CNNによる予測器とSVMによる予測器をあわせた4つの予測器による集団学習を行った。各予測器の結果は平均化によって集約した。特徴量は、どちらもPSSMと13種のAA indexを採用した。45個のMoRFsを含むテストデータセットと、膜タンパク質から生成した49個のMoRFsを含むテストデータセットを使用し性能評価を行ったところ、それぞれ、AUC値で0.795、0.776という結果であった。これらはどちらも、従来の手法に比べ、高い予測精度を達成している。本研究で開発したシステムは、Webで公開している。
MORF(分子识别特征)是在与其他分子结合后从自然变性到非天然变性态的区域,并且是自然变性蛋白(IDP)的重要功能区域,它们在细胞分子相互作用网络中起重要作用,并参与许多人类疾病。预测MORF的主要问题是没有明确的序列特征,并且通过将因子分析应用于氨基酸残基的特征,我们旨在设计特征,并且通过应用深度学习,我们旨在检测高度敏感的特征并实现高预测准确性。我们首先使用深度学习卷积神经网络(CNN)开发了一种用于自然修饰区域中氨基酸序列的MORF的系统。学习特征的数量为PSSM和13个AA索引。从包含MORF和负示例数据的421个链中,我们获得了比传统系统更高的预测结果,数据集的AUC值为0.778。接下来,使用小组学习进一步提高MORF的预测准确性。我们使用两个CNN预测因子(一个功能PSSM和22个残基属性,另一个功能PSSM和13个AA索引)进行了小组学习,其中四个预测指标,包括使用一维CNN的预测变量和使用SVM的预测变量。每个预测因子的结果通过平均值汇总。两个特征值均为PSSM和13个AA索引。使用包含45个MORF的测试数据集和包含来自膜蛋白产生的49个MORF的测试数据集进行了性能评估,AUC值分别为0.795和0.776。这两种都比常规方法具有更高的预测准确性。这项研究开发的系统在线发布。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Comparative analysis of membrane protein structure databases
Prediction of antifungal peptides by deep learning with character embedding
通过深度学习和字符嵌入来预测抗真菌肽
  • DOI:
    10.2197/ipsjtbio.12.21
  • 发表时间:
    2019-01-01
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Fang, C;Moriwaki, Y;Shimizu, K
  • 通讯作者:
    Shimizu, K
Identifying MoRFs in Disordered Protein Using Enlarged Conserved Features
使用扩大的保守特征识别无序蛋白质中的 MoRF
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

清水 謙多郎其他文献

次世代シーケンサーデータの解析手法 第20回 RNA-seqカウントデータの性質と統計モデル
下一代测序仪数据的分析方法第20部分:RNA-seq计数数据的属性和统计模型
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    牧野 磨音;坂本光央;清水 謙多郎;門田 幸二
  • 通讯作者:
    門田 幸二
Haplotype exhaustive prediction of SRK/SP11 complex structure in Brassicaceae using a modified MSA
使用改进的 MSA 对十字花科 SRK/SP11 复合结构进行单倍型详尽预测
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    澤 知希;森脇 由隆;寺田 透;村瀬 浩司;高山 誠司;清水 謙多郎
  • 通讯作者:
    清水 謙多郎
次世代シーケンサーデータの解析手法 第 11 回 統合データ解析環境 Galaxy
下一代测序仪数据分析方法 第11部分 集成数据分析环境 Galaxy
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    達郎 大田;朋子 寺田;清水 謙多郎;幸二 門田
  • 通讯作者:
    幸二 門田
次世代シーケンサーデータの解析手法 第19回 R Markdown
新一代测序仪数据分析方法19th R Markdown
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    牧野 磨音;清水 謙多郎;門田 幸二
  • 通讯作者:
    門田 幸二
リン酸化によるHP1αの液-液相分離機構の解明
通过磷酸化阐明 HP1α 的液-液相分离机制
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    古川亜矢子;米澤 健人;根上 樹;吉村 ゆり子;林 亜紀;中山 潤一;安達 成彦;千田 俊哉;清水 謙多郎;寺田 透;清水 伸隆;西村 善文
  • 通讯作者:
    西村 善文

清水 謙多郎的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('清水 謙多郎', 18)}}的其他基金

Docking prediction and design of peptides by molecluar simulation and deep learning
通过分子模拟和深度学习进行肽的对接预测和设计
  • 批准号:
    21K12122
  • 财政年份:
    2021
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
タンパク質間相互作用部位予測手法の開発
蛋白质-蛋白质相互作用位点预测方法的发展
  • 批准号:
    07F07417
  • 财政年份:
    2007
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
高精度のドッキング機能を有するタンパク質間相互作用予測システムの開発
开发具有高精度对接功能的蛋白质-蛋白质相互作用预测系统
  • 批准号:
    18016007
  • 财政年份:
    2006
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
高精度のドッキング機能を有するタンパク質間相互作用予測システムの開発
开发具有高精度对接功能的蛋白质-蛋白质相互作用预测系统
  • 批准号:
    17017014
  • 财政年份:
    2005
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
ホモロジーモデリングとアビニシオ法の統合による高精度タンパク質構造予測手法の開発
结合同源建模和阿比尼西奥方法开发高精度蛋白质结构预测方法
  • 批准号:
    16014204
  • 财政年份:
    2004
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
大規模分散データの真に透過で効率的な共有を実現する分散共有配列システムの開発
开发分布式共享阵列系统,实现大规模分布式数据真正透明高效共享
  • 批准号:
    16016226
  • 财政年份:
    2004
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
ホモロジーモデリングとアビニシオ法の統合による高精度タンパク質構造予測手法の開発
结合同源建模和阿比尼西奥方法开发高精度蛋白质结构预测方法
  • 批准号:
    15014207
  • 财政年份:
    2003
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
大規模分散データの効率的な共有を実現する並列コンピューティング環境の開発
开发实现大规模分布式数据高效共享的并行计算环境
  • 批准号:
    15017228
  • 财政年份:
    2003
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
大規模分散データの効率的な共有を実現する並列コンピューティング環境の開発
开发实现大规模分布式数据高效共享的并行计算环境
  • 批准号:
    14019029
  • 财政年份:
    2002
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
タンパク質の局所構造情報を利用したab initio立体構造・機能予測手法の開発
利用蛋白质局部结构信息开发从头算三维结构/功能预测方法
  • 批准号:
    14015208
  • 财政年份:
    2002
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas

相似海外基金

ダイナミクス情報を考慮した深層学習技術による天然変性タンパク質複合体構造予測
使用深度学习技术考虑动力学信息预测自然变性蛋白质复合物的结构
  • 批准号:
    24K15183
  • 财政年份:
    2024
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
タンパク質のダイナミクス予測のための統計力学モデルと深層学習モデルの開発
开发用于预测蛋白质动力学的统计力学模型和深度学习模型
  • 批准号:
    24K18078
  • 财政年份:
    2024
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Prediction of inhibitors for human-virus protein-protein interactions based on innovative AI technologies
基于创新人工智能技术预测人-病毒蛋白质-蛋白质相互作用的抑制剂
  • 批准号:
    22KJ2495
  • 财政年份:
    2023
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
Development of a deep learning model to predict diverse mitochondrial targeting signals in parasites
开发深度学习模型来预测寄生虫中不同的线粒体靶向信号
  • 批准号:
    23K16986
  • 财政年份:
    2023
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Development of a fast molecular dynamics simulation method using deep learning
使用深度学习开发快速分子动力学模拟方法
  • 批准号:
    22K17993
  • 财政年份:
    2022
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了