Docking prediction and design of peptides by molecluar simulation and deep learning

通过分子模拟和深度学习进行肽的对接预测和设计

基本信息

  • 批准号:
    21K12122
  • 负责人:
  • 金额:
    $ 2.66万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2021
  • 资助国家:
    日本
  • 起止时间:
    2021-04-01 至 2024-03-31
  • 项目状态:
    已结题

项目摘要

前年度に引き続き、敵対性生成ネットワークGANに独自のフィードバック機能を加えた手法を用いて抗ウイルスペプチドを設計する研究を行い、溶解度が高いと予測される新規ペプチドを複数生成した。これらの物理化学特性を予測し、既知の抗ウイルスペプチドと同等の特性をもつ可能性が高いことを示した。本研究の成果はJournal of Bioinformatics and Computational Biologyに採択されている。また、今年度は、ペプチドのアミノ酸配列から最小発育阻止濃度(MIC値)を予測する抗菌ペプチドの活性予測システムを開発した。複数の機械学習の手法を試し、既存の研究に匹敵する精度を得ることができている。とくに、畳み込みニューラルネットワークと自然言語処理モデルのBERTを組み合わせた新しい手法を適用したところ、R2値で0.6という結果であった。現在、手法の再検討を行っている。さらに今年度は、アミノ酸配列から血圧降下作用の有無を予測するシステムも開発した。従来の予測研究で用いられてきたManavalanらのデータセットは、訓練用とテスト用で配列が重複しており、エビデンスが不明なものもあったため、データセットを新たに構築した。Random Forestの派生手法であるExtra Treeを用いることで、ACCが0.801、ROC-AUCが0.875という性能を得た。Web上で公開されている先行研究に対して同じデータセットで予測したところACCが0.804, ROC-AUCが0.863となり、先行研究とおおむね同程度の性能を示した。さらに、予測に寄与した特徴量を解析したところ、プロリンやロイシンの出現頻度、疎水基アミノ酸が特定の位置に出現する傾向などが得られた。現在、これらの結果と血圧降下ペプチドの作用機序との関係について解析を行っている。
延续去年,我们进行了抗病毒肽设计研究,采用了在对抗性生成网络GAN中添加独特反馈功能的方法,并生成了几种预计具有高溶解度的新肽。我们预测了这些物理化学特性,并表明它们可能具有与已知抗病毒肽相同的特性。该研究成果已被《生物信息学与计算生物学杂志》接收。此外,今年我们开发了一种抗菌肽活性预测系统,可以根据肽的氨基酸序列预测最低抑菌浓度(MIC 值)。他们测试了多种机器学习方法,并且能够获得与现有研究相当的准确性。特别是,当应用结合了卷积神经网络和自然语言处理模型BERT的新方法时,结果是R2值为0.6。我们目前正在重新考虑该方法。此外,今年,我们开发了一种系统,可以根据氨基酸序列预测是否存在降压作用。 Manavalan等人的数据集已在之前的预测研究中使用,其训练和测试序列有重叠,并且一些证据不清楚,因此构建了一个新的数据集。通过使用随机森林的衍生品 Extra Tree,我们的 ACC 性能达到 0.801,ROC-AUC 性能达到 0.875。当使用与先前在网络上发布的研究相同的数据集进行预测时,ACC 为 0.804,ROC-AUC 为 0.863,显示与先前研究大致相同的性能。此外,通过分析有助于预测的特征,我们发现了脯氨酸和亮氨酸出现的频率以及疏水性氨基酸出现在特定位置的趋势等信息。我们目前正在分析这些结果与降压肽作用机制之间的关系。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
P-41Trans-AVPGAN: Transformerネットワークを用いた対的生成ネットワークによる抗ウイルスペプチド生成
P-41Trans-AVPGAN:使用 Transformer 网络通过配对生成网络生成抗病毒肽
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kano Hasegawa;Yoshitaka Moriwaki;Tohru Terada and Kentaro Shimizu
  • 通讯作者:
    Tohru Terada and Kentaro Shimizu
Prediction of antihypertensive activity of peptides using machine learning
使用机器学习预测肽的抗高血压活性
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    1.Kazushi Tamura;Yoshitaka Moriwaki;Tohru Terada;Kentaro Shimizu
  • 通讯作者:
    Kentaro Shimizu
Feedback-AVPGAN: Feedback-guided generative adversarial network for generating antiviral peptides
Feedback-AVPGAN:反馈引导的生成对抗网络,用于生成抗病毒肽
Web連携テキスト バイオインフォマティクス 基礎と応用
网络链接文本生物信息学基础知识和应用
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    門田幸二;清水謙多郎;岸野洋久;寺田透
  • 通讯作者:
    寺田透
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

清水 謙多郎其他文献

次世代シーケンサーデータの解析手法 第20回 RNA-seqカウントデータの性質と統計モデル
下一代测序仪数据的分析方法第20部分:RNA-seq计数数据的属性和统计模型
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    牧野 磨音;坂本光央;清水 謙多郎;門田 幸二
  • 通讯作者:
    門田 幸二
Haplotype exhaustive prediction of SRK/SP11 complex structure in Brassicaceae using a modified MSA
使用改进的 MSA 对十字花科 SRK/SP11 复合结构进行单倍型详尽预测
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    澤 知希;森脇 由隆;寺田 透;村瀬 浩司;高山 誠司;清水 謙多郎
  • 通讯作者:
    清水 謙多郎
次世代シーケンサーデータの解析手法 第 11 回 統合データ解析環境 Galaxy
下一代测序仪数据分析方法 第11部分 集成数据分析环境 Galaxy
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    達郎 大田;朋子 寺田;清水 謙多郎;幸二 門田
  • 通讯作者:
    幸二 門田
次世代シーケンサーデータの解析手法 第19回 R Markdown
新一代测序仪数据分析方法19th R Markdown
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    牧野 磨音;清水 謙多郎;門田 幸二
  • 通讯作者:
    門田 幸二
リン酸化によるHP1αの液-液相分離機構の解明
通过磷酸化阐明 HP1α 的液-液相分离机制
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    古川亜矢子;米澤 健人;根上 樹;吉村 ゆり子;林 亜紀;中山 潤一;安達 成彦;千田 俊哉;清水 謙多郎;寺田 透;清水 伸隆;西村 善文
  • 通讯作者:
    西村 善文

清水 謙多郎的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('清水 謙多郎', 18)}}的其他基金

Prediction and analysis of intrinsically disordered regions in membrane proteins
膜蛋白本质无序区域的预测和分析
  • 批准号:
    17F17050
  • 财政年份:
    2017
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
タンパク質間相互作用部位予測手法の開発
蛋白质-蛋白质相互作用位点预测方法的发展
  • 批准号:
    07F07417
  • 财政年份:
    2007
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
高精度のドッキング機能を有するタンパク質間相互作用予測システムの開発
开发具有高精度对接功能的蛋白质-蛋白质相互作用预测系统
  • 批准号:
    18016007
  • 财政年份:
    2006
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
高精度のドッキング機能を有するタンパク質間相互作用予測システムの開発
开发具有高精度对接功能的蛋白质-蛋白质相互作用预测系统
  • 批准号:
    17017014
  • 财政年份:
    2005
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
ホモロジーモデリングとアビニシオ法の統合による高精度タンパク質構造予測手法の開発
结合同源建模和阿比尼西奥方法开发高精度蛋白质结构预测方法
  • 批准号:
    16014204
  • 财政年份:
    2004
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
大規模分散データの真に透過で効率的な共有を実現する分散共有配列システムの開発
开发分布式共享阵列系统,实现大规模分布式数据真正透明高效共享
  • 批准号:
    16016226
  • 财政年份:
    2004
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
ホモロジーモデリングとアビニシオ法の統合による高精度タンパク質構造予測手法の開発
结合同源建模和阿比尼西奥方法开发高精度蛋白质结构预测方法
  • 批准号:
    15014207
  • 财政年份:
    2003
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
大規模分散データの効率的な共有を実現する並列コンピューティング環境の開発
开发实现大规模分布式数据高效共享的并行计算环境
  • 批准号:
    15017228
  • 财政年份:
    2003
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
大規模分散データの効率的な共有を実現する並列コンピューティング環境の開発
开发实现大规模分布式数据高效共享的并行计算环境
  • 批准号:
    14019029
  • 财政年份:
    2002
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
タンパク質の局所構造情報を利用したab initio立体構造・機能予測手法の開発
利用蛋白质局部结构信息开发从头算三维结构/功能预测方法
  • 批准号:
    14015208
  • 财政年份:
    2002
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas

相似海外基金

物質設計に向けた電子状態を活用した機械学習による物性予測
使用电子态进行材料设计的机器学习预测物理特性
  • 批准号:
    24K08016
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Utility and feasibility of activity type to augment consumer wearable-based physical activity energy expenditure prediction equations using heartrate and movement in children
使用儿童心率和运动来增强基于消费者可穿戴设备的身体活动能量消耗预测方程的活动类型的实用性和可行性
  • 批准号:
    10677143
  • 财政年份:
    2023
  • 资助金额:
    $ 2.66万
  • 项目类别:
Predicting the Absence of Serious Bacterial Infection in the PICU
预测 PICU 中不存在严重细菌感染
  • 批准号:
    10806039
  • 财政年份:
    2023
  • 资助金额:
    $ 2.66万
  • 项目类别:
Optimization of monitoring, prediction and phenotyping of deterioration of inhospital patients using machine learning and multimodal real time data
使用机器学习和多模态实时数据优化住院患者病情恶化的监测、预测和表型分析
  • 批准号:
    10735863
  • 财政年份:
    2023
  • 资助金额:
    $ 2.66万
  • 项目类别:
Sequential Modeling for Prediction of Periodontal Diseases: an intra-Collaborative Practice-based Research study (ICPRS)
牙周病预测的序列模型:基于内部协作实践的研究 (ICPRS)
  • 批准号:
    10755010
  • 财政年份:
    2023
  • 资助金额:
    $ 2.66万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了