機械学習とベイズ推論の融合による免疫受容体タンパク質の設計手法の開発
结合机器学习和贝叶斯推理开发免疫受体蛋白的设计方法
基本信息
- 批准号:22K18003
- 负责人:
- 金额:$ 3万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Early-Career Scientists
- 财政年份:2022
- 资助国家:日本
- 起止时间:2022-04-01 至 2024-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究は,機械学習とベイズ推論を組み合わせて,高精度かつ効率的な免疫受容体タンパク質の設計手法を確立することを目指している.T細胞受容体(TCR)は,がん免疫においてがん細胞を認識する重要な役割を果たすが,患者に合わせた適切なTCRを見つけることが困難である.本研究では,タンパク質設計問題を統計のサンプリング問題と捉え,機械学習モデルを用いてTCR配列から結合能を予測し,TCR配列空間をサンプリングして高い結合能を持つTCR配列を発見する.当該年度では,申請者はベイズ推論に基づくTCR配列のサンプリング手法を開発し,その性能を確認した.従来のサンプリング手法では,高い結合能を持つTCR配列を見つけられるものの,類似した配列が多く存在し,結合能の高いローカルモードにとらわれる問題があった.この問題に対処するため,クラスタリングを導入した逐次モンテカルロ法(SMC)を開発し,全体の探索と結合能の高い領域の優先的な探索のバランスを制御することに成功した.ただし,この手法はpHLAとTCRの結合能予測モデルに依存し,小規模データや結合能データが存在しないpHLAには適用できない.申請者は,シミュレーションと機械学習の両方から解決策を模索していた.シミュレーションモデルは予測精度が低く,時間もかかるため,本研究には適さないことが判明した.機械学習モデルは高い精度を実現できるが,タンパク質の立体構造情報が必要であり,配列からの高精度予測方法は未確立である.現在,申請者はマルチモーダル学習とタンパク質立体構造予測モデルを活用し,配列から高精度な結合能予測モデルの開発を進めている.
本研究旨在结合机器学习和贝叶斯推理,建立一种高精度、高效的免疫受体蛋白设计方法。 T细胞受体(TCR)在癌症免疫中识别癌细胞方面发挥着重要作用,但很难找到适合每个患者的TCR。在本研究中,我们将蛋白质设计问题视为统计采样问题,使用机器学习模型预测TCR序列的结合能力,并通过对TCR序列空间进行采样来发现具有高结合能力的TCR序列。今年,申请人开发了一种基于贝叶斯推理的TCR序列采样方法,并证实了其性能。虽然传统的采样方法可以找到具有高结合能力的TCR序列,但存在许多相似的序列,问题是它们陷入了具有高结合能力的局部模式。为了解决这个问题,我们开发了引入聚类的顺序蒙特卡罗方法(SMC),并成功地控制了整体搜索和高结合能力区域的优先搜索之间的平衡。然而,该方法依赖于pHLA和TCR的结合能力预测模型,并且不能应用于不存在小规模数据或结合能力数据的pHLA。申请人正在寻求使用模拟和机器学习的解决方案。该模拟模型被认为不适合本研究,因为其预测精度较低且耗时。机器学习模型可以实现高精度,但需要蛋白质的3D结构信息,并且尚未建立基于序列的高精度预测方法。目前,申请人正在利用多模态学习和蛋白质3D结构预测模型开发一种高度准确的序列结合能力预测模型。
项目成果
期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
郭 中梁其他文献
郭 中梁的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似海外基金
タンパク質の機能改良のための「省データ」機械学習技術の開発
开发“数据保存”机器学习技术以改善蛋白质功能
- 批准号:
22H03691 - 财政年份:2022
- 资助金额:
$ 3万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Docking prediction and design of peptides by molecluar simulation and deep learning
通过分子模拟和深度学习进行肽的对接预测和设计
- 批准号:
21K12122 - 财政年份:2021
- 资助金额:
$ 3万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
機械学習による量子化学計算の高速化とタンパク質設計への応用
使用机器学习加速量子化学计算及其在蛋白质设计中的应用
- 批准号:
20J21419 - 财政年份:2020
- 资助金额:
$ 3万 - 项目类别:
Grant-in-Aid for JSPS Fellows
Development of a computational drug design method for targeting protein-protein interactions
开发针对蛋白质-蛋白质相互作用的计算药物设计方法
- 批准号:
20H04280 - 财政年份:2020
- 资助金额:
$ 3万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Molecular design of real proteins in virtual space
虚拟空间中真实蛋白质的分子设计
- 批准号:
19H04202 - 财政年份:2019
- 资助金额:
$ 3万 - 项目类别:
Grant-in-Aid for Scientific Research (B)