Collaborative Research: MFB: Integrating Deep Learning and High-throughput Experimentation to Rapidly Navigate Protein Fitness Landscapes for Non-native Enzyme Catalysis
合作研究:MFB:整合深度学习和高通量实验,快速探索非天然酶催化的蛋白质适应性景观
基本信息
- 批准号:2226475
- 负责人:
- 金额:$ 56.46万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2022
- 资助国家:美国
- 起止时间:2022-11-01 至 2025-10-31
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
Understanding the relationship between protein structure and function remains a major challenge. This knowledge would benefit drug design, recycling, and chemical production. This project is designed to learn how to create proteins that will facilitate reactions seen in nature. Artificial intelligence will interpret the data generated by experiments. Two classes of enzymes will be modified to facilitate novel reactions. To help diversify the STEM workforce, workshops in machine learning will be offered to students interested in protein design. Summer research opportunities will be offered to high school and undergraduate students traditionally underrepresented in STEM fields.In this project, protein engineering is treated as a Bayesian optimization problem, with the objective to explore sequence space for improved specific activity. This approach models both the expected activity and the uncertainty of the prediction made. Training deep learning models is data intensive. A convolution neural net (CNN) using transformer architecture will use simulated sequence-function data to pretrain. The simulated data will be generated using Rosetta. Pretrained CNN will be refined with experimental data generated using combinatorial codon mutagenesis (CCM). Enzyme activity in single bacterial cells will be monitored using GFP expression, FACS-based screening, and next-generation DNA sequencing to determine the corresponding amino acid sequences. Biosensor screening can suffer from crosstalk when multiple cells are present. A picoliter-scale microdroplet screening technology developed in the Romero lab will be utilized to avoid this issue. A simulated annealing algorithm to randomly search over sequence positions and degenerate codons for libraries with high values for the expected batch BO objective will be developed. In addition, a probabilistic program using sampling-based inference to estimate the optimal combination of codons will be designed and implemented.This project is jointly supported by the Division of Chemical, Bioengineering, Environmental and Transport Systems (CBET), the Division of Chemistry (CHE), and the Division of Information and Intelligent Systems (IIS).This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
了解蛋白质结构和功能之间的关系仍然是一个重大挑战。这些知识将有利于药物设计、回收和化学品生产。该项目旨在学习如何创造能够促进自然界中发生的反应的蛋白质。人工智能将解释实验产生的数据。两类酶将被修饰以促进新的反应。为了帮助 STEM 劳动力多样化,将为对蛋白质设计感兴趣的学生提供机器学习研讨会。暑期研究机会将提供给传统上在 STEM 领域代表性不足的高中生和本科生。在该项目中,蛋白质工程被视为贝叶斯优化问题,目的是探索序列空间以提高特定活性。这种方法对预期活动和预测的不确定性进行建模。训练深度学习模型是数据密集型的。使用 Transformer 架构的卷积神经网络 (CNN) 将使用模拟序列函数数据进行预训练。 模拟数据将使用 Rosetta 生成。预训练的 CNN 将利用组合密码子诱变 (CCM) 生成的实验数据进行完善。 将使用 GFP 表达、基于 FACS 的筛选和下一代 DNA 测序来监测单个细菌细胞中的酶活性,以确定相应的氨基酸序列。 当存在多个细胞时,生物传感器筛选可能会受到串扰的影响。罗梅罗实验室开发的皮升级微滴筛选技术将用于避免这个问题。 将开发一种模拟退火算法,用于随机搜索序列位置并简并密码子,以获取具有预期批次 BO 目标高值的文库。此外,还将设计并实施一个使用基于采样的推理来估计密码子最佳组合的概率程序。该项目由化学、生物工程、环境和运输系统部(CBET)、化学部( CHE)和信息与智能系统部(IIS)。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力价值和更广泛的影响审查标准进行评估,被认为值得支持。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Jared Lewis其他文献
An updated version of a gap-free monthly mean zonal mean ozone database
无间隙月平均纬向平均臭氧数据库的更新版本
- DOI:
10.5194/essd-10-1473-2018 - 发表时间:
2018 - 期刊:
- 影响因子:11.4
- 作者:
B. Hassler;S. Kremser;G. Bodeker;Jared Lewis;Kage Nesbit;S. Davis;M. Chipperfield;S. Dhomse;M. Dameris - 通讯作者:
M. Dameris
Institutional “Paris Agreement Compatible” Mitigation Scenarios Evaluated Against the Paris Agreement 1.5°C Goal
根据《巴黎协定》1.5°C 目标评估“符合《巴黎协定》”的制度性缓解方案
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
R. Brecha;Gaurav Ganti;Robin D. Lamboll;Zebedee R. J. Nicholls;W. Hare;Jared Lewis;M. Meinshausen;M. Schaeffer;M. Gidden - 通讯作者:
M. Gidden
Deep learning for stochastic precipitation generation – deep SPG v1.0
随机降水生成的深度学习 – 深度 SPG v1.0
- DOI:
10.5194/gmd-16-3785-2023 - 发表时间:
2023 - 期刊:
- 影响因子:5.1
- 作者:
Leroy Bird;Matthew G. W. Walker;G. Bodeker;I. H. Campbell;Guangzhong Liu;Sw Sam;Jared Lewis;S. Rosier - 通讯作者:
S. Rosier
OpenSCM Two Layer Model: A Python implementation of the two-layer climate model
OpenSCM 两层模型:两层气候模型的 Python 实现
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
Zebedee R. J. Nicholls;Jared Lewis - 通讯作者:
Jared Lewis
Supplementary material to "Reduced complexity model intercomparison project phase 1: Protocol, results and initial observations"
“降低复杂性模型比对项目第一阶段:协议、结果和初步观察”的补充材料
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
Zebedee R. J. Nicholls;M. Meinshausen;Jared Lewis;R. Gieseke;D. Dommenget;K. Dorheim;Chen;J. Fuglestvedt;T. Gasser;U. Golüke;P. Goodwin;E. Kriegler;N. Leach;Davide Marchegiani;Y. Quilcaille;B. Samset;M. Sandstad;A. Shiklomanov;R. Skeie;Christopher J. Smith;Katsumasa Tanaka;J. Tsutsui;Zhiang Xie - 通讯作者:
Zhiang Xie
Jared Lewis的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Jared Lewis', 18)}}的其他基金
Understanding and Controlling the Selectivity of Visible Light Photocatalysis in Metal Polypyridyl Artificial Metalloenzymes
了解和控制金属聚吡啶人工金属酶中可见光光催化的选择性
- 批准号:
2154726 - 财政年份:2022
- 资助金额:
$ 56.46万 - 项目类别:
Standard Grant
CAREER: Catalyzing Polymerization in the Laboratory and Discussion in the Classroom with Artificial Metalloenzymes
职业:用人工金属酶在实验室中催化聚合并在课堂上进行讨论
- 批准号:
1839154 - 财政年份:2018
- 资助金额:
$ 56.46万 - 项目类别:
Continuing Grant
CAREER: Catalyzing Polymerization in the Laboratory and Discussion in the Classroom with Artificial Metalloenzymes
职业:用人工金属酶在实验室中催化聚合并在课堂上进行讨论
- 批准号:
1351991 - 财政年份:2014
- 资助金额:
$ 56.46万 - 项目类别:
Continuing Grant
相似国自然基金
基于FRET受体上升时间的单分子高精度测量方法研究
- 批准号:22304184
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
脂质多聚复合物mRNA纳米疫苗的构筑及抗肿瘤治疗研究
- 批准号:52373161
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
屏障突破型原位线粒体基因递送系统用于治疗Leber遗传性视神经病变的研究
- 批准号:82304416
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
细胞硬度介导口腔鳞癌细胞与CD8+T细胞间力学对话调控免疫杀伤的机制研究
- 批准号:82373255
- 批准年份:2023
- 资助金额:48 万元
- 项目类别:面上项目
乙酸钙不动杆菌上调DUOX2激活PERK/ATF4内质网应激在炎症性肠病中的作用机制研究
- 批准号:82300623
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
相似海外基金
Collaborative Research: MFB: Integrating Deep Learning and High-throughput Experimentation to Rapidly Navigate Protein Fitness Landscapes for Non-native Enzyme Catalysis
合作研究:MFB:整合深度学习和高通量实验,快速探索非天然酶催化的蛋白质适应性景观
- 批准号:
2226451 - 财政年份:2022
- 资助金额:
$ 56.46万 - 项目类别:
Standard Grant
Collaborative Research: MFB: Deciphering RNA-based regulatory logic with interpretable machine learning
合作研究:MFB:通过可解释的机器学习破译基于 RNA 的调控逻辑
- 批准号:
2226633 - 财政年份:2022
- 资助金额:
$ 56.46万 - 项目类别:
Standard Grant
Collaborative Research: MFB: Integrating Deep Learning and High-throughput Experimentation to Rapidly Navigate Protein Fitness Landscapes for Non-native Enzyme Catalysis
合作研究:MFB:整合深度学习和高通量实验,快速探索非天然酶催化的蛋白质适应性景观
- 批准号:
2226383 - 财政年份:2022
- 资助金额:
$ 56.46万 - 项目类别:
Standard Grant
Collaborative Research: MFB: Deciphering RNA-based regulatory logic with interpretable machine learning
合作研究:MFB:通过可解释的机器学习破译基于 RNA 的调控逻辑
- 批准号:
2226731 - 财政年份:2022
- 资助金额:
$ 56.46万 - 项目类别:
Standard Grant
Collaborative Research: MFB: Deciphering the Logic of PTM Crosstalk via Novel Chemical Technology: Histones and Beyond
合作研究:MFB:通过新型化学技术破译 PTM 串扰的逻辑:组蛋白及其他技术
- 批准号:
2127882 - 财政年份:2021
- 资助金额:
$ 56.46万 - 项目类别:
Standard Grant