MIT开发Pichia-CLM模型学习酵母DNA「语言」,外源蛋白产量最高可提高至3倍

MIT开发Pichia-CLM模型学习酵母DNA「语言」,外源蛋白产量最高可提高至3倍

💡 原文中文,约5200字,阅读约需13分钟。
📝

内容提要

毕赤酵母在重组蛋白生产中表现优异,但同义密码子的选择会影响表达量。麻省理工学院提出的Pichia-CLM模型通过深度学习优化密码子,显著提高蛋白产量,超越传统工具。研究表明,该模型有效捕捉氨基酸与密码子的关系,推动生物制药效率提升。

🎯

关键要点

  • 毕赤酵母在重组蛋白生产中表现优异,但同义密码子的选择会影响表达量。
  • 麻省理工学院提出的Pichia-CLM模型通过深度学习优化密码子,显著提高蛋白产量,超越传统工具。
  • Pichia-CLM模型有效捕捉氨基酸与密码子的关系,推动生物制药效率提升。
  • Pichia-CLM利用宿主基因组数据无偏地学习氨基酸到密码子的映射关系。
  • 研究验证显示Pichia-CLM在6类不同复杂度的蛋白上均观察到更高的表达产量。
  • Pichia-CLM采用基于GRU的编码器–解码器架构,具有更高的计算效率与更低的资源消耗。
  • 模型训练过程中使用验证集进行早停以优化参数,确保模型性能。
  • Pichia-CLM在实验中提升了多种蛋白的分泌产量,尤其是HSA的产量提升显著。
  • 与商业密码子优化工具相比,Pichia-CLM在多个指标上均表现优越。
  • Pichia-CLM能够生成高产蛋白的构建体,并学习关键的遗传序列特征。
  • 人工智能驱动的自动化优化在蛋白质生产中展现出颠覆性潜力,未来将扩展至更广泛的生物制造场景。

延伸问答

Pichia-CLM模型的主要功能是什么?

Pichia-CLM模型通过深度学习优化密码子,从而显著提高重组蛋白的产量。

Pichia-CLM与传统密码子优化工具相比有什么优势?

Pichia-CLM在多个指标上表现优越,能够在6种不同复杂度的蛋白上观察到更高的表达产量。

Pichia-CLM是如何学习氨基酸与密码子的关系的?

Pichia-CLM利用宿主基因组数据无偏地学习氨基酸到密码子的映射关系,捕捉位置依赖性和长程上下文关系。

Pichia-CLM在实验中提升了哪些蛋白的产量?

Pichia-CLM在实验中显著提升了人生长激素、粒细胞集落刺激因子和人血清白蛋白的产量,尤其是HSA的产量提升约为3倍。

Pichia-CLM的模型架构是什么?

Pichia-CLM采用基于门控循环单元(GRU)的编码器–解码器架构,旨在捕捉序列数据中的长程和短程依赖关系。

Pichia-CLM如何影响生物制药效率?

Pichia-CLM通过优化密码子选择,提升重组蛋白的表达量,从而推动生物制药的效率提升。

➡️

继续阅读