登Science子刊!上海交大联合上海AI Lab等发布蛋白质突变体设计模型,优于最先进方法

💡 原文中文,约5200字,阅读约需13分钟。
📝

内容提要

上海交通大学研究团队开发了PRIME模型,能够在没有实验数据的情况下预测蛋白质突变的性能,从而提高其稳定性和活性。该模型基于温度感知语言模型,利用4.7亿条蛋白质序列数据,显著提升了预测准确性,推动了蛋白质工程的发展。

🎯

关键要点

  • 上海交通大学研究团队开发了PRIME模型,能够在没有实验数据的情况下预测蛋白质突变的性能。
  • PRIME模型基于温度感知语言模型,利用4.7亿条蛋白质序列数据,显著提升了预测准确性。
  • PRIME在蛋白质突变-活性和突变-稳定性预测方面取得了最佳效果。
  • 研究表明,PRIME能够有效预测蛋白质的多种属性,帮助研究人员在不熟悉的领域成功设计蛋白质。
  • PRIME模型由编码器模块、MLM模块和OGT预测模块组成,能够捕捉氨基酸的上下文信息和温度特征。
  • PRIME在热稳定性预测中表现优于其他现有模型,显示出其在蛋白质工程中的应用潜力。
  • 研究团队通过湿实验验证了PRIME的有效性,超过30%的AI推荐突变体在关键性能上优于野生型蛋白。
  • PRIME还展示了一种高效的方法,能够快速获得具备增强活性和稳定性的多位点突变体。
  • 研究团队在小样本学习方面取得了多项成果,开发了FSFP策略以优化蛋白质语言模型的训练。
  • 洪亮教授认为,未来三年,专业领域的通用人工智能将带来科学发现模式的范式变革。
➡️

继续阅读