改进蛋白突变稳定性预测,清华龚海鹏团队AI蛋白工程模型登Nature子刊

改进蛋白突变稳定性预测,清华龚海鹏团队AI蛋白工程模型登Nature子刊

💡 原文中文,约2200字,阅读约需6分钟。
📝

内容提要

清华大学龚海鹏团队提出的GeoStab-suite模型套件,包括GeoFitness、GeoDDG和GeoDTm,能够有效预测蛋白质突变后的适应度、ΔΔG和ΔTm。通过几何学习和预训练策略,模型性能显著提升,GeoDDG和GeoDTm在基准测试中分别比其他方法高出30%和70%。该研究为蛋白质工程提供了重要工具。

🎯

关键要点

  • 清华大学龚海鹏团队提出了GeoStab-suite模型套件,包括GeoFitness、GeoDDG和GeoDTm。
  • GeoFitness用于预测蛋白质突变后的适应度得分,GeoDDG和GeoDTm分别用于预测ΔΔG和ΔTm。
  • GeoFitness采用专门的损失函数,利用深度突变扫描数据库中的多标记适应度数据进行训练。
  • 预训练策略与数据扩展相结合,显著提高了模型性能和通用性。
  • 在基准测试中,GeoDDG和GeoDTm的性能分别比其他方法高出至少30%和70%。
  • 蛋白质适应度是蛋白质发挥特定功能的能力,主要通过ΔG和Tm来评估蛋白质稳定性。
  • GeoStab套件包含三个模型,采用图注意神经网络架构进行预测。
  • GeoDDG和GeoDTm分别使用依赖于实验结构和仅依赖序列信息的版本进行训练。
  • 研究人员建立了GeoStab-suite的Web服务器,为蛋白质科学研究提供工具。
➡️

继续阅读