登Science子刊!上海交大联合上海AI Lab等发布蛋白质突变体设计模型,优于最先进方法
💡
原文中文,约5200字,阅读约需13分钟。
📝
内容提要
上海交通大学研究团队开发了PRIME模型,能够在没有实验数据的情况下预测蛋白质突变的性能,从而提高其稳定性和活性。该模型基于温度感知语言模型,利用4.7亿条蛋白质序列数据,显著提升了预测准确性,推动了蛋白质工程的发展。
🎯
关键要点
- 上海交通大学研究团队开发了PRIME模型,能够在没有实验数据的情况下预测蛋白质突变的性能。
- PRIME模型基于温度感知语言模型,利用4.7亿条蛋白质序列数据,显著提升了预测准确性。
- PRIME在蛋白质突变-活性和突变-稳定性预测方面取得了最佳效果。
- 研究表明,PRIME能够有效预测蛋白质的多种属性,帮助研究人员在不熟悉的领域成功设计蛋白质。
- PRIME模型由编码器模块、MLM模块和OGT预测模块组成,能够捕捉氨基酸的上下文信息和温度特征。
- PRIME在热稳定性预测中表现优于其他现有模型,显示出其在蛋白质工程中的应用潜力。
- 研究团队通过湿实验验证了PRIME的有效性,超过30%的AI推荐突变体在关键性能上优于野生型蛋白。
- PRIME还展示了一种高效的方法,能够快速获得具备增强活性和稳定性的多位点突变体。
- 研究团队在小样本学习方面取得了多项成果,开发了FSFP策略以优化蛋白质语言模型的训练。
- 洪亮教授认为,未来三年,专业领域的通用人工智能将带来科学发现模式的范式变革。
➡️