登Science子刊!上海交大联合上海AI Lab等发布蛋白质突变体设计模型,优于最先进方法
💡
原文中文,约5200字,阅读约需13分钟。
📝
内容提要
上海交通大学研究团队开发了PRIME模型,能够在没有实验数据的情况下预测蛋白质突变的性能,从而提高其稳定性和活性。该模型基于温度感知语言模型,利用4.7亿条蛋白质序列数据,显著提升了预测准确性,推动了蛋白质工程的发展。
🎯
关键要点
- 上海交通大学研究团队开发了PRIME模型,能够在没有实验数据的情况下预测蛋白质突变的性能。
- PRIME模型基于温度感知语言模型,利用4.7亿条蛋白质序列数据,显著提升了预测准确性。
- PRIME在蛋白质突变-活性和突变-稳定性预测方面取得了最佳效果。
- 研究表明,PRIME能够有效预测蛋白质的多种属性,帮助研究人员在不熟悉的领域成功设计蛋白质。
- PRIME模型由编码器模块、MLM模块和OGT预测模块组成,能够捕捉氨基酸的上下文信息和温度特征。
- PRIME在热稳定性预测中表现优于其他现有模型,显示出其在蛋白质工程中的应用潜力。
- 研究团队通过湿实验验证了PRIME的有效性,超过30%的AI推荐突变体在关键性能上优于野生型蛋白。
- PRIME还展示了一种高效的方法,能够快速获得具备增强活性和稳定性的多位点突变体。
- 研究团队在小样本学习方面取得了多项成果,开发了FSFP策略以优化蛋白质语言模型的训练。
- 洪亮教授认为,未来三年,专业领域的通用人工智能将带来科学发现模式的范式变革。
❓
延伸问答
PRIME模型的主要功能是什么?
PRIME模型能够在没有实验数据的情况下预测蛋白质突变体的性能,提升其稳定性和活性。
PRIME模型是如何提高预测准确性的?
PRIME模型基于温度感知语言模型,利用4.7亿条蛋白质序列数据,显著提升了预测准确性。
PRIME模型在蛋白质工程中的应用潜力如何?
PRIME在热稳定性预测中表现优于其他现有模型,显示出其在蛋白质工程中的广泛应用潜力。
研究团队如何验证PRIME模型的有效性?
研究团队通过湿实验验证了PRIME的有效性,超过30%的AI推荐突变体在关键性能上优于野生型蛋白。
PRIME模型的结构组成是什么?
PRIME模型由编码器模块、MLM模块和OGT预测模块组成,能够捕捉氨基酸的上下文信息和温度特征。
未来三年,洪亮教授对人工智能在科学发现中的看法是什么?
洪亮教授认为,未来三年,专业领域的通用人工智能将带来科学发现模式的范式变革。
➡️