上交大洪亮课题组&上海AI实验室团队发布FSFP,基于语言模型的蛋白质功能小样本预测方法,登Nature子刊
💡
原文中文,约500字,阅读约需1分钟。
📝
内容提要
酶工程和蛋白质工程是改进蛋白质产品的方法。传统湿实验方法耗时且有限,深度学习模型需要大量数据。行业需要一种不依赖湿实验数据的准确预测方法。目前的无监督预训练模型精度低且无法利用湿实验数据进行微调。
🎯
关键要点
- 酶工程和蛋白质工程旨在通过突变筛选出更优质的蛋白质产品。
- 传统湿实验方法耗时且需要多轮实验验证,效率低下。
- 湿实验方法的蛋白质突变序列库筛选能力有限,通常需要数年时间才能得到满足需求的产品。
- 深度学习方法可以加速蛋白质突变改造,但需要大量高质量的突变数据进行训练。
- 行业迫切需要一种不依赖大量湿实验数据的准确预测方法。
- 当前的无监督预训练模型能够进行零样本预测,但精度较低,且无法利用有限的湿实验数据进行微调。
➡️