无偏的、通用的、高灵敏度的信号肽预测器与深度蛋白质语言模型
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
利用ESM-2开发了pLMFPPred工具,用于预测功能性肽和识别有毒肽。采用SMOTE-TOMEK数据合成采样和Shapley值技术缓解数据不平衡问题和减少计算成本。在验证测试集上,pLMFPPred表现更优,具有更好的准确率、AUC-ROC和F1-Score。是一种新的预测功能性肽的计算方法。
🎯
关键要点
- 利用基于蛋白质语言模型的嵌入(ESM-2)开发了pLMFPPred工具。
- pLMFPPred用于预测功能性肽和识别有毒肽。
- 引入SMOTE-TOMEK数据合成采样和Shapley值技术以缓解数据不平衡问题和减少计算成本。
- 在验证的独立测试集上,pLMFPPred取得了0.974的准确率、0.99的AUC-ROC和0.974的F1-Score。
- pLMFPPred的表现优于当前用于预测功能性肽的方法。
- 实验结果表明,pLMFPPred在准确性、AUC-ROC和F1-Score等方面具有更好的性能,是一种新的计算方法。
➡️