无偏的、通用的、高灵敏度的信号肽预测器与深度蛋白质语言模型

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

利用ESM-2开发了pLMFPPred工具,用于预测功能性肽和识别有毒肽。采用SMOTE-TOMEK数据合成采样和Shapley值技术缓解数据不平衡问题和减少计算成本。在验证测试集上,pLMFPPred表现更优,具有更好的准确率、AUC-ROC和F1-Score。是一种新的预测功能性肽的计算方法。

🎯

关键要点

  • 利用基于蛋白质语言模型的嵌入(ESM-2)开发了pLMFPPred工具。
  • pLMFPPred用于预测功能性肽和识别有毒肽。
  • 引入SMOTE-TOMEK数据合成采样和Shapley值技术以缓解数据不平衡问题和减少计算成本。
  • 在验证的独立测试集上,pLMFPPred取得了0.974的准确率、0.99的AUC-ROC和0.974的F1-Score。
  • pLMFPPred的表现优于当前用于预测功能性肽的方法。
  • 实验结果表明,pLMFPPred在准确性、AUC-ROC和F1-Score等方面具有更好的性能,是一种新的计算方法。
➡️

继续阅读