AMPCliff: 抗微生物肽中活性断崖的定量定义和基准评估

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

利用蛋白质语言模型的嵌入(ESM-2),开发了pLMFPPred工具,用于预测功能性肽并识别有毒肽。采用数据合成采样和特征选择技术,解决了数据不平衡问题和减少计算成本。在验证集上,pLMFPPred表现优于当前方法,具有更好的准确率和性能。

🎯

关键要点

  • 开发了名为 pLMFPPred 的工具,用于预测功能性肽和识别有毒肽。
  • 采用 SMOTE-TOMEK 数据合成采样和 Shapley 值特征选择技术,解决数据不平衡问题和减少计算成本。
  • 在验证集上,pLMFPPred 的准确率为 0.974,曲线下面积(AUC-ROC)为 0.99,F1-Score 值为 0.974,优于当前方法。
  • 实验结果表明,pLMFPPred 在准确性和性能方面具有更好的表现,是一种新的计算方法。
➡️

继续阅读