AMPCliff: 抗微生物肽中活性断崖的定量定义和基准评估
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
利用蛋白质语言模型的嵌入(ESM-2),开发了pLMFPPred工具,用于预测功能性肽并识别有毒肽。采用数据合成采样和特征选择技术,解决了数据不平衡问题和减少计算成本。在验证集上,pLMFPPred表现优于当前方法,具有更好的准确率和性能。
🎯
关键要点
- 开发了名为 pLMFPPred 的工具,用于预测功能性肽和识别有毒肽。
- 采用 SMOTE-TOMEK 数据合成采样和 Shapley 值特征选择技术,解决数据不平衡问题和减少计算成本。
- 在验证集上,pLMFPPred 的准确率为 0.974,曲线下面积(AUC-ROC)为 0.99,F1-Score 值为 0.974,优于当前方法。
- 实验结果表明,pLMFPPred 在准确性和性能方面具有更好的表现,是一种新的计算方法。
➡️