朝向健壮的多模式提示:缺失模态

原文约300字,阅读约需1分钟。发表于:

使用具体的提示设计来提高多模态学习的性能和鲁棒性,并减少提示的数量。

本文介绍了一种名为VP-FAS的方法,用于改善人脸反欺诈系统的鲁棒性。该方法通过学习与模态相关的提示来适应冻结的预训练基础模型到下游的灵活多模态人脸反欺诈任务。实验证明,VP-FAS框架在各种缺失模态情况下提高了性能,并减轻了对重训练的要求。

相关推荐 去reddit讨论