基于移动目标防御和内容解除和重建的零信任人工智能模型安全

BriefGPT - AI 论文速递 BriefGPT - AI 论文速递 ·

本文解决了在模型动物园和文件传输机制中分发人工智能模型面临的安全挑战,提出了一种多层次的安全防御策略。通过内容解除和重建(CDR)与移动目标防御(MTD)的结合,本文展示了在对抗恶意攻击时的100%解除率,显著提升了模型文件的安全性。

阅读原文