小红花·文摘

Cloudflare成功抵御了创纪录的11.5Tbps DDoS攻击，显示出其强大的防御能力。此次攻击主要源自Google Cloud，突显了网络安全威胁的严峻性。随着IoT设备的增加，企业面临更大风险，需在防御性能与成本之间找到平衡。

FreeBuf网络安全行业门户 ·

本研究提出了一种名为Cert-SSB的样本特定认证防御方法，旨在提高深度神经网络对后门攻击的防御能力。通过优化样本噪声幅度并结合多个平滑模型的预测，显著提升了防御效果和认证性能。

BriefGPT - AI 论文速递 ·

STShield是一种创新的单标记哨兵机制，旨在实时监测大型语言模型的越狱攻击。该方法通过在模型响应中附加安全指示符，利用模型的对齐能力进行检测。研究表明，STShield在保持模型实用性的同时，有效防御多种越狱攻击，具备优越的防御性能和较低的计算开销，适合实际部署。

BriefGPT - AI 论文速递 ·

本研究提出了一种新的可持续自我进化对抗训练框架（SSEAT），旨在解决现有对抗训练模型在动态攻击下的不足。该框架通过持续的对抗防御和数据重放，有效学习多种对抗样本，并解决灾难性遗忘问题。实验结果表明，其防御性能和分类准确率优于其他模型。

BriefGPT - AI 论文速递 ·

本研究提出了一种基于对抗解耦增强框架（ADAF）的面部隐私保护算法，增强了防御性能，并在CelebA-HQ和VGGFace2数据集上验证了其优越性。同时，开发了领域对抗攻击方法和双教师知识蒸馏框架，以提升人脸反欺诈效果。

BriefGPT - AI 论文速递 ·