小红花·文摘 - 小红花技术领袖俱乐部

本研究提出了一种基于语法和情感的双触发文本后门攻击方法，克服了单一触发的识别问题。实验结果表明，该方法在攻击性能上优于传统方法，揭示了文本后门攻击的严重性，并为安全防护提供了新视角。

Double Landmines: Invisible Textual Backdoor Attacks Based on Dual Triggers

BriefGPT - AI 论文速递 ·

该研究提出了多种针对文本后门攻击的防御策略，如噪声增强对比学习（NCL）、CleanCLIP和RoCLIP，旨在提高模型的鲁棒性和性能。实验结果表明，这些方法有效降低了后门攻击的成功率，同时保持了模型的准确性。研究强调了多模态对比学习的潜在威胁，并呼吁开发更强的防御机制。

TA-Cleaner：多模态对比学习中的细粒度文本对齐后门防御策略

BriefGPT - AI 论文速递 ·

本文研究了文本后门攻击对NLP系统的威胁，并提出了评估协议和开源工具包OpenBackdoor。文章探讨了攻击和防御模型的性能，并提出了聚类-based的防御策略CUBE。

OrderBkd: 文字背门攻击的重新定位

BriefGPT - AI 论文速递 ·

本文研究了文本后门攻击对NLP系统的威胁，并提出了评估协议和开源工具包OpenBackdoor。文章探讨了攻击和防御模型的性能，并提出了聚类-based的防御策略CUBE。

对抗后门攻击中对比学习的防御难度

BriefGPT - AI 论文速递 ·