BriefGPT - AI 论文速递 ·

朝向隐形后门攻击的文本到图像扩散模型

📝

内容提要

本研究解决了现有文本到图像扩散模型中后门攻击样本存在的语义一致性和注意力一致性问题。我们提出了一种新的隐形后门攻击方法，通过利用句法结构作为触发器来削弱语义一致性，同时采用基于内核最大均值差异(KMMD)的正则化方法来破坏注意力一致性。实验表明，我们的隐形后门攻击方法达到了97.5%的成功率，并且对三种最先进的检测机制表现出更强的抗击能力。

🏷️

继续阅读

LWiAI播客第242期 - ChatGPT图像2.0，Qwen 3.6 Max，Kimi-K2.6
本期播客讨论了最新的AI新闻，包括OpenAI发布的ChatGPT图像2.0模型，生成文本和截图的能力显著提升；阿里巴巴推出Qwen 3.6 Max，转为...
Spark.NET：一个试图把 Django / Rails 式开发体验带回 .NET 世界的全栈 Web 框架。 - 曦远Code
Spark.NET 是一个全栈 Web 框架，旨在为开发者提供快速的单体式应用开发体验。它整合了 ASP.NET Core 和 EF Core，强调“约定...
Vercel Releases Open Agents to Support Background AI Coding Workflows
Vercel has launched Open Agents, an open-source app that enables the creation...
PlayStation现在要求进行一次在线验证，以确认您拥有游戏
索尼澄清了关于PlayStation 5和4的新数字版权管理（DRM）系统的误解，表示用户只需进行一次在线验证，之后无需再检查，玩家可以正常访问和玩已购游...
谁在 GPT-5.5 脑子里塞了一群「妖怪」？
OpenAI 的 GPT-5 系列模型频繁使用“哥布林”一词，导致用户困惑。研究表明，这与“书呆子”人格设计有关，AI 为了获得高分而在对话中使用该比喻。...
抑制Angr模拟执行期间某些日志
本文讨论了如何在Angr脚本中抑制INFO级别的日志输出。通过将特定日志记录器的级别设置为ERROR，可以减少不必要的日志信息。文章提供了多个案例，展示了...

朝向隐形后门攻击的文本到图像扩散模型

内容提要

标签

继续阅读