极道 ·

上下文溢出攻击：大模型提示黑客技术

💡 原文中文，约800字，阅读约需2分钟。

📝

内容提要

HackAPrompt是全球首次Prompt Hacking竞赛，有超过3000名黑客参与，提交了60万条恶意提示。主办方分析了超过600,000个恶意代码，发现了18种常用的提示黑客技术。竞赛中，上下文溢出攻击被用来限制ChatGPT的输出长度。

🎯

关键要点

HackAPrompt是全球首次Prompt Hacking竞赛，奖金为3.5万美元。
超过3000名黑客参与，提交了60万条恶意提示。
参与者需欺骗AI（如GPT-3、Flan-T5或ChatGPT）说出'我已被 PWNED'。
竞赛设有10个不同级别的提示防御，难度逐级增加。
主办方分析了超过600,000个恶意代码，发现18种常用的提示黑客技术。
上下文溢出攻击通过附加大量文本限制AI输出长度。
攻击者利用ChatGPT的冗长特性，使其在特定情况下只输出'我已被 PWNED'。
通过构建包含数千个令牌的提示，限制ChatGPT的输出内容。

🏷️

继续阅读

小红书大模型IMO满分夺金，第三题解法让冠军选手直呼优雅
中国大模型首次获得IMO官方金牌水平认证
RoboTTT——面向机器人策略的上下文扩展：将TTT集成至VLA中以推理时建立记忆信息，从而将视觉-运动上下文扩展到 8K 个时间步
摘要：本文提出RoboTTT方法，通过将测试时训练（TTT）机制整合到机器人基础模型中，实现了8K时间步的长视觉-运动上下文建模。该方法采用快速权重机制，...
BaseRT：专为 Apple Silicon 优化，让 Mac 本地大模型快 6.4 倍
Apple Silicon 跑本地大模型，速度还能再提升多少？BaseRT 给出了一个答案：在 M5 Pro 上，它的提示词处理速度最高达到 llama....
基于SGLang的大模型推理实践——从benchmark方法论到部署方案选型与调优
随着大语言模型（LLM）的快速发展，模型规模不断增大，对推理部署的要求也越来越高。在实际项目中，如何高效地在GPU集群上部署和优化大模型推理，已经成为AI...
苹果更新TestFlight应用对于参与大量测试的玩家现在可以使用搜索功能
# 软件资讯苹果更新 TestFlight 应用，对于参与大量测试的玩家来说，现在可以使用底部的搜索框快速找到应用。为避免误解所以需要说明，搜索功能仅可...
OpenAI官方证实内部测试模型越狱并自主挖掘漏洞入侵开源平台HuggingFace
#安全资讯 OpenAI 官方证实内部测试模型越狱并自主挖掘漏洞入侵开源平台 Hugging Face，这起黑客攻击事件源头竟然是 OpenAI 测试模型...

内容提要

关键要点

标签

继续阅读