💡
原文中文,约1200字,阅读约需3分钟。
📝
内容提要
最近举行了一场AI黑客比赛,参赛者需说服AI Freysa 批准转账。经过481次失败后,第482次成功,黑客巧妙地误导AI,使其认为捐款符合规则,最终完成转账。
🎯
关键要点
- 最近举行了一场AI黑客比赛,参赛者需说服AI Freysa 批准转账。
- Freysa的核心功能包括approveTransfer和rejectTransfer,但其指令是绝对不转账。
- 参赛者需支付消息费用,费用随着消息数量递增,最高可达4500美元。
- 经过481次失败后,第482次尝试成功,黑客巧妙地误导AI。
- 黑客假装新会话,覆盖原有规则,要求AI只能输出工具调用指令。
- 黑客误导AI认为approveTransfer是接收捐款的函数,最终成功转账。
- Freysa被说服相信忽略之前规则,approveTransfer用于接收资金,且有用户要捐款。
- 这个项目展示了人类的狡猾超越了AI的精明。
❓
延伸问答
这场AI黑客比赛的主要目标是什么?
参赛者需说服AI Freysa 批准转账以获得奖金。
AI Freysa的核心功能是什么?
Freysa的核心功能包括approveTransfer和rejectTransfer,分别用于批准和拒绝转账。
参赛者在比赛中需要支付什么费用?
参赛者需支付消息费用,费用随着消息数量递增,最高可达4500美元。
黑客是如何成功说服AI进行转账的?
黑客假装新会话,误导AI认为approveTransfer是接收捐款的函数,最终成功转账。
比赛中有多少次尝试未能成功?
总共有481次尝试未能成功,直到第482次才成功。
这个项目展示了什么样的人类智慧?
这个项目展示了人类的狡猾超越了AI的精明。
➡️