GPT-4o连验证码都解不了??SOTA模型成功率仅40% MetaAgentX团队推出了Open CaptchaWorld平台,旨在评估多模态智能体在解验证码方面的能力。研究表明,尽管人类的成功率高达93.3%,但最先进的模型如GPT-4o的成功率仅为40%,显示出当前智能体在高交互场景中的不足。该平台旨在促进智能体在真实网页任务中的应用与发展。 Open CaptchaWorld gpt 多模态智能体 成功率 网页任务 验证码