量子位 ·

教龙虾玩手机！打通GUI智能体训练-评测-部署全流程，训练、真机、评测一站解决

💡 原文中文，约4300字，阅读约需11分钟。

📝

内容提要

ClawGUI是一个开源框架，旨在解决GUI智能体的训练、评测和部署问题。它通过在线强化学习与真实设备交互，提升模型性能。ClawGUI-2B在MobileWorld基准上取得17.1 SR的成绩，显著超越基线，并支持自然语言控制手机，推动GUI智能体的实际应用。

🎯

🔎

ClawGUI的研究团队认为，GUI智能体与CLI的结合是通往通用智能体的重要路径。随着移动互联网的普及，GUI仍将是用户与数字世界的主要交互方式。未来，GUI智能体的应用将不仅限于简单的任务执行，而是能够处理更复杂的操作，提升用户体验。

尽管ClawGUI-RL在训练和评测上取得了显著进展，但在线强化学习仍面临诸多挑战，如动态UI变化和反爬机制等。这些问题影响了大规模训练的稳定性，未来需要更多的技术创新来解决这些工程难题，以实现更高效的训练流程。

ClawGUI-Eval通过标准化的评测流程解决了不同框架下评测结果不一致的问题，复现率达到95.8%。这一标准化评测不仅提高了模型评估的可信度，也为研究者提供了宝贵的经验教训，帮助他们在未来的研究中避免常见错误。

❓

ClawGUI是一个开源框架，旨在解决GUI智能体的训练、评测和部署问题。

ClawGUI-2B在MobileWorld基准上取得17.1 SR的成绩，显著超越基线的11.1。

ClawGUI通过在线强化学习与真实设备交互，提升模型性能。

ClawGUI-Eval通过标准化评测流程解决了不同框架下评测结果不一致的问题，复现率达到95.8%。

OpenClaw-GUI实现了通过自然语言控制真实手机，支持多种聊天平台的指令执行。

ClawGUI的未来规划包括真机部署、桌面和网页环境的在线强化学习扩展。

🏷️