本研究提出了一种新架构CHOP,旨在提高视觉语言模型(VLM)移动助手在子任务规划中的效率和可执行性。通过使用人工规划的子任务作为基础向量,CHOP在图形用户界面(GUI)场景中显著提升了任务完成效果与效率,并在20款应用中验证了其改进效果。
完成下面两步后,将自动完成登录并继续当前操作。