本研究提出了AppVLM,一种轻量级视觉语言模型,旨在解决手机助手的适应性和计算成本问题。通过在AndroidControl数据集上进行细调,并在AndroidWorld环境中训练,AppVLM显著提高了任务完成率和行动预测准确性,展示了其在实际应用中的高效性和实用性。
完成下面两步后,将自动完成登录并继续当前操作。