本研究提出了AppVLM,一种轻量级视觉语言模型,旨在解决手机助手的适应性和计算成本问题。通过在AndroidControl数据集上进行细调,并在AndroidWorld环境中训练,AppVLM显著提高了任务完成率和行动预测准确性,展示了其在实际应用中的高效性和实用性。
ProActive是一种用于建模活动序列中行动时间分布的框架,解决行动预测、序列目标预测和序列生成等问题。实验证明ProActive在行动和目标预测方面准确性显著提高,并首次应用了端到端行动序列生成。
完成下面两步后,将自动完成登录并继续当前操作。