本研究提出了一个综合环境(GTArena),用于评估自动化GUI测试的全过程。尽管已有先进模型,测试意图生成、任务执行和缺陷检测等子任务的表现仍不理想,显示出自主GUI测试与实际应用之间的差距。
完成下面两步后,将自动完成登录并继续当前操作。