本文介绍了一种名为MONDAY的自动化框架,利用YouTube视频生成用于训练GUI智能体的任务轨迹数据集。该数据集涵盖安卓和iOS系统,包含20320个序列和312754个注释帧,旨在降低数据获取成本并提高多样性,为跨平台移动智能体的训练提供高质量数据。
本研究提出了FedMobileAgent框架,通过用户自源数据训练移动智能体,结合自动标注和适应聚合技术,降低数据采集成本并保护隐私。其性能与中心化模型相当,成本仅为0.02%。
完成下面两步后,将自动完成登录并继续当前操作。