小红花·文摘

淘天提出的Mobile-R1是一个任务级奖励的交互式强化学习框架，旨在提高移动代理的适应性和探索能力。通过三阶段训练流程和高质量轨迹数据集，Mobile-R1在动态环境中的任务成功率达到49.40%，显著优于其他基准模型。

任务级奖励提升App Agent思考力，淘天提出Mobile-R1，3B模型可超32B

量子位 ·

基于大型语言模型的移动代理：革新设备智能

DEV Community ·

本研究提出了AutoEval框架，旨在解决移动代理评估的实用性和可扩展性问题。该框架实现了无需人工干预的自动测试，反馈性能，覆盖率达到93%，评估准确性为94%。

AutoEval: A Practical Framework for Autonomous Evaluation of Mobile Agents

BriefGPT - AI 论文速递 ·

本研究探讨了移动代理在复杂动态环境中的自动化任务需求，提出了基于提示和训练的策略，以增强多模态交互和适应能力，为未来研究提供方向。

多模态移动代理的基础与近期趋势：一项综述

BriefGPT - AI 论文速递 ·

本研究探讨了移动代理在去中心化联邦学习中的通信不稳定性问题。引入模型缓存机制后，代理能够存储和交换模型，从而提高收敛性和准确性。实验结果显示，采用缓存的去中心化联邦学习方法性能显著优于不使用缓存的方法。

Decentralized Federated Learning with Model Caching on Mobile Agents

BriefGPT - AI 论文速递 ·

本文研究了移动代理计算任务的转移，提出了一种基于分散决策的机制，并设计了多代理在线学习算法，应用于V2X模拟中。通过深度强化学习，解决了车辆互联网中的服务卸载问题，实验结果表明该框架性能优越。此外，研究了细胞V2X通信的资源分配，提出的去中心化算法优于其他算法。

动态车联网中的 DNN 划分、任务卸载和资源分配：一种基于 Lyapunov 导引的扩散强化学习方法

BriefGPT - AI 论文速递 ·

本文介绍了基于多模式大语言模型的移动代理应用程序Mobile-Agent，该程序能够识别和定位应用界面元素，并规划复杂操作任务。实验结果显示其在移动设备操作中的高准确性和完成率。系统通过个性化学习和在线指令执行实现自动化操作，解决了隐私和复杂任务的挑战。此外，研究提出了新框架Self-MAP，利用记忆和自我反思技术提升用户交互效率。

Mobile-Agent-v2: 移动设备操作助手通过多智能体协作实现有效导航

BriefGPT - AI 论文速递 ·

本文介绍了基于多模式大语言模型的移动代理应用程序Mobile-Agent，能够识别和定位应用界面元素，自主规划复杂操作任务。实验结果显示其在移动设备操作中具有高准确性和完成率。此外，DroidAgent用于自动化GUI测试，展现出较高的自主性和活动覆盖率。研究还提出了AndroidArena基准测试工具，揭示了LLM代理在跨应用场景中的挑战，并提出改进策略。

基于多样配置的移动设备控制代理的基准测试

BriefGPT - AI 论文速递 ·