近年来,大语言模型(LLM)推动了基于自然语言的GUI智能体的发展,如AppAgent X。该框架通过学习历史操作,优化执行效率,解决了智能决策与执行速度的平衡问题。智能体能够识别重复操作并自动归纳为高级操作,从而显著提高任务完成速度。
西湖大学推出了AppAgentX,这是一款具备自我进化能力的GUI代理,能够高效执行任务。它通过视觉操作,避免了传统API的依赖,提升了任务执行速度,解决了智能体在响应速度与认知能力之间的平衡问题,为移动端AI应用开辟了新路径。
本研究提出了一种新颖的进化框架,旨在提高基于大型语言模型的图形用户界面代理在常规任务中的效率。通过内存机制记录任务历史,识别重复动作,显著提升了操作的效率和准确性。实验结果表明,该方法在多个基准任务中优于现有技术,具有重要应用潜力。
完成下面两步后,将自动完成登录并继续当前操作。