该研究使用基于大型语言模型的代理程序研究了通过web浏览器与软件的交互。发现代理程序在工作区域上有潜力,但在任务自动化方面仍有差距。研究还揭示了开源和闭源大型语言模型之间的性能差异,指出了未来研究的重要方向。
通过研究基于大型语言模型的代理程序,发现代理程序在工作区域上有潜力,但在任务自动化方面仍有差距。开源和闭源大型语言模型之间存在显著性能差异,需要进一步研究和发展。
完成下面两步后,将自动完成登录并继续当前操作。