计算机使用的高效智能体训练

本研究解决了传统智能体训练中对大量高质量轨迹数据的依赖问题。论文提出了一种新的训练框架PC Agent-E,通过对少量人类标注的计算机使用轨迹进行合成,显著提升了模型性能,相较于Claude 3.7 Sonnet实现了141%的相对提升,且在不同操作系统上表现出较强的泛化能力,展示出高质量轨迹数据的潜力。

本研究提出了PC Agent-E训练框架,解决了智能体训练对高质量轨迹数据的依赖。通过合成少量人类标注的轨迹,模型性能显著提升,展现出良好的泛化能力。

原文中文,约300字,阅读约需1分钟。发表于:
阅读原文