Windsurf在其IDE中推出Arena模式,允许开发者在真实编码任务中并行比较大型语言模型,评估模型表现并进行排名。该模式旨在克服现有比较系统的局限性,支持特定模型测试和独立对话,未来还计划增加更细化的排行榜。
完成下面两步后,将自动完成登录并继续当前操作。