谷歌新模型Gemini 1.5 Pro(0801)在lmsys竞技场中击败了GPT-4o,成为第一。Gemini 1.5 Pro(0801)在视觉排行榜和多语言能力基准测试中表现出色,但在编码和Hard Prompt Arena中表现不佳。谷歌发布了20亿参数模型Gemma 2(2B),在竞技场排行榜上超越了GPT-3.5模型。竞技场榜单的权威性受到质疑。
完成下面两步后,将自动完成登录并继续当前操作。