小红花·文摘

谷歌新模型Gemini 1.5 Pro（0801）在lmsys竞技场中击败了GPT-4o，成为第一。Gemini 1.5 Pro（0801）在视觉排行榜和多语言能力基准测试中表现出色，但在编码和Hard Prompt Arena中表现不佳。谷歌发布了20亿参数模型Gemma 2（2B），在竞技场排行榜上超越了GPT-3.5模型。竞技场榜单的权威性受到质疑。