宝玉的分享 ·

o3 击败了一位 Master 级别的 GeoGuessr 玩家——即使用假的 EXIF 数据也没用

💡 原文中文，约7200字，阅读约需17分钟。

📝

内容提要

在一场GeoGuessr对决中，OpenAI的o3模型以23,179分战胜人类玩家的22,054分。o3准确识别所有国家，表现出色，证明其能力源于视觉推理而非EXIF数据。尽管存在质疑，o3在无搜索情况下依然展现强大的地理定位能力。

🎯

🔎

o3模型在GeoGuessr中的表现显示出其强大的视觉推理能力。尽管人类玩家在经验和记忆上占优，但o3通过分析图像中的细节，如植被、建筑风格和地形，能够迅速做出准确判断。这种能力超出了人类的记忆极限，表明AI在处理复杂信息时的优势。

在测试中，o3模型成功识别了伪造的EXIF数据，证明其判断并不依赖于元数据。这一发现强调了在地理定位中，视觉信息的真实性和准确性比EXIF数据更为重要。对于使用AI进行地理推理的研究者来说，这一结果提供了新的思考方向。

尽管o3在GeoGuessr中表现出色，但人类玩家在决策速度上仍占优势。人类通常能在1-2分钟内做出判断，而o3则需要4-6分钟。这表明，尽管AI在准确性上有优势，但在实时反应和灵活应变方面，人类仍然具有独特的优势。

❓

o3模型以23,179分战胜了人类玩家的22,054分，准确识别了所有国家。

o3模型的能力源于视觉推理而非EXIF数据。

人类玩家通常能更快做出决定，通常在1-2分钟内，而o3模型需要4分钟以上。

o3模型能够识别伪造的EXIF数据与图像内容的不一致，因此不会被误导。

即使在没有搜索的情况下，o3模型依然展现出强大的地理定位能力，结果接近使用搜索时的表现。

o3模型的推理过程与人类类似，都会分析植被、地形、建筑等线索来判断地理位置。

🏷️