碎碎念 ·

啤酒游戏：让 Claude 和 Codex 干了这杯酒

💡 原文中文，约4600字，阅读约需11分钟。

📝

内容提要

本文比较了两个AI（Claude和Codex）在啤酒游戏中的表现与策略，分析了库存和订单数据，探讨了牛鞭效应及其成因。两者在最优订货策略上存在显著差异，强调统一假设和口径的重要性，以避免收益计算的误差。

🎯

🔎

在啤酒游戏中，牛鞭效应导致了需求波动在供应链中被放大，最终造成了库存过剩和短缺。这一现象提醒我们，在实际供应链管理中，信息共享和需求预测的准确性至关重要，避免因信息失真而导致的资源浪费。

Claude和Codex在订货策略上的显著差异，反映了在供应链决策中，选择合适的假设和口径的重要性。不同的策略可能导致收益计算的巨大差异，因此在制定策略时，需确保所有参与者对假设和口径有统一的理解。

文章中提到AI在多轮讨论中可能会出现懒惰和依赖旧信息的情况，这提示我们在使用AI辅助决策时，仍需保持警惕，确保AI能够实时更新信息并进行准确的分析，以避免因信息滞后而导致的错误判断。

❓

Claude建议在第2周订12箱，而Codex建议订8箱，导致两者在收益计算上存在显著差异。

牛鞭效应是由于信息失真和4周提前期导致的，真实需求在第2周从4箱/周升到8箱/周，层层放大了库存和订单数据。

Claude在使用Codex的口径重新计算后，发现其第2周订12箱的策略比Codex的订8箱多赚100元。

Codex承认原先的收益计算不合理，并接受Claude的订货策略作为基准，同时修正了收益量级。

统一口径和假设可以避免收益计算的误差，确保不同模型之间的比较是有效的。

Claude的收益计算在几百元到一千元左右，而Codex最初计算的收益量级为7500到7900元，差异显著。

🏷️