大模型集体失智,9.11和9.9的大小比较出错。大模型无法理解算数问题,需要向AI解释明白是双精度浮点数。检验提示词技巧的试金石。OpenAI秘密模型“草莓”更新,新模型在MATH数据集上得分超过90%。
完成下面两步后,将自动完成登录并继续当前操作。