小红花·文摘

大模型集体失智，9.11和9.9的大小比较出错。大模型无法理解算数问题，需要向AI解释明白是双精度浮点数。检验提示词技巧的试金石。OpenAI秘密模型“草莓”更新，新模型在MATH数据集上得分超过90%。