小红花·文摘 - 小红花技术领袖俱乐部

告别9.9价格战，瑞幸的新叙事

告别9.9价格战，瑞幸的新叙事

TechWeb 全站精华 ·

大模型集体失智，9.11和9.9的大小比较出错。大模型无法理解算数问题，需要向AI解释明白是双精度浮点数。检验提示词技巧的试金石。OpenAI秘密模型“草莓”更新，新模型在MATH数据集上得分超过90%。

大模型集体失智！9.11和9.9哪个大，几乎全翻车了

程序师 ·

大模型GPT-4o在比较9.11和9.9时出现错误，将9.11拆分成数字和小数点，导致认为11比9大。问题暴露了大模型在基础算数方面的不足。解决方法是向AI解释这是一个双精度浮点数。OpenAI正在测试新模型，能否解决类似问题尚不确定。

大模型集体失智！9.11和9.9哪个大，几乎全翻车了

量子位 ·