大模型集体失智,9.11和9.9的大小比较出错。大模型无法理解算数问题,需要向AI解释明白是双精度浮点数。检验提示词技巧的试金石。OpenAI秘密模型“草莓”更新,新模型在MATH数据集上得分超过90%。
大模型GPT-4o在比较9.11和9.9时出现错误,将9.11拆分成数字和小数点,导致认为11比9大。问题暴露了大模型在基础算数方面的不足。解决方法是向AI解释这是一个双精度浮点数。OpenAI正在测试新模型,能否解决类似问题尚不确定。
完成下面两步后,将自动完成登录并继续当前操作。