尽管生成性人工智能的输出令人印象深刻,但它对世界并没有连贯的理解
原文英文,约1100词,阅读约需4分钟。发表于: 。Researchers show that even the best-performing large language models don’t form a true model of the world and its rules, and can thus fail unexpectedly on similar tasks.
大型语言模型在文本生成方面表现优异,但新研究显示它们并未真正理解世界。尽管模型能准确导航纽约市,但在环境变化时表现显著下降。研究者提出新的评估指标,发现随机选择的模型反而构建了更准确的世界模型。这表明当前模型在某些任务上表现良好,但缺乏对规则的理解,未来需探索更复杂的问题。