大语言模型能用作世界模拟器吗?
原文中文,约1300字,阅读约需3分钟。发表于: 。语言模型可以被用作世界模拟器吗? 在我们的ACL 2024论文中,我们证明了这不是真的。 GPT-4在模拟基于常识任务(如沸水)的状态变化时,准确率仅为60%。 该论文题为 "语言模型能否作为基于文本的世界模拟器? 该论文讨论了大型语言模型(LLM)在模拟基于文本的游戏中的状态转换方面的性能,...
ACL 2024论文研究证明大型语言模型(LLM)不能作为基于文本的世界模拟器,GPT-4测试结果显示其模拟状态变化的准确率仅为60%。LLM在处理需要算术、常识或科学知识的复杂转换时表现不佳,研究结果强调了其局限性并建议进一步改进。