小红花·文摘

本研究测试了几种大型语言模型（LLMs）在解决认知科学文献中的演绎推理问题方面的能力。结果表明，LLMs在传统形式上解决这些问题的能力有限，且具有推理偏见。后续实验未能提高总体性能。

BriefGPT - AI 论文速递 ·

本研究测试了几种大型语言模型（LLMs）在解决认知科学文献中的演绎推理问题方面的能力。结果表明，LLMs在传统形式上解决这些问题的能力有限，且具有独特的推理偏见。后续实验未能改善模型性能。

BriefGPT - AI 论文速递 ·