通过测试发现,GPT 系列的调整模型在理解意图和信念方面表现优于其他模型和儿童。基础模型无法解决心智理论任务。指令调整模型的增加可能与语言和心智理论的互相关联有关。呼吁在 LLMs 中对心智理论保持观点。
本研究比较了调整模型和极大语言模型在可检测可信度主张任务中的性能。实验结果表明,调整模型在跨域设置中优于零样本方法。
研究发现,GPT系列的调整模型在理解意图和信念方面表现优于其他模型和儿童。指令调整模型的增加可能与语言和心智理论的互相关联有关。建议对语言模型中的心智理论保持细致观点。
完成下面两步后,将自动完成登录并继续当前操作。