研究发现,大型语言模型具有理解和诱导欺骗策略的能力,强调在开发和部署此类AI系统时需要道德考量。这对机器心理学领域有重要意义。
本文探讨机器心理学作为新兴研究领域,评估大型语言模型(LLMs)的行为与能力。研究提出BOLT框架,分析LLMs在治疗师角色中的表现,并使用CogBench工具评估35个模型的认知行为。结果显示,LLMs在模拟人格特质和学习行为方面具有潜力,但与人类行为的一致性仍需改进,强调了进一步研究的必要性。
完成下面两步后,将自动完成登录并继续当前操作。