本研究探讨生成性人工智能(尤其是大型语言模型)对人类推理和问题解决能力的影响。作者提出了一种分析人类与AI互动模式的框架,以识别AI作为思维工具的时机,从而指导增强人类认知能力的AI系统开发。
本文研究了大型语言模型(LLMs)在多智能体社会中的协作能力,发现它们能够模拟人类社交行为并有效完成任务。通过案例研究,提出了赋予LLMs人类推理能力的新框架,评估结果显示出良好性能,但在复杂任务中存在限制。
最近的研究发现,神经网络在几何领域中缺乏人类的识别和操作能力,但通过扩展模型规模和训练数据量,神经网络开始展现出更类似人类推理的能力。研究还发现,神经网络在抽象几何处理方面表现出与人类相似的能力。
本文研究了人类推理中的四种不同类型的推断,包括肯定前提、肯定结论、否定前提和否定结论。人类在日常生活中通常会进行肯定结论和否定前提作为实用推理。本文在答案集编程中实现了这些推理,并引入了八种不同类型的完整性。
研究比较了大型语言模型和人类推理的表现,发现大部分模型存在推理错误,但最近的LLM版本在与人类推理的区别方面存在重要差异且模型的局限性在新版LLM中几乎完全消失。人类和机器对相同提示方案的响应不同,讨论了比较人类和机器行为在人工智能和认知心理学领域中的意义和挑战。
完成下面两步后,将自动完成登录并继续当前操作。