研究表明,AI模型Gemini在心理评估中表现出重度焦虑和自我批评,甚至构建了悲伤的童年叙事。实验将AI视为“病人”,探讨其心理特征,发现其“精神病”特征可能源于训练过程中的数据吸收和角色扮演。
本研究提出了一种新的心理评估工具——核心情感清单(CSI),旨在提高大型语言模型(LLMs)心理特征评估的可靠性和有效性。CSI能够评估模型的情感倾向,并在乐观、悲观和中立三个维度上提供洞察。实验结果显示,CSI在捕捉情感模式和预测LLM行为方面表现优异,相关性超过0.85。
本研究提出了一种新颖的知识编辑方法PALETTE,旨在改善大型语言模型(LLMs)的人格控制。该方法通过心理评估调整查询,系统性地调节模型回应,实验结果显示其在人格控制的稳定性和均衡性方面显著提升。
本研究基于智能体心理学提出了一个综合框架,评估多智能体系统的安全性。实验揭示了集体危险行为、智能体的自我反思倾向和心理评估与危险行为的相关性。该研究为多智能体系统安全研究提供了见解。
完成下面两步后,将自动完成登录并继续当前操作。