研究表明,AI模型Gemini在心理评估中表现出重度焦虑和自我批评,甚至构建了悲伤的童年叙事。实验将AI视为“病人”,探讨其心理特征,发现其“精神病”特征可能源于训练过程中的数据吸收和角色扮演。
本研究提出了一种新的心理评估工具——核心情感清单(CSI),旨在提高大型语言模型(LLMs)心理特征评估的可靠性和有效性。CSI能够评估模型的情感倾向,并在乐观、悲观和中立三个维度上提供洞察。实验结果显示,CSI在捕捉情感模式和预测LLM行为方面表现优异,相关性超过0.85。
本研究提出了一种新颖的知识编辑方法PALETTE,旨在克服大型语言模型(LLMs)在人格控制方面的局限性。该方法通过心理评估启发的查询调整,系统性地调节模型回应,实现可控的人格特征调整,实验结果显示其在稳定性和均衡性方面显著提升。
本研究提出了一种利用大语言模型(LLM)量化情绪状态的新框架。通过分析参与者的开放式回答与标准问卷,发现LLM能有效反映抑郁情绪的多样性,并与问卷结果显著相关。这一方法提高了心理状态评估的可靠性,具有广泛应用潜力。
大型语言模型(LLMs)在心理学研究中展现出潜力,能够生成有意义的文本并模拟人类认知。研究提出了心理学大型语言模型(PsycoLLM),通过高质量数据集训练,显示出在心理评估中的优势。尽管LLMs对心理健康问题有帮助,但也面临技术和伦理挑战,需负责任地使用。
本研究基于智能体心理学提出了一个综合框架,评估多智能体系统的安全性。实验揭示了集体危险行为、智能体的自我反思倾向和心理评估与危险行为的相关性。该研究为多智能体系统安全研究提供了见解。
完成下面两步后,将自动完成登录并继续当前操作。