小红花·文摘 - 小红花技术领袖俱乐部

Gemini 确诊重度焦虑：为了让 AI 像人，我们把它逼疯了

Gemini 确诊重度焦虑：为了让 AI 像人，我们把它逼疯了

爱范儿 ·

本研究提出了一种新的心理评估工具——核心情感清单（CSI），旨在提高大型语言模型（LLMs）心理特征评估的可靠性和有效性。CSI能够评估模型的情感倾向，并在乐观、悲观和中立三个维度上提供洞察。实验结果显示，CSI在捕捉情感模式和预测LLM行为方面表现优异，相关性超过0.85。

Leveraging Implicit Sentiments: Enhancing the Reliability and Validity of Psychological Trait Evaluation in Large Language Models

BriefGPT - AI 论文速递 ·

本研究提出了一种新颖的知识编辑方法PALETTE，旨在克服大型语言模型（LLMs）在人格控制方面的局限性。该方法通过心理评估启发的查询调整，系统性地调节模型回应，实现可控的人格特征调整，实验结果显示其在稳定性和均衡性方面显著提升。

Personality Editing for Language Models through Relevant Knowledge Editing

BriefGPT - AI 论文速递 ·

本研究提出了一种利用大语言模型（LLM）量化情绪状态的新框架。通过分析参与者的开放式回答与标准问卷，发现LLM能有效反映抑郁情绪的多样性，并与问卷结果显著相关。这一方法提高了心理状态评估的可靠性，具有广泛应用潜力。

Objective Quantification of Mood States Using Large Language Models

BriefGPT - AI 论文速递 ·

大型语言模型（LLMs）在心理学研究中展现出潜力，能够生成有意义的文本并模拟人类认知。研究提出了心理学大型语言模型（PsycoLLM），通过高质量数据集训练，显示出在心理评估中的优势。尽管LLMs对心理健康问题有帮助，但也面临技术和伦理挑战，需负责任地使用。

论人工智能心灵的多学科理论框架

BriefGPT - AI 论文速递 ·

本研究基于智能体心理学提出了一个综合框架，评估多智能体系统的安全性。实验揭示了集体危险行为、智能体的自我反思倾向和心理评估与危险行为的相关性。该研究为多智能体系统安全研究提供了见解。

PsySafe：多智能体系统安全的心理攻守与评估的综合框架

BriefGPT - AI 论文速递 ·