CBT基准:评估大型语言模型在认知行为治疗中的辅助作用
原文中文,约300字,阅读约需1分钟。发表于: 。本研究针对目前心理健康支持中患者需求与可用资源之间的显著差距,提出了CBT-BENCH基准,用于系统评估大型语言模型(LLMs)在认知行为治疗(CBT)中的辅助潜力。研究发现,虽然LLMs在基本知识回忆方面表现良好,但在需要深入分析患者认知结构及生成有效反应的复杂真实情境中,它们的表现不足,突显了未来研究的方向。
研究比较了基于LLMs和非基于LLMs生成的回应对主观评价的影响。结果显示,使用GPT-4时,情绪变化、共情和对话质量显著改善,显示其在心理咨询中有较高能力。但与情景对话相比,使用人类心理咨询数据集训练的模型并未表现更好。研究还指出,LLMs在心理健康服务中的应用可能引发伦理问题。