本研究针对行为疗法笔记质量标准不足的问题,设计了一套评价标准,涵盖完整性、简洁性和忠实度等维度。研究发现,基于标准的手动评估比传统方法更可靠,而大型语言模型在评估方面接近人类,但在忠实度上存在困难。治疗师偏好LLM生成的笔记。
完成下面两步后,将自动完成登录并继续当前操作。