小红花·文摘

本研究针对行为疗法笔记质量标准不足的问题，设计了一套评价标准，涵盖完整性、简洁性和忠实度等维度。研究发现，基于标准的手动评估比传统方法更可靠，而大型语言模型在评估方面接近人类，但在忠实度上存在困难。治疗师偏好LLM生成的笔记。