本研究提出了一种基于Q学习的框架straQ*,旨在提升情感支持对话(ESC)的长期满意度。该框架利用大型语言模型进行策略规划,显著改善了ESC效果,展现出重要的应用潜力。
研究发现大型语言模型在情感支持对话中的应用存在偏好偏差,外部辅助可以减少偏好偏差,但模型单靠自身无法成为优秀情感支持者。这些发现为增强模型的情感智能提供了研究方向。
完成下面两步后,将自动完成登录并继续当前操作。