7B模型“情商”比肩GPT-4o,腾讯突破开放域RL难题,得分直翻5倍 解决AI“情商”3大困境 腾讯的7B模型通过RLVER框架解决了AI情商的三大困境,得分从13.3提升至79.2,表现与顶级模型相当。RLVER利用用户模拟器优化多轮对话,增强模型的情感理解和共情能力,避免了灾难性遗忘。 7B模型 RLVER gpt 多轮对话 开放域 情商 腾讯