小红花·文摘

美团技术团队 ·

本研究解决了现有指令跟随基准在多轮交互中缺乏自我纠正能力的问题。通过模拟真实的人机互动，Meeseeks 引入了迭代反馈过程，使模型能够根据特定要求的失败进行自我纠正，从而更好地反映现实用户的使用模式。研究发现，Meeseeks 提供了对 LLM 实际应用中指令跟随能力的深刻见解。

BriefGPT - AI 论文速递 ·