小红花·文摘 - 小红花技术领袖俱乐部

Salesforce AI 推出 CRMArena-Pro：首个面向 LLM 代理的多轮企业级基准测试

Salesforce AI 推出 CRMArena-Pro：首个面向 LLM 代理的多轮企业级基准测试

实时互动网 ·

本研究提出CRMArena基准，用于评估AI代理在客户关系管理系统中的表现。实验结果显示，现有高级语言模型代理在九个客户服务任务中的成功率不足40%，强调了提升代理功能的必要性。

CRMArena：理解大型语言模型代理在真实环境中执行专业客户关系管理任务的能力

BriefGPT - AI 论文速递 ·