💡 原文英文,约1100词,阅读约需4分钟。
📝

内容提要

LangSmith推出新功能,通过引入“线程”概念和新增“洞察代理”、“多轮评估”工具,自动分类代理使用模式并评分完整对话,提升用户交互可见性,助力改进代理性能。

🎯

关键要点

  • LangSmith推出新功能,提升用户交互可见性,改进代理性能。
  • 引入“线程”概念,代表多轮代理交互。
  • 新增“洞察代理”工具,自动分类代理使用模式。
  • 新增“多轮评估”工具,评分完整对话。
  • 传统的可观察性和测试无法判断代理是否达成用户目标。
  • 洞察代理分析生产轨迹,发现常见使用模式和失败模式。
  • 用户可以根据使用模式和负面交互对数据进行分类。
  • 洞察代理高度可配置,支持自定义分类和过滤。
  • 多轮评估帮助评估整个交互是否达成用户目标。
  • 多轮评估包括语义意图、语义结果和代理轨迹的测量。
  • 洞察代理和多轮评估是LangSmith未来线程级功能的基础。
➡️

继续阅读