评估(evals)对可靠的LLM应用至关重要。新发布的openevals和agentevals提供了易用的评估框架和工具,帮助用户根据特定数据和指标评估LLM输出质量。用户可以通过定制评估器和数据集,支持多种应用场景的有效评估。
完成下面两步后,将自动完成登录并继续当前操作。