Blog on LlamaIndex ·

使用DeepEval和LlamaIndex评估RAG

💡 原文英文，约1100词，阅读约需4分钟。

📝

内容提要

DeepEval是一个开源Python库，用于评估各种LLM应用，提供50多种度量标准。结合LlamaIndex框架，用户可以构建复杂的RAG管道，通过定义答案相关性、忠实度和上下文精度等度量标准，优化模型性能并进行有效评估。

🎯

🏷️

电子商务搜索稀疏嵌入的微调 | 第三部分：评估与困难负样本
这是关于电子商务搜索稀疏嵌入微调系列文章的第三部分。在第二部分中，我们训练了SPLADE模型，现在将对该模型进行评估并进行困难负样本挖掘。
富士胶片“光影漫游·沉浸式影像光影秀”全国巡展首站于杭州启幕
（全球TMT2026年3月10日讯）2026年3月7日至4月9日，富士胶片“光影漫游·沉浸式影像光影秀”全国巡 […]
2026全球电信品牌价值50强榜单
（全球TMT2026年3月10日讯）英国品牌评估机构“品牌金融”(Brand Finance)发布2026“全 […]
20250310
作者经历了一次长时间的睡眠，梦见了许多不可能的人和故事。因工作过度感到虚弱，意识到需要休息，决定减少工作时间，以保持创造力和好奇心。
AI 不只是聊天：小龙虾背后的范式变化
最近一段时间，有不少朋友来问我一个问题：
AI客服越智能越坑人？坑了商家、坑客户，咋办？
你是否也在烦恼AI客服只会兜圈子、不给退款、死活不转人工？这期内容拆解AI客服常见套路，教你识别“只会聊天不办事”的系统，并学会更高效地和AI客服沟通。 ...