DEV Community ·

🚀 我是如何在LLM面试中取得成功的：构建一个基于RAG的聊天机器人

💡 原文英文，约1000词，阅读约需4分钟。

📝

内容提要

我设计了一个基于检索增强生成（RAG）的客户支持聊天机器人，使用开源模型，支持100+用户，响应时间低于2秒。系统架构包括前端、API网关、Kafka、后端服务和LLM服务，确保数据隐私和高效处理，同时通过优化和监控保持低成本，适应不断变化的需求。

🎯

❓

设计一个基于RAG的聊天机器人需要使用开源模型，确保数据隐私，支持100+用户，响应时间低于2秒，并且回答基于公司文档。

系统架构包括前端（React）、API网关（NGINX）、Kafka、后端服务（FastAPI）、LLM服务和数据存储（MinIO和MongoDB）。

选择了Llama-2（7B和13B）和BGE-M3模型，以确保多语言支持和文档检索的准确性。

通过RAG实现，确保回答基于公司文档，避免生成虚假信息，并使用反幻觉提示来限制回答范围。

部署在AWS上，使用Kubernetes进行自动扩展，确保系统可扩展性，并使用Docker进行容器化。

每月成本估算约为2069.80美元，包括LLM服务、后端服务和数据库等各项费用。

🏷️

Zed 1.0协议风波：你的代码被用来做训练数据
Zed 1.0协议引发了开发者对数据使用权和隐私的担忧。模糊的条款导致用户误解，认为自己的代码可能被滥用。AI补全功能需要访问用户代码，可能导致数据外流。...
小米最新人形机器人的手，会「出汗」了
小米最新发布的人形机器人CyberOne V2在投资者大会上亮相。该机器人高178cm，重52kg，具备22-27个自由度的灵巧手，能够进行精细操作，并配...
AI sandboxing is having its Kubernetes moment
Recently, Anthropic announced that its new model, Mythos, had autonomously fo...
微软的Xbox模式现已在所有Windows 11 PC上可用
Microsoft is now rolling out its Xbox mode to all Windows 11 PCs. The new Xbo...
Meta威胁称，如果被迫进行“技术上不可行”的更改，将撤回其在新墨西哥州的应用程序
Meta says it may be forced to pull Facebook, Instagram, and WhatsApp from New...
通过《Saros》，Housemarque主张以不同的方式开发次世代游戏
芬兰开发商Housemarque在新作《Saros》中探索了不同于传统AAA游戏的设计理念，强调游戏玩法而非视觉真实。玩家将扮演阿尔君，调查失踪的矿工，体...