安志合的学习博客 ·

Docker部署bge-m3/bge-reranker模型

💡 原文中文，约6800字，阅读约需17分钟。

📝

内容提要

在安装NVIDIA Container Toolkit之前，需确保已安装NVIDIA GPU驱动和Docker。根据操作系统使用相应命令安装工具包并配置Docker运行时。验证GPU支持后，可部署BGE-M3和BGE-Reranker模型，并执行命令启动服务进行测试。

🎯

关键要点

确保已安装NVIDIA GPU驱动和Docker。
根据操作系统使用相应命令安装NVIDIA Container Toolkit。
配置Docker守护进程以使用NVIDIA Container Runtime。
验证Docker中GPU的支持，运行nvidia-smi命令。
下载BGE-M3和BGE-Reranker模型，推荐使用ModelScope。
部署BGE-M3嵌入模型和BGE-Reranker重排序模型的核心命令。
检查容器状态，确保服务正常运行。
发送测试请求以验证模型的功能。
处理CUDA计算能力兼容性错误，确保GPU与模型兼容。

❓

延伸问答

如何安装NVIDIA Container Toolkit？

根据操作系统使用相应命令安装NVIDIA Container Toolkit，Ubuntu使用apt命令，CentOS使用yum命令。

如何验证Docker中GPU的支持？

运行命令'docker run --rm --gpus all nvidia/cuda:12.0-base nvidia-smi'，如果能正常显示GPU信息，则配置成功。

BGE-M3和BGE-Reranker模型的核心功能是什么？

BGE-M3模型将文本转换为向量，BGE-Reranker模型对(query, document)对进行相关性打分。

如何部署BGE-M3嵌入模型？

使用'docker run'命令启动BGE-M3模型容器，指定模型路径和端口映射。

如何检查容器状态以确保服务正常运行？

使用'docker ps | grep -E "bge-m3|bge-reranker"'命令确认容器状态为Up。

遇到CUDA计算能力兼容性错误时该如何处理？

确认GPU型号和计算能力，替换适配的NVIDIA镜像以解决不匹配问题。

🏷️

继续阅读

使用Wayland在Docker容器中显示GUI
Wayland是Linux的现代显示服务器协议，旨在取代X11协议。从Ubuntu 26.04 LTS开始，Wayland成为默认协议。本文介绍如何在Ub...
如何将Go应用程序容器化 – 完整的逐步指南
本文介绍了如何使用Docker将Go应用程序容器化，以确保在不同环境中一致运行。Docker通过将代码及其依赖打包成镜像，解决了“在我机器上可以运行”的问...
生数科技认领神秘登顶模型：AI视频公司拿出工业级Demo，跨本体跑通复杂长程任务
生数科技推出的MotuBrain是一款具身智能机器人通用大脑，具备世界模型的预测和行动能力，展现出卓越的物理理解和行动能力。MotuBrain通过统一建模...
OpenClaw v2026.4.27：DeepInfra模型自动路由、文件附件升级、元宝QQBot接入
OpenClaw v2026.4.27版本引入DeepInfra，提升AI应用功能和用户体验。DeepInfra提供模型发现、媒体生成与编辑、语音转换等功...
解决“打地鼠困境”：一种更智能的去偏见AI视觉模型的方法
WRING是一种新型去偏见技术，通过调整模型中特定坐标的表示方式，减少目标概念的偏见，同时不增加其他领域的偏见。该方法高效且无需重新训练模型，适用于视觉语...
在PyCharm中使用词袋模型
本文介绍了词袋模型（BoW）在自然语言处理中的应用，强调其通过记录词汇出现频率将文本转换为数值向量的有效性。BoW适用于文本分类和情感分析等任务。文章还展...