DeepSeek 3FS 运维指南

💡 原文中文,约20700字,阅读约需50分钟。
📝

内容提要

本文记录了DeepSeek 3FS的运维操作,包括基本概念、链和目标定义、参数设置、集群初始化、节点重建和扩容等,强调操作谨慎性和命令幂等性,提供详细命令示例和注意事项,以确保数据一致性和系统稳定性。

🎯

关键要点

  • DeepSeek 3FS 的运维操作包括基本概念、链和目标定义、参数设置等。
  • Chain 是由多个 Target 组成,每个 Target 是一个存储副本,不能在同一节点上。
  • Target 有三种角色:HEAD、MIDDLE 和 TAIL,分别代表最新、最旧和同步状态的数据。
  • ChainTable 记录可用的 Chain ID,未加入 ChainTable 的 Chain 不能存储数据。
  • 参数约束包括链的数量、磁盘数量和副本数的关系。
  • 启动 Storage 节点时要谨慎,避免数据紊乱,最好让 3FS 重建数据。
  • 操作要慢,等待状态同步完成,命令是幂等的,可以重复执行。
  • 条带化参数在初始化集群时设置,宽度过大会增加管理复杂度。
  • 重置和初始化集群需要清空元数据,重启 Storage 节点并清理存储目录。
  • 创建 Target 和用户需要提交配置,上传 chainTable 和生成的链。
  • 重建存储节点时需删除旧数据,重启节点并创建新的 Target。
  • 替换存储节点时需删除旧节点的 Target,创建新节点并重新分配 Target。
  • 扩容存储节点需规划 Target 数量,确保总数为存储数量的整数倍。
  • 下线存储节点需迁移 Target,确保同一 Chain 的 Target 不在同一节点。
  • 添加 Chain 能增加 Target 数量,需保证一致性并上传 Chain。
  • LASTSRV 状态的 Target 需分配 OFFLINE 状态的 Target,轮转 Chain 上的 Target。
  • 重建 Target 适用于状态异常的情况,需删除并重新创建 Target。
➡️

继续阅读