跳到主要内容

节点

LLMOS 节点可以是虚拟机或物理机,具体取决于您的集群。集群中的第一个节点默认被指定为 cluster-init 节点。其他节点可以配置为 server 节点或 worker 节点。

管理节点承载系统组件,例如 API 服务器、控制器管理器和 etcd,以及用户工作负载。相比之下,工作节点主要用于运行用户工作负载,同时处理基本的系统服务,如一些 DaemonSet 服务和隧道代理。

您可以通过 LLMOS 管理 > 节点 页面查看和管理集群中的节点。

nodes

故障容忍

信息

LLMOS 集群使用 etcd 作为数据库,这意味着在一个有 3 个管理节点的集群中,系统可以容忍最多 1 个节点故障。

建议在集群中有一个奇数数量的管理节点,因为奇数规模的集群提供与偶数规模集群相同的故障容忍能力,但节点数量更少。下表说明了这一点:

管理节点多数故障容忍能力
110
220
321

添加节点

LLMOS 允许您向集群中添加服务器或工作节点。您可以参考安装配置以获取详细选项。

要从仪表板向集群中添加节点,请执行以下步骤:

  1. 转到 LLMOS 管理 > 节点 页面。
  2. 点击 导入 按钮以注册节点到集群。
  3. 选择节点角色(Server 或 Worker 节点)。
  4. (可选):您可以通过 显示高级 选项指定高级选项,例如节点名称、IP 地址、标签和污点。
  5. 检查生成的命令,并在您想要注册的每个现有 Linux 机器上运行它。 node-import
  6. (可选):要监控安装日志,请在节点上运行 journalctl -u llmos -f
  7. 等待节点准备就绪,节点应在节点页面上显示并标记为 Active

删除节点

要从集群中删除节点:

  1. 转到 LLMOS 管理 > 节点 页面。
  2. 选择要删除的节点,然后点击 删除
  3. 在确认对话框中输入节点名称以确认删除。
  4. 节点将从集群中移除。
  5. 为了防止节点重新加入集群,您需要重新安装操作系统或使用 卸载脚本 完全移除节点。

delete