节点
LLMOS 节点可以是虚拟机或物理机,具体取决于您的集群。集群中的第一个节点默认被指定为 cluster-init 节点。其他节点可以配置为 server 节点或 worker 节点。
管理节点承载系统组件,例如 API 服务器、控制器管理器和 etcd,以及用户工作负载。相比之下,工作节点主要用于运行用户工作负载,同时处理基本的系统服务,如一些 DaemonSet 服务和隧道代理。
您可以通过 LLMOS 管理 > 节点 页面查看和管理集群中的节点。
故障容忍
信息
LLMOS 集群使用 etcd 作为数据库,这意味着在一个有 3 个管理节点的集群中,系统可以容忍最多 1 个节点故障。
建议在集群中有一个奇数数量的管理节点,因为奇数规模的集群提供与偶数规模集群相同的故障容忍能力,但节点数量更少。下表说明了这一点:
管理节点 | 多数 | 故障容忍能力 |
---|---|---|
1 | 1 | 0 |
2 | 2 | 0 |
3 | 2 | 1 |
添加节点
LLMOS 允许您向集群中添加服务器或工作节点。您可以参考安装配置以获取详细选项。
要从仪表板向集群中添加节点,请执行以下步骤:
- 转到 LLMOS 管理 > 节点 页面。
- 点击 导入 按钮以注册节点到集群。
- 选择节点角色(Server 或 Worker 节点)。
- (可选):您可以通过 显示高级 选项指定高级选项,例如节点名称、IP 地址、标签和污点。
- 检查生成的命令,并在您想要注册的每个现有 Linux 机器上运行它。
- (可选):要监控安装日志,请在节点上运行
journalctl -u llmos -f
。 - 等待节点准备就绪,节点应在节点页面上显示并标记为 Active。
删除节点
要从集群中删除节点:
- 转到 LLMOS 管理 > 节点 页面。
- 选择要删除的节点,然后点击 删除。
- 在确认对话框中输入节点名称以确认删除。
- 节点将从集群中移除。
- 为了防止节点重新加入集群,您需要重新安装操作系统或使用 卸载脚本 完全移除节点。