系统组件
系统组件帮助管理 LLMOS 集群所需的额外组件。默认情况下,LLMOS 配备了一组开箱即用的系统附加组件。这些系统附加组件包括:
- LLMOS GPU Stack: GPU 管理工具集,将虚拟 GPU (vGPU) 和多加速器支持引入到 LLMOS 平台,查看更多详情。
- LLMOS 监控: 使用 Prometheus Operator 提供 LLMOS 集群的监控和警报功能,查看更多详情。
- LLMOS Redis: 提供一个 LLMOS 管理的 Redis 服务,用于系统服务和聊天存储。
- Rook Ceph Operator: 使用 Rook Ceph Operator 为集群添加高可用、可冗余的分布式存储系统。
- KubeRay Operator: 通过 KubeRay Operator 促进机器学习集群和其他机器学习资源在 LLMOS 集群中的管理。
- 系统更新控制器: 通过可定制的升级计划,使用 System Upgrade Controller 管理 LLMOS 节点的升级。
备注
系统附加组件对 LLMOS 的正常运行至关重要,用户在默认情况下无需修改。然而,您可以根据需要安装超出默认集的其他附加组件。
创建一个自定义组件
自定义组件使用 Helm 进行安装和管理。您可以从外部源(例如 Artifact Hub)添加其他附加组件。
- 转到 系统组件 页面并点击 创建。
- 选择所需的 命名空间 并输入附加组件的名称。
- 提供 Chart Repository URL(例如
https://grafana.github.io/helm-charts
)、Chart 名称 和 版本。 - (可选) 如果您计划稍后启用附加组件,将 启用 设置为
false
。 - (可选) 通过添加
Values
内容来自定义附加组件,以覆盖默认设置(如有必要)。 - 单击 创建 开始安装过程。
- 附加组件将在后台安装。您可以在 系统组件 页面上监控其状态。
- 一旦附加组件成功安装,状态将显示为
已就绪
。
- 一旦附加组件成功安装,状态将显示为