配置需求

无论您是在虚拟机还是物理服务器上设置 LLMOS，每个运行 LLMOS 的节点都需要满足以下最低要求。这些要求涵盖 LLMOS 及其组件，但不包括您运行的工作负载所需的资源。

先决条件

如果节点包含 NVIDIA GPU，请首先安装 NVIDIA 驱动程序。
- 确保 CUDA 驱动程序 Driver 版本为 575 版本或更高。
两个节点不应具有相同的主机名。
节点上不得运行任何现有的 Kubernetes 集群。

备注

要检查 NVIDIA 驱动程序是否正确安装，请运行以下命令：

nvidia-smi

输出应类似于以下内容：

+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 575.64.03              Driver Version: 575.64.03      CUDA Version: 12.9     |
|-----------------------------------------+------------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
|                                         |                        |               MIG M. |
|=========================================+========================+======================|
|   0  NVIDIA GeForce RTX 4090        Off |   00000000:01:00.0 Off |                  Off |
|  0%   48C    P8             14W /  450W |   16801MiB /  24564MiB |      0%      Default |
|                                         |                        |                  N/A |
+-----------------------------------------+------------------------+----------------------+
                                                                                         
+-----------------------------------------------------------------------------------------+
| Processes:                                                                              |
|  GPU   GI   CI              PID   Type   Process name                        GPU Memory |
|        ID   ID                                                               Usage      |
|=========================================================================================|
|    0   N/A  N/A          746020      C   /usr/bin/python3                       8434MiB |
|    0   N/A  N/A          819263      C   /usr/bin/python3                       8352MiB |
+-----------------------------------------------------------------------------------------+

支持的架构

LLMOS 支持以下系统架构：

x86_64
arm64/aarch64

支持的操作系统

虽然 LLMOS 预计可以在大多数现代 Linux 发行版上运行，但团队已正式测试并验证以下版本：

信息

建议关闭 firewalld。如果您保持启用状态，可能需要打开额外的端口。有关更多信息，请检查节点的入站规则部分。

发行版	版本
Ubuntu	20.04 LTS 或更新
RHEL	8.5 或更新
SLES/OpenSUSE	15.3 (Leap) 或更新
Rocky Linux	8.5 或更新
Debian	11.0 或更新
Fedora	37 或更新

硬件要求

硬件需求将根据您的部署规模而有所不同。以下是最低建议：

规格	最低要求	推荐规格
CPU	8 核	16 核
内存	16 GB	32 GB
系统磁盘空间	100 GB	200 GB
磁盘性能	对于系统磁盘 (推荐SSD/NVMe)，要求 5000+ 随机 IOPS	与最低要求相同

磁盘类型

为了获得更好的性能，请使用 SSD/NVMe 作为 LLMOS 集群的存储介质。如果您使用的是云服务提供商，请选择合适的磁盘大小，并选用最大 IOPS 的磁盘类型。

网络

LLMOS 节点需要访问所有节点的 6443 和 8443 端口。

LLMOS 使用反向隧道，这意味着节点与服务器建立出站连接，所有节点间的流量通过该隧道运行。

如果需要使用 metrics 服务，请确保所有节点可以在 10250 端口上互相通信。

节点的入站规则

协议	端口	源	目的地	描述
TCP	2379-2380	Server	Server	需要用于具有嵌入式 etcd 的 HA 设置
TCP	6443	Worker	Server	Kubernetes API 服务
TCP	8443	所有节点	所有节点	LLMOS 仪表板和 API 服务
UDP	8472	所有节点	所有节点	用于系统 VXLAN 网络
TCP	10250	所有节点	所有节点	metrics 服务
TCP	5001, 6443	所有节点	所有节点	嵌入式分布式注册表 (Spegel)
TCP	30000-32767	所有节点	所有节点	NodePort 端口范围

通常，允许所有出站流量。根据您的操作系统，您可能需要调整防火墙设置。

先决条件​

支持的架构​

支持的操作系统​

硬件要求​

磁盘类型​

网络​

节点的入站规则​