Live Demo: Inbetriebnahme
Von der nackten Maschine zum KI-fähigen Kubernetes-Node
1
GPU-Node hinzufügen
RKE2 Agent auf dem neuen Server installieren und mit dem Cluster verbinden.
# RKE2 Agent installieren
curl -sfL https://get.rke2.io | ...
# Service starten & aktivieren
systemctl start rke2-agent.service
2
NVIDIA Operator installieren
Den Operator via Helm installieren, um Treiber & Runtimes im Cluster zu verwalten.
# Helm Repo hinzufügen & updaten
helm repo add nvidia ... && helm repo update
# Operator für RKE2 installieren
helm install gpu-operator ... --set ...
3
GPU-Zugriff validieren
Einen Test-Pod starten, der eine CUDA-Applikation ausführt und den GPU-Zugriff bestätigt.
# Test-Pod starten
kubectl apply -f cuda-vectoradd.yaml
# Logs prüfen
kubectl logs cuda-vectoradd