本篇介紹如何在安裝 NVIDIA GPU Operator 後啟用 console-plugin 於 OpenShift Console 顯示 GPU Utilization。
先決條件:
- Bastion 安裝 Helm
- 當前 OpenShift 版本為 4.10+
- Nvidia GPU Operator 已經完成安裝
啟用 NVIDIA GPU Operator Usage 資訊
- 添加 helm repo:
1
|
$ helm repo add rh-ecosystem-edge https://rh-ecosystem-edge.github.io/console-plugin-nvidia-gpu
|
- 更新 repo:
- 安裝
helm chart
於預設 NVIDIA GPU Operator namespace:
1
2
3
4
5
6
7
8
|
$ helm install -n nvidia-gpu-operator console-plugin-nvidia-gpu rh-ecosystem-edge/console-plugin-nvidia-gpu
$ kubectl -n nvidia-gpu-operator get all -l app.kubernetes.io/name=console-plugin-nvidia-gpu
# 啟用 plugin 執行以下 command:
$ kubectl patch consoles.operator.openshift.io cluster --patch '[{"op": "add", "path": "/spec/plugins/-", "value": "console-plugin-nvidia-gpu" }]' --type=json
|
- 查看部署的資源:
1
|
$ oc -n nvidia-gpu-operator get all -l app.kubernetes.io/name=console-plugin-nvidia-gpu
|
- 驗證 plugins 是否已指定
1
|
$ oc get consoles.operator.openshift.io cluster --output=jsonpath="{.spec.plugins}"
|
- 如果未指定,則運行以下 command 以啟用 plugin:
1
|
$ oc patch consoles.operator.openshift.io cluster --patch '{ "spec": { "plugins": ["console-plugin-nvidia-gpu"] } }' --type=merge
|
- 如果指定,則運行以下 command 以啟用 plugin:
1
|
$ oc patch consoles.operator.openshift.io cluster --patch '[{"op": "add", "path": "/spec/plugins/-", "value": "console-plugin-nvidia-gpu" }]' --type=json
|
在 OCP Web Console 頁面中(Home > Overview)就可以查閱 GPU utilization:
Reference