add NIM k8s solution

2025-10-23 08:33:09 +00:00 · 2025-07-29 09:01:21 -07:00 · 2025-07-29 09:01:21 -07:00 · 8c0f328cbc
commit 8c0f328cbc
parent 95d25ddfe2
4 changed files with 133 additions and 128 deletions
--- a/docs/source/distributions/k8s/stack-k8s.yaml.template
+++ b/docs/source/distributions/k8s/stack-k8s.yaml.template
@ -45,6 +45,8 @@ spec:
          value: http://vllm-server.default.svc.cluster.local:8000/v1
        - name: VLLM_MAX_TOKENS
          value: "3072"
+        - name: NVIDIA_BASE_URL
+          value: http://llama-nano-nim.default.svc.cluster.local:8000/v1
        - name: VLLM_SAFETY_URL
          value: http://vllm-server-safety.default.svc.cluster.local:8001/v1
        - name: POSTGRES_HOST