move build.yaml to templates, symlink in distributions

2025-12-16 21:49:27 +00:00 · 2024-10-25 11:54:09 -07:00 · 2024-10-25 11:54:09 -07:00 · 56f9b7d5d6
commit 56f9b7d5d6
parent 81ed0327f3
23 changed files with 136 additions and 142 deletions
--- a/llama_stack/templates/meta-reference-quantized-gpu/build.yaml
+++ b/llama_stack/templates/meta-reference-quantized-gpu/build.yaml
@ -0,0 +1,14 @@
+name: meta-reference-quantized-gpu
+distribution_spec:
+  docker_image: pytorch/pytorch:2.5.0-cuda12.4-cudnn9-runtime
+  description: Use code from `llama_stack` itself to serve all llama stack APIs
+  providers:
+    inference: meta-reference-quantized
+    memory:
+    - meta-reference
+    - remote::chromadb
+    - remote::pgvector
+    safety: meta-reference
+    agents: meta-reference
+    telemetry: meta-reference
+image_type: docker