move build.yaml to templates, symlink in distributions

2025-07-29 15:23:51 +00:00 · 2024-10-25 11:54:09 -07:00 · 2024-10-25 11:54:09 -07:00 · 56f9b7d5d6
commit 56f9b7d5d6
parent 81ed0327f3
23 changed files with 136 additions and 142 deletions
--- a/distributions/bedrock/build.yaml
+++ b/distributions/bedrock/build.yaml
@ -1,10 +0,0 @@
 name: bedrock
 distribution_spec:
  description: Use Amazon Bedrock APIs.
  providers:
    inference: remote::bedrock
    memory: meta-reference
    safety: meta-reference
    agents: meta-reference
    telemetry: meta-reference
 image_type: conda
--- a/distributions/bedrock/build.yaml
+++ b/distributions/bedrock/build.yaml
@ -0,0 +1 @@
 ../../llama_stack/templates/bedrock/build.yaml
--- a/distributions/databricks/build.yaml
+++ b/distributions/databricks/build.yaml
@ -1,10 +0,0 @@
 name: databricks
 distribution_spec:
  description: Use Databricks for running LLM inference
  providers:
    inference: remote::databricks
    memory: meta-reference
    safety: meta-reference
    agents: meta-reference
    telemetry: meta-reference
 image_type: conda
--- a/distributions/databricks/build.yaml
+++ b/distributions/databricks/build.yaml
@ -0,0 +1 @@
 ../../llama_stack/templates/databricks/build.yaml
--- a/distributions/fireworks/build.yaml
+++ b/distributions/fireworks/build.yaml
@ -1,10 +0,0 @@
 name: fireworks
 distribution_spec:
  description: Use Fireworks.ai for running LLM inference
  providers:
    inference: remote::fireworks
    memory: meta-reference
    safety: meta-reference
    agents: meta-reference
    telemetry: meta-reference
 image_type: docker
--- a/distributions/fireworks/build.yaml
+++ b/distributions/fireworks/build.yaml
@ -0,0 +1 @@
 ../../llama_stack/templates/fireworks/build.yaml
--- a/distributions/hf-endpoint/build.yaml
+++ b/distributions/hf-endpoint/build.yaml
@ -1,10 +0,0 @@
 name: hf-endpoint
 distribution_spec:
  description: "Like local, but use Hugging Face Inference Endpoints for running LLM inference.\nSee https://hf.co/docs/api-endpoints."
  providers:
    inference: remote::hf::endpoint
    memory: meta-reference
    safety: meta-reference
    agents: meta-reference
    telemetry: meta-reference
 image_type: conda
--- a/distributions/hf-endpoint/build.yaml
+++ b/distributions/hf-endpoint/build.yaml
@ -0,0 +1 @@
 ../../llama_stack/templates/hf-endpoint/build.yaml
--- a/distributions/hf-serverless/build.yaml
+++ b/distributions/hf-serverless/build.yaml
@ -1,10 +0,0 @@
 name: hf-serverless
 distribution_spec:
  description: "Like local, but use Hugging Face Inference API (serverless) for running LLM inference.\nSee https://hf.co/docs/api-inference."
  providers:
    inference: remote::hf::serverless
    memory: meta-reference
    safety: meta-reference
    agents: meta-reference
    telemetry: meta-reference
 image_type: conda
--- a/distributions/hf-serverless/build.yaml
+++ b/distributions/hf-serverless/build.yaml
@ -0,0 +1 @@
 ../../llama_stack/templates/hf-serverless/build.yaml
--- a/distributions/meta-reference-gpu/build.yaml
+++ b/distributions/meta-reference-gpu/build.yaml
@ -1,14 +0,0 @@
 name: meta-reference-gpu
 distribution_spec:
  docker_image: pytorch/pytorch
  description: Use code from `llama_stack` itself to serve all llama stack APIs
  providers:
    inference: meta-reference
    memory:
    - meta-reference
    - remote::chromadb
    - remote::pgvector
    safety: meta-reference
    agents: meta-reference
    telemetry: meta-reference
 image_type: docker
--- a/distributions/meta-reference-gpu/build.yaml
+++ b/distributions/meta-reference-gpu/build.yaml
@ -0,0 +1 @@
 ../../llama_stack/templates/meta-reference-gpu/build.yaml
--- a/distributions/meta-reference-quantized-gpu/build.yaml
+++ b/distributions/meta-reference-quantized-gpu/build.yaml
@ -1,14 +0,0 @@
 name: meta-reference-quantized-gpu
 distribution_spec:
  docker_image: pytorch/pytorch:2.5.0-cuda12.4-cudnn9-runtime
  description: Use code from `llama_stack` itself to serve all llama stack APIs
  providers:
    inference: meta-reference-quantized
    memory:
    - meta-reference
    - remote::chromadb
    - remote::pgvector
    safety: meta-reference
    agents: meta-reference
    telemetry: meta-reference
 image_type: docker
--- a/distributions/meta-reference-quantized-gpu/build.yaml
+++ b/distributions/meta-reference-quantized-gpu/build.yaml
@ -0,0 +1 @@
 ../../llama_stack/templates/meta-reference-quantized-gpu/build.yaml
--- a/distributions/ollama/build.yaml
+++ b/distributions/ollama/build.yaml
@ -1,13 +0,0 @@
 name: ollama
 distribution_spec:
  description: Use ollama for running LLM inference
  providers:
    inference: remote::ollama
    memory:
    - meta-reference
    - remote::chromadb
    - remote::pgvector
    safety: meta-reference
    agents: meta-reference
    telemetry: meta-reference
 image_type: docker
--- a/distributions/ollama/build.yaml
+++ b/distributions/ollama/build.yaml
@ -0,0 +1 @@
 ../../llama_stack/templates/ollama/build.yaml
--- a/distributions/tgi/build.yaml
+++ b/distributions/tgi/build.yaml
@ -1,13 +0,0 @@
 name: tgi
 distribution_spec:
  description: Use TGI for running LLM inference
  providers:
    inference: remote::tgi
    memory:
    - meta-reference
    - remote::chromadb
    - remote::pgvector
    safety: meta-reference
    agents: meta-reference
    telemetry: meta-reference
 image_type: docker
--- a/distributions/tgi/build.yaml
+++ b/distributions/tgi/build.yaml
@ -0,0 +1 @@
 ../../llama_stack/templates/tgi/build.yaml
--- a/distributions/together/build.yaml
+++ b/distributions/together/build.yaml
@ -1,10 +0,0 @@
 name: together
 distribution_spec:
  description: Use Together.ai for running LLM inference
  providers:
    inference: remote::together
    memory: remote::weaviate
    safety: remote::together
    agents: meta-reference
    telemetry: meta-reference
 image_type: docker
--- a/distributions/together/build.yaml
+++ b/distributions/together/build.yaml
@ -0,0 +1 @@
 ../../llama_stack/templates/together/build.yaml
--- a/distributions/vllm/build.yaml
+++ b/distributions/vllm/build.yaml
@ -1,10 +0,0 @@
 name: vllm
 distribution_spec:
  description: Like local, but use vLLM for running LLM inference
  providers:
    inference: vllm
    memory: meta-reference
    safety: meta-reference
    agents: meta-reference
    telemetry: meta-reference
 image_type: conda
--- a/distributions/vllm/build.yaml
+++ b/distributions/vllm/build.yaml
@ -0,0 +1 @@
 ../../llama_stack/templates/vllm/build.yaml
--- a/llama_stack/cli/stack/build.py
+++ b/llama_stack/cli/stack/build.py
@ -12,15 +12,7 @@ import os
 from functools import lru_cache
 from pathlib import Path
-TEMPLATES_PATH = (
+TEMPLATES_PATH = Path(os.path.relpath(__file__)).parent.parent.parent / "templates"
    Path(os.path.relpath(__file__)).parent.parent.parent.parent / "distributions----"
 )
 # build.yaml templates exist in the llama-stack/distributions while wheel installs llama-stack/llama_stack
 # we copied the distributions folder to llama-stack/llama_stack/cli/distributions for wheel builds,
 # so we need to check both locations
 if not TEMPLATES_PATH.exists():
    TEMPLATES_PATH = Path(os.path.relpath(__file__)).parent.parent.parent / "templates"
@lru_cache()
--- a/llama_stack/templates/bedrock/build.yaml
+++ b/llama_stack/templates/bedrock/build.yaml
@ -1 +0,0 @@
 ../../distributions/bedrock/build.yaml
--- a/llama_stack/templates/bedrock/build.yaml
+++ b/llama_stack/templates/bedrock/build.yaml
@ -0,0 +1,10 @@
 name: bedrock
 distribution_spec:
  description: Use Amazon Bedrock APIs.
  providers:
    inference: remote::bedrock
    memory: meta-reference
    safety: meta-reference
    agents: meta-reference
    telemetry: meta-reference
 image_type: conda
--- a/llama_stack/templates/databricks/build.yaml
+++ b/llama_stack/templates/databricks/build.yaml
@ -0,0 +1,10 @@
 name: databricks
 distribution_spec:
  description: Use Databricks for running LLM inference
  providers:
    inference: remote::databricks
    memory: meta-reference
    safety: meta-reference
    agents: meta-reference
    telemetry: meta-reference
 image_type: conda
--- a/llama_stack/templates/fireworks/build.yaml
+++ b/llama_stack/templates/fireworks/build.yaml
@ -1 +0,0 @@
 ../../distributions/fireworks/build.yaml
--- a/llama_stack/templates/fireworks/build.yaml
+++ b/llama_stack/templates/fireworks/build.yaml
@ -0,0 +1,10 @@
 name: fireworks
 distribution_spec:
  description: Use Fireworks.ai for running LLM inference
  providers:
    inference: remote::fireworks
    memory: meta-reference
    safety: meta-reference
    agents: meta-reference
    telemetry: meta-reference
 image_type: docker
--- a/llama_stack/templates/hf-endpoint/build.yaml
+++ b/llama_stack/templates/hf-endpoint/build.yaml
@ -1 +0,0 @@
 ../../distributions/hf-endpoint/build.yaml
--- a/llama_stack/templates/hf-endpoint/build.yaml
+++ b/llama_stack/templates/hf-endpoint/build.yaml
@ -0,0 +1,10 @@
 name: hf-endpoint
 distribution_spec:
  description: "Like local, but use Hugging Face Inference Endpoints for running LLM inference.\nSee https://hf.co/docs/api-endpoints."
  providers:
    inference: remote::hf::endpoint
    memory: meta-reference
    safety: meta-reference
    agents: meta-reference
    telemetry: meta-reference
 image_type: conda
--- a/llama_stack/templates/hf-serverless/build.yaml
+++ b/llama_stack/templates/hf-serverless/build.yaml
@ -1 +0,0 @@
 ../../distributions/hf-serverless/build.yaml
--- a/llama_stack/templates/hf-serverless/build.yaml
+++ b/llama_stack/templates/hf-serverless/build.yaml
@ -0,0 +1,10 @@
 name: hf-serverless
 distribution_spec:
  description: "Like local, but use Hugging Face Inference API (serverless) for running LLM inference.\nSee https://hf.co/docs/api-inference."
  providers:
    inference: remote::hf::serverless
    memory: meta-reference
    safety: meta-reference
    agents: meta-reference
    telemetry: meta-reference
 image_type: conda
--- a/llama_stack/templates/meta-reference-gpu/build.yaml
+++ b/llama_stack/templates/meta-reference-gpu/build.yaml
@ -1 +0,0 @@
 ../../distributions/meta-reference-gpu/build.yaml
--- a/llama_stack/templates/meta-reference-gpu/build.yaml
+++ b/llama_stack/templates/meta-reference-gpu/build.yaml
@ -0,0 +1,14 @@
 name: meta-reference-gpu
 distribution_spec:
  docker_image: pytorch/pytorch
  description: Use code from `llama_stack` itself to serve all llama stack APIs
  providers:
    inference: meta-reference
    memory:
    - meta-reference
    - remote::chromadb
    - remote::pgvector
    safety: meta-reference
    agents: meta-reference
    telemetry: meta-reference
 image_type: docker
--- a/llama_stack/templates/meta-reference-quantized-gpu/build.yaml
+++ b/llama_stack/templates/meta-reference-quantized-gpu/build.yaml
@ -0,0 +1,14 @@
 name: meta-reference-quantized-gpu
 distribution_spec:
  docker_image: pytorch/pytorch:2.5.0-cuda12.4-cudnn9-runtime
  description: Use code from `llama_stack` itself to serve all llama stack APIs
  providers:
    inference: meta-reference-quantized
    memory:
    - meta-reference
    - remote::chromadb
    - remote::pgvector
    safety: meta-reference
    agents: meta-reference
    telemetry: meta-reference
 image_type: docker
--- a/llama_stack/templates/ollama/build.yaml
+++ b/llama_stack/templates/ollama/build.yaml
@ -1 +0,0 @@
 ../../distributions/ollama/build.yaml
--- a/llama_stack/templates/ollama/build.yaml
+++ b/llama_stack/templates/ollama/build.yaml
@ -0,0 +1,13 @@
 name: ollama
 distribution_spec:
  description: Use ollama for running LLM inference
  providers:
    inference: remote::ollama
    memory:
    - meta-reference
    - remote::chromadb
    - remote::pgvector
    safety: meta-reference
    agents: meta-reference
    telemetry: meta-reference
 image_type: docker
--- a/llama_stack/templates/tgi/build.yaml
+++ b/llama_stack/templates/tgi/build.yaml
@ -1 +0,0 @@
 ../../distributions/tgi/build.yaml
--- a/llama_stack/templates/tgi/build.yaml
+++ b/llama_stack/templates/tgi/build.yaml
@ -0,0 +1,13 @@
 name: tgi
 distribution_spec:
  description: Use TGI for running LLM inference
  providers:
    inference: remote::tgi
    memory:
    - meta-reference
    - remote::chromadb
    - remote::pgvector
    safety: meta-reference
    agents: meta-reference
    telemetry: meta-reference
 image_type: docker
--- a/llama_stack/templates/together/build.yaml
+++ b/llama_stack/templates/together/build.yaml
@ -1 +0,0 @@
 ../../distributions/together/build.yaml
--- a/llama_stack/templates/together/build.yaml
+++ b/llama_stack/templates/together/build.yaml
@ -0,0 +1,10 @@
 name: together
 distribution_spec:
  description: Use Together.ai for running LLM inference
  providers:
    inference: remote::together
    memory: remote::weaviate
    safety: remote::together
    agents: meta-reference
    telemetry: meta-reference
 image_type: docker
--- a/llama_stack/templates/vllm/build.yaml
+++ b/llama_stack/templates/vllm/build.yaml
@ -1 +0,0 @@
 ../../distributions/vllm/build.yaml
--- a/llama_stack/templates/vllm/build.yaml
+++ b/llama_stack/templates/vllm/build.yaml
@ -0,0 +1,10 @@
 name: vllm
 distribution_spec:
  description: Like local, but use vLLM for running LLM inference
  providers:
    inference: vllm
    memory: meta-reference
    safety: meta-reference
    agents: meta-reference
    telemetry: meta-reference
 image_type: conda
		`@ -0,0 +1 @@`
							`../../llama_stack/templates/bedrock/build.yaml`
		`@ -0,0 +1 @@`
							`../../llama_stack/templates/databricks/build.yaml`
		`@ -0,0 +1 @@`
							`../../llama_stack/templates/fireworks/build.yaml`
		`@ -0,0 +1 @@`
							`../../llama_stack/templates/hf-endpoint/build.yaml`
		`@ -0,0 +1 @@`
							`../../llama_stack/templates/hf-serverless/build.yaml`
		`@ -0,0 +1 @@`
							`../../llama_stack/templates/meta-reference-gpu/build.yaml`
		`@ -0,0 +1 @@`
							`../../llama_stack/templates/ollama/build.yaml`
		`@ -0,0 +1 @@`
							`../../llama_stack/templates/together/build.yaml`
		`@ -1 +0,0 @@`
			`../../distributions/hf-serverless/build.yaml`
		`@ -1 +0,0 @@`
			`../../distributions/meta-reference-gpu/build.yaml`