Add vLLM inference provider for OpenAI compatible vLLM server (#178)

This PR adds vLLM inference provider for OpenAI compatible vLLM server.
2024-10-20 21:43:25 -04:00 · 2024-10-20 21:43:25 -04:00 · a27a2cd2af
commit a27a2cd2af
parent 59c43736e8
6 changed files with 209 additions and 1 deletions
--- a/llama_stack/distribution/templates/build_configs/local-vllm-build.yaml
+++ b/llama_stack/distribution/templates/build_configs/local-vllm-build.yaml
@ -7,4 +7,4 @@ distribution_spec:
    safety: meta-reference
    agents: meta-reference
    telemetry: meta-reference
-image_type: conda
+image_type: conda
--- a/llama_stack/distribution/templates/remote-vllm-build.yaml
+++ b/llama_stack/distribution/templates/remote-vllm-build.yaml
@ -0,0 +1,10 @@
+name: remote-vllm
+distribution_spec:
+  description: Use remote vLLM for running LLM inference
+  providers:
+    inference: remote::vllm
+    memory: meta-reference
+    safety: meta-reference
+    agents: meta-reference
+    telemetry: meta-reference
+image_type: docker