Add vLLM inference provider for OpenAI compatible vLLM server (#178)

This PR adds vLLM inference provider for OpenAI compatible vLLM server.
2025-12-04 18:13:44 +00:00 · 2024-10-20 21:43:25 -04:00 · 2024-10-20 21:43:25 -04:00 · a27a2cd2af
commit a27a2cd2af
parent 59c43736e8
6 changed files with 209 additions and 1 deletions
--- a/llama_stack/providers/registry/inference.py
+++ b/llama_stack/providers/registry/inference.py
@ -60,6 +60,15 @@ def available_providers() -> List[ProviderSpec]:
                module="llama_stack.providers.adapters.inference.ollama",
            ),
        ),
+#        remote_provider_spec(
+#            api=Api.inference,
+#            adapter=AdapterSpec(
+#                adapter_type="vllm",
+#                pip_packages=["openai"],
+#                module="llama_stack.providers.adapters.inference.vllm",
+#                config_class="llama_stack.providers.adapters.inference.vllm.VLLMImplConfig",
+#            ),
+#        ),
        remote_provider_spec(
            api=Api.inference,
            adapter=AdapterSpec(