Enable remote::vllm (#384)

* Enable remote::vllm * Kill the giant list of hard coded models
2025-12-03 18:00:36 +00:00 · 2024-11-06 14:42:44 -08:00 · 2024-11-06 14:42:44 -08:00 · b10e9f46bb
commit b10e9f46bb
parent 093c9f1987
5 changed files with 80 additions and 53 deletions
--- a/llama_stack/providers/registry/inference.py
+++ b/llama_stack/providers/registry/inference.py
@ -61,15 +61,15 @@ def available_providers() -> List[ProviderSpec]:
                module="llama_stack.providers.adapters.inference.ollama",
            ),
        ),
-        # remote_provider_spec(
-        #     api=Api.inference,
-        #     adapter=AdapterSpec(
-        #         adapter_type="vllm",
-        #         pip_packages=["openai"],
-        #         module="llama_stack.providers.adapters.inference.vllm",
-        #         config_class="llama_stack.providers.adapters.inference.vllm.VLLMImplConfig",
-        #     ),
-        # ),
+        remote_provider_spec(
+            api=Api.inference,
+            adapter=AdapterSpec(
+                adapter_type="vllm",
+                pip_packages=["openai"],
+                module="llama_stack.providers.adapters.inference.vllm",
+                config_class="llama_stack.providers.adapters.inference.vllm.VLLMInferenceAdapterConfig",
+            ),
+        ),
        remote_provider_spec(
            api=Api.inference,
            adapter=AdapterSpec(