add NVIDIA NIM inference adapter

2025-10-18 07:18:53 +00:00 · 2024-10-22 14:31:11 -04:00 · 2024-10-22 14:31:11 -04:00 · 2dd8c4bcb6
commit 2dd8c4bcb6
parent ac93dd89cf
12 changed files with 1115 additions and 0 deletions
--- a/llama_stack/providers/registry/inference.py
+++ b/llama_stack/providers/registry/inference.py
@ -140,6 +140,15 @@ def available_providers() -> List[ProviderSpec]:
                config_class="llama_stack.providers.adapters.inference.databricks.DatabricksImplConfig",
            ),
        ),
+        remote_provider_spec(
+            api=Api.inference,
+            adapter=AdapterSpec(
+                adapter_type="nvidia",
+                pip_packages=[],  # TODO(mf): need to specify httpx if it's already a llama-stack dep?
+                module="llama_stack.providers.adapters.inference.nvidia",
+                config_class="llama_stack.providers.adapters.inference.nvidia.NVIDIAConfig",
+            ),
+        ),
        InlineProviderSpec(
            api=Api.inference,
            provider_type="vllm",