enable streaming support, use openai-python instead of httpx

2025-12-17 07:32:36 +00:00 · 2024-11-04 10:22:29 -05:00 · 2024-11-04 10:22:29 -05:00 · dbe665ed19
commit dbe665ed19
parent 2dd8c4bcb6
7 changed files with 1037 additions and 341 deletions
--- a/llama_stack/providers/registry/inference.py
+++ b/llama_stack/providers/registry/inference.py
@ -144,7 +144,9 @@ def available_providers() -> List[ProviderSpec]:
            api=Api.inference,
            adapter=AdapterSpec(
                adapter_type="nvidia",
-                pip_packages=[],  # TODO(mf): need to specify httpx if it's already a llama-stack dep?
+                pip_packages=[
+                    "openai",
+                ],
                module="llama_stack.providers.adapters.inference.nvidia",
                config_class="llama_stack.providers.adapters.inference.nvidia.NVIDIAConfig",
            ),