Test fixes in openai_compat

2025-12-18 03:09:49 +00:00 · 2025-09-17 16:50:46 -07:00 · 2025-09-17 16:50:46 -07:00 · d60514b57b
commit d60514b57b
parent e56a3f266c
7 changed files with 221 additions and 7 deletions
--- a/llama_stack/providers/remote/inference/fireworks/fireworks.py
+++ b/llama_stack/providers/remote/inference/fireworks/fireworks.py
@ -130,7 +130,7 @@ class FireworksInferenceAdapter(OpenAIMixin, ModelRegistryHelper, Inference, Nee
    async def _stream_completion(self, request: CompletionRequest) -> AsyncGenerator:
        params = await self._get_params(request)

-        stream = self.client.completions.create(**params)
+        stream = await self.client.completions.create(**params)
        async for chunk in process_completion_stream_response(stream):
            yield chunk

@ -208,9 +208,9 @@ class FireworksInferenceAdapter(OpenAIMixin, ModelRegistryHelper, Inference, Nee
        params = await self._get_params(request)

        if "messages" in params:
-            stream = self.client.chat.completions.create(**params)
+            stream = await self.client.chat.completions.create(**params)
        else:
-            stream = self.client.completions.create(**params)
+            stream = await self.client.completions.create(**params)
        async for chunk in process_chat_completion_stream_response(stream, request):
            yield chunk