Remove request arg from chat completion response processing (#240)

Signed-off-by: Yuan Tang <terrytangyuan@gmail.com>
2025-12-08 19:10:56 +00:00 · 2024-10-15 16:03:17 -04:00 · 2024-10-15 16:03:17 -04:00 · 80ada04f76
commit 80ada04f76
parent 209cd3d35e
7 changed files with 14 additions and 18 deletions
--- a/llama_stack/providers/adapters/inference/ollama/ollama.py
+++ b/llama_stack/providers/adapters/inference/ollama/ollama.py
@ -143,7 +143,7 @@ class OllamaInferenceAdapter(Inference, ModelsProtocolPrivate):
        response = OpenAICompatCompletionResponse(
            choices=[choice],
        )
-        return process_chat_completion_response(request, response, self.formatter)
+        return process_chat_completion_response(response, self.formatter)

    async def _stream_chat_completion(
        self, request: ChatCompletionRequest
@ -163,7 +163,7 @@ class OllamaInferenceAdapter(Inference, ModelsProtocolPrivate):

        stream = _generate_and_convert_to_openai_compat()
        async for chunk in process_chat_completion_stream_response(
-            request, stream, self.formatter
+            stream, self.formatter
        ):
            yield chunk