update router client

2025-12-03 09:53:45 +00:00 · 2024-09-19 08:56:52 -07:00 · 2024-09-19 08:56:52 -07:00 · 47a51289ca
commit 47a51289ca
parent 46bf0192a1
2 changed files with 18 additions and 0 deletions
--- a/llama_stack/apis/inference/client.py
+++ b/llama_stack/apis/inference/client.py
@ -98,6 +98,17 @@ async def run_main(host: str, port: int, stream: bool):
    async for log in EventLogger().log(iterator):
        log.print()

+    print("Testing a different model provider")
+    iterator = client.chat_completion(
+        ChatCompletionRequest(
+            model="ollama-1",
+            messages=[message],
+            stream=stream,
+        )
+    )
+    async for log in EventLogger().log(iterator):
+        log.print()
+

 def main(host: str, port: int, stream: bool = True):
    asyncio.run(run_main(host, port, stream))
--- a/llama_stack/providers/adapters/inference/ollama/ollama.py
+++ b/llama_stack/providers/adapters/inference/ollama/ollama.py
@ -105,6 +105,13 @@ class OllamaInferenceAdapter(Inference):
                delta="",
            )
        )
+
+        yield ChatCompletionResponseStreamChunk(
+            event=ChatCompletionResponseEvent(
+                event_type=ChatCompletionResponseEventType.progress,
+                delta="model={}, url={}".format(model, self.url),
+            )
+        )
        # request = ChatCompletionRequest(
        #     model=model,
        #     messages=messages,