Test fixes

2025-07-29 07:14:20 +00:00 · 2024-10-08 16:57:52 -07:00 · 2024-10-08 16:57:52 -07:00 · f40cd62306
commit f40cd62306
parent 8eee5b9adc
3 changed files with 1 additions and 3 deletions
--- a/llama_stack/apis/inference/client.py
+++ b/llama_stack/apis/inference/client.py
@ -84,7 +84,7 @@ class InferenceClient(Inference):
            response.raise_for_status()
            j = response.json()
-            yield ChatCompletionResponse(**j)
+            return ChatCompletionResponse(**j)
    async def _stream_chat_completion(
        self, request: ChatCompletionRequest
--- a/llama_stack/providers/tests/inference/test_inference.py
+++ b/llama_stack/providers/tests/inference/test_inference.py
@ -68,7 +68,6 @@ async def inference_settings(request):
            ModelDef(
                identifier=model,
                llama_model=model,
                provider_id="",
            )
        ],
    )
--- a/llama_stack/providers/tests/memory/test_memory.py
+++ b/llama_stack/providers/tests/memory/test_memory.py
@ -67,7 +67,6 @@ def sample_documents():
 async def register_memory_bank(memory_impl: Memory):
    bank = VectorMemoryBankDef(
        identifier="test_bank",
        provider_id="",
        embedding_model="all-MiniLM-L6-v2",
        chunk_size_in_tokens=512,
        overlap_size_in_tokens=64,