mock responses for streaming

2025-04-26 19:24:27 +00:00 · 2023-09-11 16:30:29 -07:00 · 2023-09-11 16:30:29 -07:00 · f944eaee4b
commit f944eaee4b
parent 3c1901216d
5 changed files with 41 additions and 3 deletions
--- a/litellm/pycache/main.cpython-311.pyc
+++ b/litellm/pycache/main.cpython-311.pyc
--- a/litellm/pycache/utils.cpython-311.pyc
+++ b/litellm/pycache/utils.cpython-311.pyc
--- a/litellm/main.py
+++ b/litellm/main.py
@ -954,6 +954,30 @@ def batch_completion(
    return results


+def mock_completion(model: str, messages: List, stream: bool = False, mock_response: str = "This is a mock request"):
+    try:
+        model_response = ModelResponse()
+        if stream: # return a generator object, iterate through the text in chunks of 3 char / chunk
+            for i in range(0, len(mock_response), 3):
+                completion_obj = {"role": "assistant", "content": mock_response[i: i+3]}
+                yield {
+                "choices": 
+                    [
+                        {
+                            "delta": completion_obj,
+                            "finish_reason": None
+                        },
+                    ]
+                }
+        else:
+            ## RESPONSE OBJECT
+            completion_response = "This is a mock request"
+            model_response["choices"][0]["message"]["content"] = completion_response
+            model_response["created"] = time.time()
+            model_response["model"] = "MockResponse"
+            return model_response
+    except:
+        raise Exception("Mock completion response failed")
 ### EMBEDDING ENDPOINTS ####################
@client
@timeout(  # type: ignore
--- a/litellm/tests/test_mock_request.py
+++ b/litellm/tests/test_mock_request.py
@ -13,9 +13,23 @@ def test_mock_request():
    try:
        model = "gpt-3.5-turbo"
        messages = [{"role": "user", "content": "Hey, I'm a mock request"}]
-        response = litellm.completion(model=model, messages=messages, mock_request=True)
+        response = litellm.mock_completion(model=model, messages=messages)
        print(response)
    except:
        traceback.print_exc()

-test_mock_request()
+def test_streaming_mock_request():
+    try: 
+        model = "gpt-3.5-turbo"
+        messages = [{"role": "user", "content": "Hey, I'm a mock request"}]
+        response = litellm.mock_completion(model=model, messages=messages, stream=True)
+        complete_response = "" 
+        for chunk in response: 
+            print(f"chunk: {chunk}")
+            complete_response += chunk["choices"][0]["delta"]["content"]
+        if complete_response == "": 
+            raise Exception("Empty response received")
+    except:
+        traceback.print_exc()
+
+test_streaming_mock_request()
--- a/pyproject.toml
+++ b/pyproject.toml
@ -1,6 +1,6 @@
 [tool.poetry]
 name = "litellm"
-version = "0.1.597"
+version = "0.1.598"
 description = "Library to easily interface with LLM API providers"
 authors = ["BerriAI"]
 license = "MIT License"