diff --git a/tests/test_end_users.py b/tests/test_end_users.py
index 9f405ccc5..4ee894987 100644
--- a/tests/test_end_users.py
+++ b/tests/test_end_users.py
@@ -227,31 +227,23 @@ async def test_enduser_tpm_limits_non_master_key():
     # chat completion 1
     client = AsyncOpenAI(api_key=key, base_url="http://0.0.0.0:4000")
 
-    result = await client.chat.completions.create(
-        model="fake-openai-endpoint",
-        messages=[{"role": "user", "content": "Hey!"}],
-        user=end_user_id,
-    )
-
-    print("\nchat completion result 1=", result)
-
     # chat completion 2
-    try:
-        result = await client.chat.completions.create(
-            model="fake-openai-endpoint",
-            messages=[{"role": "user", "content": "Hey!"}],
-            user=end_user_id,
-        )
-        pytest.fail(
-            "User crossed their limit - this should have failed. instead got result = {}".format(
-                result
+    passed = 0
+    for _ in range(10):
+        try:
+            result = await client.chat.completions.create(
+                model="fake-openai-endpoint",
+                messages=[{"role": "user", "content": "Hey!"}],
+                user=end_user_id,
             )
-        )
-    except Exception as e:
-        print("got exception 2 =", e)
-        assert "Crossed TPM, RPM Limit" in str(
-            e
-        ), f"Expected 'Crossed TPM, RPM Limit' but got {str(e)}"
+            passed += 1
+        except:
+            pass
+    print("Passed requests=", passed)
+
+    assert (
+        passed < 5
+    ), f"Sent 10 requests and end-user has tpm_limit of 2. Number requests passed: {passed}. Expected less than 5 to pass"
 
 
 @pytest.mark.asyncio
@@ -277,30 +269,20 @@ async def test_enduser_tpm_limits_with_master_key():
     # chat completion 1
     client = AsyncOpenAI(api_key="sk-1234", base_url="http://0.0.0.0:4000")
 
-    result = await client.chat.completions.create(
-        model="fake-openai-endpoint",
-        messages=[{"role": "user", "content": "Hey!"}],
-        user=end_user_id,
-    )
-
-    print("\nchat completion result 1=", result)
-
-    await asyncio.sleep(1)
-
     # chat completion 2
-    try:
-        result = await client.chat.completions.create(
-            model="fake-openai-endpoint",
-            messages=[{"role": "user", "content": "Hey!"}],
-            user=end_user_id,
-        )
-        pytest.fail(
-            "User crossed their limit - this should have failed. instead got result = {}".format(
-                result
+    passed = 0
+    for _ in range(10):
+        try:
+            result = await client.chat.completions.create(
+                model="fake-openai-endpoint",
+                messages=[{"role": "user", "content": "Hey!"}],
+                user=end_user_id,
             )
-        )
-    except Exception as e:
-        print("got exception 2 =", e)
-        assert "Crossed TPM, RPM Limit" in str(
-            e
-        ), f"Expected 'Crossed TPM, RPM Limit' but got {str(e)}"
+            passed += 1
+        except:
+            pass
+    print("Passed requests=", passed)
+
+    assert (
+        passed < 5
+    ), f"Sent 10 requests and end-user has tpm_limit of 2. Number requests passed: {passed}. Expected less than 5 to pass"