fix(parallel_request_limiter.py): fix user+team tpm/rpm limit check

Closes https://github.com/BerriAI/litellm/issues/3788
2025-04-26 03:04:13 +00:00 · 2024-05-27 08:48:23 -07:00 · 2024-05-27 08:48:23 -07:00 · 4408b717f0
commit 4408b717f0
parent fa064c91fb
7 changed files with 157 additions and 532 deletions
--- a/litellm/tests/test_parallel_request_limiter.py
+++ b/litellm/tests/test_parallel_request_limiter.py
@ -229,17 +229,21 @@ async def test_pre_call_hook_user_tpm_limits():
    """
    Test if error raised on hitting tpm limits
    """
+    local_cache = DualCache()
    # create user with tpm/rpm limits
+    user_id = "test-user"
+    user_obj = {"tpm_limit": 9, "rpm_limit": 10}
+
+    local_cache.set_cache(key=user_id, value=user_obj)

    _api_key = "sk-12345"
    user_api_key_dict = UserAPIKeyAuth(
        api_key=_api_key,
-        user_id="ishaan",
-        user_id_rate_limits={"tpm_limit": 9, "rpm_limit": 10},
+        user_id=user_id,
    )
    res = dict(user_api_key_dict)
    print("dict user", res)
-    local_cache = DualCache()
+
    parallel_request_handler = MaxParallelRequestsHandler()

    await parallel_request_handler.async_pre_call_hook(
@ -248,7 +252,7 @@ async def test_pre_call_hook_user_tpm_limits():

    kwargs = {
        "litellm_params": {
-            "metadata": {"user_api_key_user_id": "ishaan", "user_api_key": "gm"}
+            "metadata": {"user_api_key_user_id": user_id, "user_api_key": "gm"}
        }
    }

@ -734,7 +738,7 @@ async def test_bad_router_call():
    request_count_api_key = f"{_api_key}::{precise_minute}::request_count"

    assert (
-        parallel_request_handler.user_api_key_cache.get_cache(
+        parallel_request_handler.user_api_key_cache.get_cache(  # type: ignore
            key=request_count_api_key
        )["current_requests"]
        == 1
@ -751,7 +755,7 @@ async def test_bad_router_call():
    except:
        pass
    assert (
-        parallel_request_handler.user_api_key_cache.get_cache(
+        parallel_request_handler.user_api_key_cache.get_cache(  # type: ignore
            key=request_count_api_key
        )["current_requests"]
        == 0