fix(proxy_server.py): expose flag to disable retries when max parallel request limit is hit

2025-04-26 03:04:13 +00:00 · 2024-08-22 16:49:52 -07:00 · 2024-08-22 16:49:52 -07:00 · 735fc804ed
commit 735fc804ed
parent d7b525f391
2 changed files with 8 additions and 0 deletions
--- a/litellm/proxy/proxy_server.py
+++ b/litellm/proxy/proxy_server.py
@ -2672,6 +2672,13 @@ def giveup(e):
        and isinstance(e.message, str)
        and "Max parallel request limit reached" in e.message
    )
+
+    if (
+        general_settings.get("disable_retry_on_max_parallel_request_limit_error")
+        is True
+    ):
+        return True  # giveup if queuing max parallel request limits is disabled
+
    if result:
        verbose_proxy_logger.info(json.dumps({"event": "giveup", "exception": str(e)}))
    return result