Revert "fix(router.py): fix max retries on set_client"

This reverts commit 821844c1a3.
2024-04-24 23:19:14 -07:00 · 2024-04-24 23:19:14 -07:00 · 4e707af592
commit 4e707af592
parent 13e0ac64ef
2 changed files with 3 additions and 16 deletions
--- a/litellm/router.py
+++ b/litellm/router.py
@ -70,7 +70,7 @@ class Router:
        ] = None,  # if you want to cache across model groups
        client_ttl: int = 3600,  # ttl for cached clients - will re-initialize after this time in seconds
        ## RELIABILITY ##
-        num_retries: Optional[int] = None,
+        num_retries: int = 0,
        timeout: Optional[float] = None,
        default_litellm_params={},  # default params for Router.chat.completion.create
        default_max_parallel_requests: Optional[int] = None,
@ -229,10 +229,7 @@ class Router:
        self.failed_calls = (
            InMemoryCache()
        )  # cache to track failed call per deployment, if num failed calls within 1 minute > allowed fails, then add it to cooldown
-        self.num_retries = num_retries  # type: ignore
-        if self.num_retries is None:
-            if litellm.num_retries is not None:
-                self.num_retries = litellm.num_retries
+        self.num_retries = num_retries or litellm.num_retries or 0
        self.timeout = timeout or litellm.request_timeout

        self.retry_after = retry_after
@ -1989,7 +1986,7 @@ class Router:
                stream_timeout = litellm.get_secret(stream_timeout_env_name)
                litellm_params["stream_timeout"] = stream_timeout

-            max_retries = litellm_params.pop("max_retries", self.num_retries)
+            max_retries = litellm_params.pop("max_retries", 2)
            if isinstance(max_retries, str) and max_retries.startswith("os.environ/"):
                max_retries_env_name = max_retries.replace("os.environ/", "")
                max_retries = litellm.get_secret(max_retries_env_name)
@ -2886,10 +2883,6 @@ class Router:
                model=model, healthy_deployments=healthy_deployments, messages=messages
            )

-        if len(healthy_deployments) == 0:
-            raise ValueError(
-                f"No deployments available for selected model, passed model={model}"
-            )
        if (
            self.routing_strategy == "usage-based-routing-v2"
            and self.lowesttpm_logger_v2 is not None