refactor(test_router_caching.py): move tpm/rpm routing tests to separate file

2024-01-02 11:10:11 +05:30 · 2024-01-02 11:10:11 +05:30 · dff4c172d0
commit dff4c172d0
parent 18ef244230
3 changed files with 18 additions and 45 deletions
--- a/litellm/router.py
+++ b/litellm/router.py
@ -1564,6 +1564,23 @@ class Router:
            ):
                model["litellm_params"]["tpm"] = model.get("tpm")

+            #### VALIDATE MODEL ########
+            # check if model provider in supported providers
+            (
+                model,
+                custom_llm_provider,
+                dynamic_api_key,
+                api_base,
+            ) = litellm.get_llm_provider(
+                model=model["litellm_params"]["model"],
+                custom_llm_provider=model["litellm_params"].get(
+                    "custom_llm_provider", None
+                ),
+            )
+
+            if custom_llm_provider not in litellm.provider_list:
+                raise Exception(f"Unsupported provider - {custom_llm_provider}")
+
            self.set_client(model=model)

        self.print_verbose(f"\nInitialized Model List {self.model_list}")
--- a/litellm/router_strategy/lowest_tpm_rpm.py
+++ b/litellm/router_strategy/lowest_tpm_rpm.py
@ -182,7 +182,7 @@ class LowestTPMLoggingHandler(CustomLogger):
                break
            elif (
                item_tpm + input_tokens > _deployment_tpm
-                or rpm_dict[item] + 1 >= _deployment_rpm
+                or rpm_dict[item] + 1 > _deployment_rpm
            ):  # if user passed in tpm / rpm in the model_list
                continue
            elif item_tpm < lowest_tpm:
--- a/litellm/tests/test_router_caching.py
+++ b/litellm/tests/test_router_caching.py
@ -209,47 +209,3 @@ async def test_acompletion_caching_on_router_caching_groups():
    except Exception as e:
        traceback.print_exc()
        pytest.fail(f"Error occurred: {e}")
-
-
-def test_usage_based_routing_completion():
-    litellm.set_verbose = True
-    model_list = [
-        {
-            "model_name": "gpt-3.5-turbo",
-            "litellm_params": {
-                "model": "gpt-3.5-turbo-0301",
-                "api_key": os.getenv("OPENAI_API_KEY"),
-                "custom_llm_provider": "Custom-LLM",
-            },
-            "tpm": 10000,
-            "rpm": 5,
-        },
-        {
-            "model_name": "gpt-3.5-turbo",
-            "litellm_params": {
-                "model": "gpt-3.5-turbo-0301",
-                "api_key": os.getenv("OPENAI_API_KEY"),
-            },
-            "tpm": 10000,
-            "rpm": 5,
-        },
-    ]
-    router = Router(
-        model_list=model_list, routing_strategy="usage-based-routing", set_verbose=False
-    )
-    max_requests = 5
-    while max_requests > 0:
-        try:
-            router.completion(
-                model="gpt-3.5-turbo",
-                messages=[{"content": "write a one sentence poem.", "role": "user"}],
-            )
-        except ValueError as e:
-            traceback.print_exc()
-            pytest.fail(f"Error occurred: {e}")
-        finally:
-            max_requests -= 1
-    router.reset()
-
-
-test_usage_based_routing_completion()