refactor: cleanup duplicates

2024-01-10 21:42:20 +05:30 · 2024-01-10 21:42:20 +05:30 · 9a829ff956
commit 9a829ff956
parent 31917176ff
1 changed files with 2 additions and 39 deletions
--- a/litellm/tests/test_lowest_latency_routing.py
+++ b/litellm/tests/test_lowest_latency_routing.py
@ -54,8 +54,10 @@ def test_latency_updated():
        == test_cache.get_cache(key=latency_key)[deployment_id]["latency"][0]
    )

+
 # test_tpm_rpm_updated()

+
 def test_latency_updated_custom_ttl():
    """
    Invalidate the cached request.
@ -95,45 +97,6 @@ def test_latency_updated_custom_ttl():
    assert test_cache.get_cache(key=latency_key) is None


-def test_latency_updated_custom_ttl():
-    """
-    Invalidate the cached request.
-
-    Test that the cache is empty
-    """
-    test_cache = DualCache()
-    model_list = []
-    cache_time = 3
-    lowest_latency_logger = LowestLatencyLoggingHandler(
-        router_cache=test_cache, model_list=model_list, routing_args={"ttl": cache_time}
-    )
-    model_group = "gpt-3.5-turbo"
-    deployment_id = "1234"
-    kwargs = {
-        "litellm_params": {
-            "metadata": {
-                "model_group": "gpt-3.5-turbo",
-                "deployment": "azure/chatgpt-v-2",
-            },
-            "model_info": {"id": deployment_id},
-        }
-    }
-    start_time = time.time()
-    response_obj = {"usage": {"total_tokens": 50}}
-    time.sleep(5)
-    end_time = time.time()
-    lowest_latency_logger.log_success_event(
-        response_obj=response_obj,
-        kwargs=kwargs,
-        start_time=start_time,
-        end_time=end_time,
-    )
-    latency_key = f"{model_group}_map"
-    assert isinstance(test_cache.get_cache(key=latency_key), dict)
-    time.sleep(cache_time)
-    assert test_cache.get_cache(key=latency_key) is None
-
-
 def test_get_available_deployments():
    test_cache = DualCache()
    model_list = [