From 4265f9b2efec474e66446080977d2fe0c201be28 Mon Sep 17 00:00:00 2001
From: ishaan-jaff <ishaanjaffer0324@gmail.com>
Date: Mon, 27 Nov 2023 16:26:09 -0800
Subject: [PATCH] (fix) router: allow same model/name

---
 litellm/router.py | 12 ++++++++----
 1 file changed, 8 insertions(+), 4 deletions(-)

diff --git a/litellm/router.py b/litellm/router.py
index 471c4f857e..3d43197cb6 100644
--- a/litellm/router.py
+++ b/litellm/router.py
@@ -166,11 +166,11 @@ class Router:
             # pick the one that is available (lowest TPM/RPM)
             deployment = self.get_available_deployment(model=model, messages=messages)
             kwargs.setdefault("metadata", {}).update({"deployment": deployment["litellm_params"]["model"]})
-            data = deployment["litellm_params"]
+            data = deployment["litellm_params"].copy()
             for k, v in self.default_litellm_params.items(): 
                 if k not in data: # prioritize model-specific params > default router params 
                     data[k] = v
-            
+            data["model"] = data["model"][:-14]
             self.print_verbose(f"completion model: {data['model']}")
             return litellm.completion(**{**data, "messages": messages, "caching": self.cache_responses, **kwargs})
         except Exception as e: 
@@ -202,10 +202,11 @@ class Router:
             self.print_verbose(f"Inside _acompletion()- model: {model}; kwargs: {kwargs}")
             deployment = self.get_available_deployment(model=model, messages=messages)
             kwargs.setdefault("metadata", {}).update({"deployment": deployment["litellm_params"]["model"]})
-            data = deployment["litellm_params"]
+            data = deployment["litellm_params"].copy()
             for k, v in self.default_litellm_params.items(): 
                 if k not in data: # prioritize model-specific params > default router params 
                     data[k] = v
+            data["model"] = data["model"][:-14]
             self.print_verbose(f"acompletion model: {data['model']}")
             
             response = await litellm.acompletion(**{**data, "messages": messages, "caching": self.cache_responses, **kwargs})
@@ -722,6 +723,9 @@ class Router:
 
     def set_model_list(self, model_list: list):
         self.model_list = model_list
+        # we add a 5 digit uuid to each model so load balancing between azure/gpt on api_base1 and api_base2 works 
+        for model in self.model_list:
+            model["litellm_params"]["model"] += "-ModelID-" + str(random.randint(10000, 99999))[:5]
         self.model_names = [m["model_name"] for m in model_list]
 
     def get_model_names(self):
@@ -757,7 +761,7 @@ class Router:
         ### FILTER OUT UNHEALTHY DEPLOYMENTS
         for deployment in deployments_to_remove:
             healthy_deployments.remove(deployment)
-        self.print_verbose(f"healthy deployments: {healthy_deployments}")
+        self.print_verbose(f"healthy deployments: length {len(healthy_deployments)} {healthy_deployments}")
         if len(healthy_deployments) == 0: 
             raise ValueError("No models available")
         if litellm.model_alias_map and model in litellm.model_alias_map: