From 94d35f1ec559e5109fded84b9c6c40b019ff410a Mon Sep 17 00:00:00 2001
From: ishaan-jaff <ishaanjaffer0324@gmail.com>
Date: Tue, 28 Nov 2023 15:42:57 -0800
Subject: [PATCH] (feat) router: re-use the same client for high trafic

---
 litellm/router.py | 9 ++++++++-
 1 file changed, 8 insertions(+), 1 deletion(-)

diff --git a/litellm/router.py b/litellm/router.py
index 88f12fc56e..d996c02c5a 100644
--- a/litellm/router.py
+++ b/litellm/router.py
@@ -216,6 +216,7 @@ class Router:
             **kwargs):
         try: 
             self.print_verbose(f"Inside _acompletion()- model: {model}; kwargs: {kwargs}")
+            original_model_string = None # set a default for this variable
             deployment = self.get_available_deployment(model=model, messages=messages)
             kwargs.setdefault("metadata", {}).update({"deployment": deployment["litellm_params"]["model"]})
             data = deployment["litellm_params"].copy()
@@ -231,8 +232,9 @@ class Router:
                 data["model"] = original_model_string[:index_of_model_id]
             else:
                 data["model"] = original_model_string
+            model_client = deployment["client"]
             self.total_calls[original_model_string] +=1
-            response = await litellm.acompletion(**{**data, "messages": messages, "caching": self.cache_responses, **kwargs})
+            response = await litellm.acompletion(**{**data, "messages": messages, "caching": self.cache_responses, "azure_client": model_client, **kwargs})
             self.success_calls[original_model_string] +=1
             return response
         except Exception as e: 
@@ -803,6 +805,11 @@ class Router:
             for key in model["litellm_params"]:
                 model_id+= str(model["litellm_params"][key])
             model["litellm_params"]["model"] += "-ModelID-" + model_id
+
+            model["client"] = openai.AsyncAzureOpenAI(
+                api_key= model["litellm_params"]["api_key"],
+                azure_endpoint = model["litellm_params"]["api_base"]
+            )
         self.model_names = [m["model_name"] for m in model_list]
 
     def get_model_names(self):