From 93c9ea160d1926b49b067e487f511fbe172c95a4 Mon Sep 17 00:00:00 2001
From: Krrish Dholakia <krrishdholakia@gmail.com>
Date: Sat, 1 Jun 2024 16:45:34 -0700
Subject: [PATCH] fix(openai.py): fix client caching logic

---
 litellm/llms/openai.py | 4 +++-
 litellm/main.py        | 1 +
 2 files changed, 4 insertions(+), 1 deletion(-)

diff --git a/litellm/llms/openai.py b/litellm/llms/openai.py
index c72b404c3..f561fa3a9 100644
--- a/litellm/llms/openai.py
+++ b/litellm/llms/openai.py
@@ -515,6 +515,7 @@ class OpenAIChatCompletion(BaseLLM):
         organization: Optional[str] = None,
         client: Optional[Union[OpenAI, AsyncOpenAI]] = None,
     ):
+        args = locals()
         if client is None:
             if not isinstance(max_retries, int):
                 raise OpenAIError(
@@ -532,7 +533,7 @@ class OpenAIChatCompletion(BaseLLM):
                 # Hexadecimal representation of the hash
                 hashed_api_key = hash_object.hexdigest()
 
-            _cache_key = f"hashed_api_key={hashed_api_key},api_base={api_base},timeout={timeout},max_retries={max_retries},organization={organization}"
+            _cache_key = f"hashed_api_key={hashed_api_key},api_base={api_base},timeout={timeout},max_retries={max_retries},organization={organization},is_async={is_async}"
 
             if _cache_key in litellm.in_memory_llm_clients_cache:
                 return litellm.in_memory_llm_clients_cache[_cache_key]
@@ -555,6 +556,7 @@ class OpenAIChatCompletion(BaseLLM):
                     organization=organization,
                 )
 
+            ## SAVE CACHE KEY
             litellm.in_memory_llm_clients_cache[_cache_key] = _new_client
             return _new_client
 
diff --git a/litellm/main.py b/litellm/main.py
index 959a90c4b..7021137a8 100644
--- a/litellm/main.py
+++ b/litellm/main.py
@@ -14,6 +14,7 @@ from functools import partial
 import dotenv, traceback, random, asyncio, time, contextvars
 from copy import deepcopy
 import httpx
+
 import litellm
 from ._logging import verbose_logger
 from litellm import (  # type: ignore