[Perf Proxy] parallel request limiter - use one cache update call (#5932)

* fix parallel request limiter - use one cache update call * ci/cd run again * run ci/cd again * use docker username password * fix config.yml * fix config * fix config * fix config.yml * ci/cd run again * use correct typing for batch set cache * fix async_set_cache_pipeline * fix only check user id tpm / rpm limits when limits set * fix test_openai_azure_embedding_with_oidc_and_cf
2025-04-25 18:54:30 +00:00 · 2024-09-27 10:26:15 -07:00 · 2024-09-27 10:26:15 -07:00 · f4613a100d
commit f4613a100d
parent 71f68ac185
7 changed files with 56 additions and 36 deletions
--- a/litellm/caching.py
+++ b/litellm/caching.py
@ -123,7 +123,7 @@ class InMemoryCache(BaseCache):
    async def async_set_cache(self, key, value, **kwargs):
        self.set_cache(key=key, value=value, **kwargs)

-    async def async_set_cache_pipeline(self, cache_list, ttl=None):
+    async def async_set_cache_pipeline(self, cache_list, ttl=None, **kwargs):
        for cache_key, cache_value in cache_list:
            if ttl is not None:
                self.set_cache(key=cache_key, value=cache_value, ttl=ttl)
@ -2038,7 +2038,7 @@ class DualCache(BaseCache):

            if self.redis_cache is not None and local_only == False:
                await self.redis_cache.async_set_cache_pipeline(
-                    cache_list=cache_list, ttl=kwargs.get("ttl", None), **kwargs
+                    cache_list=cache_list, ttl=kwargs.pop("ttl", None), **kwargs
                )
        except Exception as e:
            verbose_logger.exception(