fix(main.py): fix retries being multiplied when using openai sdk (#7221)

* fix(main.py): fix retries being multiplied when using openai sdk Closes https://github.com/BerriAI/litellm/pull/7130 * docs(prompt_management.md): add langfuse prompt management doc * feat(team_endpoints.py): allow teams to add their own models Enables teams to call their own finetuned models via the proxy * test: add better enforcement check testing for `/model/new` now that teams can add their own models * docs(team_model_add.md): tutorial for allowing teams to add their own models * test: fix test
2025-04-25 10:44:24 +00:00 · 2024-12-14 11:56:55 -08:00 · 2024-12-14 11:56:55 -08:00 · ec36353b41
commit ec36353b41
parent 8060c5c698
16 changed files with 2439 additions and 1540 deletions
--- a/litellm/main.py
+++ b/litellm/main.py
@ -2969,6 +2969,9 @@ def completion_with_retries(*args, **kwargs):
        )

    num_retries = kwargs.pop("num_retries", 3)
+    # reset retries in .completion()
+    kwargs["max_retries"] = 0
+    kwargs["num_retries"] = 0
    retry_strategy: Literal["exponential_backoff_retry", "constant_retry"] = kwargs.pop(
        "retry_strategy", "constant_retry"
    )  # type: ignore
@ -2999,6 +3002,8 @@ async def acompletion_with_retries(*args, **kwargs):
        )

    num_retries = kwargs.pop("num_retries", 3)
+    kwargs["max_retries"] = 0
+    kwargs["num_retries"] = 0
    retry_strategy = kwargs.pop("retry_strategy", "constant_retry")
    original_function = kwargs.pop("original_function", completion)
    if retry_strategy == "exponential_backoff_retry":