LiteLLM Minor Fixes and Improvements (09/07/2024) (#5580)

* fix(litellm_logging.py): set completion_start_time_float to end_time_float if none Fixes https://github.com/BerriAI/litellm/issues/5500 * feat(_init_.py): add new 'openai_text_completion_compatible_providers' list Fixes https://github.com/BerriAI/litellm/issues/5558 Handles correctly routing fireworks ai calls when done via text completions * fix: fix linting errors * fix: fix linting errors * fix(openai.py): fix exception raised * fix(openai.py): fix error handling * fix(_redis.py): allow all supported arguments for redis cluster (#5554) * Revert "fix(_redis.py): allow all supported arguments for redis cluster (#5554)" (#5583) This reverts commit f2191ef4cb. * fix(router.py): return model alias w/ underlying deployment on router.get_model_list() Fixes https://github.com/BerriAI/litellm/issues/5524#issuecomment-2336410666 * test: handle flaky tests --------- Co-authored-by: Jonas Dittrich <58814480+Kakadus@users.noreply.github.com>
2025-04-26 11:14:04 +00:00 · 2024-09-09 18:54:17 -07:00 · 2024-09-09 18:54:17 -07:00 · 4ac66bd843
commit 4ac66bd843
parent c86b333054
14 changed files with 101 additions and 34 deletions
--- a/litellm/llms/azure_text.py
+++ b/litellm/llms/azure_text.py
@ -162,11 +162,10 @@ class AzureTextCompletion(BaseLLM):
        client=None,
    ):
        super().completion()
-        exception_mapping_worked = False
        try:
            if model is None or messages is None:
                raise AzureOpenAIError(
-                    status_code=422, message=f"Missing model or messages"
+                    status_code=422, message="Missing model or messages"
                )

            max_retries = optional_params.pop("max_retries", 2)
@ -293,7 +292,10 @@ class AzureTextCompletion(BaseLLM):
                            "api-version", api_version
                        )

-                response = azure_client.completions.create(**data, timeout=timeout)  # type: ignore
+                raw_response = azure_client.completions.with_raw_response.create(
+                    **data, timeout=timeout
+                )
+                response = raw_response.parse()
                stringified_response = response.model_dump()
                ## LOGGING
                logging_obj.post_call(
@ -380,13 +382,15 @@ class AzureTextCompletion(BaseLLM):
                    "complete_input_dict": data,
                },
            )
-            response = await azure_client.completions.create(**data, timeout=timeout)
+            raw_response = await azure_client.completions.with_raw_response.create(
+                **data, timeout=timeout
+            )
+            response = raw_response.parse()
            return openai_text_completion_config.convert_to_chat_model_response_object(
                response_object=response.model_dump(),
                model_response_object=model_response,
            )
        except AzureOpenAIError as e:
-            exception_mapping_worked = True
            raise e
        except Exception as e:
            status_code = getattr(e, "status_code", 500)