fix(main.py): support custom pricing for embedding calls

2025-04-28 04:04:31 +00:00 · 2024-01-22 12:10:53 -08:00 · 2024-01-22 12:10:53 -08:00 · 85b9ad7def
commit 85b9ad7def
parent 17e65996de
2 changed files with 34 additions and 1 deletions
--- a/litellm/utils.py
+++ b/litellm/utils.py
@ -2371,7 +2371,9 @@ def client(original_function):
                result._hidden_params["model_id"] = kwargs.get("model_info", {}).get(
                    "id", None
                )
-            if isinstance(result, ModelResponse):
+            if isinstance(result, ModelResponse) or isinstance(
+                result, EmbeddingResponse
+            ):
                result._response_ms = (
                    end_time - start_time
                ).total_seconds() * 1000  # return response latency in ms like openai