fix(routing.py): update token usage on streaming

2025-04-24 18:24:20 +00:00 · 2023-11-20 14:19:14 -08:00 · 2023-11-20 14:19:14 -08:00 · 1976d0f7d6
commit 1976d0f7d6
parent 0422bba38d
4 changed files with 14 additions and 167 deletions
--- a/litellm/router.py
+++ b/litellm/router.py
@ -331,8 +331,13 @@ class Router:
        custom_llm_provider = kwargs.get("litellm_params", {}).get('custom_llm_provider', None)  # i.e. azure
        if custom_llm_provider:
            model_name = f"{custom_llm_provider}/{model_name}"
-        total_tokens = completion_response['usage']['total_tokens']
-        self._set_deployment_usage(model_name, total_tokens)
+        if kwargs["stream"] is True: 
+            if kwargs.get("complete_streaming_response"):
+                total_tokens = kwargs.get("complete_streaming_response")['usage']['total_tokens']
+                self._set_deployment_usage(model_name, total_tokens)
+        else: 
+            total_tokens = completion_response['usage']['total_tokens']
+            self._set_deployment_usage(model_name, total_tokens)

    def get_usage_based_available_deployment(self,
                               model: str,