fix(main.py): fix streaming completion token counting error

2025-04-27 11:43:54 +00:00 · 2024-01-10 23:44:35 +05:30 · 2024-01-10 23:44:35 +05:30 · e71154f286
commit e71154f286
parent 3ed296e2dd
2 changed files with 16 additions and 48 deletions
--- a/litellm/main.py
+++ b/litellm/main.py
@ -3357,7 +3357,7 @@ def stream_chunk_builder(chunks: list, messages: Optional[list] = None):
        response["usage"]["prompt_tokens"] = 0
    response["usage"]["completion_tokens"] = token_counter(
        model=model,
-        text=combined_content,
+        text=completion_output,
        count_response_tokens=True,  # count_response_tokens is a Flag to tell token counter this is a response, No need to add extra tokens we do for input messages
    )
    response["usage"]["total_tokens"] = (