(feat) add model_response.usage.completion_tokens for bedrock, palm, petals, sagemaker

2025-04-24 18:24:20 +00:00 · 2023-10-27 09:51:50 -07:00 · 2023-10-27 09:51:50 -07:00 · 194f85e92f
commit 194f85e92f
parent 97d237a896
4 changed files with 12 additions and 20 deletions
--- a/litellm/llms/bedrock.py
+++ b/litellm/llms/bedrock.py
@ -392,11 +392,9 @@ def completion(

    model_response["created"] = time.time()
    model_response["model"] = model
-    model_response["usage"] = {
-        "prompt_tokens": prompt_tokens,
-        "completion_tokens": completion_tokens,
-        "total_tokens": prompt_tokens + completion_tokens,
-    }
+    model_response.usage.completion_tokens = completion_tokens
+    model_response.usage.prompt_tokens = prompt_tokens
+    model_response.usage.total_tokens = prompt_tokens + completion_tokens
    return model_response


--- a/litellm/llms/palm.py
+++ b/litellm/llms/palm.py
@ -157,11 +157,9 @@ def completion(

    model_response["created"] = time.time()
    model_response["model"] = "palm/" + model
-    model_response["usage"] = {
-        "prompt_tokens": prompt_tokens,
-        "completion_tokens": completion_tokens,
-        "total_tokens": prompt_tokens + completion_tokens,
-    }
+    model_response.usage.completion_tokens = completion_tokens
+    model_response.usage.prompt_tokens = prompt_tokens
+    model_response.usage.total_tokens = prompt_tokens + completion_tokens
    return model_response

 def embedding():
--- a/litellm/llms/petals.py
+++ b/litellm/llms/petals.py
@ -176,11 +176,9 @@ def completion(

    model_response["created"] = time.time()
    model_response["model"] = model
-    model_response["usage"] = {
-        "prompt_tokens": prompt_tokens,
-        "completion_tokens": completion_tokens,
-        "total_tokens": prompt_tokens + completion_tokens,
-    }
+    model_response.usage.completion_tokens = completion_tokens
+    model_response.usage.prompt_tokens = prompt_tokens
+    model_response.usage.total_tokens = prompt_tokens + completion_tokens
    return model_response

 def embedding():
--- a/litellm/llms/sagemaker.py
+++ b/litellm/llms/sagemaker.py
@ -169,11 +169,9 @@ def completion(

    model_response["created"] = time.time()
    model_response["model"] = model
-    model_response["usage"] = {
-        "prompt_tokens": prompt_tokens,
-        "completion_tokens": completion_tokens,
-        "total_tokens": prompt_tokens + completion_tokens,
-    }
+    model_response.usage.completion_tokens = completion_tokens
+    model_response.usage.prompt_tokens = prompt_tokens
+    model_response.usage.total_tokens = prompt_tokens + completion_tokens
    return model_response

 def embedding():