Merge pull request #3682 from BerriAI/litellm_token_counter_endpoint

[Feat] `token_counter` endpoint
2025-04-25 10:44:24 +00:00 · 2024-05-16 13:39:23 -07:00 · 2024-05-16 13:39:23 -07:00 · 0a816b2c45
commit 0a816b2c45
parent c397114591 4a5e6aa43c
4 changed files with 214 additions and 2 deletions
--- a/litellm/utils.py
+++ b/litellm/utils.py
@ -3880,7 +3880,12 @@ def _select_tokenizer(model: str):
        return {"type": "huggingface_tokenizer", "tokenizer": tokenizer}
    # default - tiktoken
    else:
-        return {"type": "openai_tokenizer", "tokenizer": encoding}
+        tokenizer = None
+        try:
+            tokenizer = Tokenizer.from_pretrained(model)
+            return {"type": "huggingface_tokenizer", "tokenizer": tokenizer}
+        except:
+            return {"type": "openai_tokenizer", "tokenizer": encoding}


 def encode(model="", text="", custom_tokenizer: Optional[dict] = None):
@ -4117,6 +4122,7 @@ def token_counter(
    text: Optional[Union[str, List[str]]] = None,
    messages: Optional[List] = None,
    count_response_tokens: Optional[bool] = False,
+    return_tokenizer_used: Optional[bool] = False,
 ):
    """
    Count the number of tokens in a given text using a specified model.
@ -4209,7 +4215,10 @@ def token_counter(
                )
    else:
        num_tokens = len(encoding.encode(text, disallowed_special=()))  # type: ignore
-
+    _tokenizer_type = tokenizer_json["type"]
+    if return_tokenizer_used:
+        # used by litellm proxy server ->  POST /utils/token_counter
+        return num_tokens, _tokenizer_type
    return num_tokens