[Feat] Add max_completion_tokens param (#5691)

* add max_completion_tokens * add max_completion_tokens * add max_completion_tokens support for OpenAI models * add max_completion_tokens param * add max_completion_tokens for bedrock converse models * add test for converse maxTokens * fix openai o1 param mapping test * move test optional params * add max_completion_tokens for anthropic api * fix conftest * add max_completion tokens for vertex ai partner models * add max_completion_tokens for fireworks ai * add max_completion_tokens for hf rest api * add test for param mapping * add param mapping for vertex, gemini + testing * predibase is the most unstable and unusable llm api in prod, can't handle our ci/cd * add max_completion_tokens to openai supported params * fix fireworks ai param mapping
2025-04-27 03:34:10 +00:00 · 2024-09-14 14:57:01 -07:00 · 2024-09-14 14:57:01 -07:00 · 85acdb9193
commit 85acdb9193
parent 415a3ede9e
31 changed files with 591 additions and 35 deletions
--- a/litellm/llms/nvidia_nim.py
+++ b/litellm/llms/nvidia_nim.py
@ -78,6 +78,7 @@ class NvidiaNimConfig:
                "temperature",
                "top_p",
                "max_tokens",
+                "max_completion_tokens",
            ]
        elif model == "nvidia/nemotron-4-340b-reward":
            return [
@ -92,6 +93,7 @@ class NvidiaNimConfig:
                "frequency_penalty",
                "presence_penalty",
                "max_tokens",
+                "max_completion_tokens",
                "stop",
            ]
        else:
@ -124,6 +126,7 @@ class NvidiaNimConfig:
                "frequency_penalty",
                "presence_penalty",
                "max_tokens",
+                "max_completion_tokens",
                "stop",
                "seed",
            ]
@ -133,6 +136,8 @@ class NvidiaNimConfig:
    ) -> dict:
        supported_openai_params = self.get_supported_openai_params(model=model)
        for param, value in non_default_params.items():
-            if param in supported_openai_params:
+            if param == "max_completion_tokens":
+                optional_params["max_tokens"] = value
+            elif param in supported_openai_params:
                optional_params[param] = value
        return optional_params