dont set num_predict for all providers (#294)

2025-12-05 02:17:31 +00:00 · 2024-10-23 11:44:04 -07:00 · 2024-10-23 11:44:04 -07:00 · 21f2e9adf5
commit 21f2e9adf5
parent ffb561070d
1 changed files with 0 additions and 2 deletions
--- a/llama_stack/providers/utils/inference/openai_compat.py
+++ b/llama_stack/providers/utils/inference/openai_compat.py
@ -34,8 +34,6 @@ def get_sampling_options(request: ChatCompletionRequest) -> dict:
    if params := request.sampling_params:
        for attr in {"temperature", "top_p", "top_k", "max_tokens"}:
            if getattr(params, attr):
-                if attr == "max_tokens":
-                    options["num_predict"] = getattr(params, attr)
                options[attr] = getattr(params, attr)

        if params.repetition_penalty is not None and params.repetition_penalty != 1.0: