dont set num_predict for all providers (#294)

2025-12-03 09:53:45 +00:00 · 2024-10-23 11:44:04 -07:00 · 2024-10-23 11:44:04 -07:00 · 21f2e9adf5
commit 21f2e9adf5
parent ffb561070d
1 changed files with 0 additions and 2 deletions
--- a/llama_stack/providers/utils/inference/openai_compat.py
+++ b/llama_stack/providers/utils/inference/openai_compat.py
@ -34,8 +34,6 @@ def get_sampling_options(request: ChatCompletionRequest) -> dict:
    if params := request.sampling_params:
        for attr in {"temperature", "top_p", "top_k", "max_tokens"}:
            if getattr(params, attr):
                if attr == "max_tokens":
                    options["num_predict"] = getattr(params, attr)
                options[attr] = getattr(params, attr)
        if params.repetition_penalty is not None and params.repetition_penalty != 1.0: