refactor get_max_tokens and build_options

2025-12-15 20:13:07 +00:00 · 2024-10-23 19:11:04 -07:00 · 2024-10-23 19:11:04 -07:00 · 4a073fcee5
commit 4a073fcee5
parent 5965ef3979
7 changed files with 33 additions and 38 deletions
--- a/llama_stack/providers/utils/inference/openai_compat.py
+++ b/llama_stack/providers/utils/inference/openai_compat.py
@ -29,9 +29,9 @@ class OpenAICompatCompletionResponse(BaseModel):
    choices: List[OpenAICompatCompletionChoice]


-def get_sampling_options(request: ChatCompletionRequest) -> dict:
+def get_sampling_options(params: SamplingParams) -> dict:
    options = {}
-    if params := request.sampling_params:
+    if params:
        for attr in {"temperature", "top_p", "top_k", "max_tokens"}:
            if getattr(params, attr):
                options[attr] = getattr(params, attr)