fix: use model-id

Signed-off-by: Jeff MAURY <jmaury@redhat.com>
2025-12-30 19:13:52 +00:00 · 2025-04-03 19:06:17 +02:00 · 2025-04-03 19:06:17 +02:00 · cfc68012f7
commit cfc68012f7
parent 0397c0cd44
1 changed files with 6 additions and 3 deletions
--- a/llama_stack/providers/remote/inference/podman_ai_lab/podman_ai_lab.py
+++ b/llama_stack/providers/remote/inference/podman_ai_lab/podman_ai_lab.py
@ -150,9 +150,8 @@ class PodmanAILabInferenceAdapter(Inference, ModelsProtocolPrivate):
    ) -> AsyncGenerator:
        if sampling_params is None:
            sampling_params = SamplingParams()
-        model = await self.model_store.get_model(model_id)
        request = ChatCompletionRequest(
-            model=model.provider_resource_id,
+            model=model_id,
            messages=messages,
            sampling_params=sampling_params,
            tools=tools or [],
@ -175,7 +174,7 @@ class PodmanAILabInferenceAdapter(Inference, ModelsProtocolPrivate):

        input_dict = {}
        media_present = request_has_media(request)
-        llama_model = self.register_helper.get_llama_model(request.model)
+        llama_model = request.model
        if isinstance(request, ChatCompletionRequest):
            if media_present or not llama_model:
                contents = [await convert_message_to_openai_dict_for_podman_ai_lab(m) for m in request.messages]
@ -292,3 +291,7 @@ async def convert_message_to_openai_dict_for_podman_ai_lab(message: Message) ->
        return [await _convert_content(c) for c in message.content]
    else:
        return [await _convert_content(message.content)]
+    
+    async def register_model(self, model: Model) -> Model:
+        return model
+