Remove openai embedding override

We can just use the default, runpod embedding endpoint for vllm is nothing special and just passes through to vllm
2025-12-12 12:06:04 +00:00 · 2025-10-06 15:11:27 -04:00 · 2025-10-06 15:11:27 -04:00 · 412ea00c0b
commit 412ea00c0b
parent b519434c88
1 changed files with 0 additions and 23 deletions
--- a/llama_stack/providers/remote/inference/runpod/runpod.py
+++ b/llama_stack/providers/remote/inference/runpod/runpod.py
@ -7,7 +7,6 @@
 from typing import Any

 from llama_stack.apis.inference import (
-    OpenAIEmbeddingsResponse,
    OpenAIMessageParam,
    OpenAIResponseFormatParam,
 )
@ -114,25 +113,3 @@ class RunpodInferenceAdapter(OpenAIMixin):
            )

        return model
-
-    async def openai_embeddings(
-        self,
-        model: str,
-        input: str | list[str],
-        encoding_format: str | None = "float",
-        dimensions: int | None = None,
-        user: str | None = None,
-    ) -> OpenAIEmbeddingsResponse:
-        # Resolve model_id to provider_resource_id
-        model_obj = await self.model_store.get_model(model)
-        provider_model_id = model_obj.provider_resource_id or model
-
-        response = await self.client.embeddings.create(
-            model=provider_model_id,
-            input=input,
-            encoding_format=encoding_format,
-            dimensions=dimensions,
-            user=user,
-        )
-
-        return response