From 92107f316c8260c41c92cfe5338476a40656be25 Mon Sep 17 00:00:00 2001
From: Francisco Javier Arceo <farceo@redhat.com>
Date: Mon, 13 Oct 2025 13:12:12 -0400
Subject: [PATCH] update based on feedback

Signed-off-by: Francisco Javier Arceo <farceo@redhat.com>
---
 llama_stack/core/routers/vector_io.py             | 15 ++++++++-------
 .../utils/memory/openai_vector_store_mixin.py     |  2 +-
 2 files changed, 9 insertions(+), 8 deletions(-)

diff --git a/llama_stack/core/routers/vector_io.py b/llama_stack/core/routers/vector_io.py
index 8e00873e8..dc7b3a694 100644
--- a/llama_stack/core/routers/vector_io.py
+++ b/llama_stack/core/routers/vector_io.py
@@ -117,7 +117,7 @@ class VectorIORouter(VectorIO):
         # Extract llama-stack-specific parameters from extra_body
         extra = params.model_extra or {}
         embedding_model = extra.get("embedding_model")
-        embedding_dimension = extra.get("embedding_dimension", 384)
+        embedding_dimension = extra.get("embedding_dimension")
         provider_id = extra.get("provider_id")
 
         logger.debug(f"VectorIORouter.openai_create_vector_store: name={params.name}, provider_id={provider_id}")
@@ -126,20 +126,21 @@ class VectorIORouter(VectorIO):
         if embedding_model is None:
             raise ValueError("embedding_model is required in extra_body when creating a vector store")
 
-        # Always extract embedding dimension from the model registry
-        embedding_dimension = await self._get_embedding_model_dimension(embedding_model)
+        if embedding_dimension is None:
+            embedding_dimension = await self._get_embedding_model_dimension(embedding_model)
 
         # Auto-select provider if not specified
         if provider_id is None:
-            if len(self.routing_table.impls_by_provider_id) == 1:
-                provider_id = list(self.routing_table.impls_by_provider_id.keys())[0]
-                logger.info(f"No provider_id specified, using the only available vector_io provider: {provider_id}")
-            else:
+            num_providers = len(self.routing_table.impls_by_provider_id)
+            if num_providers == 0:
+                raise ValueError("No vector_io providers available")
+            if num_providers > 1:
                 available_providers = list(self.routing_table.impls_by_provider_id.keys())
                 raise ValueError(
                     f"Multiple vector_io providers available. Please specify provider_id in extra_body. "
                     f"Available providers: {available_providers}"
                 )
+            provider_id = list(self.routing_table.impls_by_provider_id.keys())[0]
 
         vector_db_id = f"vs_{uuid.uuid4()}"
         registered_vector_db = await self.routing_table.register_vector_db(
diff --git a/llama_stack/providers/utils/memory/openai_vector_store_mixin.py b/llama_stack/providers/utils/memory/openai_vector_store_mixin.py
index 4c80d7435..02c3d9730 100644
--- a/llama_stack/providers/utils/memory/openai_vector_store_mixin.py
+++ b/llama_stack/providers/utils/memory/openai_vector_store_mixin.py
@@ -353,7 +353,7 @@ class OpenAIVectorStoreMixin(ABC):
         provider_vector_db_id = extra.get("provider_vector_db_id")
         embedding_model = extra.get("embedding_model")
         embedding_dimension = extra.get("embedding_dimension", 384)
-        # use provider_id from router or default to this provider's own ID (need for --stack-config)
+        # use provider_id set by router; fallback to provider's own ID when used directly via --stack-config
         provider_id = extra.get("provider_id") or getattr(self, "__provider_id__", None)
 
         # Derive the canonical vector_db_id (allow override, else generate)