feat: configure vector-io provider with an embedding model

Signed-off-by: Mustafa Elbehery <melbeher@redhat.com>
2025-12-26 10:48:03 +00:00 · 2025-07-31 13:07:03 +02:00 · 2025-07-31 13:07:03 +02:00 · d8f013b35a
commit d8f013b35a
parent 1f0766308d
29 changed files with 228 additions and 24 deletions
--- a/llama_stack/providers/inline/vector_io/faiss/config.py
+++ b/llama_stack/providers/inline/vector_io/faiss/config.py
@ -6,18 +6,23 @@

 from typing import Any

-from pydantic import BaseModel
+from pydantic import BaseModel, Field

 from llama_stack.providers.utils.kvstore.config import (
    KVStoreConfig,
    SqliteKVStoreConfig,
 )
+from llama_stack.providers.utils.vector_io.embedding_config import EmbeddingConfig
 from llama_stack.schema_utils import json_schema_type


@json_schema_type
 class FaissVectorIOConfig(BaseModel):
    kvstore: KVStoreConfig
+    embedding: EmbeddingConfig | None = Field(
+        default=None,
+        description="Default embedding configuration for this provider. When specified, vector databases created with this provider will use these embedding settings as defaults.",
+    )

    @classmethod
    def sample_run_config(cls, __distro_dir__: str, **kwargs: Any) -> dict[str, Any]:
@ -25,5 +30,10 @@ class FaissVectorIOConfig(BaseModel):
            "kvstore": SqliteKVStoreConfig.sample_run_config(
                __distro_dir__=__distro_dir__,
                db_name="faiss_store.db",
-            )
+            ),
+            # Optional: Configure default embedding model for this provider
+            # "embedding": {
+            #     "model": "${env.FAISS_EMBEDDING_MODEL:=all-MiniLM-L6-v2}",
+            #     "dimensions": 384
+            # },
        }
--- a/llama_stack/providers/inline/vector_io/faiss/faiss.py
+++ b/llama_stack/providers/inline/vector_io/faiss/faiss.py
@ -35,6 +35,7 @@ from llama_stack.providers.utils.memory.openai_vector_store_mixin import OpenAIV
 from llama_stack.providers.utils.memory.vector_store import (
    EmbeddingIndex,
    VectorDBWithIndex,
+    apply_provider_embedding_defaults,
 )

 from .config import FaissVectorIOConfig
@ -237,6 +238,9 @@ class FaissVectorIOAdapter(OpenAIVectorStoreMixin, VectorIO, VectorDBsProtocolPr
        self,
        vector_db: VectorDB,
    ) -> None:
+        # Apply provider-level embedding defaults if configured
+        vector_db = apply_provider_embedding_defaults(vector_db, self.config.embedding)
+
        assert self.kvstore is not None

        key = f"{VECTOR_DBS_PREFIX}{vector_db.identifier}"