Update embedding dimension singular

2025-12-04 02:03:44 +00:00 · 2025-02-20 16:14:46 -08:00 · 2025-02-20 16:14:46 -08:00 · 2608b6074f
commit 2608b6074f
parent 9436dd570d
9 changed files with 15 additions and 15 deletions
--- a/llama_stack/providers/remote/inference/fireworks/fireworks.py
+++ b/llama_stack/providers/remote/inference/fireworks/fireworks.py
@ -237,8 +237,8 @@ class FireworksInferenceAdapter(ModelRegistryHelper, Inference, NeedsRequestProv
        model = await self.model_store.get_model(model_id)

        kwargs = {}
-        if model.metadata.get("embedding_dimensions"):
-            kwargs["dimensions"] = model.metadata.get("embedding_dimensions")
+        if model.metadata.get("embedding_dimension"):
+            kwargs["dimensions"] = model.metadata.get("embedding_dimension")
        assert all(not content_has_media(content) for content in contents), (
            "Fireworks does not support media for embeddings"
        )
--- a/llama_stack/providers/remote/inference/fireworks/models.py
+++ b/llama_stack/providers/remote/inference/fireworks/models.py
@ -56,7 +56,7 @@ MODEL_ENTRIES = [
        provider_model_id="nomic-ai/nomic-embed-text-v1.5",
        model_type=ModelType.embedding,
        metadata={
-            "embedding_dimensions": 768,
+            "embedding_dimension": 768,
            "context_length": 8192,
        },
    ),
--- a/llama_stack/providers/remote/inference/ollama/models.py
+++ b/llama_stack/providers/remote/inference/ollama/models.py
@ -88,7 +88,7 @@ model_entries = [
        aliases=["all-minilm"],
        model_type=ModelType.embedding,
        metadata={
-            "embedding_dimensions": 384,
+            "embedding_dimension": 384,
            "context_length": 512,
        },
    ),
@ -96,7 +96,7 @@ model_entries = [
        provider_model_id="nomic-embed-text",
        model_type=ModelType.embedding,
        metadata={
-            "embedding_dimensions": 768,
+            "embedding_dimension": 768,
            "context_length": 8192,
        },
    ),
--- a/llama_stack/providers/remote/inference/together/models.py
+++ b/llama_stack/providers/remote/inference/together/models.py
@ -52,7 +52,7 @@ MODEL_ENTRIES = [
        provider_model_id="togethercomputer/m2-bert-80M-8k-retrieval",
        model_type=ModelType.embedding,
        metadata={
-            "embedding_dimensions": 768,
+            "embedding_dimension": 768,
            "context_length": 8192,
        },
    ),
@ -60,7 +60,7 @@ MODEL_ENTRIES = [
        provider_model_id="togethercomputer/m2-bert-80M-32k-retrieval",
        model_type=ModelType.embedding,
        metadata={
-            "embedding_dimensions": 768,
+            "embedding_dimension": 768,
            "context_length": 32768,
        },
    ),
--- a/llama_stack/providers/remote/inference/vllm/vllm.py
+++ b/llama_stack/providers/remote/inference/vllm/vllm.py
@ -375,8 +375,8 @@ class VLLMInferenceAdapter(Inference, ModelsProtocolPrivate):

        kwargs = {}
        assert model.model_type == ModelType.embedding
-        assert model.metadata.get("embedding_dimensions")
-        kwargs["dimensions"] = model.metadata.get("embedding_dimensions")
+        assert model.metadata.get("embedding_dimension")
+        kwargs["dimensions"] = model.metadata.get("embedding_dimension")
        assert all(not content_has_media(content) for content in contents), "VLLM does not support media for embeddings"
        response = self.client.embeddings.create(
            model=model.provider_resource_id,
--- a/llama_stack/templates/fireworks/run-with-safety.yaml
+++ b/llama_stack/templates/fireworks/run-with-safety.yaml
@ -150,7 +150,7 @@ models:
  provider_model_id: accounts/fireworks/models/llama-guard-3-11b-vision
  model_type: llm
 - metadata:
-    embedding_dimensions: 768
+    embedding_dimension: 768
    context_length: 8192
  model_id: nomic-ai/nomic-embed-text-v1.5
  provider_id: fireworks
--- a/llama_stack/templates/fireworks/run.yaml
+++ b/llama_stack/templates/fireworks/run.yaml
@ -144,7 +144,7 @@ models:
  provider_model_id: accounts/fireworks/models/llama-guard-3-11b-vision
  model_type: llm
 - metadata:
-    embedding_dimensions: 768
+    embedding_dimension: 768
    context_length: 8192
  model_id: nomic-ai/nomic-embed-text-v1.5
  provider_id: fireworks
--- a/llama_stack/templates/together/run-with-safety.yaml
+++ b/llama_stack/templates/together/run-with-safety.yaml
@ -145,14 +145,14 @@ models:
  provider_model_id: meta-llama/Llama-Guard-3-11B-Vision-Turbo
  model_type: llm
 - metadata:
-    embedding_dimensions: 768
+    embedding_dimension: 768
    context_length: 8192
  model_id: togethercomputer/m2-bert-80M-8k-retrieval
  provider_id: together
  provider_model_id: togethercomputer/m2-bert-80M-8k-retrieval
  model_type: embedding
 - metadata:
-    embedding_dimensions: 768
+    embedding_dimension: 768
    context_length: 32768
  model_id: togethercomputer/m2-bert-80M-32k-retrieval
  provider_id: together
--- a/llama_stack/templates/together/run.yaml
+++ b/llama_stack/templates/together/run.yaml
@ -139,14 +139,14 @@ models:
  provider_model_id: meta-llama/Llama-Guard-3-11B-Vision-Turbo
  model_type: llm
 - metadata:
-    embedding_dimensions: 768
+    embedding_dimension: 768
    context_length: 8192
  model_id: togethercomputer/m2-bert-80M-8k-retrieval
  provider_id: together
  provider_model_id: togethercomputer/m2-bert-80M-8k-retrieval
  model_type: embedding
 - metadata:
-    embedding_dimensions: 768
+    embedding_dimension: 768
    context_length: 32768
  model_id: togethercomputer/m2-bert-80M-32k-retrieval
  provider_id: together