fix: Adding Embedding model to watsonx inference (#2118)

# What does this PR do? Issue Link : https://github.com/meta-llama/llama-stack/issues/2117 ## Test Plan Once added, User will be able to use Sentence Transformer model `all-MiniLM-L6-v2`
2025-07-24 05:14:30 +00:00 · 2025-05-12 23:28:22 +05:30 · 2025-05-12 23:28:22 +05:30 · c985ea6326
commit c985ea6326
parent 136e6b3cf7
5 changed files with 36 additions and 6 deletions
--- a/llama_stack/templates/watsonx/run.yaml
+++ b/llama_stack/templates/watsonx/run.yaml
@ -18,6 +18,9 @@ providers:
      url: ${env.WATSONX_BASE_URL:https://us-south.ml.cloud.ibm.com}
      api_key: ${env.WATSONX_API_KEY:}
      project_id: ${env.WATSONX_PROJECT_ID:}
+  - provider_id: sentence-transformers
+    provider_type: inline::sentence-transformers
+    config: {}
  vector_io:
  - provider_id: faiss
    provider_type: inline::faiss
@ -191,6 +194,11 @@ models:
  provider_id: watsonx
  provider_model_id: meta-llama/llama-guard-3-11b-vision
  model_type: llm
+- metadata:
+    embedding_dimension: 384
+  model_id: all-MiniLM-L6-v2
+  provider_id: sentence-transformers
+  model_type: embedding
 shields: []
 vector_dbs: []
 datasets: []