implement embedding generation in supported inference providers

2025-12-17 16:32:38 +00:00 · 2024-12-09 12:48:56 -08:00 · 2024-12-09 12:48:56 -08:00 · e167e9eb93
commit e167e9eb93
parent b896be2311
16 changed files with 383 additions and 29 deletions
--- a/llama_stack/providers/registry/inference.py
+++ b/llama_stack/providers/registry/inference.py
@ -18,6 +18,7 @@ META_REFERENCE_DEPS = [
    "transformers",
    "zmq",
    "lm-format-enforcer",
+    "sentence-transformers",
 ]


@ -52,6 +53,13 @@ def available_providers() -> List[ProviderSpec]:
            module="llama_stack.providers.inline.inference.vllm",
            config_class="llama_stack.providers.inline.inference.vllm.VLLMConfig",
        ),
+        InlineProviderSpec(
+            api=Api.inference,
+            provider_type="inline::sentence-transformers",
+            pip_packages=["sentence-transformers"],
+            module="llama_stack.providers.inline.inference.sentence_transformers",
+            config_class="llama_stack.providers.inline.inference.sentence_transformers.config.SentenceTransformersInferenceConfig",
+        ),
        remote_provider_spec(
            api=Api.inference,
            adapter=AdapterSpec(