implement embedding generation in supported inference providers

2025-12-17 18:22:41 +00:00 · 2024-12-09 12:48:56 -08:00 · 2024-12-09 12:48:56 -08:00 · e167e9eb93
commit e167e9eb93
parent b896be2311
16 changed files with 383 additions and 29 deletions
--- a/llama_stack/providers/remote/inference/together/together.py
+++ b/llama_stack/providers/remote/inference/together/together.py
@ -253,4 +253,9 @@ class TogetherInferenceAdapter(
        model_id: str,
        contents: List[InterleavedTextMedia],
    ) -> EmbeddingsResponse:
-        raise NotImplementedError()
+        model = await self.model_store.get_model(model_id)
+        r = self._get_client().embeddings.create(
+            model=model.provider_resource_id, input=contents
+        )
+        embeddings = [item.embedding for item in r.data]
+        return EmbeddingsResponse(embeddings=embeddings)