working fireworks and together

2025-12-17 11:12:36 +00:00 · 2024-11-12 13:07:35 -08:00 · 2024-11-12 13:07:35 -08:00 · 8de4cee373
commit 8de4cee373
parent 25d8ab0e14
8 changed files with 205 additions and 86 deletions
--- a/llama_stack/distribution/routers/routers.py
+++ b/llama_stack/distribution/routers/routers.py
@ -105,9 +105,8 @@ class InferenceRouter(Inference):
        stream: Optional[bool] = False,
        logprobs: Optional[LogProbConfig] = None,
    ) -> AsyncGenerator:
-        model = await self.routing_table.get_model(model_id)
        params = dict(
-            model_id=model.provider_resource_id,
+            model_id=model_id,
            messages=messages,
            sampling_params=sampling_params,
            tools=tools or [],
@ -132,10 +131,9 @@ class InferenceRouter(Inference):
        stream: Optional[bool] = False,
        logprobs: Optional[LogProbConfig] = None,
    ) -> AsyncGenerator:
-        model = await self.routing_table.get_model(model_id)
        provider = self.routing_table.get_provider_impl(model_id)
        params = dict(
-            model_id=model.provider_resource_id,
+            model_id=model_id,
            content=content,
            sampling_params=sampling_params,
            response_format=response_format,
@ -152,9 +150,8 @@ class InferenceRouter(Inference):
        model_id: str,
        contents: List[InterleavedTextMedia],
    ) -> EmbeddingsResponse:
-        model = await self.routing_table.get_model(model_id)
        return await self.routing_table.get_provider_impl(model_id).embeddings(
-            model_id=model.provider_resource_id,
+            model_id=model_id,
            contents=contents,
        )