Fixes to the llama stack configure script + inference adapters

2024-09-03 23:22:21 -07:00 · 2024-09-03 23:22:21 -07:00 · 1380d78c19
commit 1380d78c19
parent 4869f2b983
11 changed files with 124 additions and 37 deletions
--- a/llama_toolchain/inference/adapters/fireworks/init.py
+++ b/llama_toolchain/inference/adapters/fireworks/init.py
@ -7,7 +7,7 @@
 from .config import FireworksImplConfig


-async def get_adapter_impl(config: FireworksImplConfig, _deps) -> Inference:
+async def get_adapter_impl(config: FireworksImplConfig, _deps):
    from .fireworks import FireworksInferenceAdapter

    assert isinstance(
--- a/llama_toolchain/inference/adapters/fireworks/config.py
+++ b/llama_toolchain/inference/adapters/fireworks/config.py
@ -11,7 +11,7 @@ from pydantic import BaseModel, Field
@json_schema_type
 class FireworksImplConfig(BaseModel):
    url: str = Field(
-        default="https://api.fireworks.api/inference",
+        default="https://api.fireworks.ai/inference",
        description="The URL for the Fireworks server",
    )
    api_key: str = Field(
--- a/llama_toolchain/inference/adapters/together/init.py
+++ b/llama_toolchain/inference/adapters/together/init.py
@ -7,7 +7,7 @@
 from .config import TogetherImplConfig


-async def get_adapter_impl(config: TogetherImplConfig, _deps) -> Inference:
+async def get_adapter_impl(config: TogetherImplConfig, _deps):
    from .together import TogetherInferenceAdapter

    assert isinstance(
--- a/llama_toolchain/inference/providers.py
+++ b/llama_toolchain/inference/providers.py
@ -42,8 +42,8 @@ def available_inference_providers() -> List[ProviderSpec]:
                pip_packages=[
                    "fireworks-ai",
                ],
-                module="llama_toolchain.inference.fireworks",
-                config_class="llama_toolchain.inference.fireworks.FireworksImplConfig",
+                module="llama_toolchain.inference.adapters.fireworks",
+                config_class="llama_toolchain.inference.adapters.fireworks.FireworksImplConfig",
            ),
        ),
        remote_provider_spec(
@ -53,8 +53,8 @@ def available_inference_providers() -> List[ProviderSpec]:
                pip_packages=[
                    "together",
                ],
-                module="llama_toolchain.inference.together",
-                config_class="llama_toolchain.inference.together.TogetherImplConfig",
+                module="llama_toolchain.inference.adapters.together",
+                config_class="llama_toolchain.inference.adapters.together.TogetherImplConfig",
            ),
        ),
    ]