Use huggingface_hub inference client for TGI inference

2025-10-04 12:07:34 +00:00 · 2024-09-05 18:29:04 +02:00 · 2024-09-05 18:29:04 +02:00 · e5bcfdac21
commit e5bcfdac21
parent 21bedc1596
6 changed files with 179 additions and 142 deletions
--- a/llama_toolchain/inference/providers.py
+++ b/llama_toolchain/inference/providers.py
@ -39,8 +39,9 @@ def available_inference_providers() -> List[ProviderSpec]:
            api=Api.inference,
            adapter=AdapterSpec(
                adapter_id="tgi",
-                pip_packages=["text-generation"],
+                pip_packages=["huggingface_hub"],
                module="llama_toolchain.inference.adapters.tgi",
+                config_class="llama_toolchain.inference.adapters.tgi.TGIImplConfig",
            ),
        ),
        remote_provider_spec(