Use huggingface_hub inference client for TGI inference

2025-10-04 12:07:34 +00:00 · 2024-09-05 18:29:04 +02:00 · 2024-09-05 18:29:04 +02:00 · e5bcfdac21
commit e5bcfdac21
parent 21bedc1596
6 changed files with 179 additions and 142 deletions
--- a/llama_toolchain/core/distribution_registry.py
+++ b/llama_toolchain/core/distribution_registry.py
@ -58,6 +58,16 @@ def available_distribution_specs() -> List[DistributionSpec]:
                Api.memory: "meta-reference-faiss",
            },
        ),
+        DistributionSpec(
+            distribution_id="local-plus-tgi-inference",
+            description="Use TGI for running LLM inference",
+            providers={
+                Api.inference: remote_provider_id("tgi"),
+                Api.safety: "meta-reference",
+                Api.agentic_system: "meta-reference",
+                Api.memory: "meta-reference-faiss",
+            },
+        ),
    ]