Merge branch 'meta-llama:main' into preprocessors

2026-01-03 12:32:17 +00:00 · 2025-04-07 12:03:11 +02:00 · 2025-04-07 12:03:11 +02:00 · 3941d083ea
commit 3941d083ea
parent 0b968678b4 c1973f6528
71 changed files with 206623 additions and 6480 deletions
--- a/llama_stack/providers/registry/inference.py
+++ b/llama_stack/providers/registry/inference.py
@ -39,13 +39,7 @@ def available_providers() -> List[ProviderSpec]:
        InlineProviderSpec(
            api=Api.inference,
            provider_type="inline::meta-reference-quantized",
-            pip_packages=(
-                META_REFERENCE_DEPS
-                + [
-                    "fbgemm-gpu",
-                    "torchao==0.5.0",
-                ]
-            ),
+            pip_packages=META_REFERENCE_DEPS + ["fbgemm-gpu", "torchao==0.5.0"],
            module="llama_stack.providers.inline.inference.meta_reference",
            config_class="llama_stack.providers.inline.inference.meta_reference.MetaReferenceQuantizedInferenceConfig",
        ),