refine

2025-08-02 08:44:44 +00:00 · 2024-12-18 16:05:35 -08:00 · 2024-12-18 16:05:35 -08:00 · 7b0deee899
commit 7b0deee899
parent 92a367340c
3 changed files with 2 additions and 3 deletions
--- a/docs/source/distributions/self_hosted_distro/meta-reference-gpu.md
+++ b/docs/source/distributions/self_hosted_distro/meta-reference-gpu.md
@ -96,5 +96,5 @@ If you are using Llama Stack Safety / Shield APIs, use:
 llama stack run distributions/meta-reference-gpu/run-with-safety.yaml \
  --port 5001 \
  --env INFERENCE_MODEL=Llama3.2-3B-Instruct \
-  --env SAFETY_MODEL=meta-Llama-Guard-3-1B
+  --env SAFETY_MODEL=Llama-Guard-3-1B
 ```
--- a/docs/source/distributions/self_hosted_distro/meta-reference-quantized-gpu.md
+++ b/docs/source/distributions/self_hosted_distro/meta-reference-quantized-gpu.md
@ -76,7 +76,7 @@ docker run \
  llamastack/distribution-meta-reference-quantized-gpu \
  --port $LLAMA_STACK_PORT \
  --env INFERENCE_MODEL=Llama3.2-3B-Instruct \
-  --env SAFETY_MODEL=meta-Llama-Guard-3-1B
+  --env SAFETY_MODEL=Llama-Guard-3-1B
 ```

 ### Via Conda
--- a/llama_stack/providers/inline/inference/meta_reference/init.py
+++ b/llama_stack/providers/inline/inference/meta_reference/init.py
@ -17,5 +17,4 @@ async def get_provider_impl(

    impl = MetaReferenceInferenceImpl(config)
    await impl.initialize()
-
    return impl