Merge branch 'main' into restructure_scoring

2025-10-18 15:27:16 +00:00 · 2024-11-12 09:59:35 -05:00 · 2024-11-12 09:59:35 -05:00 · 86fdad3be3
commit 86fdad3be3
parent fd424e7900 3d7561e55c
26 changed files with 89 additions and 80 deletions
--- a/llama_stack/cli/tests/test_stack_config.py
+++ b/llama_stack/cli/tests/test_stack_config.py
@ -25,11 +25,11 @@ def up_to_date_config():
        providers:
          inference:
            - provider_id: provider1
-              provider_type: meta-reference
+              provider_type: inline::meta-reference
              config: {{}}
          safety:
            - provider_id: provider1
-              provider_type: meta-reference
+              provider_type: inline::meta-reference
              config:
                llama_guard_shield:
                  model: Llama-Guard-3-1B
@ -39,7 +39,7 @@ def up_to_date_config():
                enable_prompt_guard: false
          memory:
            - provider_id: provider1
-              provider_type: meta-reference
+              provider_type: inline::meta-reference
              config: {{}}
    """.format(
            version=LLAMA_STACK_RUN_CONFIG_VERSION, built_at=datetime.now().isoformat()
@ -61,13 +61,13 @@ def old_config():
                host: localhost
                port: 11434
              routing_key: Llama3.2-1B-Instruct
-            - provider_type: meta-reference
+            - provider_type: inline::meta-reference
              config:
                model: Llama3.1-8B-Instruct
              routing_key: Llama3.1-8B-Instruct
          safety:
            - routing_key: ["shield1", "shield2"]
-              provider_type: meta-reference
+              provider_type: inline::meta-reference
              config:
                llama_guard_shield:
                  model: Llama-Guard-3-1B
@ -77,7 +77,7 @@ def old_config():
                enable_prompt_guard: false
          memory:
            - routing_key: vector
-              provider_type: meta-reference
+              provider_type: inline::meta-reference
              config: {{}}
        api_providers:
          telemetry:
--- a/llama_stack/distribution/build.py
+++ b/llama_stack/distribution/build.py
@ -5,7 +5,7 @@
 # the root directory of this source tree.

 from enum import Enum
-from typing import List, Optional
+from typing import List

 import pkg_resources
 from pydantic import BaseModel
@ -38,11 +38,6 @@ class ImageType(Enum):
    conda = "conda"


-class Dependencies(BaseModel):
-    pip_packages: List[str]
-    docker_image: Optional[str] = None
-
-
 class ApiInput(BaseModel):
    api: Api
    provider: str
@ -103,17 +98,12 @@ def print_pip_install_help(providers: Dict[str, List[Provider]]):


 def build_image(build_config: BuildConfig, build_file_path: Path):
-    package_deps = Dependencies(
-        docker_image=build_config.distribution_spec.docker_image or "python:3.10-slim",
-        pip_packages=SERVER_DEPENDENCIES,
-    )
+    docker_image = build_config.distribution_spec.docker_image or "python:3.10-slim"

-    # extend package dependencies based on providers spec
    normal_deps, special_deps = get_provider_dependencies(
        build_config.distribution_spec.providers
    )
-    package_deps.pip_packages.extend(normal_deps)
-    package_deps.pip_packages.extend(special_deps)
+    normal_deps += SERVER_DEPENDENCIES

    if build_config.image_type == ImageType.docker.value:
        script = pkg_resources.resource_filename(
@ -122,7 +112,7 @@ def build_image(build_config: BuildConfig, build_file_path: Path):
        args = [
            script,
            build_config.name,
-            package_deps.docker_image,
+            docker_image,
            str(build_file_path),
            str(BUILDS_BASE_DIR / ImageType.docker.value),
            " ".join(normal_deps),
--- a/llama_stack/distribution/build_container.sh
+++ b/llama_stack/distribution/build_container.sh
@ -147,8 +147,19 @@ else
  image_name="$image_name-$(curl -s $URL | jq -r '.info.version')"
 fi

+# Detect platform architecture
+ARCH=$(uname -m)
+if [ "$ARCH" = "arm64" ] || [ "$ARCH" = "aarch64" ]; then
+  PLATFORM="--platform linux/arm64"
+elif [ "$ARCH" = "x86_64" ]; then
+  PLATFORM="--platform linux/amd64"
+else
+  echo "Unsupported architecture: $ARCH"
+  exit 1
+fi
+
 set -x
-$DOCKER_BINARY build $DOCKER_OPTS -t $image_name -f "$TEMP_DIR/Dockerfile" "$REPO_DIR" $mounts
+$DOCKER_BINARY build $DOCKER_OPTS $PLATFORM -t $image_name -f "$TEMP_DIR/Dockerfile" "$REPO_DIR" $mounts

 # clean up tmp/configs
 set +x
--- a/llama_stack/distribution/start_container.sh
+++ b/llama_stack/distribution/start_container.sh
@ -10,6 +10,8 @@ DOCKER_BINARY=${DOCKER_BINARY:-docker}
 DOCKER_OPTS=${DOCKER_OPTS:-}
 LLAMA_CHECKPOINT_DIR=${LLAMA_CHECKPOINT_DIR:-}
 LLAMA_STACK_DIR=${LLAMA_STACK_DIR:-}
+TEST_PYPI_VERSION=${TEST_PYPI_VERSION:-}
+PYPI_VERSION=${PYPI_VERSION:-}

 set -euo pipefail

@ -54,6 +56,12 @@ if [ -n "$LLAMA_CHECKPOINT_DIR" ]; then
  DOCKER_OPTS="$DOCKER_OPTS --gpus=all"
 fi

+if [ -n "$PYPI_VERSION" ]; then
+  docker_image="$docker_image-$PYPI_VERSION"
+elif [ -n "$TEST_PYPI_VERSION" ]; then
+  docker_image="$docker_image-test-$TEST_PYPI_VERSION"
+fi
+
 $DOCKER_BINARY run $DOCKER_OPTS -it \
  -p $port:$port \
  -v "$yaml_config:/app/config.yaml" \
--- a/llama_stack/providers/registry/agents.py
+++ b/llama_stack/providers/registry/agents.py
@ -14,7 +14,7 @@ def available_providers() -> List[ProviderSpec]:
    return [
        InlineProviderSpec(
            api=Api.agents,
-            provider_type="meta-reference",
+            provider_type="inline::meta-reference",
            pip_packages=[
                "matplotlib",
                "pillow",
--- a/llama_stack/providers/registry/eval.py
+++ b/llama_stack/providers/registry/eval.py
@ -13,7 +13,7 @@ def available_providers() -> List[ProviderSpec]:
    return [
        InlineProviderSpec(
            api=Api.eval,
-            provider_type="meta-reference",
+            provider_type="inline::meta-reference",
            pip_packages=[],
            module="llama_stack.providers.inline.eval.meta_reference",
            config_class="llama_stack.providers.inline.eval.meta_reference.MetaReferenceEvalConfig",
--- a/llama_stack/providers/registry/inference.py
+++ b/llama_stack/providers/registry/inference.py
@ -25,14 +25,14 @@ def available_providers() -> List[ProviderSpec]:
    return [
        InlineProviderSpec(
            api=Api.inference,
-            provider_type="meta-reference",
+            provider_type="inline::meta-reference",
            pip_packages=META_REFERENCE_DEPS,
            module="llama_stack.providers.inline.inference.meta_reference",
            config_class="llama_stack.providers.inline.inference.meta_reference.MetaReferenceInferenceConfig",
        ),
        InlineProviderSpec(
            api=Api.inference,
-            provider_type="meta-reference-quantized",
+            provider_type="inline::meta-reference-quantized",
            pip_packages=(
                META_REFERENCE_DEPS
                + [
--- a/llama_stack/providers/registry/memory.py
+++ b/llama_stack/providers/registry/memory.py
@ -34,7 +34,7 @@ def available_providers() -> List[ProviderSpec]:
    return [
        InlineProviderSpec(
            api=Api.memory,
-            provider_type="meta-reference",
+            provider_type="inline::meta-reference",
            pip_packages=EMBEDDING_DEPS + ["faiss-cpu"],
            module="llama_stack.providers.inline.memory.faiss",
            config_class="llama_stack.providers.inline.memory.faiss.FaissImplConfig",
--- a/llama_stack/providers/registry/safety.py
+++ b/llama_stack/providers/registry/safety.py
@ -19,7 +19,7 @@ def available_providers() -> List[ProviderSpec]:
    return [
        InlineProviderSpec(
            api=Api.safety,
-            provider_type="meta-reference",
+            provider_type="inline::meta-reference",
            pip_packages=[
                "transformers",
                "torch --index-url https://download.pytorch.org/whl/cpu",
@ -30,7 +30,7 @@ def available_providers() -> List[ProviderSpec]:
                Api.inference,
            ],
            deprecation_error="""
-Provider `meta-reference` for API `safety` does not work with the latest Llama Stack.
+Provider `inline::meta-reference` for API `safety` does not work with the latest Llama Stack.

 - if you are using Llama Guard v3, please use the `inline::llama-guard` provider instead.
 - if you are using Prompt Guard, please use the `inline::prompt-guard` provider instead.
--- a/llama_stack/providers/registry/scoring.py
+++ b/llama_stack/providers/registry/scoring.py
@ -13,7 +13,7 @@ def available_providers() -> List[ProviderSpec]:
    return [
        InlineProviderSpec(
            api=Api.scoring,
-            provider_type="basic",
+            provider_type="inline::basic",
            pip_packages=[],
            module="llama_stack.providers.inline.scoring.basic",
            config_class="llama_stack.providers.inline.scoring.basic.BasicScoringConfig",
@ -24,7 +24,7 @@ def available_providers() -> List[ProviderSpec]:
        ),
        InlineProviderSpec(
            api=Api.scoring,
-            provider_type="llm-as-judge",
+            provider_type="inline::llm-as-judge",
            pip_packages=[],
            module="llama_stack.providers.inline.scoring.llm_as_judge",
            config_class="llama_stack.providers.inline.scoring.llm_as_judge.LlmAsJudgeScoringConfig",
@ -36,7 +36,7 @@ def available_providers() -> List[ProviderSpec]:
        ),
        InlineProviderSpec(
            api=Api.scoring,
-            provider_type="braintrust",
+            provider_type="inline::braintrust",
            pip_packages=["autoevals", "openai"],
            module="llama_stack.providers.inline.scoring.braintrust",
            config_class="llama_stack.providers.inline.scoring.braintrust.BraintrustScoringConfig",
--- a/llama_stack/providers/registry/telemetry.py
+++ b/llama_stack/providers/registry/telemetry.py
@ -13,7 +13,7 @@ def available_providers() -> List[ProviderSpec]:
    return [
        InlineProviderSpec(
            api=Api.telemetry,
-            provider_type="meta-reference",
+            provider_type="inline::meta-reference",
            pip_packages=[],
            module="llama_stack.providers.inline.meta_reference.telemetry",
            config_class="llama_stack.providers.inline.meta_reference.telemetry.ConsoleConfig",