Merge 5115801835 into 537dc693ee

2025-07-25 21:57:45 +00:00 · 2025-07-24 19:26:53 +02:00 · 2025-07-24 19:26:53 +02:00 · 55c415f64c
commit 55c415f64c
parent 537dc693ee 5115801835
49 changed files with 307 additions and 97 deletions
--- a/.pre-commit-config.yaml
+++ b/.pre-commit-config.yaml
@ -145,6 +145,14 @@ repos:
              echo;
              exit 1;
            } || true
+      - id: check-logger-usage
+        name: Check for proper logger usage
+        entry: ./scripts/check-logger-usage.py
+        language: system
+        pass_filenames: false
+        require_serial: true
+        types: [python]
+        files: ^llama_stack/.*\.py$

 ci:
    autofix_commit_msg: 🎨 [pre-commit.ci] Auto format from pre-commit.com hooks
--- a/llama_stack/distribution/build.py
+++ b/llama_stack/distribution/build.py
@ -5,7 +5,6 @@
 # the root directory of this source tree.

 import importlib.resources
-import logging
 import sys
 from pathlib import Path

@ -16,10 +15,11 @@ from llama_stack.distribution.datatypes import BuildConfig
 from llama_stack.distribution.distribution import get_provider_registry
 from llama_stack.distribution.utils.exec import run_command
 from llama_stack.distribution.utils.image_types import LlamaStackImageType
+from llama_stack.log import get_logger
 from llama_stack.providers.datatypes import Api
 from llama_stack.templates.template import DistributionTemplate

-log = logging.getLogger(__name__)
+log = get_logger(name=__name__, category="core")

 # These are the dependencies needed by the distribution server.
 # `llama-stack` is automatically installed by the installation script.
--- a/llama_stack/distribution/configure.py
+++ b/llama_stack/distribution/configure.py
@ -3,7 +3,6 @@
 #
 # This source code is licensed under the terms described in the LICENSE file in
 # the root directory of this source tree.
-import logging
 import textwrap
 from typing import Any

@ -21,9 +20,10 @@ from llama_stack.distribution.stack import cast_image_name_to_string, replace_en
 from llama_stack.distribution.utils.config_dirs import EXTERNAL_PROVIDERS_DIR
 from llama_stack.distribution.utils.dynamic import instantiate_class_type
 from llama_stack.distribution.utils.prompt_for_config import prompt_for_config
+from llama_stack.log import get_logger
 from llama_stack.providers.datatypes import Api, ProviderSpec

-logger = logging.getLogger(__name__)
+logger = get_logger(name=__name__, category="core")


 def configure_single_provider(registry: dict[str, ProviderSpec], provider: Provider) -> Provider:
--- a/llama_stack/distribution/library_client.py
+++ b/llama_stack/distribution/library_client.py
@ -48,6 +48,7 @@ from llama_stack.distribution.stack import (
 from llama_stack.distribution.utils.config import redact_sensitive_fields
 from llama_stack.distribution.utils.context import preserve_contexts_async_generator
 from llama_stack.distribution.utils.exec import in_notebook
+from llama_stack.log import get_logger
 from llama_stack.providers.utils.telemetry.tracing import (
    CURRENT_TRACE_CONTEXT,
    end_trace,
@ -55,7 +56,7 @@ from llama_stack.providers.utils.telemetry.tracing import (
    start_trace,
 )

-logger = logging.getLogger(__name__)
+logger = get_logger(name=__name__, category="core")

 T = TypeVar("T")

--- a/llama_stack/distribution/request_headers.py
+++ b/llama_stack/distribution/request_headers.py
@ -6,15 +6,15 @@

 import contextvars
 import json
-import logging
 from contextlib import AbstractContextManager
 from typing import Any

 from llama_stack.distribution.datatypes import User
+from llama_stack.log import get_logger

 from .utils.dynamic import instantiate_class_type

-log = logging.getLogger(__name__)
+log = get_logger(name=__name__, category="core")

 # Context variable for request provider data and auth attributes
 PROVIDER_DATA_VAR = contextvars.ContextVar("provider_data", default=None)
--- a/llama_stack/distribution/server/server.py
+++ b/llama_stack/distribution/server/server.py
@ -9,7 +9,6 @@ import asyncio
 import functools
 import inspect
 import json
-import logging
 import os
 import ssl
 import sys
@ -245,7 +244,7 @@ def create_dynamic_typed_route(func: Any, method: str, route: str) -> Callable:
                        result.url = route
                    return result
            except Exception as e:
-                if logger.isEnabledFor(logging.DEBUG):
+                if logger.isEnabledFor(10):  # DEBUG level
                    logger.exception(f"Error executing endpoint {route=} {method=}")
                else:
                    logger.error(f"Error executing endpoint {route=} {method=}: {str(e)}")
--- a/llama_stack/distribution/utils/exec.py
+++ b/llama_stack/distribution/utils/exec.py
@ -4,7 +4,6 @@
 # This source code is licensed under the terms described in the LICENSE file in
 # the root directory of this source tree.

-import logging
 import os
 import signal
 import subprocess
@ -12,7 +11,9 @@ import sys

 from termcolor import cprint

-log = logging.getLogger(__name__)
+from llama_stack.log import get_logger
+
+log = get_logger(name=__name__, category="core")

 import importlib
 import json
--- a/llama_stack/distribution/utils/prompt_for_config.py
+++ b/llama_stack/distribution/utils/prompt_for_config.py
@ -6,7 +6,6 @@

 import inspect
 import json
-import logging
 from enum import Enum
 from typing import Annotated, Any, Literal, Union, get_args, get_origin

@ -14,7 +13,9 @@ from pydantic import BaseModel
 from pydantic.fields import FieldInfo
 from pydantic_core import PydanticUndefinedType

-log = logging.getLogger(__name__)
+from llama_stack.log import get_logger
+
+log = get_logger(name=__name__, category="core")


 def is_list_of_primitives(field_type):
--- a/llama_stack/models/llama/llama3/multimodal/encoder_utils.py
+++ b/llama_stack/models/llama/llama3/multimodal/encoder_utils.py
@ -13,14 +13,15 @@

 # Copyright (c) Meta Platforms, Inc. and its affiliates.
 import math
-from logging import getLogger

 import torch
 import torch.nn.functional as F

+from llama_stack.log import get_logger
+
 from .utils import get_negative_inf_value, to_2tuple

-logger = getLogger()
+logger = get_logger(name=__name__, category="core")


 def resize_local_position_embedding(orig_pos_embed, grid_size):
--- a/llama_stack/models/llama/llama3/multimodal/image_transform.py
+++ b/llama_stack/models/llama/llama3/multimodal/image_transform.py
@ -13,7 +13,6 @@

 import math
 from collections import defaultdict
-from logging import getLogger
 from typing import Any

 import torch
@ -21,9 +20,11 @@ import torchvision.transforms as tv
 from PIL import Image
 from torchvision.transforms import functional as F

+from llama_stack.log import get_logger
+
 IMAGE_RES = 224

-logger = getLogger()
+logger = get_logger(name=__name__, category="core")


 class VariableSizeImageTransform:
--- a/llama_stack/models/llama/llama3/multimodal/model.py
+++ b/llama_stack/models/llama/llama3/multimodal/model.py
@ -4,7 +4,6 @@
 # This source code is licensed under the terms described in the LICENSE file in
 # the root directory of this source tree.

-import logging
 import math
 from collections.abc import Callable
 from functools import partial
@ -22,6 +21,8 @@ from PIL import Image as PIL_Image
 from torch import Tensor, nn
 from torch.distributed import _functional_collectives as funcol

+from llama_stack.log import get_logger
+
 from ..model import ModelArgs, RMSNorm, apply_rotary_emb, precompute_freqs_cis
 from .encoder_utils import (
    build_encoder_attention_mask,
@ -34,7 +35,7 @@ from .encoder_utils import (
 from .image_transform import VariableSizeImageTransform
 from .utils import get_negative_inf_value, to_2tuple

-logger = logging.getLogger(__name__)
+logger = get_logger(name=__name__, category="core")
 MP_SCALE = 8


@ -771,7 +772,7 @@ class TilePositionEmbedding(nn.Module):
        if embed is not None:
            # reshape the weights to the correct shape
            nt_old, nt_old, _, w = embed.shape
-            logging.info(f"Resizing tile embedding from {nt_old}x{nt_old} to {self.num_tiles}x{self.num_tiles}")
+            logger.info(f"Resizing tile embedding from {nt_old}x{nt_old} to {self.num_tiles}x{self.num_tiles}")
            embed_new = TilePositionEmbedding._dynamic_resize(embed, self.num_tiles)
            # assign the weights to the module
            state_dict[prefix + "embedding"] = embed_new
--- a/llama_stack/models/llama/llama3/tokenizer.py
+++ b/llama_stack/models/llama/llama3/tokenizer.py
@ -5,7 +5,6 @@
 # the root directory of this source tree.

 from collections.abc import Collection, Iterator, Sequence, Set
-from logging import getLogger
 from pathlib import Path
 from typing import (
    Literal,
@ -14,9 +13,10 @@ from typing import (

 import tiktoken

+from llama_stack.log import get_logger
 from llama_stack.models.llama.tokenizer_utils import load_bpe_file

-logger = getLogger(__name__)
+logger = get_logger(name=__name__, category="core")


 # The tiktoken tokenizer can handle <=400k chars without
--- a/llama_stack/models/llama/llama4/quantization/loader.py
+++ b/llama_stack/models/llama/llama4/quantization/loader.py
@ -4,7 +4,6 @@
 # This source code is licensed under the terms described in the LICENSE file in
 # the root directory of this source tree.

-import logging
 import os
 from collections.abc import Callable

@ -13,11 +12,13 @@ from fairscale.nn.model_parallel.initialize import get_model_parallel_rank
 from torch import Tensor, nn
 from torch.nn import functional as F

+from llama_stack.log import get_logger
+
 from ...datatypes import QuantizationMode
 from ..model import Transformer, TransformerBlock
 from ..moe import MoE

-log = logging.getLogger(__name__)
+log = get_logger(name=__name__, category="core")


 def swiglu_wrapper_no_reduce(
--- a/llama_stack/models/llama/llama4/tokenizer.py
+++ b/llama_stack/models/llama/llama4/tokenizer.py
@ -5,7 +5,6 @@
 # the root directory of this source tree.

 from collections.abc import Collection, Iterator, Sequence, Set
-from logging import getLogger
 from pathlib import Path
 from typing import (
    Literal,
@ -14,9 +13,10 @@ from typing import (

 import tiktoken

+from llama_stack.log import get_logger
 from llama_stack.models.llama.tokenizer_utils import load_bpe_file

-logger = getLogger(__name__)
+logger = get_logger(name=__name__, category="core")


 # The tiktoken tokenizer can handle <=400k chars without
--- a/llama_stack/models/llama/quantize_impls.py
+++ b/llama_stack/models/llama/quantize_impls.py
@ -6,9 +6,10 @@

 # type: ignore
 import collections
-import logging

-log = logging.getLogger(__name__)
+from llama_stack.log import get_logger
+
+log = get_logger(name=__name__, category="core")

 try:
    import fbgemm_gpu.experimental.gen_ai  # noqa: F401
--- a/llama_stack/providers/inline/agents/meta_reference/agents.py
+++ b/llama_stack/providers/inline/agents/meta_reference/agents.py
@ -4,7 +4,6 @@
 # This source code is licensed under the terms described in the LICENSE file in
 # the root directory of this source tree.

-import logging
 import uuid
 from collections.abc import AsyncGenerator
 from datetime import UTC, datetime
@ -42,6 +41,7 @@ from llama_stack.apis.safety import Safety
 from llama_stack.apis.tools import ToolGroups, ToolRuntime
 from llama_stack.apis.vector_io import VectorIO
 from llama_stack.distribution.datatypes import AccessRule
+from llama_stack.log import get_logger
 from llama_stack.providers.utils.kvstore import InmemoryKVStoreImpl, kvstore_impl
 from llama_stack.providers.utils.pagination import paginate_records
 from llama_stack.providers.utils.responses.responses_store import ResponsesStore
@ -51,7 +51,7 @@ from .config import MetaReferenceAgentsImplConfig
 from .openai_responses import OpenAIResponsesImpl
 from .persistence import AgentInfo

-logger = logging.getLogger()
+logger = get_logger(name=__name__, category="core")


 class MetaReferenceAgentsImpl(Agents):
--- a/llama_stack/providers/inline/agents/meta_reference/persistence.py
+++ b/llama_stack/providers/inline/agents/meta_reference/persistence.py
@ -5,7 +5,6 @@
 # the root directory of this source tree.

 import json
-import logging
 import uuid
 from datetime import UTC, datetime

@ -14,9 +13,10 @@ from llama_stack.distribution.access_control.access_control import AccessDeniedE
 from llama_stack.distribution.access_control.datatypes import AccessRule
 from llama_stack.distribution.datatypes import User
 from llama_stack.distribution.request_headers import get_authenticated_user
+from llama_stack.log import get_logger
 from llama_stack.providers.utils.kvstore import KVStore

-log = logging.getLogger(__name__)
+log = get_logger(name=__name__, category="core")


 class AgentSessionInfo(Session):
--- a/llama_stack/providers/inline/agents/meta_reference/safety.py
+++ b/llama_stack/providers/inline/agents/meta_reference/safety.py
@ -5,13 +5,13 @@
 # the root directory of this source tree.

 import asyncio
-import logging

 from llama_stack.apis.inference import Message
 from llama_stack.apis.safety import Safety, SafetyViolation, ViolationLevel
+from llama_stack.log import get_logger
 from llama_stack.providers.utils.telemetry import tracing

-log = logging.getLogger(__name__)
+log = get_logger(name=__name__, category="core")


 class SafetyException(Exception):  # noqa: N818
--- a/llama_stack/providers/inline/inference/meta_reference/parallel_utils.py
+++ b/llama_stack/providers/inline/inference/meta_reference/parallel_utils.py
@ -12,7 +12,6 @@

 import copy
 import json
-import logging
 import multiprocessing
 import os
 import tempfile
@ -32,13 +31,14 @@ from fairscale.nn.model_parallel.initialize import (
 from pydantic import BaseModel, Field
 from torch.distributed.launcher.api import LaunchConfig, elastic_launch

+from llama_stack.log import get_logger
 from llama_stack.models.llama.datatypes import GenerationResult
 from llama_stack.providers.utils.inference.prompt_adapter import (
    ChatCompletionRequestWithRawContent,
    CompletionRequestWithRawContent,
 )

-log = logging.getLogger(__name__)
+log = get_logger(name=__name__, category="core")


 class ProcessingMessageName(str, Enum):
--- a/llama_stack/providers/inline/inference/sentence_transformers/sentence_transformers.py
+++ b/llama_stack/providers/inline/inference/sentence_transformers/sentence_transformers.py
@ -4,7 +4,6 @@
 # This source code is licensed under the terms described in the LICENSE file in
 # the root directory of this source tree.

-import logging
 from collections.abc import AsyncGenerator

 from llama_stack.apis.inference import (
@ -20,6 +19,7 @@ from llama_stack.apis.inference import (
    ToolDefinition,
    ToolPromptFormat,
 )
+from llama_stack.log import get_logger
 from llama_stack.providers.datatypes import Model, ModelsProtocolPrivate
 from llama_stack.providers.utils.inference.embedding_mixin import (
    SentenceTransformerEmbeddingMixin,
@ -31,7 +31,7 @@ from llama_stack.providers.utils.inference.openai_compat import (

 from .config import SentenceTransformersInferenceConfig

-log = logging.getLogger(__name__)
+log = get_logger(name=__name__, category="core")


 class SentenceTransformersInferenceImpl(
--- a/llama_stack/providers/inline/post_training/huggingface/recipes/finetune_single_device.py
+++ b/llama_stack/providers/inline/post_training/huggingface/recipes/finetune_single_device.py
@ -6,7 +6,6 @@

 import gc
 import json
-import logging
 import multiprocessing
 import os
 import signal
@ -17,6 +16,7 @@ from typing import Any

 import psutil

+from llama_stack.log import get_logger
 from llama_stack.providers.inline.post_training.common.utils import evacuate_model_from_device

 # Set tokenizer parallelism environment variable
@ -48,7 +48,7 @@ from llama_stack.apis.post_training import (

 from ..config import HuggingFacePostTrainingConfig

-logger = logging.getLogger(__name__)
+logger = get_logger(name=__name__, category="core")


 def get_gb(to_convert: int) -> str:
--- a/llama_stack/providers/inline/post_training/torchtune/recipes/lora_finetuning_single_device.py
+++ b/llama_stack/providers/inline/post_training/torchtune/recipes/lora_finetuning_single_device.py
@ -4,7 +4,6 @@
 # This source code is licensed under the terms described in the LICENSE file in
 # the root directory of this source tree.

-import logging
 import os
 import time
 from datetime import UTC, datetime
@ -45,6 +44,7 @@ from llama_stack.apis.post_training import (
 )
 from llama_stack.distribution.utils.config_dirs import DEFAULT_CHECKPOINT_DIR
 from llama_stack.distribution.utils.model_utils import model_local_dir
+from llama_stack.log import get_logger
 from llama_stack.models.llama.sku_list import resolve_model
 from llama_stack.providers.inline.post_training.common.utils import evacuate_model_from_device
 from llama_stack.providers.inline.post_training.torchtune.common import utils
@ -56,7 +56,7 @@ from llama_stack.providers.inline.post_training.torchtune.config import (
 )
 from llama_stack.providers.inline.post_training.torchtune.datasets.sft import SFTDataset

-log = logging.getLogger(__name__)
+log = get_logger(name=__name__, category="core")

 from torchtune.models.llama3._tokenizer import Llama3Tokenizer

--- a/llama_stack/providers/inline/safety/code_scanner/code_scanner.py
+++ b/llama_stack/providers/inline/safety/code_scanner/code_scanner.py
@ -4,7 +4,6 @@
 # This source code is licensed under the terms described in the LICENSE file in
 # the root directory of this source tree.

-import logging
 from typing import Any

 from llama_stack.apis.inference import Message
@ -15,13 +14,14 @@ from llama_stack.apis.safety import (
    ViolationLevel,
 )
 from llama_stack.apis.shields import Shield
+from llama_stack.log import get_logger
 from llama_stack.providers.utils.inference.prompt_adapter import (
    interleaved_content_as_str,
 )

 from .config import CodeScannerConfig

-log = logging.getLogger(__name__)
+log = get_logger(name=__name__, category="core")

 ALLOWED_CODE_SCANNER_MODEL_IDS = [
    "CodeScanner",
--- a/llama_stack/providers/inline/safety/prompt_guard/prompt_guard.py
+++ b/llama_stack/providers/inline/safety/prompt_guard/prompt_guard.py
@ -4,7 +4,6 @@
 # This source code is licensed under the terms described in the LICENSE file in
 # the root directory of this source tree.

-import logging
 from typing import Any

 import torch
@ -19,6 +18,7 @@ from llama_stack.apis.safety import (
 )
 from llama_stack.apis.shields import Shield
 from llama_stack.distribution.utils.model_utils import model_local_dir
+from llama_stack.log import get_logger
 from llama_stack.providers.datatypes import ShieldsProtocolPrivate
 from llama_stack.providers.utils.inference.prompt_adapter import (
    interleaved_content_as_str,
@ -26,7 +26,7 @@ from llama_stack.providers.utils.inference.prompt_adapter import (

 from .config import PromptGuardConfig, PromptGuardType

-log = logging.getLogger(__name__)
+log = get_logger(name=__name__, category="core")

 PROMPT_GUARD_MODEL = "Prompt-Guard-86M"

--- a/llama_stack/providers/inline/scoring/basic/utils/ifeval_utils.py
+++ b/llama_stack/providers/inline/scoring/basic/utils/ifeval_utils.py
@ -7,7 +7,6 @@
 import collections
 import functools
 import json
-import logging
 import random
 import re
 import string
@ -20,7 +19,9 @@ import nltk
 from pythainlp.tokenize import sent_tokenize as sent_tokenize_thai
 from pythainlp.tokenize import word_tokenize as word_tokenize_thai

-logger = logging.getLogger()
+from llama_stack.log import get_logger
+
+logger = get_logger(name=__name__, category="core")

 WORD_LIST = [
    "western",
--- a/llama_stack/providers/inline/tool_runtime/rag/memory.py
+++ b/llama_stack/providers/inline/tool_runtime/rag/memory.py
@ -5,7 +5,6 @@
 # the root directory of this source tree.

 import asyncio
-import logging
 import secrets
 import string
 from typing import Any
@ -32,6 +31,7 @@ from llama_stack.apis.tools import (
    ToolRuntime,
 )
 from llama_stack.apis.vector_io import QueryChunksResponse, VectorIO
+from llama_stack.log import get_logger
 from llama_stack.providers.datatypes import ToolGroupsProtocolPrivate
 from llama_stack.providers.utils.inference.prompt_adapter import interleaved_content_as_str
 from llama_stack.providers.utils.memory.vector_store import (
@ -42,7 +42,7 @@ from llama_stack.providers.utils.memory.vector_store import (
 from .config import RagToolRuntimeConfig
 from .context_retriever import generate_rag_query

-log = logging.getLogger(__name__)
+log = get_logger(name=__name__, category="core")


 def make_random_string(length: int = 8):
--- a/llama_stack/providers/inline/vector_io/faiss/faiss.py
+++ b/llama_stack/providers/inline/vector_io/faiss/faiss.py
@ -8,7 +8,6 @@ import asyncio
 import base64
 import io
 import json
-import logging
 from typing import Any

 import faiss
@ -23,6 +22,7 @@ from llama_stack.apis.vector_io import (
    QueryChunksResponse,
    VectorIO,
 )
+from llama_stack.log import get_logger
 from llama_stack.providers.datatypes import (
    HealthResponse,
    HealthStatus,
@ -38,7 +38,7 @@ from llama_stack.providers.utils.memory.vector_store import (

 from .config import FaissVectorIOConfig

-logger = logging.getLogger(__name__)
+logger = get_logger(name=__name__, category="core")

 VERSION = "v3"
 VECTOR_DBS_PREFIX = f"vector_dbs:{VERSION}::"
--- a/llama_stack/providers/inline/vector_io/sqlite_vec/sqlite_vec.py
+++ b/llama_stack/providers/inline/vector_io/sqlite_vec/sqlite_vec.py
@ -5,7 +5,6 @@
 # the root directory of this source tree.

 import asyncio
-import logging
 import re
 import sqlite3
 import struct
@ -23,6 +22,7 @@ from llama_stack.apis.vector_io import (
    QueryChunksResponse,
    VectorIO,
 )
+from llama_stack.log import get_logger
 from llama_stack.providers.datatypes import VectorDBsProtocolPrivate
 from llama_stack.providers.utils.kvstore import kvstore_impl
 from llama_stack.providers.utils.kvstore.api import KVStore
@ -34,7 +34,7 @@ from llama_stack.providers.utils.memory.vector_store import (
    VectorDBWithIndex,
 )

-logger = logging.getLogger(__name__)
+logger = get_logger(name=__name__, category="core")

 # Specifying search mode is dependent on the VectorIO provider.
 VECTOR_SEARCH = "vector"
--- a/llama_stack/providers/remote/inference/llama_openai_compat/llama.py
+++ b/llama_stack/providers/remote/inference/llama_openai_compat/llama.py
@ -3,15 +3,14 @@
 #
 # This source code is licensed under the terms described in the LICENSE file in
 # the root directory of this source tree.
-import logging
-
+from llama_stack.log import get_logger
 from llama_stack.providers.remote.inference.llama_openai_compat.config import LlamaCompatConfig
 from llama_stack.providers.utils.inference.litellm_openai_mixin import LiteLLMOpenAIMixin
 from llama_stack.providers.utils.inference.openai_mixin import OpenAIMixin

 from .models import MODEL_ENTRIES

-logger = logging.getLogger(__name__)
+logger = get_logger(name=__name__, category="core")


 class LlamaCompatInferenceAdapter(OpenAIMixin, LiteLLMOpenAIMixin):
--- a/llama_stack/providers/remote/inference/nvidia/nvidia.py
+++ b/llama_stack/providers/remote/inference/nvidia/nvidia.py
@ -4,7 +4,6 @@
 # This source code is licensed under the terms described in the LICENSE file in
 # the root directory of this source tree.

-import logging
 import warnings
 from collections.abc import AsyncIterator

@ -33,6 +32,7 @@ from llama_stack.apis.inference import (
    ToolChoice,
    ToolConfig,
 )
+from llama_stack.log import get_logger
 from llama_stack.models.llama.datatypes import ToolDefinition, ToolPromptFormat
 from llama_stack.providers.utils.inference.model_registry import (
    ModelRegistryHelper,
@ -54,7 +54,7 @@ from .openai_utils import (
 )
 from .utils import _is_nvidia_hosted

-logger = logging.getLogger(__name__)
+logger = get_logger(name=__name__, category="core")


 class NVIDIAInferenceAdapter(OpenAIMixin, Inference, ModelRegistryHelper):
--- a/llama_stack/providers/remote/inference/nvidia/utils.py
+++ b/llama_stack/providers/remote/inference/nvidia/utils.py
@ -4,13 +4,13 @@
 # This source code is licensed under the terms described in the LICENSE file in
 # the root directory of this source tree.

-import logging
-
 import httpx

+from llama_stack.log import get_logger
+
 from . import NVIDIAConfig

-logger = logging.getLogger(__name__)
+logger = get_logger(name=__name__, category="core")


 def _is_nvidia_hosted(config: NVIDIAConfig) -> bool:
--- a/llama_stack/providers/remote/inference/openai/openai.py
+++ b/llama_stack/providers/remote/inference/openai/openai.py
@ -4,15 +4,14 @@
 # This source code is licensed under the terms described in the LICENSE file in
 # the root directory of this source tree.

-import logging
-
+from llama_stack.log import get_logger
 from llama_stack.providers.utils.inference.litellm_openai_mixin import LiteLLMOpenAIMixin
 from llama_stack.providers.utils.inference.openai_mixin import OpenAIMixin

 from .config import OpenAIConfig
 from .models import MODEL_ENTRIES

-logger = logging.getLogger(__name__)
+logger = get_logger(name=__name__, category="core")


 #
--- a/llama_stack/providers/remote/inference/tgi/tgi.py
+++ b/llama_stack/providers/remote/inference/tgi/tgi.py
@ -5,7 +5,6 @@
 # the root directory of this source tree.


-import logging
 from collections.abc import AsyncGenerator

 from huggingface_hub import AsyncInferenceClient, HfApi
@ -34,6 +33,7 @@ from llama_stack.apis.inference import (
    ToolPromptFormat,
 )
 from llama_stack.apis.models import Model
+from llama_stack.log import get_logger
 from llama_stack.models.llama.sku_list import all_registered_models
 from llama_stack.providers.datatypes import ModelsProtocolPrivate
 from llama_stack.providers.utils.inference.model_registry import (
@ -58,7 +58,7 @@ from llama_stack.providers.utils.inference.prompt_adapter import (

 from .config import InferenceAPIImplConfig, InferenceEndpointImplConfig, TGIImplConfig

-log = logging.getLogger(__name__)
+log = get_logger(name=__name__, category="core")


 def build_hf_repo_model_entries():
--- a/llama_stack/providers/remote/post_training/nvidia/utils.py
+++ b/llama_stack/providers/remote/post_training/nvidia/utils.py
@ -4,18 +4,18 @@
 # This source code is licensed under the terms described in the LICENSE file in
 # the root directory of this source tree.

-import logging
 import warnings
 from typing import Any

 from pydantic import BaseModel

 from llama_stack.apis.post_training import TrainingConfig
+from llama_stack.log import get_logger
 from llama_stack.providers.remote.post_training.nvidia.config import SFTLoRADefaultConfig

 from .config import NvidiaPostTrainingConfig

-logger = logging.getLogger(__name__)
+logger = get_logger(name=__name__, category="core")


 def warn_unsupported_params(config_dict: Any, supported_keys: set[str], config_name: str) -> None:
--- a/llama_stack/providers/remote/safety/bedrock/bedrock.py
+++ b/llama_stack/providers/remote/safety/bedrock/bedrock.py
@ -5,7 +5,6 @@
 # the root directory of this source tree.

 import json
-import logging
 from typing import Any

 from llama_stack.apis.inference import Message
@ -16,12 +15,13 @@ from llama_stack.apis.safety import (
    ViolationLevel,
 )
 from llama_stack.apis.shields import Shield
+from llama_stack.log import get_logger
 from llama_stack.providers.datatypes import ShieldsProtocolPrivate
 from llama_stack.providers.utils.bedrock.client import create_bedrock_client

 from .config import BedrockSafetyConfig

-logger = logging.getLogger(__name__)
+logger = get_logger(name=__name__, category="core")


 class BedrockSafetyAdapter(Safety, ShieldsProtocolPrivate):
--- a/llama_stack/providers/remote/safety/nvidia/nvidia.py
+++ b/llama_stack/providers/remote/safety/nvidia/nvidia.py
@ -4,7 +4,6 @@
 # This source code is licensed under the terms described in the LICENSE file in
 # the root directory of this source tree.

-import logging
 from typing import Any

 import requests
@ -12,12 +11,13 @@ import requests
 from llama_stack.apis.inference import Message
 from llama_stack.apis.safety import RunShieldResponse, Safety, SafetyViolation, ViolationLevel
 from llama_stack.apis.shields import Shield
+from llama_stack.log import get_logger
 from llama_stack.providers.datatypes import ShieldsProtocolPrivate
 from llama_stack.providers.utils.inference.openai_compat import convert_message_to_openai_dict_new

 from .config import NVIDIASafetyConfig

-logger = logging.getLogger(__name__)
+logger = get_logger(name=__name__, category="core")


 class NVIDIASafetyAdapter(Safety, ShieldsProtocolPrivate):
--- a/llama_stack/providers/remote/safety/sambanova/sambanova.py
+++ b/llama_stack/providers/remote/safety/sambanova/sambanova.py
@ -5,7 +5,6 @@
 # the root directory of this source tree.

 import json
-import logging
 from typing import Any

 import litellm
@ -20,12 +19,13 @@ from llama_stack.apis.safety import (
 )
 from llama_stack.apis.shields import Shield
 from llama_stack.distribution.request_headers import NeedsRequestProviderData
+from llama_stack.log import get_logger
 from llama_stack.providers.datatypes import ShieldsProtocolPrivate
 from llama_stack.providers.utils.inference.openai_compat import convert_message_to_openai_dict_new

 from .config import SambaNovaSafetyConfig

-logger = logging.getLogger(__name__)
+logger = get_logger(name=__name__, category="core")

 CANNED_RESPONSE_TEXT = "I can't answer that. Can I help with something else?"

--- a/llama_stack/providers/remote/vector_io/chroma/chroma.py
+++ b/llama_stack/providers/remote/vector_io/chroma/chroma.py
@ -5,7 +5,6 @@
 # the root directory of this source tree.
 import asyncio
 import json
-import logging
 from typing import Any
 from urllib.parse import urlparse

@ -20,6 +19,7 @@ from llama_stack.apis.vector_io import (
    QueryChunksResponse,
    VectorIO,
 )
+from llama_stack.log import get_logger
 from llama_stack.providers.datatypes import Api, VectorDBsProtocolPrivate
 from llama_stack.providers.inline.vector_io.chroma import ChromaVectorIOConfig as InlineChromaVectorIOConfig
 from llama_stack.providers.utils.kvstore import kvstore_impl
@ -32,7 +32,7 @@ from llama_stack.providers.utils.memory.vector_store import (

 from .config import ChromaVectorIOConfig as RemoteChromaVectorIOConfig

-log = logging.getLogger(__name__)
+log = get_logger(name=__name__, category="core")

 ChromaClientType = chromadb.api.AsyncClientAPI | chromadb.api.ClientAPI

--- a/llama_stack/providers/remote/vector_io/milvus/milvus.py
+++ b/llama_stack/providers/remote/vector_io/milvus/milvus.py
@ -5,7 +5,6 @@
 # the root directory of this source tree.

 import asyncio
-import logging
 import os
 import re
 from typing import Any
@ -21,6 +20,7 @@ from llama_stack.apis.vector_io import (
    QueryChunksResponse,
    VectorIO,
 )
+from llama_stack.log import get_logger
 from llama_stack.providers.datatypes import VectorDBsProtocolPrivate
 from llama_stack.providers.inline.vector_io.milvus import MilvusVectorIOConfig as InlineMilvusVectorIOConfig
 from llama_stack.providers.utils.kvstore import kvstore_impl
@ -33,7 +33,7 @@ from llama_stack.providers.utils.memory.vector_store import (

 from .config import MilvusVectorIOConfig as RemoteMilvusVectorIOConfig

-logger = logging.getLogger(__name__)
+logger = get_logger(name=__name__, category="core")

 VERSION = "v3"
 VECTOR_DBS_PREFIX = f"vector_dbs:milvus:{VERSION}::"
--- a/llama_stack/providers/remote/vector_io/pgvector/pgvector.py
+++ b/llama_stack/providers/remote/vector_io/pgvector/pgvector.py
@ -4,7 +4,6 @@
 # This source code is licensed under the terms described in the LICENSE file in
 # the root directory of this source tree.

-import logging
 from typing import Any

 import psycopg2
@ -21,6 +20,7 @@ from llama_stack.apis.vector_io import (
    QueryChunksResponse,
    VectorIO,
 )
+from llama_stack.log import get_logger
 from llama_stack.providers.datatypes import Api, VectorDBsProtocolPrivate
 from llama_stack.providers.utils.kvstore import kvstore_impl
 from llama_stack.providers.utils.kvstore.api import KVStore
@ -32,7 +32,7 @@ from llama_stack.providers.utils.memory.vector_store import (

 from .config import PGVectorVectorIOConfig

-log = logging.getLogger(__name__)
+log = get_logger(name=__name__, category="core")

 VERSION = "v3"
 VECTOR_DBS_PREFIX = f"vector_dbs:pgvector:{VERSION}::"
--- a/llama_stack/providers/remote/vector_io/qdrant/qdrant.py
+++ b/llama_stack/providers/remote/vector_io/qdrant/qdrant.py
@ -4,7 +4,6 @@
 # This source code is licensed under the terms described in the LICENSE file in
 # the root directory of this source tree.

-import logging
 import uuid
 from typing import Any

@ -29,6 +28,7 @@ from llama_stack.apis.vector_io import (
    VectorStoreObject,
    VectorStoreSearchResponsePage,
 )
+from llama_stack.log import get_logger
 from llama_stack.providers.datatypes import Api, VectorDBsProtocolPrivate
 from llama_stack.providers.inline.vector_io.qdrant import QdrantVectorIOConfig as InlineQdrantVectorIOConfig
 from llama_stack.providers.utils.memory.vector_store import (
@ -38,7 +38,7 @@ from llama_stack.providers.utils.memory.vector_store import (

 from .config import QdrantVectorIOConfig as RemoteQdrantVectorIOConfig

-log = logging.getLogger(__name__)
+log = get_logger(name=__name__, category="core")
 CHUNK_ID_KEY = "_chunk_id"


--- a/llama_stack/providers/remote/vector_io/weaviate/weaviate.py
+++ b/llama_stack/providers/remote/vector_io/weaviate/weaviate.py
@ -4,7 +4,6 @@
 # This source code is licensed under the terms described in the LICENSE file in
 # the root directory of this source tree.
 import json
-import logging
 from typing import Any

 import weaviate
@ -18,6 +17,7 @@ from llama_stack.apis.files.files import Files
 from llama_stack.apis.vector_dbs import VectorDB
 from llama_stack.apis.vector_io import Chunk, QueryChunksResponse, VectorIO
 from llama_stack.distribution.request_headers import NeedsRequestProviderData
+from llama_stack.log import get_logger
 from llama_stack.providers.datatypes import Api, VectorDBsProtocolPrivate
 from llama_stack.providers.utils.kvstore import kvstore_impl
 from llama_stack.providers.utils.kvstore.api import KVStore
@ -28,7 +28,7 @@ from llama_stack.providers.utils.memory.vector_store import (

 from .config import WeaviateRequestProviderData, WeaviateVectorIOConfig

-log = logging.getLogger(__name__)
+log = get_logger(name=__name__, category="core")

 VERSION = "v3"
 VECTOR_DBS_PREFIX = f"vector_dbs:weaviate:{VERSION}::"
--- a/llama_stack/providers/utils/inference/embedding_mixin.py
+++ b/llama_stack/providers/utils/inference/embedding_mixin.py
@ -5,10 +5,11 @@
 # the root directory of this source tree.

 import base64
-import logging
 import struct
 from typing import TYPE_CHECKING

+from llama_stack.log import get_logger
+
 if TYPE_CHECKING:
    from sentence_transformers import SentenceTransformer

@ -27,7 +28,7 @@ from llama_stack.providers.utils.inference.prompt_adapter import interleaved_con
 EMBEDDING_MODELS = {}


-log = logging.getLogger(__name__)
+log = get_logger(name=__name__, category="core")


 class SentenceTransformerEmbeddingMixin:
--- a/llama_stack/providers/utils/inference/openai_compat.py
+++ b/llama_stack/providers/utils/inference/openai_compat.py
@ -5,7 +5,6 @@
 # the root directory of this source tree.
 import base64
 import json
-import logging
 import struct
 import time
 import uuid
@ -116,6 +115,7 @@ from llama_stack.apis.inference import (
 from llama_stack.apis.inference import (
    OpenAIChoice as OpenAIChatCompletionChoice,
 )
+from llama_stack.log import get_logger
 from llama_stack.models.llama.datatypes import (
    BuiltinTool,
    StopReason,
@ -128,7 +128,7 @@ from llama_stack.providers.utils.inference.prompt_adapter import (
    decode_assistant_message,
 )

-logger = logging.getLogger(__name__)
+logger = get_logger(name=__name__, category="core")


 class OpenAICompatCompletionChoiceDelta(BaseModel):
--- a/llama_stack/providers/utils/kvstore/mongodb/mongodb.py
+++ b/llama_stack/providers/utils/kvstore/mongodb/mongodb.py
@ -4,16 +4,16 @@
 # This source code is licensed under the terms described in the LICENSE file in
 # the root directory of this source tree.

-import logging
 from datetime import datetime

 from pymongo import AsyncMongoClient

+from llama_stack.log import get_logger
 from llama_stack.providers.utils.kvstore import KVStore

 from ..config import MongoDBKVStoreConfig

-log = logging.getLogger(__name__)
+log = get_logger(name=__name__, category="core")


 class MongoDBKVStoreImpl(KVStore):
--- a/llama_stack/providers/utils/kvstore/postgres/postgres.py
+++ b/llama_stack/providers/utils/kvstore/postgres/postgres.py
@ -4,16 +4,17 @@
 # This source code is licensed under the terms described in the LICENSE file in
 # the root directory of this source tree.

-import logging
 from datetime import datetime

 import psycopg2
 from psycopg2.extras import DictCursor

+from llama_stack.log import get_logger
+
 from ..api import KVStore
 from ..config import PostgresKVStoreConfig

-log = logging.getLogger(__name__)
+log = get_logger(name=__name__, category="core")


 class PostgresKVStoreImpl(KVStore):
--- a/llama_stack/providers/utils/memory/openai_vector_store_mixin.py
+++ b/llama_stack/providers/utils/memory/openai_vector_store_mixin.py
@ -6,7 +6,6 @@

 import asyncio
 import json
-import logging
 import mimetypes
 import time
 import uuid
@ -36,10 +35,11 @@ from llama_stack.apis.vector_io import (
    VectorStoreSearchResponse,
    VectorStoreSearchResponsePage,
 )
+from llama_stack.log import get_logger
 from llama_stack.providers.utils.kvstore.api import KVStore
 from llama_stack.providers.utils.memory.vector_store import content_from_data_and_mime_type, make_overlapped_chunks

-logger = logging.getLogger(__name__)
+logger = get_logger(name=__name__, category="core")

 # Constants for OpenAI vector stores
 CHUNK_MULTIPLIER = 5
--- a/llama_stack/providers/utils/memory/vector_store.py
+++ b/llama_stack/providers/utils/memory/vector_store.py
@ -5,7 +5,6 @@
 # the root directory of this source tree.
 import base64
 import io
-import logging
 import re
 import time
 from abc import ABC, abstractmethod
@ -25,6 +24,7 @@ from llama_stack.apis.common.content_types import (
 from llama_stack.apis.tools import RAGDocument
 from llama_stack.apis.vector_dbs import VectorDB
 from llama_stack.apis.vector_io import Chunk, ChunkMetadata, QueryChunksResponse
+from llama_stack.log import get_logger
 from llama_stack.models.llama.llama3.tokenizer import Tokenizer
 from llama_stack.providers.datatypes import Api
 from llama_stack.providers.utils.inference.prompt_adapter import (
@ -32,7 +32,7 @@ from llama_stack.providers.utils.inference.prompt_adapter import (
 )
 from llama_stack.providers.utils.vector_io.chunk_utils import generate_chunk_id

-log = logging.getLogger(__name__)
+log = get_logger(name=__name__, category="core")

 # Constants for reranker types
 RERANKER_TYPE_RRF = "rrf"
--- a/scripts/check-logger-usage.py
+++ b/scripts/check-logger-usage.py
@ -0,0 +1,194 @@
+#!/usr/bin/env python3
+# Copyright (c) Meta Platforms, Inc. and affiliates.
+# All rights reserved.
+#
+# This source code is licensed under the terms described in the LICENSE file in
+# the root directory of this source tree.
+
+"""
+Check for improper logger usage in Python files.
+
+This script enforces the use of the custom logger implementation:
+    from llama_stack.log import get_logger
+    logger = get_logger(name=__name__, category="core")
+
+Instead of the standard logging module:
+    import logging
+
+Certain files are excluded where import logging is necessary.
+"""
+
+import argparse
+import ast
+import sys
+from pathlib import Path
+
+# Files where import logging is allowed (relative to project root)
+ALLOWED_LOGGING_IMPORTS = {
+    "llama_stack/log.py",  # The logger implementation itself needs logging
+    "log.py",  # When running from within llama_stack directory
+    "llama_stack/providers/utils/telemetry/tracing.py",  # Telemetry handler needs logging classes
+    "providers/utils/telemetry/tracing.py",  # When running from llama_stack directory
+    "tracing.py",  # When running from providers/utils/telemetry directory
+}
+
+# Additional patterns for files that may legitimately need logging
+ALLOWED_PATTERNS = {
+    # Test files might need to directly control logging for testing
+    "tests/",
+    # Third-party integration code might need direct logging access
+    "llama_stack/providers/remote/",
+    # Some model implementations might need direct logging control
+    "llama_stack/models/",
+    # Distribution/build scripts might need direct logging
+    "llama_stack/distribution/build.py",
+    "llama_stack/distribution/configure.py",
+    "llama_stack/distribution/library_client.py",
+    "llama_stack/distribution/request_headers.py",
+    "llama_stack/distribution/server/server.py",
+    "llama_stack/distribution/utils/",
+    # Distribution files when run from llama_stack directory
+    "distribution/build.py",
+    "distribution/configure.py",
+    "distribution/library_client.py",
+    "distribution/request_headers.py",
+    "distribution/server/server.py",
+    "distribution/utils/",
+    # Inline providers might need direct logging control
+    "llama_stack/providers/inline/",
+    "providers/inline/",
+    # Provider utilities might need direct logging
+    "llama_stack/providers/utils/",
+    "providers/utils/",
+}
+
+
+def is_file_excluded(file_path: str) -> bool:
+    """Check if a file is excluded from the logging import check."""
+    # Check exact file matches
+    if file_path in ALLOWED_LOGGING_IMPORTS:
+        return True
+
+    # Check pattern matches
+    for pattern in ALLOWED_PATTERNS:
+        if file_path.startswith(pattern):
+            return True
+
+    return False
+
+
+def find_logging_imports(file_path: Path) -> list[int]:
+    """
+    Find line numbers where 'import logging' is used in a Python file.
+
+    Returns:
+        List of line numbers where import logging is found.
+    """
+    try:
+        with open(file_path, encoding="utf-8") as f:
+            content = f.read()
+
+        try:
+            tree = ast.parse(content)
+        except SyntaxError:
+            # Skip files with syntax errors (might be templates or broken files)
+            return []
+
+        logging_imports = []
+
+        for node in ast.walk(tree):
+            if isinstance(node, ast.Import):
+                for alias in node.names:
+                    if alias.name == "logging":
+                        logging_imports.append(node.lineno)
+            elif isinstance(node, ast.ImportFrom):
+                if node.module == "logging":
+                    logging_imports.append(node.lineno)
+
+        return logging_imports
+    except (OSError, UnicodeDecodeError):
+        # Skip files that can't be read
+        return []
+
+
+def check_directory(directory: Path) -> int:
+    """
+    Check all Python files in a directory for improper logging imports.
+
+    Returns:
+        Number of violations found.
+    """
+    violations = 0
+
+    # Find all Python files
+    python_files = directory.rglob("*.py")
+
+    for py_file in python_files:
+        # Get relative path for checking against exclusions
+        try:
+            relative_path = str(py_file.relative_to(directory))
+        except ValueError:
+            # File is not under the directory (shouldn't happen with rglob)
+            continue
+
+        # Skip excluded files
+        if is_file_excluded(relative_path):
+            continue
+
+        # Check for logging imports
+        logging_lines = find_logging_imports(py_file)
+
+        if logging_lines:
+            violations += 1
+            # Format for GitHub Actions annotations for each logger violation
+            for line_num in logging_lines:
+                title = "Improper logger usage"
+                message = (
+                    f"File '{relative_path}' uses improper logger. "
+                    "Use the custom logger instead: "
+                    "from llama_stack.log import get_logger; "
+                    'logger = get_logger(name=__name__, category="core")'
+                )
+                print(f"::error title={title},file={relative_path},line={line_num}::{message}")
+
+    return violations
+
+
+def main():
+    parser = argparse.ArgumentParser(description="Check for improper logger usage")
+    parser.add_argument("directory", nargs="?", default="llama_stack", help="Directory to check (default: llama_stack)")
+
+    args = parser.parse_args()
+
+    # Convert to Path object
+    check_dir = Path(args.directory)
+
+    if not check_dir.exists():
+        print(f"ERROR: Directory '{check_dir}' does not exist", file=sys.stderr)
+        return 1
+
+    if not check_dir.is_dir():
+        print(f"ERROR: '{check_dir}' is not a directory", file=sys.stderr)
+        return 1
+
+    # Perform the check
+    violations = check_directory(check_dir)
+
+    if violations > 0:
+        print(f"Found {violations} file(s) with improper logger usage.")
+        print()
+        print("To fix these issues:")
+        print("   1. Replace 'import logging' with 'from llama_stack.log import get_logger'")
+        print(
+            "   2. Replace logger creation with 'logger = get_logger(name=__name__, category=\"appropriate_category\")'"
+        )
+        print("   3. Available categories: core, server, router, inference, agents, safety, eval, tools, client")
+        print()
+        return 1
+    else:
+        print("All files use proper logger implementation.")
+        return 0
+
+
+if __name__ == "__main__":
+    sys.exit(main())