impls -> inline, adapters -> remote (#381)

2025-12-03 18:00:36 +00:00 · 2024-11-06 14:54:05 -08:00 · 2024-11-06 14:54:05 -08:00 · 994732e2e0
commit 994732e2e0
parent b10e9f46bb
169 changed files with 106 additions and 105 deletions
--- a/llama_stack/providers/adapters/init.py
+++ b/llama_stack/providers/adapters/init.py
--- a/llama_stack/providers/inline/braintrust/scoring/init.py
+++ b/llama_stack/providers/inline/braintrust/scoring/init.py
--- a/llama_stack/providers/inline/braintrust/scoring/braintrust.py
+++ b/llama_stack/providers/inline/braintrust/scoring/braintrust.py
@ -16,7 +16,7 @@ from llama_stack.apis.datasets import *  # noqa: F403
 from autoevals.llm import Factuality
 from autoevals.ragas import AnswerCorrectness
 from llama_stack.providers.datatypes import ScoringFunctionsProtocolPrivate
-from llama_stack.providers.impls.meta_reference.scoring.scoring_fn.common import (
+from llama_stack.providers.inline.meta_reference.scoring.scoring_fn.common import (
    aggregate_average,
 )

--- a/llama_stack/providers/inline/braintrust/scoring/config.py
+++ b/llama_stack/providers/inline/braintrust/scoring/config.py
--- a/llama_stack/providers/inline/braintrust/scoring/scoring_fn/init.py
+++ b/llama_stack/providers/inline/braintrust/scoring/scoring_fn/init.py
--- a/llama_stack/providers/inline/braintrust/scoring/scoring_fn/fn_defs/init.py
+++ b/llama_stack/providers/inline/braintrust/scoring/scoring_fn/fn_defs/init.py
--- a/llama_stack/providers/inline/braintrust/scoring/scoring_fn/fn_defs/answer_correctness.py
+++ b/llama_stack/providers/inline/braintrust/scoring/scoring_fn/fn_defs/answer_correctness.py
--- a/llama_stack/providers/inline/braintrust/scoring/scoring_fn/fn_defs/factuality.py
+++ b/llama_stack/providers/inline/braintrust/scoring/scoring_fn/fn_defs/factuality.py
--- a/llama_stack/providers/inline/ios/inference/LocalInferenceImpl.xcodeproj/project.pbxproj
+++ b/llama_stack/providers/inline/ios/inference/LocalInferenceImpl.xcodeproj/project.pbxproj
--- a/llama_stack/providers/inline/ios/inference/LocalInferenceImpl.xcodeproj/project.xcworkspace/contents.xcworkspacedata
+++ b/llama_stack/providers/inline/ios/inference/LocalInferenceImpl.xcodeproj/project.xcworkspace/contents.xcworkspacedata
--- a/llama_stack/providers/inline/ios/inference/LocalInferenceImpl.xcodeproj/project.xcworkspace/xcshareddata/IDEWorkspaceChecks.plist
+++ b/llama_stack/providers/inline/ios/inference/LocalInferenceImpl.xcodeproj/project.xcworkspace/xcshareddata/IDEWorkspaceChecks.plist
--- a/llama_stack/providers/inline/ios/inference/LocalInferenceImpl/LocalInference.h
+++ b/llama_stack/providers/inline/ios/inference/LocalInferenceImpl/LocalInference.h
--- a/llama_stack/providers/inline/ios/inference/LocalInferenceImpl/LocalInference.swift
+++ b/llama_stack/providers/inline/ios/inference/LocalInferenceImpl/LocalInference.swift
--- a/llama_stack/providers/inline/ios/inference/LocalInferenceImpl/Parsing.swift
+++ b/llama_stack/providers/inline/ios/inference/LocalInferenceImpl/Parsing.swift
--- a/llama_stack/providers/inline/ios/inference/LocalInferenceImpl/PromptTemplate.swift
+++ b/llama_stack/providers/inline/ios/inference/LocalInferenceImpl/PromptTemplate.swift
--- a/llama_stack/providers/inline/ios/inference/LocalInferenceImpl/SystemPrompts.swift
+++ b/llama_stack/providers/inline/ios/inference/LocalInferenceImpl/SystemPrompts.swift
--- a/llama_stack/providers/inline/ios/inference/executorch
+++ b/llama_stack/providers/inline/ios/inference/executorch
--- a/llama_stack/providers/inline/meta_reference/init.py
+++ b/llama_stack/providers/inline/meta_reference/init.py
--- a/llama_stack/providers/inline/meta_reference/agents/init.py
+++ b/llama_stack/providers/inline/meta_reference/agents/init.py
--- a/llama_stack/providers/inline/meta_reference/agents/agent_instance.py
+++ b/llama_stack/providers/inline/meta_reference/agents/agent_instance.py
--- a/llama_stack/providers/inline/meta_reference/agents/agents.py
+++ b/llama_stack/providers/inline/meta_reference/agents/agents.py
--- a/llama_stack/providers/inline/meta_reference/agents/config.py
+++ b/llama_stack/providers/inline/meta_reference/agents/config.py
--- a/llama_stack/providers/inline/meta_reference/agents/persistence.py
+++ b/llama_stack/providers/inline/meta_reference/agents/persistence.py
--- a/llama_stack/providers/inline/meta_reference/agents/rag/init.py
+++ b/llama_stack/providers/inline/meta_reference/agents/rag/init.py
--- a/llama_stack/providers/inline/meta_reference/agents/rag/context_retriever.py
+++ b/llama_stack/providers/inline/meta_reference/agents/rag/context_retriever.py
--- a/llama_stack/providers/inline/meta_reference/agents/safety.py
+++ b/llama_stack/providers/inline/meta_reference/agents/safety.py
--- a/llama_stack/providers/inline/meta_reference/agents/tests/init.py
+++ b/llama_stack/providers/inline/meta_reference/agents/tests/init.py
--- a/llama_stack/providers/inline/meta_reference/agents/tests/code_execution.py
+++ b/llama_stack/providers/inline/meta_reference/agents/tests/code_execution.py
--- a/llama_stack/providers/inline/meta_reference/agents/tests/test_chat_agent.py
+++ b/llama_stack/providers/inline/meta_reference/agents/tests/test_chat_agent.py
--- a/llama_stack/providers/inline/meta_reference/agents/tools/init.py
+++ b/llama_stack/providers/inline/meta_reference/agents/tools/init.py
--- a/llama_stack/providers/inline/meta_reference/agents/tools/base.py
+++ b/llama_stack/providers/inline/meta_reference/agents/tools/base.py
--- a/llama_stack/providers/inline/meta_reference/agents/tools/builtin.py
+++ b/llama_stack/providers/inline/meta_reference/agents/tools/builtin.py
--- a/llama_stack/providers/inline/meta_reference/agents/tools/ipython_tool/init.py
+++ b/llama_stack/providers/inline/meta_reference/agents/tools/ipython_tool/init.py
--- a/llama_stack/providers/inline/meta_reference/agents/tools/ipython_tool/code_env_prefix.py
+++ b/llama_stack/providers/inline/meta_reference/agents/tools/ipython_tool/code_env_prefix.py
--- a/llama_stack/providers/inline/meta_reference/agents/tools/ipython_tool/code_execution.py
+++ b/llama_stack/providers/inline/meta_reference/agents/tools/ipython_tool/code_execution.py
--- a/llama_stack/providers/inline/meta_reference/agents/tools/ipython_tool/matplotlib_custom_backend.py
+++ b/llama_stack/providers/inline/meta_reference/agents/tools/ipython_tool/matplotlib_custom_backend.py
--- a/llama_stack/providers/inline/meta_reference/agents/tools/ipython_tool/utils.py
+++ b/llama_stack/providers/inline/meta_reference/agents/tools/ipython_tool/utils.py
--- a/llama_stack/providers/inline/meta_reference/agents/tools/safety.py
+++ b/llama_stack/providers/inline/meta_reference/agents/tools/safety.py
@ -9,7 +9,7 @@ from typing import List
 from llama_stack.apis.inference import Message
 from llama_stack.apis.safety import *  # noqa: F403

-from llama_stack.providers.impls.meta_reference.agents.safety import ShieldRunnerMixin
+from llama_stack.providers.inline.meta_reference.agents.safety import ShieldRunnerMixin

 from .builtin import BaseTool

--- a/llama_stack/providers/inline/meta_reference/codeshield/init.py
+++ b/llama_stack/providers/inline/meta_reference/codeshield/init.py
--- a/llama_stack/providers/inline/meta_reference/codeshield/code_scanner.py
+++ b/llama_stack/providers/inline/meta_reference/codeshield/code_scanner.py
--- a/llama_stack/providers/inline/meta_reference/codeshield/config.py
+++ b/llama_stack/providers/inline/meta_reference/codeshield/config.py
--- a/llama_stack/providers/inline/meta_reference/datasetio/init.py
+++ b/llama_stack/providers/inline/meta_reference/datasetio/init.py
--- a/llama_stack/providers/inline/meta_reference/datasetio/config.py
+++ b/llama_stack/providers/inline/meta_reference/datasetio/config.py
--- a/llama_stack/providers/inline/meta_reference/datasetio/datasetio.py
+++ b/llama_stack/providers/inline/meta_reference/datasetio/datasetio.py
--- a/llama_stack/providers/inline/meta_reference/eval/init.py
+++ b/llama_stack/providers/inline/meta_reference/eval/init.py
--- a/llama_stack/providers/inline/meta_reference/eval/config.py
+++ b/llama_stack/providers/inline/meta_reference/eval/config.py
--- a/llama_stack/providers/inline/meta_reference/eval/eval.py
+++ b/llama_stack/providers/inline/meta_reference/eval/eval.py
--- a/llama_stack/providers/inline/meta_reference/inference/init.py
+++ b/llama_stack/providers/inline/meta_reference/inference/init.py
--- a/llama_stack/providers/inline/meta_reference/inference/config.py
+++ b/llama_stack/providers/inline/meta_reference/inference/config.py
--- a/llama_stack/providers/inline/meta_reference/inference/generation.py
+++ b/llama_stack/providers/inline/meta_reference/inference/generation.py
--- a/llama_stack/providers/inline/meta_reference/inference/inference.py
+++ b/llama_stack/providers/inline/meta_reference/inference/inference.py
--- a/llama_stack/providers/inline/meta_reference/inference/model_parallel.py
+++ b/llama_stack/providers/inline/meta_reference/inference/model_parallel.py
--- a/llama_stack/providers/inline/meta_reference/inference/parallel_utils.py
+++ b/llama_stack/providers/inline/meta_reference/inference/parallel_utils.py
--- a/llama_stack/providers/inline/meta_reference/inference/quantization/init.py
+++ b/llama_stack/providers/inline/meta_reference/inference/quantization/init.py
--- a/llama_stack/providers/inline/meta_reference/inference/quantization/fp8_impls.py
+++ b/llama_stack/providers/inline/meta_reference/inference/quantization/fp8_impls.py
--- a/llama_stack/providers/inline/meta_reference/inference/quantization/fp8_txest_disabled.py
+++ b/llama_stack/providers/inline/meta_reference/inference/quantization/fp8_txest_disabled.py
--- a/llama_stack/providers/inline/meta_reference/inference/quantization/hadamard_utils.py
+++ b/llama_stack/providers/inline/meta_reference/inference/quantization/hadamard_utils.py
--- a/llama_stack/providers/inline/meta_reference/inference/quantization/loader.py
+++ b/llama_stack/providers/inline/meta_reference/inference/quantization/loader.py
@ -27,7 +27,7 @@ from torchao.quantization.GPTQ import Int8DynActInt4WeightLinear

 from llama_stack.apis.inference import QuantizationType

-from llama_stack.providers.impls.meta_reference.inference.config import (
+from llama_stack.providers.inline.meta_reference.inference.config import (
    MetaReferenceQuantizedInferenceConfig,
 )

--- a/llama_stack/providers/inline/meta_reference/inference/quantization/scripts/init.py
+++ b/llama_stack/providers/inline/meta_reference/inference/quantization/scripts/init.py
--- a/llama_stack/providers/inline/meta_reference/inference/quantization/scripts/build_conda.sh
+++ b/llama_stack/providers/inline/meta_reference/inference/quantization/scripts/build_conda.sh
--- a/llama_stack/providers/inline/meta_reference/inference/quantization/scripts/quantize_checkpoint.py
+++ b/llama_stack/providers/inline/meta_reference/inference/quantization/scripts/quantize_checkpoint.py
--- a/llama_stack/providers/inline/meta_reference/inference/quantization/scripts/run_quantize_checkpoint.sh
+++ b/llama_stack/providers/inline/meta_reference/inference/quantization/scripts/run_quantize_checkpoint.sh
--- a/llama_stack/providers/inline/meta_reference/memory/init.py
+++ b/llama_stack/providers/inline/meta_reference/memory/init.py
--- a/llama_stack/providers/inline/meta_reference/memory/config.py
+++ b/llama_stack/providers/inline/meta_reference/memory/config.py
--- a/llama_stack/providers/inline/meta_reference/memory/faiss.py
+++ b/llama_stack/providers/inline/meta_reference/memory/faiss.py
--- a/llama_stack/providers/inline/meta_reference/memory/tests/test_faiss.py
+++ b/llama_stack/providers/inline/meta_reference/memory/tests/test_faiss.py
@ -8,9 +8,9 @@ import tempfile

 import pytest
 from llama_stack.apis.memory import MemoryBankType, VectorMemoryBankDef
-from llama_stack.providers.impls.meta_reference.memory.config import FaissImplConfig
+from llama_stack.providers.inline.meta_reference.memory.config import FaissImplConfig

-from llama_stack.providers.impls.meta_reference.memory.faiss import FaissMemoryImpl
+from llama_stack.providers.inline.meta_reference.memory.faiss import FaissMemoryImpl
 from llama_stack.providers.utils.kvstore.config import SqliteKVStoreConfig


--- a/llama_stack/providers/inline/meta_reference/safety/init.py
+++ b/llama_stack/providers/inline/meta_reference/safety/init.py
--- a/llama_stack/providers/inline/meta_reference/safety/base.py
+++ b/llama_stack/providers/inline/meta_reference/safety/base.py
--- a/llama_stack/providers/inline/meta_reference/safety/config.py
+++ b/llama_stack/providers/inline/meta_reference/safety/config.py
--- a/llama_stack/providers/inline/meta_reference/safety/llama_guard.py
+++ b/llama_stack/providers/inline/meta_reference/safety/llama_guard.py
--- a/llama_stack/providers/inline/meta_reference/safety/prompt_guard.py
+++ b/llama_stack/providers/inline/meta_reference/safety/prompt_guard.py
--- a/llama_stack/providers/inline/meta_reference/safety/safety.py
+++ b/llama_stack/providers/inline/meta_reference/safety/safety.py
--- a/llama_stack/providers/inline/meta_reference/scoring/init.py
+++ b/llama_stack/providers/inline/meta_reference/scoring/init.py
--- a/llama_stack/providers/inline/meta_reference/scoring/config.py
+++ b/llama_stack/providers/inline/meta_reference/scoring/config.py
--- a/llama_stack/providers/inline/meta_reference/scoring/scoring.py
+++ b/llama_stack/providers/inline/meta_reference/scoring/scoring.py
@ -13,15 +13,15 @@ from llama_stack.apis.datasetio import *  # noqa: F403
 from llama_stack.apis.datasets import *  # noqa: F403
 from llama_stack.apis.inference.inference import Inference
 from llama_stack.providers.datatypes import ScoringFunctionsProtocolPrivate
-from llama_stack.providers.impls.meta_reference.scoring.scoring_fn.equality_scoring_fn import (
+from llama_stack.providers.inline.meta_reference.scoring.scoring_fn.equality_scoring_fn import (
    EqualityScoringFn,
 )

-from llama_stack.providers.impls.meta_reference.scoring.scoring_fn.llm_as_judge_scoring_fn import (
+from llama_stack.providers.inline.meta_reference.scoring.scoring_fn.llm_as_judge_scoring_fn import (
    LlmAsJudgeScoringFn,
 )

-from llama_stack.providers.impls.meta_reference.scoring.scoring_fn.subset_of_scoring_fn import (
+from llama_stack.providers.inline.meta_reference.scoring.scoring_fn.subset_of_scoring_fn import (
    SubsetOfScoringFn,
 )

--- a/llama_stack/providers/inline/meta_reference/scoring/scoring_fn/init.py
+++ b/llama_stack/providers/inline/meta_reference/scoring/scoring_fn/init.py
--- a/llama_stack/providers/inline/meta_reference/scoring/scoring_fn/base_scoring_fn.py
+++ b/llama_stack/providers/inline/meta_reference/scoring/scoring_fn/base_scoring_fn.py
--- a/llama_stack/providers/inline/meta_reference/scoring/scoring_fn/common.py
+++ b/llama_stack/providers/inline/meta_reference/scoring/scoring_fn/common.py
--- a/llama_stack/providers/inline/meta_reference/scoring/scoring_fn/equality_scoring_fn.py
+++ b/llama_stack/providers/inline/meta_reference/scoring/scoring_fn/equality_scoring_fn.py
@ -4,18 +4,18 @@
 # This source code is licensed under the terms described in the LICENSE file in
 # the root directory of this source tree.

-from llama_stack.providers.impls.meta_reference.scoring.scoring_fn.base_scoring_fn import (
+from llama_stack.providers.inline.meta_reference.scoring.scoring_fn.base_scoring_fn import (
    BaseScoringFn,
 )
 from llama_stack.apis.scoring_functions import *  # noqa: F401, F403
 from llama_stack.apis.scoring import *  # noqa: F401, F403
 from llama_stack.apis.common.type_system import *  # noqa: F403

-from llama_stack.providers.impls.meta_reference.scoring.scoring_fn.common import (
+from llama_stack.providers.inline.meta_reference.scoring.scoring_fn.common import (
    aggregate_accuracy,
 )

-from llama_stack.providers.impls.meta_reference.scoring.scoring_fn.fn_defs.equality import (
+from llama_stack.providers.inline.meta_reference.scoring.scoring_fn.fn_defs.equality import (
    equality,
 )

--- a/llama_stack/providers/inline/meta_reference/scoring/scoring_fn/fn_defs/init.py
+++ b/llama_stack/providers/inline/meta_reference/scoring/scoring_fn/fn_defs/init.py
--- a/llama_stack/providers/inline/meta_reference/scoring/scoring_fn/fn_defs/equality.py
+++ b/llama_stack/providers/inline/meta_reference/scoring/scoring_fn/fn_defs/equality.py
--- a/llama_stack/providers/inline/meta_reference/scoring/scoring_fn/fn_defs/llm_as_judge_8b_correctness.py
+++ b/llama_stack/providers/inline/meta_reference/scoring/scoring_fn/fn_defs/llm_as_judge_8b_correctness.py
--- a/llama_stack/providers/inline/meta_reference/scoring/scoring_fn/fn_defs/subset_of.py
+++ b/llama_stack/providers/inline/meta_reference/scoring/scoring_fn/fn_defs/subset_of.py
--- a/llama_stack/providers/inline/meta_reference/scoring/scoring_fn/llm_as_judge_scoring_fn.py
+++ b/llama_stack/providers/inline/meta_reference/scoring/scoring_fn/llm_as_judge_scoring_fn.py
@ -4,7 +4,7 @@
 # This source code is licensed under the terms described in the LICENSE file in
 # the root directory of this source tree.
 from llama_stack.apis.inference.inference import Inference
-from llama_stack.providers.impls.meta_reference.scoring.scoring_fn.base_scoring_fn import (
+from llama_stack.providers.inline.meta_reference.scoring.scoring_fn.base_scoring_fn import (
    BaseScoringFn,
 )
 from llama_stack.apis.scoring_functions import *  # noqa: F401, F403
@ -12,10 +12,10 @@ from llama_stack.apis.scoring import *  # noqa: F401, F403
 from llama_stack.apis.common.type_system import *  # noqa: F403
 import re

-from llama_stack.providers.impls.meta_reference.scoring.scoring_fn.common import (
+from llama_stack.providers.inline.meta_reference.scoring.scoring_fn.common import (
    aggregate_average,
 )
-from llama_stack.providers.impls.meta_reference.scoring.scoring_fn.fn_defs.llm_as_judge_8b_correctness import (
+from llama_stack.providers.inline.meta_reference.scoring.scoring_fn.fn_defs.llm_as_judge_8b_correctness import (
    llm_as_judge_8b_correctness,
 )

--- a/llama_stack/providers/inline/meta_reference/scoring/scoring_fn/subset_of_scoring_fn.py
+++ b/llama_stack/providers/inline/meta_reference/scoring/scoring_fn/subset_of_scoring_fn.py
@ -4,17 +4,17 @@
 # This source code is licensed under the terms described in the LICENSE file in
 # the root directory of this source tree.

-from llama_stack.providers.impls.meta_reference.scoring.scoring_fn.base_scoring_fn import (
+from llama_stack.providers.inline.meta_reference.scoring.scoring_fn.base_scoring_fn import (
    BaseScoringFn,
 )
 from llama_stack.apis.scoring_functions import *  # noqa: F401, F403
 from llama_stack.apis.scoring import *  # noqa: F401, F403
 from llama_stack.apis.common.type_system import *  # noqa: F403
-from llama_stack.providers.impls.meta_reference.scoring.scoring_fn.common import (
+from llama_stack.providers.inline.meta_reference.scoring.scoring_fn.common import (
    aggregate_accuracy,
 )

-from llama_stack.providers.impls.meta_reference.scoring.scoring_fn.fn_defs.subset_of import (
+from llama_stack.providers.inline.meta_reference.scoring.scoring_fn.fn_defs.subset_of import (
    subset_of,
 )

--- a/llama_stack/providers/inline/meta_reference/telemetry/init.py
+++ b/llama_stack/providers/inline/meta_reference/telemetry/init.py
--- a/llama_stack/providers/inline/meta_reference/telemetry/config.py
+++ b/llama_stack/providers/inline/meta_reference/telemetry/config.py
--- a/llama_stack/providers/inline/meta_reference/telemetry/console.py
+++ b/llama_stack/providers/inline/meta_reference/telemetry/console.py
--- a/llama_stack/providers/inline/vllm/init.py
+++ b/llama_stack/providers/inline/vllm/init.py
--- a/llama_stack/providers/inline/vllm/config.py
+++ b/llama_stack/providers/inline/vllm/config.py
--- a/llama_stack/providers/inline/vllm/vllm.py
+++ b/llama_stack/providers/inline/vllm/vllm.py
--- a/llama_stack/providers/registry/agents.py
+++ b/llama_stack/providers/registry/agents.py
@ -22,8 +22,8 @@ def available_providers() -> List[ProviderSpec]:
                "scikit-learn",
            ]
            + kvstore_dependencies(),
-            module="llama_stack.providers.impls.meta_reference.agents",
-            config_class="llama_stack.providers.impls.meta_reference.agents.MetaReferenceAgentsImplConfig",
+            module="llama_stack.providers.inline.meta_reference.agents",
+            config_class="llama_stack.providers.inline.meta_reference.agents.MetaReferenceAgentsImplConfig",
            api_dependencies=[
                Api.inference,
                Api.safety,
@ -36,8 +36,8 @@ def available_providers() -> List[ProviderSpec]:
            adapter=AdapterSpec(
                adapter_type="sample",
                pip_packages=[],
-                module="llama_stack.providers.adapters.agents.sample",
-                config_class="llama_stack.providers.adapters.agents.sample.SampleConfig",
+                module="llama_stack.providers.remote.agents.sample",
+                config_class="llama_stack.providers.remote.agents.sample.SampleConfig",
            ),
        ),
    ]
--- a/llama_stack/providers/registry/datasetio.py
+++ b/llama_stack/providers/registry/datasetio.py
@ -15,8 +15,8 @@ def available_providers() -> List[ProviderSpec]:
            api=Api.datasetio,
            provider_type="meta-reference",
            pip_packages=["pandas"],
-            module="llama_stack.providers.impls.meta_reference.datasetio",
-            config_class="llama_stack.providers.impls.meta_reference.datasetio.MetaReferenceDatasetIOConfig",
+            module="llama_stack.providers.inline.meta_reference.datasetio",
+            config_class="llama_stack.providers.inline.meta_reference.datasetio.MetaReferenceDatasetIOConfig",
            api_dependencies=[],
        ),
    ]
--- a/llama_stack/providers/registry/eval.py
+++ b/llama_stack/providers/registry/eval.py
@ -15,8 +15,8 @@ def available_providers() -> List[ProviderSpec]:
            api=Api.eval,
            provider_type="meta-reference",
            pip_packages=[],
-            module="llama_stack.providers.impls.meta_reference.eval",
-            config_class="llama_stack.providers.impls.meta_reference.eval.MetaReferenceEvalConfig",
+            module="llama_stack.providers.inline.meta_reference.eval",
+            config_class="llama_stack.providers.inline.meta_reference.eval.MetaReferenceEvalConfig",
            api_dependencies=[
                Api.datasetio,
                Api.datasets,
--- a/llama_stack/providers/registry/inference.py
+++ b/llama_stack/providers/registry/inference.py
@ -27,8 +27,8 @@ def available_providers() -> List[ProviderSpec]:
            api=Api.inference,
            provider_type="meta-reference",
            pip_packages=META_REFERENCE_DEPS,
-            module="llama_stack.providers.impls.meta_reference.inference",
-            config_class="llama_stack.providers.impls.meta_reference.inference.MetaReferenceInferenceConfig",
+            module="llama_stack.providers.inline.meta_reference.inference",
+            config_class="llama_stack.providers.inline.meta_reference.inference.MetaReferenceInferenceConfig",
        ),
        InlineProviderSpec(
            api=Api.inference,
@ -40,16 +40,16 @@ def available_providers() -> List[ProviderSpec]:
                    "torchao==0.5.0",
                ]
            ),
-            module="llama_stack.providers.impls.meta_reference.inference",
-            config_class="llama_stack.providers.impls.meta_reference.inference.MetaReferenceQuantizedInferenceConfig",
+            module="llama_stack.providers.inline.meta_reference.inference",
+            config_class="llama_stack.providers.inline.meta_reference.inference.MetaReferenceQuantizedInferenceConfig",
        ),
        remote_provider_spec(
            api=Api.inference,
            adapter=AdapterSpec(
                adapter_type="sample",
                pip_packages=[],
-                module="llama_stack.providers.adapters.inference.sample",
-                config_class="llama_stack.providers.adapters.inference.sample.SampleConfig",
+                module="llama_stack.providers.remote.inference.sample",
+                config_class="llama_stack.providers.remote.inference.sample.SampleConfig",
            ),
        ),
        remote_provider_spec(
@ -57,8 +57,8 @@ def available_providers() -> List[ProviderSpec]:
            adapter=AdapterSpec(
                adapter_type="ollama",
                pip_packages=["ollama", "aiohttp"],
-                config_class="llama_stack.providers.adapters.inference.ollama.OllamaImplConfig",
-                module="llama_stack.providers.adapters.inference.ollama",
+                config_class="llama_stack.providers.remote.inference.ollama.OllamaImplConfig",
+                module="llama_stack.providers.remote.inference.ollama",
            ),
        ),
        remote_provider_spec(
@ -66,8 +66,8 @@ def available_providers() -> List[ProviderSpec]:
            adapter=AdapterSpec(
                adapter_type="vllm",
                pip_packages=["openai"],
-                module="llama_stack.providers.adapters.inference.vllm",
-                config_class="llama_stack.providers.adapters.inference.vllm.VLLMInferenceAdapterConfig",
+                module="llama_stack.providers.remote.inference.vllm",
+                config_class="llama_stack.providers.remote.inference.vllm.VLLMInferenceAdapterConfig",
            ),
        ),
        remote_provider_spec(
@ -75,8 +75,8 @@ def available_providers() -> List[ProviderSpec]:
            adapter=AdapterSpec(
                adapter_type="tgi",
                pip_packages=["huggingface_hub", "aiohttp"],
-                module="llama_stack.providers.adapters.inference.tgi",
-                config_class="llama_stack.providers.adapters.inference.tgi.TGIImplConfig",
+                module="llama_stack.providers.remote.inference.tgi",
+                config_class="llama_stack.providers.remote.inference.tgi.TGIImplConfig",
            ),
        ),
        remote_provider_spec(
@ -84,8 +84,8 @@ def available_providers() -> List[ProviderSpec]:
            adapter=AdapterSpec(
                adapter_type="hf::serverless",
                pip_packages=["huggingface_hub", "aiohttp"],
-                module="llama_stack.providers.adapters.inference.tgi",
-                config_class="llama_stack.providers.adapters.inference.tgi.InferenceAPIImplConfig",
+                module="llama_stack.providers.remote.inference.tgi",
+                config_class="llama_stack.providers.remote.inference.tgi.InferenceAPIImplConfig",
            ),
        ),
        remote_provider_spec(
@ -93,8 +93,8 @@ def available_providers() -> List[ProviderSpec]:
            adapter=AdapterSpec(
                adapter_type="hf::endpoint",
                pip_packages=["huggingface_hub", "aiohttp"],
-                module="llama_stack.providers.adapters.inference.tgi",
-                config_class="llama_stack.providers.adapters.inference.tgi.InferenceEndpointImplConfig",
+                module="llama_stack.providers.remote.inference.tgi",
+                config_class="llama_stack.providers.remote.inference.tgi.InferenceEndpointImplConfig",
            ),
        ),
        remote_provider_spec(
@ -104,8 +104,8 @@ def available_providers() -> List[ProviderSpec]:
                pip_packages=[
                    "fireworks-ai",
                ],
-                module="llama_stack.providers.adapters.inference.fireworks",
-                config_class="llama_stack.providers.adapters.inference.fireworks.FireworksImplConfig",
+                module="llama_stack.providers.remote.inference.fireworks",
+                config_class="llama_stack.providers.remote.inference.fireworks.FireworksImplConfig",
            ),
        ),
        remote_provider_spec(
@ -115,9 +115,9 @@ def available_providers() -> List[ProviderSpec]:
                pip_packages=[
                    "together",
                ],
-                module="llama_stack.providers.adapters.inference.together",
-                config_class="llama_stack.providers.adapters.inference.together.TogetherImplConfig",
-                provider_data_validator="llama_stack.providers.adapters.safety.together.TogetherProviderDataValidator",
+                module="llama_stack.providers.remote.inference.together",
+                config_class="llama_stack.providers.remote.inference.together.TogetherImplConfig",
+                provider_data_validator="llama_stack.providers.remote.safety.together.TogetherProviderDataValidator",
            ),
        ),
        remote_provider_spec(
@ -125,8 +125,8 @@ def available_providers() -> List[ProviderSpec]:
            adapter=AdapterSpec(
                adapter_type="bedrock",
                pip_packages=["boto3"],
-                module="llama_stack.providers.adapters.inference.bedrock",
-                config_class="llama_stack.providers.adapters.inference.bedrock.BedrockConfig",
+                module="llama_stack.providers.remote.inference.bedrock",
+                config_class="llama_stack.providers.remote.inference.bedrock.BedrockConfig",
            ),
        ),
        remote_provider_spec(
@ -136,8 +136,8 @@ def available_providers() -> List[ProviderSpec]:
                pip_packages=[
                    "openai",
                ],
-                module="llama_stack.providers.adapters.inference.databricks",
-                config_class="llama_stack.providers.adapters.inference.databricks.DatabricksImplConfig",
+                module="llama_stack.providers.remote.inference.databricks",
+                config_class="llama_stack.providers.remote.inference.databricks.DatabricksImplConfig",
            ),
        ),
        InlineProviderSpec(
@ -146,7 +146,7 @@ def available_providers() -> List[ProviderSpec]:
            pip_packages=[
                "vllm",
            ],
-            module="llama_stack.providers.impls.vllm",
-            config_class="llama_stack.providers.impls.vllm.VLLMConfig",
+            module="llama_stack.providers.inline.vllm",
+            config_class="llama_stack.providers.inline.vllm.VLLMConfig",
        ),
    ]
--- a/llama_stack/providers/registry/memory.py
+++ b/llama_stack/providers/registry/memory.py
@ -36,15 +36,15 @@ def available_providers() -> List[ProviderSpec]:
            api=Api.memory,
            provider_type="meta-reference",
            pip_packages=EMBEDDING_DEPS + ["faiss-cpu"],
-            module="llama_stack.providers.impls.meta_reference.memory",
-            config_class="llama_stack.providers.impls.meta_reference.memory.FaissImplConfig",
+            module="llama_stack.providers.inline.meta_reference.memory",
+            config_class="llama_stack.providers.inline.meta_reference.memory.FaissImplConfig",
        ),
        remote_provider_spec(
            Api.memory,
            AdapterSpec(
                adapter_type="chromadb",
                pip_packages=EMBEDDING_DEPS + ["chromadb-client"],
-                module="llama_stack.providers.adapters.memory.chroma",
+                module="llama_stack.providers.remote.memory.chroma",
            ),
        ),
        remote_provider_spec(
@ -52,8 +52,8 @@ def available_providers() -> List[ProviderSpec]:
            AdapterSpec(
                adapter_type="pgvector",
                pip_packages=EMBEDDING_DEPS + ["psycopg2-binary"],
-                module="llama_stack.providers.adapters.memory.pgvector",
-                config_class="llama_stack.providers.adapters.memory.pgvector.PGVectorConfig",
+                module="llama_stack.providers.remote.memory.pgvector",
+                config_class="llama_stack.providers.remote.memory.pgvector.PGVectorConfig",
            ),
        ),
        remote_provider_spec(
@ -61,9 +61,9 @@ def available_providers() -> List[ProviderSpec]:
            AdapterSpec(
                adapter_type="weaviate",
                pip_packages=EMBEDDING_DEPS + ["weaviate-client"],
-                module="llama_stack.providers.adapters.memory.weaviate",
-                config_class="llama_stack.providers.adapters.memory.weaviate.WeaviateConfig",
-                provider_data_validator="llama_stack.providers.adapters.memory.weaviate.WeaviateRequestProviderData",
+                module="llama_stack.providers.remote.memory.weaviate",
+                config_class="llama_stack.providers.remote.memory.weaviate.WeaviateConfig",
+                provider_data_validator="llama_stack.providers.remote.memory.weaviate.WeaviateRequestProviderData",
            ),
        ),
        remote_provider_spec(
@ -71,8 +71,8 @@ def available_providers() -> List[ProviderSpec]:
            adapter=AdapterSpec(
                adapter_type="sample",
                pip_packages=[],
-                module="llama_stack.providers.adapters.memory.sample",
-                config_class="llama_stack.providers.adapters.memory.sample.SampleConfig",
+                module="llama_stack.providers.remote.memory.sample",
+                config_class="llama_stack.providers.remote.memory.sample.SampleConfig",
            ),
        ),
        remote_provider_spec(
@ -80,8 +80,8 @@ def available_providers() -> List[ProviderSpec]:
            AdapterSpec(
                adapter_type="qdrant",
                pip_packages=EMBEDDING_DEPS + ["qdrant-client"],
-                module="llama_stack.providers.adapters.memory.qdrant",
-                config_class="llama_stack.providers.adapters.memory.qdrant.QdrantConfig",
+                module="llama_stack.providers.remote.memory.qdrant",
+                config_class="llama_stack.providers.remote.memory.qdrant.QdrantConfig",
            ),
        ),
    ]
--- a/llama_stack/providers/registry/safety.py
+++ b/llama_stack/providers/registry/safety.py
@ -24,8 +24,8 @@ def available_providers() -> List[ProviderSpec]:
                "transformers",
                "torch --index-url https://download.pytorch.org/whl/cpu",
            ],
-            module="llama_stack.providers.impls.meta_reference.safety",
-            config_class="llama_stack.providers.impls.meta_reference.safety.SafetyConfig",
+            module="llama_stack.providers.inline.meta_reference.safety",
+            config_class="llama_stack.providers.inline.meta_reference.safety.SafetyConfig",
            api_dependencies=[
                Api.inference,
            ],
@ -35,8 +35,8 @@ def available_providers() -> List[ProviderSpec]:
            adapter=AdapterSpec(
                adapter_type="sample",
                pip_packages=[],
-                module="llama_stack.providers.adapters.safety.sample",
-                config_class="llama_stack.providers.adapters.safety.sample.SampleConfig",
+                module="llama_stack.providers.remote.safety.sample",
+                config_class="llama_stack.providers.remote.safety.sample.SampleConfig",
            ),
        ),
        remote_provider_spec(
@ -44,8 +44,8 @@ def available_providers() -> List[ProviderSpec]:
            adapter=AdapterSpec(
                adapter_type="bedrock",
                pip_packages=["boto3"],
-                module="llama_stack.providers.adapters.safety.bedrock",
-                config_class="llama_stack.providers.adapters.safety.bedrock.BedrockSafetyConfig",
+                module="llama_stack.providers.remote.safety.bedrock",
+                config_class="llama_stack.providers.remote.safety.bedrock.BedrockSafetyConfig",
            ),
        ),
        remote_provider_spec(
@ -55,9 +55,9 @@ def available_providers() -> List[ProviderSpec]:
                pip_packages=[
                    "together",
                ],
-                module="llama_stack.providers.adapters.safety.together",
-                config_class="llama_stack.providers.adapters.safety.together.TogetherSafetyConfig",
-                provider_data_validator="llama_stack.providers.adapters.safety.together.TogetherProviderDataValidator",
+                module="llama_stack.providers.remote.safety.together",
+                config_class="llama_stack.providers.remote.safety.together.TogetherSafetyConfig",
+                provider_data_validator="llama_stack.providers.remote.safety.together.TogetherProviderDataValidator",
            ),
        ),
        InlineProviderSpec(
@ -66,8 +66,8 @@ def available_providers() -> List[ProviderSpec]:
            pip_packages=[
                "codeshield",
            ],
-            module="llama_stack.providers.impls.meta_reference.codeshield",
-            config_class="llama_stack.providers.impls.meta_reference.codeshield.CodeShieldConfig",
+            module="llama_stack.providers.inline.meta_reference.codeshield",
+            config_class="llama_stack.providers.inline.meta_reference.codeshield.CodeShieldConfig",
            api_dependencies=[],
        ),
    ]
--- a/llama_stack/providers/registry/scoring.py
+++ b/llama_stack/providers/registry/scoring.py
@ -15,8 +15,8 @@ def available_providers() -> List[ProviderSpec]:
            api=Api.scoring,
            provider_type="meta-reference",
            pip_packages=[],
-            module="llama_stack.providers.impls.meta_reference.scoring",
-            config_class="llama_stack.providers.impls.meta_reference.scoring.MetaReferenceScoringConfig",
+            module="llama_stack.providers.inline.meta_reference.scoring",
+            config_class="llama_stack.providers.inline.meta_reference.scoring.MetaReferenceScoringConfig",
            api_dependencies=[
                Api.datasetio,
                Api.datasets,
@ -27,8 +27,8 @@ def available_providers() -> List[ProviderSpec]:
            api=Api.scoring,
            provider_type="braintrust",
            pip_packages=["autoevals", "openai"],
-            module="llama_stack.providers.impls.braintrust.scoring",
-            config_class="llama_stack.providers.impls.braintrust.scoring.BraintrustScoringConfig",
+            module="llama_stack.providers.inline.braintrust.scoring",
+            config_class="llama_stack.providers.inline.braintrust.scoring.BraintrustScoringConfig",
            api_dependencies=[
                Api.datasetio,
                Api.datasets,
--- a/llama_stack/providers/registry/telemetry.py
+++ b/llama_stack/providers/registry/telemetry.py
@ -15,16 +15,16 @@ def available_providers() -> List[ProviderSpec]:
            api=Api.telemetry,
            provider_type="meta-reference",
            pip_packages=[],
-            module="llama_stack.providers.impls.meta_reference.telemetry",
-            config_class="llama_stack.providers.impls.meta_reference.telemetry.ConsoleConfig",
+            module="llama_stack.providers.inline.meta_reference.telemetry",
+            config_class="llama_stack.providers.inline.meta_reference.telemetry.ConsoleConfig",
        ),
        remote_provider_spec(
            api=Api.telemetry,
            adapter=AdapterSpec(
                adapter_type="sample",
                pip_packages=[],
-                module="llama_stack.providers.adapters.telemetry.sample",
-                config_class="llama_stack.providers.adapters.telemetry.sample.SampleConfig",
+                module="llama_stack.providers.remote.telemetry.sample",
+                config_class="llama_stack.providers.remote.telemetry.sample.SampleConfig",
            ),
        ),
        remote_provider_spec(
@ -37,8 +37,8 @@ def available_providers() -> List[ProviderSpec]:
                    "opentelemetry-exporter-jaeger",
                    "opentelemetry-semantic-conventions",
                ],
-                module="llama_stack.providers.adapters.telemetry.opentelemetry",
-                config_class="llama_stack.providers.adapters.telemetry.opentelemetry.OpenTelemetryConfig",
+                module="llama_stack.providers.remote.telemetry.opentelemetry",
+                config_class="llama_stack.providers.remote.telemetry.opentelemetry.OpenTelemetryConfig",
            ),
        ),
    ]
--- a/llama_stack/providers/impls/meta_reference/agents/tools/init.py
+++ b/llama_stack/providers/impls/meta_reference/agents/tools/init.py
--- a/Show more
+++ b/Show more