models api configure prompts

2025-12-03 18:00:36 +00:00 · 2024-09-19 23:22:43 -07:00 · 2024-09-19 23:22:43 -07:00 · 4647cc3e08
commit 4647cc3e08
parent e2c7a3cea9
2 changed files with 75 additions and 3 deletions
--- a/llama_stack/distribution/configure.py
+++ b/llama_stack/distribution/configure.py
@ -9,12 +9,11 @@ from typing import Any
 from pydantic import BaseModel

 from llama_stack.distribution.datatypes import *  # noqa: F403
-from termcolor import cprint
-
 from llama_stack.distribution.distribution import api_providers, stack_apis
 from llama_stack.distribution.utils.dynamic import instantiate_class_type

 from llama_stack.distribution.utils.prompt_for_config import prompt_for_config
+from termcolor import cprint


 def make_routing_entry_type(config_class: Any):
@ -25,6 +24,69 @@ def make_routing_entry_type(config_class: Any):
    return BaseModelWithConfig


+def configure_models_api(
+    config: StackRunConfig, spec: DistributionSpec
+) -> StackRunConfig:
+    from llama_stack.providers.impls.builtin.models.config import (
+        ModelConfigProviderEntry,
+    )
+    from prompt_toolkit import prompt
+
+    cprint(f"Configuring API `models`...\n", "white", attrs=["bold"])
+    # models do not need prompting, we can use the pre-existing configs to populate the models_config
+    provider = spec.providers["models"]
+    models_config_list = []
+
+    # TODO (xiyan): we need to clean up configure with models & routers
+    # check inference api
+    if "inference" in config.apis_to_serve and "inference" in config.provider_map:
+        inference_provider_id = config.provider_map["inference"].provider_id
+        inference_provider_config = config.provider_map["inference"].config
+
+        if inference_provider_id == "meta-reference":
+            core_model_id = inference_provider_config["model"]
+        else:
+            core_model_id = prompt(
+                "Enter model_id your inference is serving",
+                default="Meta-Llama3.1-8B-Instruct",
+            )
+        models_config_list.append(
+            ModelConfigProviderEntry(
+                api="inference",
+                core_model_id=core_model_id,
+                provider_id=inference_provider_id,
+                config=inference_provider_config,
+            )
+        )
+
+    # check safety api for models
+    if "safety" in config.apis_to_serve and "safety" in config.provider_map:
+        safety_provider_id = config.provider_map["safety"].provider_id
+        safety_provider_config = config.provider_map["safety"].config
+
+        if safety_provider_id == "meta-reference":
+            for model_type in ["llama_guard_shield", "prompt_guard_shield"]:
+                if model_type not in safety_provider_config:
+                    continue
+
+                core_model_id = safety_provider_config[model_type]["model"]
+                models_config_list.append(
+                    ModelConfigProviderEntry(
+                        api="safety",
+                        core_model_id=core_model_id,
+                        provider_id=safety_provider_id,
+                        config=safety_provider_config,
+                    )
+                )
+
+    config.provider_map["models"] = GenericProviderConfig(
+        provider_id=spec.providers["models"],
+        config={"models_config": models_config_list},
+    )
+
+    return config
+
+
 # TODO: make sure we can deal with existing configuration values correctly
 # instead of just overwriting them
 def configure_api_providers(
@ -40,6 +102,10 @@ def configure_api_providers(
        if api_str not in apis:
            raise ValueError(f"Unknown API `{api_str}`")

+        # configure models builtin api last based on existing configs
+        if api_str == "models":
+            continue
+
        cprint(f"Configuring API `{api_str}`...\n", "white", attrs=["bold"])
        api = Api(api_str)

@ -92,4 +158,7 @@ def configure_api_providers(
                config=cfg.dict(),
            )

+    if "models" in config.apis_to_serve:
+        config = configure_models_api(config, spec)
+
    return config
--- a/llama_stack/providers/impls/builtin/models/config.py
+++ b/llama_stack/providers/impls/builtin/models/config.py
@ -21,4 +21,7 @@ class ModelConfigProviderEntry(GenericProviderConfig):

@json_schema_type
 class BuiltinImplConfig(BaseModel):
-    models_config: List[ModelConfigProviderEntry]
+    models_config: List[ModelConfigProviderEntry] = Field(
+        default_factory=list,
+        description="list of model config entries for each model",
+    )