more fixes to postgres-store run yaml ugh

2025-12-03 09:53:45 +00:00 · 2025-11-10 15:54:00 -08:00 · 2025-11-10 15:54:00 -08:00 · 7ce0c5c5dc
commit 7ce0c5c5dc
parent e6de865bcb
4 changed files with 89 additions and 101 deletions
--- a/src/llama_stack/distributions/ci-tests/run-with-postgres-store.yaml
+++ b/src/llama_stack/distributions/ci-tests/run-with-postgres-store.yaml
@ -170,7 +170,7 @@ providers:
          namespace: agents
          backend: kv_default
        responses:
-          table_name: agent_responses
+          table_name: responses
          backend: sql_default
          max_write_queue_size: 10000
          num_writers: 4
@ -230,8 +230,6 @@ providers:
      kvstore:
        namespace: batches
        backend: kv_default
-      max_concurrent_batches: 1
-      max_concurrent_requests_per_batch: 10
 storage:
  backends:
    kv_default:
@ -266,13 +264,30 @@ storage:
      backend: kv_default
 registered_resources:
  models: []
-  shields: []
+  shields:
+  - shield_id: llama-guard
+    provider_id: ${env.SAFETY_MODEL:+llama-guard}
+    provider_shield_id: ${env.SAFETY_MODEL:=}
+  - shield_id: code-scanner
+    provider_id: ${env.CODE_SCANNER_MODEL:+code-scanner}
+    provider_shield_id: ${env.CODE_SCANNER_MODEL:=}
  vector_dbs: []
  datasets: []
  scoring_fns: []
  benchmarks: []
-  tool_groups: []
+  tool_groups:
+  - toolgroup_id: builtin::websearch
+    provider_id: tavily-search
+  - toolgroup_id: builtin::rag
+    provider_id: rag-runtime
 server:
  port: 8321
 telemetry:
  enabled: true
+vector_stores:
+  default_provider_id: faiss
+  default_embedding_model:
+    provider_id: sentence-transformers
+    model_id: nomic-ai/nomic-embed-text-v1.5
+safety:
+  default_shield_id: llama-guard
--- a/src/llama_stack/distributions/starter-gpu/run-with-postgres-store.yaml
+++ b/src/llama_stack/distributions/starter-gpu/run-with-postgres-store.yaml
@ -170,7 +170,7 @@ providers:
          namespace: agents
          backend: kv_default
        responses:
-          table_name: agent_responses
+          table_name: responses
          backend: sql_default
          max_write_queue_size: 10000
          num_writers: 4
@ -233,8 +233,6 @@ providers:
      kvstore:
        namespace: batches
        backend: kv_default
-      max_concurrent_batches: 1
-      max_concurrent_requests_per_batch: 10
 storage:
  backends:
    kv_default:
@ -269,13 +267,30 @@ storage:
      backend: kv_default
 registered_resources:
  models: []
-  shields: []
+  shields:
+  - shield_id: llama-guard
+    provider_id: ${env.SAFETY_MODEL:+llama-guard}
+    provider_shield_id: ${env.SAFETY_MODEL:=}
+  - shield_id: code-scanner
+    provider_id: ${env.CODE_SCANNER_MODEL:+code-scanner}
+    provider_shield_id: ${env.CODE_SCANNER_MODEL:=}
  vector_dbs: []
  datasets: []
  scoring_fns: []
  benchmarks: []
-  tool_groups: []
+  tool_groups:
+  - toolgroup_id: builtin::websearch
+    provider_id: tavily-search
+  - toolgroup_id: builtin::rag
+    provider_id: rag-runtime
 server:
  port: 8321
 telemetry:
  enabled: true
+vector_stores:
+  default_provider_id: faiss
+  default_embedding_model:
+    provider_id: sentence-transformers
+    model_id: nomic-ai/nomic-embed-text-v1.5
+safety:
+  default_shield_id: llama-guard
--- a/src/llama_stack/distributions/starter/run-with-postgres-store.yaml
+++ b/src/llama_stack/distributions/starter/run-with-postgres-store.yaml
@ -170,7 +170,7 @@ providers:
          namespace: agents
          backend: kv_default
        responses:
-          table_name: agent_responses
+          table_name: responses
          backend: sql_default
          max_write_queue_size: 10000
          num_writers: 4
@ -230,8 +230,6 @@ providers:
      kvstore:
        namespace: batches
        backend: kv_default
-      max_concurrent_batches: 1
-      max_concurrent_requests_per_batch: 10
 storage:
  backends:
    kv_default:
@ -266,13 +264,30 @@ storage:
      backend: kv_default
 registered_resources:
  models: []
-  shields: []
+  shields:
+  - shield_id: llama-guard
+    provider_id: ${env.SAFETY_MODEL:+llama-guard}
+    provider_shield_id: ${env.SAFETY_MODEL:=}
+  - shield_id: code-scanner
+    provider_id: ${env.CODE_SCANNER_MODEL:+code-scanner}
+    provider_shield_id: ${env.CODE_SCANNER_MODEL:=}
  vector_dbs: []
  datasets: []
  scoring_fns: []
  benchmarks: []
-  tool_groups: []
+  tool_groups:
+  - toolgroup_id: builtin::websearch
+    provider_id: tavily-search
+  - toolgroup_id: builtin::rag
+    provider_id: rag-runtime
 server:
  port: 8321
 telemetry:
  enabled: true
+vector_stores:
+  default_provider_id: faiss
+  default_embedding_model:
+    provider_id: sentence-transformers
+    model_id: nomic-ai/nomic-embed-text-v1.5
+safety:
+  default_shield_id: llama-guard
--- a/src/llama_stack/distributions/starter/starter.py
+++ b/src/llama_stack/distributions/starter/starter.py
@ -17,22 +17,9 @@ from llama_stack.core.datatypes import (
    ToolGroupInput,
    VectorStoresConfig,
 )
-from llama_stack.core.storage.datatypes import (
-    InferenceStoreReference,
-    KVStoreReference,
-    ResponsesStoreReference,
-    SqlStoreReference,
-)
 from llama_stack.core.utils.dynamic import instantiate_class_type
 from llama_stack.distributions.template import DistributionTemplate, RunConfigSettings
 from llama_stack.providers.datatypes import RemoteProviderSpec
-from llama_stack.providers.inline.agents.meta_reference.config import (
-    AgentPersistenceConfig,
-    MetaReferenceAgentsImplConfig,
-)
-from llama_stack.providers.inline.batches.reference.config import (
-    ReferenceBatchesImplConfig,
-)
 from llama_stack.providers.inline.files.localfs.config import LocalfsFilesImplConfig
 from llama_stack.providers.inline.inference.sentence_transformers import (
    SentenceTransformersInferenceConfig,
@ -254,16 +241,7 @@ def get_distribution_template(name: str = "starter") -> DistributionTemplate:
        "files": [files_provider],
    }

-    return DistributionTemplate(
-        name=name,
-        distro_type="self_hosted",
-        description="Quick start template for running Llama Stack with several popular providers. This distribution is intended for CPU-only environments.",
-        container_image=None,
-        template_path=None,
-        providers=providers,
-        additional_pip_packages=list(set(PostgresSqlStoreConfig.pip_packages() + PostgresKVStoreConfig.pip_packages())),
-        run_configs={
-            "run.yaml": RunConfigSettings(
+    base_run_settings = RunConfigSettings(
        provider_overrides=default_overrides,
        default_models=[],
        default_tool_groups=default_tool_groups,
@ -278,64 +256,29 @@ def get_distribution_template(name: str = "starter") -> DistributionTemplate:
        safety_config=SafetyConfig(
            default_shield_id="llama-guard",
        ),
-            ),
-            "run-with-postgres-store.yaml": RunConfigSettings(
-                provider_overrides={
-                    **default_overrides,
-                    "agents": [
-                        Provider(
-                            provider_id="meta-reference",
-                            provider_type="inline::meta-reference",
-                            config=MetaReferenceAgentsImplConfig(
-                                persistence=AgentPersistenceConfig(
-                                    agent_state=KVStoreReference(
-                                        backend="kv_default",
-                                        namespace="agents",
-                                    ),
-                                    responses=ResponsesStoreReference(
-                                        backend="sql_default",
-                                        table_name="agent_responses",
-                                    ),
-                                ),
-                            ).model_dump(exclude_none=True),
    )
-                    ],
-                    "batches": [
-                        Provider(
-                            provider_id="reference",
-                            provider_type="inline::reference",
-                            config=ReferenceBatchesImplConfig(
-                                kvstore=KVStoreReference(
-                                    backend="kv_default",
-                                    namespace="batches",
-                                ),
-                            ).model_dump(exclude_none=True),
-                        )
-                    ],
-                },
-                storage_backends={
+
+    postgres_run_settings = base_run_settings.model_copy(
+        update={
+            "storage_backends": {
                "kv_default": postgres_kv_config,
                "sql_default": postgres_sql_config,
+            }
        },
-                storage_stores={
-                    "metadata": KVStoreReference(
-                        backend="kv_default",
-                        namespace="registry",
-                    ).model_dump(exclude_none=True),
-                    "inference": InferenceStoreReference(
-                        backend="sql_default",
-                        table_name="inference_store",
-                    ).model_dump(exclude_none=True),
-                    "conversations": SqlStoreReference(
-                        backend="sql_default",
-                        table_name="openai_conversations",
-                    ).model_dump(exclude_none=True),
-                    "prompts": KVStoreReference(
-                        backend="kv_default",
-                        namespace="prompts",
-                    ).model_dump(exclude_none=True),
-                },
-            ),
+        deep=True,
+    )
+
+    return DistributionTemplate(
+        name=name,
+        distro_type="self_hosted",
+        description="Quick start template for running Llama Stack with several popular providers. This distribution is intended for CPU-only environments.",
+        container_image=None,
+        template_path=None,
+        providers=providers,
+        additional_pip_packages=list(set(PostgresSqlStoreConfig.pip_packages() + PostgresKVStoreConfig.pip_packages())),
+        run_configs={
+            "run.yaml": base_run_settings,
+            "run-with-postgres-store.yaml": postgres_run_settings,
        },
        run_config_env_vars={
            "LLAMA_STACK_PORT": (