models endpoint testing

2025-12-04 18:13:44 +00:00 · 2024-09-22 00:01:35 -07:00 · 2024-09-22 00:01:35 -07:00 · 0348f26e00
commit 0348f26e00
parent c0199029e5
10 changed files with 235 additions and 79 deletions
--- a/llama_stack/examples/router-table-run.yaml
+++ b/llama_stack/examples/router-table-run.yaml
@ -4,25 +4,25 @@ docker_image: null
 conda_env: local
 apis_to_serve:
 - inference
- memory
+# - memory
 - telemetry
- agents
- safety
+# - agents
+# - safety
 - models
 provider_map:
  telemetry:
    provider_id: meta-reference
    config: {}
-  safety:
-    provider_id: meta-reference
-    config:
-      llama_guard_shield:
-        model: Llama-Guard-3-8B
-        excluded_categories: []
-        disable_input_check: false
-        disable_output_check: false
-      prompt_guard_shield:
-        model: Prompt-Guard-86M
+  # safety:
+  #   provider_id: meta-reference
+  #   config:
+  #     llama_guard_shield:
+  #       model: Llama-Guard-3-8B
+  #       excluded_categories: []
+  #       disable_input_check: false
+  #       disable_output_check: false
+  #     prompt_guard_shield:
+  #       model: Prompt-Guard-86M
  # inference:
  #   provider_id: meta-reference
  #   config:
@ -31,32 +31,29 @@ provider_map:
  #     torch_seed: null
  #     max_seq_len: 4096
  #     max_batch_size: 1
-  inference:
-    provider_id: remote::ollama
-    config:
-
-  agents:
-    provider_id: meta-reference
-    config: {}
-provider_routing_table:
  # inference:
-  #   - routing_key: Meta-Llama3.1-8B-Instruct
-  #     provider_id: meta-reference
-  #     config:
-  #       model: Meta-Llama3.1-8B-Instruct
-  #       quantization: null
-  #       torch_seed: null
-  #       max_seq_len: 4096
-  #       max_batch_size: 1
-  #   - routing_key: Meta-Llama3.1-8B-Instruct
-  #     provider_id: meta-reference
-  #     config:
-  #       model: Meta-Llama3.1-8B
-  #       quantization: null
-  #       torch_seed: null
-  #       max_seq_len: 4096
-  #       max_batch_size: 1
-  memory:
+  #   provider_id: remote::ollama
+  #   config:
+  #     url: https:ollama-1.com
+  # agents:
+  #   provider_id: meta-reference
+  #   config: {}
+provider_routing_table:
+  inference:
+    - routing_key: Meta-Llama3.1-8B-Instruct
+      provider_id: meta-reference
+      config:
+        model: Meta-Llama3.1-8B-Instruct
+        quantization: null
+        torch_seed: null
+        max_seq_len: 4096
+        max_batch_size: 1
+    - routing_key: Meta-Llama3.1-8B
+      provider_id: remote::ollama
+      config:
+        url: https:://ollama.com
+
+  # memory:
    # - routing_key: keyvalue
    #   provider_id: remote::pgvector
    #   config:
@ -65,6 +62,6 @@ provider_routing_table:
    #     db: vectordb
    #     user: vectoruser
    #     password: xxxx
-    - routing_key: vector
-      provider_id: meta-reference
-      config: {}
+    # - routing_key: vector
+    #   provider_id: meta-reference
+    #   config: {}
--- a/llama_stack/examples/simple-local-run.yaml
+++ b/llama_stack/examples/simple-local-run.yaml
@ -7,6 +7,7 @@ apis_to_serve:
 - safety
 - agents
 - memory
+- models
 provider_map:
  inference:
    provider_id: meta-reference
@ -16,6 +17,10 @@ provider_map:
      torch_seed: null
      max_seq_len: 4096
      max_batch_size: 1
+  # inference:
+  #   provider_id: remote::ollama
+  #   config:
+  #     url: https://xxx
  safety:
    provider_id: meta-reference
    config: