update example run files

2025-12-04 02:03:44 +00:00 · 2024-09-22 00:25:01 -07:00 · 2024-09-22 00:25:01 -07:00 · 44fe099866
commit 44fe099866
parent e42b5556ef
3 changed files with 51 additions and 71 deletions
--- a/llama_stack/examples/router-local-run.yaml
+++ b/llama_stack/examples/router-local-run.yaml
@ -0,0 +1,50 @@
 built_at: '2024-09-18T13:41:17.656743'
 image_name: local
 docker_image: null
 conda_env: local
 apis_to_serve:
 - inference
 - memory
 - telemetry
 - agents
 - safety
 - models
 provider_map:
  telemetry:
    provider_id: meta-reference
    config: {}
  safety:
    provider_id: meta-reference
    config:
      llama_guard_shield:
        model: Llama-Guard-3-8B
        excluded_categories: []
        disable_input_check: false
        disable_output_check: false
      prompt_guard_shield:
        model: Prompt-Guard-86M
  agents:
    provider_id: meta-reference
    config: {}
 provider_routing_table:
  inference:
    - routing_key: Meta-Llama3.1-8B-Instruct
      provider_id: meta-reference
      config:
        model: Meta-Llama3.1-8B-Instruct
        quantization: null
        torch_seed: null
        max_seq_len: 4096
        max_batch_size: 1
    - routing_key: Meta-Llama3.1-8B
      provider_id: meta-reference
      config:
        model: Meta-Llama3.1-8B
        quantization: null
        torch_seed: null
        max_seq_len: 4096
        max_batch_size: 1
  memory:
    - routing_key: vector
      provider_id: meta-reference
      config: {}
--- a/llama_stack/examples/router-table-run.yaml
+++ b/llama_stack/examples/router-table-run.yaml
@ -1,67 +0,0 @@
 built_at: '2024-09-18T13:41:17.656743'
 image_name: local
 docker_image: null
 conda_env: local
 apis_to_serve:
 - inference
 # - memory
 - telemetry
 # - agents
 # - safety
 - models
 provider_map:
  telemetry:
    provider_id: meta-reference
    config: {}
  # safety:
  #   provider_id: meta-reference
  #   config:
  #     llama_guard_shield:
  #       model: Llama-Guard-3-8B
  #       excluded_categories: []
  #       disable_input_check: false
  #       disable_output_check: false
  #     prompt_guard_shield:
  #       model: Prompt-Guard-86M
  # inference:
  #   provider_id: meta-reference
  #   config:
  #     model: Meta-Llama3.1-8B-Instruct
  #     quantization: null
  #     torch_seed: null
  #     max_seq_len: 4096
  #     max_batch_size: 1
  # inference:
  #   provider_id: remote::ollama
  #   config:
  #     url: https:ollama-1.com
  # agents:
  #   provider_id: meta-reference
  #   config: {}
 provider_routing_table:
  inference:
    - routing_key: Meta-Llama3.1-8B-Instruct
      provider_id: meta-reference
      config:
        model: Meta-Llama3.1-8B-Instruct
        quantization: null
        torch_seed: null
        max_seq_len: 4096
        max_batch_size: 1
    - routing_key: Meta-Llama3.1-8B
      provider_id: remote::ollama
      config:
        url: https:://ollama.com
  # memory:
    # - routing_key: keyvalue
    #   provider_id: remote::pgvector
    #   config:
    #     host: localhost
    #     port: 5432
    #     db: vectordb
    #     user: vectoruser
    #     password: xxxx
    # - routing_key: vector
    #   provider_id: meta-reference
    #   config: {}
--- a/llama_stack/examples/simple-local-run.yaml
+++ b/llama_stack/examples/simple-local-run.yaml
@ -8,6 +8,7 @@ apis_to_serve:
 - agents
 - memory
 - models
 - telemetry
 provider_map:
  inference:
    provider_id: meta-reference
@ -17,10 +18,6 @@ provider_map:
      torch_seed: null
      max_seq_len: 4096
      max_batch_size: 1
  # inference:
  #   provider_id: remote::ollama
  #   config:
  #     url: https://xxx
  safety:
    provider_id: meta-reference
    config: