llama-stack/llama_stack/distribution/templates/build_configs/local-vllm-build.yaml at a27a2cd2af93d73e48d9789ac92c55927da6c44d - phoenix-oss/llama-stack - Git for basel.kvant.cloud

phoenix-oss/llama-stack

forked from phoenix-oss/llama-stack-mirror

Yuan Tang a27a2cd2af

Add vLLM inference provider for OpenAI compatible vLLM server (#178 )

This PR adds vLLM inference provider for OpenAI compatible vLLM server.

2024-10-20 18:43:25 -07:00

10 lines

No EOL

263 B

YAML

Raw Blame History

 name: local-vllm
 distribution_spec:
   description: Like local, but use vLLM for running LLM inference
   providers:
     inference: vllm
     memory: meta-reference
     safety: meta-reference
     agents: meta-reference
     telemetry: meta-reference
 image_type: conda