llama-stack-mirror/llama_stack/distribution/templates/remote-vllm-build.yaml at 74e6356b5192d160cfafe2a7b5de673d04d59009 - phoenix-oss/llama-stack-mirror - Git for basel.kvant.cloud

phoenix-oss/llama-stack-mirror

mirror of https://github.com/meta-llama/llama-stack.git synced 2025-12-11 11:50:41 +00:00

Yuan Tang 74e6356b51 Add vLLM inference provider for OpenAI compatible vLLM server (#178 )

This PR adds vLLM inference provider for OpenAI compatible vLLM server.

2024-10-21 10:46:45 -07:00

10 lines

No EOL

264 B

YAML

Raw Blame History

 name: remote-vllm
 distribution_spec:
   description: Use remote vLLM for running LLM inference
   providers:
     inference: remote::vllm
     memory: meta-reference
     safety: meta-reference
     agents: meta-reference
     telemetry: meta-reference
 image_type: docker