llama-stack-mirror/llama_stack/distribution/templates/remote-vllm-build.yaml at 23210e867935cc7136162bbb82522e201946ded7 - phoenix-oss/llama-stack-mirror - Git for basel.kvant.cloud

phoenix-oss/llama-stack-mirror

mirror of https://github.com/meta-llama/llama-stack.git synced 2025-07-24 13:19:54 +00:00

Yuan Tang a27a2cd2af

Add vLLM inference provider for OpenAI compatible vLLM server (#178 )

This PR adds vLLM inference provider for OpenAI compatible vLLM server.

2024-10-20 18:43:25 -07:00

10 lines

No EOL

264 B

YAML

Raw Blame History

 name: remote-vllm
 distribution_spec:
   description: Use remote vLLM for running LLM inference
   providers:
     inference: remote::vllm
     memory: meta-reference
     safety: meta-reference
     agents: meta-reference
     telemetry: meta-reference
 image_type: docker