llama-stack

History

Yuan Tang a27a2cd2af Add vLLM inference provider for OpenAI compatible vLLM server (#178 ) This PR adds vLLM inference provider for OpenAI compatible vLLM server.		2024-10-20 18:43:25 -07:00
..
adapters	Add vLLM inference provider for OpenAI compatible vLLM server (#178 )	2024-10-20 18:43:25 -07:00
impls	Make all methods `async def` again; add completion() for meta-reference (#270 )	2024-10-18 20:50:59 -07:00
registry	Add vLLM inference provider for OpenAI compatible vLLM server (#178 )	2024-10-20 18:43:25 -07:00
tests	Make all methods `async def` again; add completion() for meta-reference (#270 )	2024-10-18 20:50:59 -07:00
utils	Remove request arg from chat completion response processing (#240 )	2024-10-15 13:03:17 -07:00
__init__.py	API Updates (#73 )	2024-09-17 19:51:35 -07:00
datatypes.py	Remove "routing_table" and "routing_key" concepts for the user (#201 )	2024-10-10 10:24:13 -07:00