llama-stack-mirror

mirror of https://github.com/meta-llama/llama-stack.git synced 2025-12-17 17:49:49 +00:00

History

Dinesh Yeduguru d362d2d740 implement embedding generation in supported inference providers (#589 ) This PR adds the ability to generate embeddings in all supported inference providers. ``` pytest -v -s llama_stack/providers/tests/inference/test_embeddings.py -k "bedrock" --inference-model="amazon.titan-embed-text-v2:0" --env EMBEDDING_DIMENSION=1024 pytest -v -s -k "vllm" --inferrence-model="intfloat/e5-mistral-7b-instruct" llama_stack/providers/tests/inference/test_embeddings.py --env EMBEDDING_DIMENSION=4096 --env VLLM_URL="http://localhost:9798/v1" pytest -v -s --inference-model="nomic-ai/nomic-embed-text-v1.5" llama_stack/providers/tests/inference/test_embeddings.py -k "fireworks" --env FIREWORKS_API_KEY=<API_KEY>--env EMBEDDING_DIMENSION=128 pytest -v -s --inference-model="togethercomputer/m2-bert-80M-2k-retrieval" llama_stack/providers/tests/inference/test_embeddings.py -k "together" --env TOGETHER_API_KEY=<API_KEY>--env EMBEDDING_DIMENSION=768 pytest -v -s -k "ollama" --inference-model="all-minilm:v8" llama_stack/providers/tests/inference/test_embeddings.py --env EMBEDDING_DIMENSION=384 torchrun $CONDA_PREFIX/bin/pytest -v -s -k "meta_reference" --inference-model="sentence-transformers/all-MiniLM-L6-v2" llama_stack/providers/tests/inference/test_embeddings.py --env EMBEDDING_DIMENSION=384 ```		2024-12-12 11:25:09 -08:00
..
__init__.py	Added support for llama 3.3 model (#601 )	2024-12-10 20:03:31 -08:00
embedding_mixin.py	implement embedding generation in supported inference providers (#589 )	2024-12-12 11:25:09 -08:00
model_registry.py	Revert "Revert "add model type to APIs" (#605 )"	2024-12-12 11:19:32 -08:00
openai_compat.py	Enable vision models for (Together, Fireworks, Meta-Reference, Ollama) (#376 )	2024-11-05 16:22:33 -08:00
prompt_adapter.py	use logging instead of prints (#499 )	2024-11-21 11:32:53 -08:00