llama-stack-mirror

mirror of https://github.com/meta-llama/llama-stack.git synced 2025-12-17 19:42:36 +00:00

History

Dinesh Yeduguru d362d2d740 implement embedding generation in supported inference providers (#589 ) This PR adds the ability to generate embeddings in all supported inference providers. ``` pytest -v -s llama_stack/providers/tests/inference/test_embeddings.py -k "bedrock" --inference-model="amazon.titan-embed-text-v2:0" --env EMBEDDING_DIMENSION=1024 pytest -v -s -k "vllm" --inferrence-model="intfloat/e5-mistral-7b-instruct" llama_stack/providers/tests/inference/test_embeddings.py --env EMBEDDING_DIMENSION=4096 --env VLLM_URL="http://localhost:9798/v1" pytest -v -s --inference-model="nomic-ai/nomic-embed-text-v1.5" llama_stack/providers/tests/inference/test_embeddings.py -k "fireworks" --env FIREWORKS_API_KEY=<API_KEY>--env EMBEDDING_DIMENSION=128 pytest -v -s --inference-model="togethercomputer/m2-bert-80M-2k-retrieval" llama_stack/providers/tests/inference/test_embeddings.py -k "together" --env TOGETHER_API_KEY=<API_KEY>--env EMBEDDING_DIMENSION=768 pytest -v -s -k "ollama" --inference-model="all-minilm:v8" llama_stack/providers/tests/inference/test_embeddings.py --env EMBEDDING_DIMENSION=384 torchrun $CONDA_PREFIX/bin/pytest -v -s -k "meta_reference" --inference-model="sentence-transformers/all-MiniLM-L6-v2" llama_stack/providers/tests/inference/test_embeddings.py --env EMBEDDING_DIMENSION=384 ```		2024-12-12 11:25:09 -08:00
..
agents	memory retrival to print only the bytes injected	2024-12-10 09:32:18 -08:00
batch_inference	Add version to REST API url (#478 )	2024-11-18 22:44:14 -08:00
common	[Evals API][4/n] evals with generation meta-reference impl (#303 )	2024-10-25 13:12:39 -07:00
datasetio	Telemetry API redesign (#525 )	2024-12-04 11:22:45 -08:00
datasets	unregister API for dataset (#507 )	2024-12-03 21:18:30 -08:00
eval	Add version to REST API url (#478 )	2024-11-18 22:44:14 -08:00
eval_tasks	Add version to REST API url (#478 )	2024-11-18 22:44:14 -08:00
inference	Console span processor improvements (#577 )	2024-12-06 11:46:16 -08:00
inspect	Remove "routing_table" and "routing_key" concepts for the user (#201 )	2024-10-10 10:24:13 -07:00
memory	Console span processor improvements (#577 )	2024-12-06 11:46:16 -08:00
memory_banks	Revert "Revert "add model type to APIs" (#605 )"	2024-12-12 11:19:32 -08:00
models	implement embedding generation in supported inference providers (#589 )	2024-12-12 11:25:09 -08:00
post_training	Add version to REST API url (#478 )	2024-11-18 22:44:14 -08:00
safety	Console span processor improvements (#577 )	2024-12-06 11:46:16 -08:00
scoring	Add version to REST API url (#478 )	2024-11-18 22:44:14 -08:00
scoring_functions	[/scoring] add ability to define aggregation functions for scoring functions & refactors (#597 )	2024-12-11 10:03:42 -08:00
shields	Console span processor improvements (#577 )	2024-12-06 11:46:16 -08:00
synthetic_data_generation	Add version to REST API url (#478 )	2024-11-18 22:44:14 -08:00
telemetry	Regenerate openapi	2024-12-08 20:46:22 -08:00
__init__.py	API Updates (#73 )	2024-09-17 19:51:35 -07:00
resource.py	Enable sane naming of registered objects with defaults (#429 )	2024-11-12 11:18:05 -08:00
version.py	Fix the pyopenapi generator avoid potential circular imports	2024-11-18 23:37:52 -08:00