llama-stack-mirror

mirror of https://github.com/meta-llama/llama-stack.git synced 2025-12-17 15:52:39 +00:00

History

Dinesh Yeduguru 4f8b73b9e1 Vector store inference api (#598 ) # What does this PR do? Moves all the memory providers to use the inference API and improved the memory tests to setup the inference stack correctly and use the embedding models ## Test Plan torchrun $CONDA_PREFIX/bin/pytest -v -s -k "meta_reference" --inference-model="Llama3.2-3B-Instruct" --embedding-model="sentence-transformers/all-MiniLM-L6-v2" llama_stack/providers/tests/inference/test_embeddings.py --env EMBEDDING_DIMENSION=384 pytest -v -s llama_stack/providers/tests/memory/test_memory.py --providers="inference=together,memory=weaviate" --embedding-model="togethercomputer/m2-bert-80M-2k-retrieval" --env EMBEDDING_DIMENSION=768 --env TOGETHER_API_KEY=<API-KEY> --env WEAVIATE_API_KEY=foo --env WEAVIATE_CLUSTER_URL=bar pytest -v -s llama_stack/providers/tests/memory/test_memory.py --providers="inference=together,memory=chroma" --embedding-model="togethercomputer/m2-bert-80M-2k-retrieval" --env EMBEDDING_DIMENSION=768 --env TOGETHER_API_KEY=<API-KEY>--env CHROMA_HOST=localhost --env CHROMA_PORT=8000 pytest -v -s llama_stack/providers/tests/memory/test_memory.py --providers="inference=together,memory=pgvector" --embedding-model="togethercomputer/m2-bert-80M-2k-retrieval" --env PGVECTOR_DB=postgres --env PGVECTOR_USER=postgres --env PGVECTOR_PASSWORD=mysecretpassword --env PGVECTOR_HOST=0.0.0.0 --env EMBEDDING_DIMENSION=768 --env TOGETHER_API_KEY=<API-KEY> pytest -v -s llama_stack/providers/tests/memory/test_memory.py --providers="inference=together,memory=faiss" --embedding-model="togethercomputer/m2-bert-80M-2k-retrieval" --env EMBEDDING_DIMENSION=768 --env TOGETHER_API_KEY=<API-KEY>		2024-12-12 11:16:54 -08:00
..
agents	add tracing back to the lib cli (#595 )	2024-12-11 08:44:20 -08:00
datasetio	Telemetry API redesign (#525 )	2024-12-04 11:22:45 -08:00
eval	Add ability to query and export spans to dataset (#574 )	2024-12-05 21:07:30 -08:00
inference	remove unused check_model	2024-12-12 11:15:38 -08:00
ios/inference	`impls` -> `inline`, `adapters` -> `remote` (#381 )	2024-11-06 14:54:05 -08:00
memory	Vector store inference api (#598 )	2024-12-12 11:16:54 -08:00
meta_reference	Telemetry API redesign (#525 )	2024-12-04 11:22:45 -08:00
safety	use logging instead of prints (#499 )	2024-11-21 11:32:53 -08:00
scoring	[/scoring] add ability to define aggregation functions for scoring functions & refactors (#597 )	2024-12-11 10:03:42 -08:00
telemetry	add tracing back to the lib cli (#595 )	2024-12-11 08:44:20 -08:00
__init__.py	`impls` -> `inline`, `adapters` -> `remote` (#381 )	2024-11-06 14:54:05 -08:00