llama-stack-mirror

mirror of https://github.com/meta-llama/llama-stack.git synced 2025-12-03 18:00:36 +00:00

History

Jiayi Ni fa7699d2c3 feat: Add rerank API for NVIDIA Inference Provider (#3329 ) # What does this PR do? Add rerank API for NVIDIA Inference Provider. <!-- If resolving an issue, uncomment and update the line below --> Closes #3278 ## Test Plan Unit test: ``` pytest tests/unit/providers/nvidia/test_rerank_inference.py ``` Integration test: ``` pytest -s -v tests/integration/inference/test_rerank.py --stack-config="inference=nvidia" --rerank-model=nvidia/nvidia/nv-rerankqa-mistral-4b-v3 --env NVIDIA_API_KEY="" --env NVIDIA_BASE_URL="https://integrate.api.nvidia.com" ```		2025-10-30 21:42:09 -07:00
..
agents	feat(stores)!: use backend storage references instead of configs (#3697 )	2025-10-20 13:20:09 -07:00
batches	feat(stores)!: use backend storage references instead of configs (#3697 )	2025-10-20 13:20:09 -07:00
datasetio	feat(stores)!: use backend storage references instead of configs (#3697 )	2025-10-20 13:20:09 -07:00
eval	feat(stores)!: use backend storage references instead of configs (#3697 )	2025-10-20 13:20:09 -07:00
external	chore: update doc (#3857 )	2025-10-20 10:33:21 -07:00
files	feat: openai files provider (#3946 )	2025-10-28 16:25:03 -07:00
inference	feat: Add rerank API for NVIDIA Inference Provider (#3329 )	2025-10-30 21:42:09 -07:00
post_training	docs: fix broken links (#3540 )	2025-09-24 14:16:31 -07:00
safety	feat: add refresh_models support to inference adapters (default: false) (#3719 )	2025-10-07 15:19:56 +02:00
scoring	docs: fix broken links (#3540 )	2025-09-24 14:16:31 -07:00
tool_runtime	docs: fix broken links (#3540 )	2025-09-24 14:16:31 -07:00
vector_io	chore!: BREAKING CHANGE: vector_db_id -> vector_store_id (#3923 )	2025-10-27 14:26:06 -07:00
index.mdx	chore: update docs for telemetry api removal (#3900 )	2025-10-24 13:57:28 -07:00
openai.mdx	docs: Document known limitations of Responses (#3776 )	2025-10-16 10:26:23 -07:00
openai_responses_limitations.mdx	docs: Document known limitations of Responses (#3776 )	2025-10-16 10:26:23 -07:00