Add rerank API for NVIDIA Inference Provider

2025-10-04 04:04:14 +00:00 · 2025-09-03 17:34:05 -07:00 · 2025-09-03 17:34:05 -07:00 · bab9d7aaea
commit bab9d7aaea
parent ce77c27ff8
9 changed files with 9213 additions and 1 deletions
--- a/llama_stack/apis/models/models.py
+++ b/llama_stack/apis/models/models.py
@ -27,10 +27,12 @@ class ModelType(StrEnum):
    """Enumeration of supported model types in Llama Stack.
    :cvar llm: Large language model for text generation and completion
    :cvar embedding: Embedding model for converting text to vector representations
+    :cvar rerank: Reranking model for reordering documents by relevance
    """

    llm = "llm"
    embedding = "embedding"
+    rerank = "rerank"


@json_schema_type