(fix proxy) model_group/info support rerank models (#5955)

* fix /model_group/info on rerank * add test test_proxy_model_group_info_rerank
2025-04-24 18:24:20 +00:00 · 2024-09-28 10:54:43 -07:00 · 2024-09-28 10:54:43 -07:00 · 8bf7573fd8
commit 8bf7573fd8
parent 088d906276
2 changed files with 65 additions and 1 deletions
--- a/litellm/tests/test_proxy_server.py
+++ b/litellm/tests/test_proxy_server.py
@ -1515,3 +1515,62 @@ async def test_proxy_model_group_alias_checks(prisma_client, hidden):
        assert is_model_alias_in_list is False
    else:
        assert is_model_alias_in_list, f"models: {models}"
+
+
+@pytest.mark.asyncio
+async def test_proxy_model_group_info_rerank(prisma_client):
+    """
+    Check if rerank model is returned on the following endpoints
+
+    `/v1/models`
+    `/v1/model/info`
+    `/v1/model_group/info`
+    """
+    import json
+
+    from fastapi import HTTPException, Request, Response
+    from starlette.datastructures import URL
+
+    from litellm.proxy.proxy_server import model_group_info, model_info_v1, model_list
+
+    setattr(litellm.proxy.proxy_server, "prisma_client", prisma_client)
+    setattr(litellm.proxy.proxy_server, "master_key", "sk-1234")
+    await litellm.proxy.proxy_server.prisma_client.connect()
+
+    proxy_config = getattr(litellm.proxy.proxy_server, "proxy_config")
+
+    _model_list = [
+        {
+            "model_name": "rerank-english-v3.0",
+            "litellm_params": {"model": "cohere/rerank-english-v3.0"},
+            "model_info": {
+                "mode": "rerank",
+            },
+        }
+    ]
+    router = litellm.Router(model_list=_model_list)
+    setattr(litellm.proxy.proxy_server, "llm_router", router)
+    setattr(litellm.proxy.proxy_server, "llm_model_list", _model_list)
+
+    request = Request(scope={"type": "http", "method": "POST", "headers": {}})
+    request._url = URL(url="/v1/models")
+
+    resp = await model_list(
+        user_api_key_dict=UserAPIKeyAuth(models=[]),
+    )
+
+    assert len(resp["data"]) == 1
+    print(resp)
+
+    resp = await model_info_v1(
+        user_api_key_dict=UserAPIKeyAuth(models=[]),
+    )
+    models = resp["data"]
+    assert models[0]["model_info"]["mode"] == "rerank"
+    resp = await model_group_info(
+        user_api_key_dict=UserAPIKeyAuth(models=[]),
+    )
+
+    print(resp)
+    models = resp["data"]
+    assert models[0].mode == "rerank"
--- a/litellm/types/router.py
+++ b/litellm/types/router.py
@ -482,7 +482,12 @@ class ModelGroupInfo(BaseModel):
    output_cost_per_token: Optional[float] = None
    mode: Optional[
        Literal[
-            "chat", "embedding", "completion", "image_generation", "audio_transcription"
+            "chat",
+            "embedding",
+            "completion",
+            "image_generation",
+            "audio_transcription",
+            "rerank",
        ]
    ] = Field(default="chat")
    tpm: Optional[int] = None