LiteLLM Minor Fixes & Improvements (09/19/2024) (#5793)

* fix(model_prices_and_context_window.json): add cost tracking for more vertex llama3.1 model 8b and 70b models * fix(proxy/utils.py): handle data being none on pre-call hooks * fix(proxy/): create views on initial proxy startup fixes base case, where user starts proxy for first time Fixes https://github.com/BerriAI/litellm/issues/5756 * build(config.yml): fix vertex version for test * feat(ui/): support enabling/disabling slack alerting Allows admin to turn on/off slack alerting through ui * feat(rerank/main.py): support langfuse logging * fix(proxy/utils.py): fix linting errors * fix(langfuse.py): log clean metadata * test(tests): replace deprecated openai model
2025-04-25 18:54:30 +00:00 · 2024-09-20 08:19:52 -07:00 · 2024-09-20 08:19:52 -07:00 · 3933fba41f
commit 3933fba41f
parent 696fc387d2
22 changed files with 645 additions and 94 deletions
--- a/litellm/rerank_api/main.py
+++ b/litellm/rerank_api/main.py
@ -103,10 +103,20 @@ def rerank(
            )
        )

+        model_parameters = [
+            "top_n",
+            "rank_fields",
+            "return_documents",
+            "max_chunks_per_doc",
+        ]
+        model_params_dict = {}
+        for k, v in optional_params.model_fields.items():
+            if k in model_parameters:
+                model_params_dict[k] = v
        litellm_logging_obj.update_environment_variables(
            model=model,
            user=user,
-            optional_params=optional_params.model_dump(),
+            optional_params=model_params_dict,
            litellm_params={
                "litellm_call_id": litellm_call_id,
                "proxy_server_request": proxy_server_request,
@ -114,6 +124,7 @@ def rerank(
                "metadata": metadata,
                "preset_cache_key": None,
                "stream_response": {},
+                **optional_params.model_dump(exclude_unset=True),
            },
            custom_llm_provider=_custom_llm_provider,
        )