fix(triton/completion/transformation.py): remove bad_words / stop wor… (#10163)

* fix(triton/completion/transformation.py): remove bad_words / stop words from triton call parameter 'bad_words' has invalid type. It should be either 'int', 'bool', or 'string'. * fix(proxy_track_cost_callback.py): add debug logging for track cost callback error
2025-04-24 18:24:20 +00:00 · 2025-04-19 11:23:37 -07:00 · 2025-04-19 11:23:37 -07:00 · 5c929317cd
commit 5c929317cd
parent f08a4e3c06
4 changed files with 49 additions and 4 deletions
--- a/litellm/llms/triton/completion/transformation.py
+++ b/litellm/llms/triton/completion/transformation.py
@ -201,8 +201,6 @@ class TritonGenerateConfig(TritonConfig):
                "max_tokens": int(
                    optional_params.get("max_tokens", DEFAULT_MAX_TOKENS_FOR_TRITON)
                ),
-                "bad_words": [""],
-                "stop_words": [""],
            },
            "stream": bool(stream),
        }
--- a/litellm/proxy/hooks/proxy_track_cost_callback.py
+++ b/litellm/proxy/hooks/proxy_track_cost_callback.py
@ -199,9 +199,13 @@ class _ProxyDBLogger(CustomLogger):
        except Exception as e:
            error_msg = f"Error in tracking cost callback - {str(e)}\n Traceback:{traceback.format_exc()}"
            model = kwargs.get("model", "")
-            metadata = kwargs.get("litellm_params", {}).get("metadata", {})
+            metadata = get_litellm_metadata_from_kwargs(kwargs=kwargs)
+            litellm_metadata = kwargs.get("litellm_params", {}).get(
+                "litellm_metadata", {}
+            )
+            old_metadata = kwargs.get("litellm_params", {}).get("metadata", {})
            call_type = kwargs.get("call_type", "")
-            error_msg += f"\n Args to _PROXY_track_cost_callback\n model: {model}\n metadata: {metadata}\n call_type: {call_type}\n"
+            error_msg += f"\n Args to _PROXY_track_cost_callback\n model: {model}\n chosen_metadata: {metadata}\n litellm_metadata: {litellm_metadata}\n old_metadata: {old_metadata}\n call_type: {call_type}\n"
            asyncio.create_task(
                proxy_logging_obj.failed_tracking_alert(
                    error_message=error_msg,
--- a/tests/litellm/litellm_core_utils/test_core_helpers.py
+++ b/tests/litellm/litellm_core_utils/test_core_helpers.py
@ -0,0 +1,22 @@
+import json
+import os
+import sys
+from unittest.mock import MagicMock, patch
+
+import pytest
+
+sys.path.insert(
+    0, os.path.abspath("../../..")
+)  # Adds the parent directory to the system path
+
+from litellm.litellm_core_utils.core_helpers import get_litellm_metadata_from_kwargs
+
+
+def test_get_litellm_metadata_from_kwargs():
+    kwargs = {
+        "litellm_params": {
+            "litellm_metadata": {},
+            "metadata": {"user_api_key": "1234567890"},
+        },
+    }
+    assert get_litellm_metadata_from_kwargs(kwargs) == {"user_api_key": "1234567890"}
--- a/tests/llm_translation/test_triton.py
+++ b/tests/llm_translation/test_triton.py
@ -20,6 +20,7 @@ from litellm.llms.triton.embedding.transformation import TritonEmbeddingConfig
 import litellm


+
 def test_split_embedding_by_shape_passes():
    try:
        data = [
@ -230,3 +231,23 @@ async def test_triton_embeddings():
        assert response.data[0]["embedding"] == [0.1, 0.2]
    except Exception as e:
        pytest.fail(f"Error occurred: {e}")
+
+
+
+def test_triton_generate_raw_request():
+    from litellm.utils import return_raw_request
+    from litellm.types.utils import CallTypes
+    try:
+        kwargs = {
+            "model": "triton/llama-3-8b-instruct",
+            "messages": [{"role": "user", "content": "who are u?"}],
+            "api_base": "http://localhost:8000/generate",
+        }
+        raw_request = return_raw_request(endpoint=CallTypes.completion, kwargs=kwargs)
+        print("raw_request", raw_request)
+        assert raw_request is not None
+        assert "bad_words" not in json.dumps(raw_request["raw_request_body"])
+        assert "stop_words" not in json.dumps(raw_request["raw_request_body"])
+    except Exception as e:
+        pytest.fail(f"Error occurred: {e}")
+