fix(http_handler.py): mask gemini api key in error logs

Fixes https://github.com/BerriAI/litellm/issues/6963
2024-11-29 14:25:00 -08:00 · 2024-11-29 14:25:00 -08:00 · a2dc3cec95
commit a2dc3cec95
parent 7624cc45e6
2 changed files with 116 additions and 4 deletions
--- a/litellm/llms/custom_httpx/http_handler.py
+++ b/litellm/llms/custom_httpx/http_handler.py
@ -28,6 +28,58 @@ headers = {
 _DEFAULT_TIMEOUT = httpx.Timeout(timeout=5.0, connect=5.0)
 _DEFAULT_TTL_FOR_HTTPX_CLIENTS = 3600  # 1 hour, re-use the same httpx client for 1 hour

+import re
+
+
+def mask_sensitive_info(error_message):
+    # Find the start of the key parameter
+    key_index = error_message.find("key=")
+
+    # If key is found
+    if key_index != -1:
+        # Find the end of the key parameter (next & or end of string)
+        next_param = error_message.find("&", key_index)
+
+        if next_param == -1:
+            # If no more parameters, mask until the end of the string
+            masked_message = error_message[: key_index + 4] + "[REDACTED_API_KEY]"
+        else:
+            # Replace the key with redacted value, keeping other parameters
+            masked_message = (
+                error_message[: key_index + 4]
+                + "[REDACTED_API_KEY]"
+                + error_message[next_param:]
+            )
+
+        return masked_message
+
+    return error_message
+
+
+class MaskedHTTPStatusError(httpx.HTTPStatusError):
+    def __init__(
+        self, original_error, message: Optional[str] = None, text: Optional[str] = None
+    ):
+        # Create a new error with the masked URL
+        masked_url = mask_sensitive_info(str(original_error.request.url))
+        # Create a new error that looks like the original, but with a masked URL
+
+        super().__init__(
+            message=original_error.message,
+            request=httpx.Request(
+                method=original_error.request.method,
+                url=masked_url,
+                headers=original_error.request.headers,
+                content=original_error.request.content,
+            ),
+            response=httpx.Response(
+                status_code=original_error.response.status_code,
+                content=original_error.response.content,
+            ),
+        )
+        self.message = message
+        self.text = text
+

 class AsyncHTTPHandler:
    def __init__(
@ -155,13 +207,17 @@ class AsyncHTTPHandler:
                headers=headers,
            )
        except httpx.HTTPStatusError as e:
-            setattr(e, "status_code", e.response.status_code)
+
            if stream is True:
                setattr(e, "message", await e.response.aread())
                setattr(e, "text", await e.response.aread())
            else:
                setattr(e, "message", e.response.text)
                setattr(e, "text", e.response.text)
+            e = MaskedHTTPStatusError(
+                e, message=getattr(e, "message", None), text=getattr(e, "text", None)
+            )
+            setattr(e, "status_code", e.response.status_code)
            raise e
        except Exception as e:
            raise e
@ -399,11 +455,20 @@ class HTTPHandler:
                llm_provider="litellm-httpx-handler",
            )
        except httpx.HTTPStatusError as e:
-            setattr(e, "status_code", e.response.status_code)
+            error_text = mask_sensitive_info(e.response.text)
+
            if stream is True:
-                setattr(e, "message", e.response.read())
+                setattr(e, "message", mask_sensitive_info(e.response.read()))
+                setattr(e, "text", mask_sensitive_info(e.response.read()))
            else:
-                setattr(e, "message", e.response.text)
+                setattr(e, "message", error_text)
+                setattr(e, "text", error_text)
+
+            e = MaskedHTTPStatusError(
+                e, message=getattr(e, "message", None), text=getattr(e, "text", None)
+            )
+            setattr(e, "status_code", e.response.status_code)
+
            raise e
        except Exception as e:
            raise e
--- a/tests/local_testing/test_utils.py
+++ b/tests/local_testing/test_utils.py
@ -1032,3 +1032,50 @@ def test_get_end_user_id_for_cost_tracking(
        get_end_user_id_for_cost_tracking(litellm_params=litellm_params)
        == expected_end_user_id
    )
+
+
+@pytest.mark.parametrize("sync_mode", [True, False])
+@pytest.mark.asyncio
+async def test_sensitive_url_filtering(sync_mode):
+    """ensure gemini api key not leaked in logs - Relevant Issue: https://github.com/BerriAI/litellm/issues/6963"""
+    from litellm.llms.custom_httpx.http_handler import HTTPHandler, AsyncHTTPHandler
+    import json
+    import httpx
+
+    client = HTTPHandler() if sync_mode else AsyncHTTPHandler()
+    gemini_api_key = os.getenv("GEMINI_API_KEY")
+    request_data = {
+        "input": [{"content": "hey, how's it going?"}],
+        "model": "text-embedding-004",
+        "max_tokens": 200,  # invalid param
+    }
+    with pytest.raises(httpx.HTTPStatusError) as e:
+        if sync_mode:
+            client.post(
+                url=f"https://generativelanguage.googleapis.com/v1beta/models/text-embedding-004:batchEmbedContents?key={gemini_api_key}",
+                data=json.dumps(request_data),
+            )
+        else:
+            await client.post(
+                url=f"https://generativelanguage.googleapis.com/v1beta/models/text-embedding-004:batchEmbedContents?key={gemini_api_key}",
+                data=json.dumps(request_data),
+            )
+    print(e.traceback)
+    print(f"exception received: {e._excinfo[1]}")
+    assert gemini_api_key not in str(e._excinfo[1])
+
+    with pytest.raises(litellm.BadRequestError) as e:
+        if sync_mode:
+            litellm.embedding(
+                model="gemini/text-embedding-004",
+                input="hey, how's it going?",
+                max_tokens=200,
+            )
+        else:
+            await litellm.embedding(
+                model="gemini/text-embedding-004",
+                input="hey, how's it going?",
+                max_tokens=200,
+            )
+
+    assert "invalid json payload" in str(e._excinfo[1]).lower()