fix(utils.py): support image gen logging to langfuse

2025-04-25 10:44:24 +00:00 · 2024-02-16 16:12:52 -08:00 · 2024-02-16 16:12:52 -08:00 · f57483ea70
commit f57483ea70
parent 5f9e141d1e
5 changed files with 58 additions and 91 deletions
--- a/litellm/utils.py
+++ b/litellm/utils.py
@ -44,9 +44,9 @@ except:
    filename = str(
        resources.files(litellm).joinpath("llms/tokenizers")  # for python 3.10
    )  # for python 3.10+
-os.environ[
-    "TIKTOKEN_CACHE_DIR"
-] = filename  # use local copy of tiktoken b/c of - https://github.com/BerriAI/litellm/issues/1071
+os.environ["TIKTOKEN_CACHE_DIR"] = (
+    filename  # use local copy of tiktoken b/c of - https://github.com/BerriAI/litellm/issues/1071
+)

 encoding = tiktoken.get_encoding("cl100k_base")
 import importlib.metadata
@ -1110,6 +1110,9 @@ class Logging:
                                    completion_response=result,
                                    model=self.model,
                                    call_type=self.call_type,
+                                    custom_llm_provider=self.model_call_details.get(
+                                        "custom_llm_provider", None
+                                    ),  # set for img gen models
                                )
                            )
                        else:
@ -1789,14 +1792,14 @@ class Logging:

                        input = self.model_call_details["input"]

-                        type = (
+                        _type = (
                            "embed"
                            if self.call_type == CallTypes.embedding.value
                            else "llm"
                        )

                        llmonitorLogger.log_event(
-                            type=type,
+                            type=_type,
                            event="error",
                            user_id=self.model_call_details.get("user", "default"),
                            model=model,
@ -3512,6 +3515,15 @@ def completion_cost(
        - If an error occurs during execution, the function returns 0.0 without blocking the user's execution path.
    """
    try:
+
+        if (
+            (call_type == "aimage_generation" or call_type == "image_generation")
+            and model is not None
+            and isinstance(model, str)
+            and len(model) == 0
+            and custom_llm_provider == "azure"
+        ):
+            model = "dall-e-2"  # for dall-e-2, azure expects an empty model name
        # Handle Inputs to completion_cost
        prompt_tokens = 0
        completion_tokens = 0
@ -3565,12 +3577,15 @@ def completion_cost(
            or call_type == CallTypes.aimage_generation.value
        ):
            ### IMAGE GENERATION COST CALCULATION ###
+            # fix size to match naming convention
+            if "x" in size and "-x-" not in size:
+                size = size.replace("x", "-x-")
            image_gen_model_name = f"{size}/{model}"
            image_gen_model_name_with_quality = image_gen_model_name
            if quality is not None:
                image_gen_model_name_with_quality = f"{quality}/{image_gen_model_name}"
            size = size.split("-x-")
-            height = int(size[0])
+            height = int(size[0])  # if it's 1024-x-1024 vs. 1024x1024
            width = int(size[1])
            verbose_logger.debug(f"image_gen_model_name: {image_gen_model_name}")
            verbose_logger.debug(
@ -5968,73 +5983,6 @@ def convert_to_model_response_object(
        raise Exception(f"Invalid response object {e}")


-# NOTE: DEPRECATING this in favor of using success_handler() in Logging:
-def handle_success(args, kwargs, result, start_time, end_time):
-    global heliconeLogger, aispendLogger, supabaseClient, liteDebuggerClient, llmonitorLogger
-    try:
-        model = args[0] if len(args) > 0 else kwargs["model"]
-        input = (
-            args[1]
-            if len(args) > 1
-            else kwargs.get("messages", kwargs.get("input", None))
-        )
-        success_handler = additional_details.pop("success_handler", None)
-        failure_handler = additional_details.pop("failure_handler", None)
-        additional_details["Event_Name"] = additional_details.pop(
-            "successful_event_name", "litellm.succes_query"
-        )
-        for callback in litellm.success_callback:
-            try:
-                if callback == "posthog":
-                    ph_obj = {}
-                    for detail in additional_details:
-                        ph_obj[detail] = additional_details[detail]
-                    event_name = additional_details["Event_Name"]
-                    if "user_id" in additional_details:
-                        posthog.capture(
-                            additional_details["user_id"], event_name, ph_obj
-                        )
-                    else:  # PostHog calls require a unique id to identify a user - https://posthog.com/docs/libraries/python
-                        unique_id = str(uuid.uuid4())
-                        posthog.capture(unique_id, event_name, ph_obj)
-                    pass
-                elif callback == "slack":
-                    slack_msg = ""
-                    for detail in additional_details:
-                        slack_msg += f"{detail}: {additional_details[detail]}\n"
-                    slack_app.client.chat_postMessage(
-                        channel=alerts_channel, text=slack_msg
-                    )
-                elif callback == "aispend":
-                    print_verbose("reaches aispend for logging!")
-                    model = args[0] if len(args) > 0 else kwargs["model"]
-                    aispendLogger.log_event(
-                        model=model,
-                        response_obj=result,
-                        start_time=start_time,
-                        end_time=end_time,
-                        print_verbose=print_verbose,
-                    )
-            except Exception as e:
-                # LOGGING
-                exception_logging(logger_fn=user_logger_fn, exception=e)
-                print_verbose(
-                    f"[Non-Blocking] Success Callback Error - {traceback.format_exc()}"
-                )
-                pass
-
-        if success_handler and callable(success_handler):
-            success_handler(args, kwargs)
-        pass
-    except Exception as e:
-        # LOGGING
-        exception_logging(logger_fn=user_logger_fn, exception=e)
-        print_verbose(
-            f"[Non-Blocking] Success Callback Error - {traceback.format_exc()}"
-        )
-        pass
-
-
 def acreate(*args, **kwargs):  ## Thin client to handle the acreate langchain call
    return litellm.acompletion(*args, **kwargs)