try/except completion_cost + custom logger func

2023-09-09 18:36:12 -07:00 · 2023-09-09 18:36:12 -07:00 · 7dc694c704
commit 7dc694c704
parent 73c25de950
2 changed files with 80 additions and 30 deletions
--- a/litellm/integrations/custom_logger.py
+++ b/litellm/integrations/custom_logger.py
@ -0,0 +1,36 @@
 #### What this does ####
 #    On success, logs events to Promptlayer
 import dotenv, os
 import requests
 import requests
 dotenv.load_dotenv()  # Loading env variables using dotenv
 import traceback
 class CustomLogger:
    # Class variables or attributes
    def __init__(self, callback_func):
        # Instance variables
        self.callback_func = callback_func
    def log_event(self, kwargs, response_obj, start_time, end_time, print_verbose):
        # Method definition
        try:
            print_verbose(
                f"Custom Logger - Enters logging function for model {kwargs}"
            )
            self.callback_func(
                kwargs, # kwargs to func
                response_obj,
                start_time,
                end_time,
                print_verbose
            )
            print_verbose(
                f"Custom Logger - final response object: {response_obj}"
            )
        except:
            # traceback.print_exc()
            print_verbose(f"Custom Logger Error - {traceback.format_exc()}")
            pass
--- a/litellm/utils.py
+++ b/litellm/utils.py
@ -17,6 +17,7 @@ from .integrations.berrispend import BerriSpendLogger
 from .integrations.supabase import Supabase
 from .integrations.llmonitor import LLMonitorLogger
 from .integrations.prompt_layer import PromptLayerLogger
 from .integrations.custom_logger import CustomLogger
 from .integrations.langfuse import LangFuseLogger
 from .integrations.litedebugger import LiteDebugger
 from openai.error import OpenAIError as OriginalError
@ -46,6 +47,7 @@ slack_app = None
 alerts_channel = None
 heliconeLogger = None
 promptLayerLogger = None
 customLogger = None
 langFuseLogger = None
 llmonitorLogger = None
 aispendLogger = None
@ -677,35 +679,37 @@ def completion_cost(
        completion="",
        total_time=0.0, # used for replicate
    ):
    try:
        # Handle Inputs to completion_cost
        prompt_tokens = 0
        completion_tokens = 0
        if completion_response != None:
            # get input/output tokens from completion_response
            prompt_tokens = completion_response['usage']['prompt_tokens']
            completion_tokens = completion_response['usage']['completion_tokens']
            model = completion_response['model'] # get model from completion_response
        else:
            prompt_tokens = token_counter(model=model, text=prompt)
            completion_tokens = token_counter(model=model, text=completion)
-    # Handle Inputs to completion_cost
+        # Calculate cost based on prompt_tokens, completion_tokens
-    prompt_tokens = 0
+        if "togethercomputer" in model:
-    completion_tokens = 0
+            # together ai prices based on size of llm
-    if completion_response != None:
+            # get_model_params_and_category takes a model name and returns the category of LLM size it is in model_prices_and_context_window.json 
-        # get input/output tokens from completion_response
+            model = get_model_params_and_category(model)
-        prompt_tokens = completion_response['usage']['prompt_tokens']
+        # replicate llms are calculate based on time for request running
-        completion_tokens = completion_response['usage']['completion_tokens']
+        # see https://replicate.com/pricing
-        model = completion_response['model'] # get model from completion_response
+        elif (
-    else:
+            model in litellm.replicate_models or
-        prompt_tokens = token_counter(model=model, text=prompt)
+            "replicate" in model
-        completion_tokens = token_counter(model=model, text=completion)
+        ):
-    
+            return get_replicate_completion_pricing(completion_response, total_time)
-    # Calculate cost based on prompt_tokens, completion_tokens
+        prompt_tokens_cost_usd_dollar, completion_tokens_cost_usd_dollar = cost_per_token(
-    if "togethercomputer" in model:
+            model=model, prompt_tokens=prompt_tokens, completion_tokens=completion_tokens
-        # together ai prices based on size of llm
+        )
-        # get_model_params_and_category takes a model name and returns the category of LLM size it is in model_prices_and_context_window.json 
+        return prompt_tokens_cost_usd_dollar + completion_tokens_cost_usd_dollar
-        model = get_model_params_and_category(model)
+    except:
-    # replicate llms are calculate based on time for request running
+        return 0.0 # this should not block a users execution path
    # see https://replicate.com/pricing
    elif (
        model in litellm.replicate_models or
        "replicate" in model
    ):
        return get_replicate_completion_pricing(completion_response, total_time)
    prompt_tokens_cost_usd_dollar, completion_tokens_cost_usd_dollar = cost_per_token(
        model=model, prompt_tokens=prompt_tokens, completion_tokens=completion_tokens
    )
    return prompt_tokens_cost_usd_dollar + completion_tokens_cost_usd_dollar
 ####### HELPER FUNCTIONS ################
 def get_litellm_params(
@ -993,7 +997,7 @@ def validate_environment():
        return api_key
 def set_callbacks(callback_list, function_id=None):
-    global sentry_sdk_instance, capture_exception, add_breadcrumb, posthog, slack_app, alerts_channel, traceloopLogger, heliconeLogger, aispendLogger, berrispendLogger, supabaseClient, liteDebuggerClient, llmonitorLogger, promptLayerLogger, langFuseLogger
+    global sentry_sdk_instance, capture_exception, add_breadcrumb, posthog, slack_app, alerts_channel, traceloopLogger, heliconeLogger, aispendLogger, berrispendLogger, supabaseClient, liteDebuggerClient, llmonitorLogger, promptLayerLogger, langFuseLogger, customLogger
    try:
        for callback in callback_list:
            print_verbose(f"callback: {callback}")
@ -1073,6 +1077,8 @@ def set_callbacks(callback_list, function_id=None):
                    liteDebuggerClient = LiteDebugger(email=litellm.email)
                else:
                    liteDebuggerClient = LiteDebugger(email=str(uuid.uuid4()))
            elif callable(callback):
                customLogger = CustomLogger()
    except Exception as e:
        raise e
@ -1366,6 +1372,14 @@ def handle_success(args, kwargs, result, start_time, end_time):
                        litellm_call_id=kwargs["litellm_call_id"],
                        print_verbose=print_verbose,
                    )
                elif callable(callback): # custom logger functions
                    customLogger.log_event(
                        kwargs=kwargs,
                        response_obj=result,
                        start_time=start_time,
                        end_time=end_time,
                        print_verbose=print_verbose,
                    )
            except Exception as e:
                # LOGGING
                exception_logging(logger_fn=user_logger_fn, exception=e)