From a18fe5a1fdc632b5347beb4f2f87b4a7bd1e43de Mon Sep 17 00:00:00 2001
From: ishaan-jaff <ishaanjaffer0324@gmail.com>
Date: Wed, 15 Nov 2023 16:20:42 -0800
Subject: [PATCH] (fix) proxy raise exceptions from litellm.completion()

---
 litellm/proxy/proxy_server.py | 23 +++++++++++++----------
 1 file changed, 13 insertions(+), 10 deletions(-)

diff --git a/litellm/proxy/proxy_server.py b/litellm/proxy/proxy_server.py
index a7fa7becf..d98d272bd 100644
--- a/litellm/proxy/proxy_server.py
+++ b/litellm/proxy/proxy_server.py
@@ -455,16 +455,19 @@ def litellm_completion(*args, **kwargs):
         kwargs["api_base"] = user_api_base
     ## ROUTE TO CORRECT ENDPOINT ## 
     router_model_names = [m["model_name"] for m in llm_model_list] if llm_model_list is not None else []
-    if llm_router is not None and kwargs["model"] in router_model_names: # model in router model list 
-        if call_type == "chat_completion":
-            response = llm_router.completion(*args, **kwargs)
-        elif call_type == "text_completion":
-            response = llm_router.text_completion(*args, **kwargs)
-    else: 
-        if call_type == "chat_completion":
-            response = litellm.completion(*args, **kwargs)
-        elif call_type == "text_completion":
-            response = litellm.text_completion(*args, **kwargs)
+    try:
+        if llm_router is not None and kwargs["model"] in router_model_names: # model in router model list 
+            if call_type == "chat_completion":
+                response = llm_router.completion(*args, **kwargs)
+            elif call_type == "text_completion":
+                response = llm_router.text_completion(*args, **kwargs)
+        else: 
+            if call_type == "chat_completion":
+                response = litellm.completion(*args, **kwargs)
+            elif call_type == "text_completion":
+                response = litellm.text_completion(*args, **kwargs)
+    except Exception as e:
+        raise e
     if 'stream' in kwargs and kwargs['stream'] == True: # use generate_responses to stream responses
         return StreamingResponse(data_generator(response), media_type='text/event-stream')
     return response