fix(proxy_server): fix prompt template for proxy server

2023-10-11 21:08:34 -07:00 · 2023-10-11 21:08:34 -07:00 · 4b0f8825f3
commit 4b0f8825f3
parent 413097f0a7
4 changed files with 24 additions and 22 deletions
--- a/litellm/proxy/proxy_server.py
+++ b/litellm/proxy/proxy_server.py
@ -245,9 +245,8 @@ def deploy_proxy(model, api_base, debug, temperature, max_tokens, telemetry, dep

 # for streaming
 def data_generator(response):
-    print("inside generator")
+    print_verbose("inside generator")
    for chunk in response:
-        print(f"chunk: {chunk}")
        print_verbose(f"returned chunk: {chunk}")
        yield f"data: {json.dumps(chunk)}\n\n"

@ -302,26 +301,6 @@ def litellm_completion(data, type):
            data["max_tokens"] = user_max_tokens
        if user_api_base: 
            data["api_base"] = user_api_base
-        ## CUSTOM PROMPT TEMPLATE ##  - run `litellm --config` to set this
-        litellm.register_prompt_template(
-            model=user_model, 
-            roles={
-                "system": {
-                    "pre_message": os.getenv("MODEL_SYSTEM_MESSAGE_START_TOKEN", ""),
-                    "post_message": os.getenv("MODEL_SYSTEM_MESSAGE_END_TOKEN", ""),    
-                }, 
-                "assistant": {
-                    "pre_message": os.getenv("MODEL_ASSISTANT_MESSAGE_START_TOKEN", ""), 
-                    "post_message": os.getenv("MODEL_ASSISTANT_MESSAGE_END_TOKEN", "")
-                }, 
-                "user": {
-                    "pre_message": os.getenv("MODEL_USER_MESSAGE_START_TOKEN", ""), 
-                    "post_message": os.getenv("MODEL_USER_MESSAGE_END_TOKEN", "")
-                }
-            },
-            initial_prompt_value=os.getenv("MODEL_PRE_PROMPT", ""), 
-            final_prompt_value=os.getenv("MODEL_POST_PROMPT", "")
-        )
        if type == "completion": 
            response = litellm.text_completion(**data)
        elif type == "chat_completion":