(feat) proxy use main.py

2023-10-21 12:33:51 -07:00 · 2023-10-21 12:33:51 -07:00 · 00a6b4067d
commit 00a6b4067d
parent e5e82c7474
1 changed files with 83 additions and 0 deletions
--- a/litellm-proxy/main.py
+++ b/litellm-proxy/main.py
@ -0,0 +1,83 @@
+
+import litellm
+from fastapi import FastAPI, Request
+from fastapi.routing import APIRouter
+from fastapi.responses import StreamingResponse, FileResponse
+from fastapi.middleware.cors import CORSMiddleware
+import json
+
+app = FastAPI()
+router = APIRouter()
+origins = ["*"]
+
+app.add_middleware(
+    CORSMiddleware,
+    allow_origins=origins,
+    allow_credentials=True,
+    allow_methods=["*"],
+    allow_headers=["*"],
+)
+
+
+#### API ENDPOINTS ####
+@router.post("/v1/models")
+@router.get("/models")  # if project requires model list
+def model_list():
+    all_models = litellm.utils.get_valid_models()
+    return dict(
+        data=[
+            {
+                "id": model,
+                "object": "model",
+                "created": 1677610602,
+                "owned_by": "openai",
+            }
+            for model in all_models
+        ],
+        object="list",
+    )
+# for streaming
+def data_generator(response):
+    print("inside generator")
+    for chunk in response:
+        print(f"returned chunk: {chunk}")
+        yield f"data: {json.dumps(chunk)}\n\n"
+
+@router.post("/v1/completions")
+@router.post("/completions")
+async def completion(request: Request):
+    data = await request.json()
+    response = litellm.completion(
+        **data
+    )
+    if 'stream' in data and data['stream'] == True: # use generate_responses to stream responses
+            return StreamingResponse(data_generator(response), media_type='text/event-stream')
+    return response
+
+
+@router.post("/v1/chat/completions")
+@router.post("/chat/completions")
+async def chat_completion(request: Request):
+    litellm.set_verbose=True
+    print("got chat completion requet")
+    data = await request.json()
+    print(data)
+    print(request.headers)
+
+    api_key = request.headers.get("authorization")
+    print(api_key)
+    api_key = api_key.split(" ")[1]
+    data["api_key"] = api_key
+    response = litellm.completion(
+        **data
+    )
+    if 'stream' in data and data['stream'] == True: # use generate_responses to stream responses
+            return StreamingResponse(data_generator(response), media_type='text/event-stream')
+    return response
+
+@router.get("/")
+async def home(request: Request):
+    return "LiteLLM: RUNNING"
+
+
+app.include_router(router)