(fix) select_data_generator - sagemaker

2025-04-26 03:04:13 +00:00 · 2024-01-23 12:08:58 -08:00 · 2024-01-23 12:08:58 -08:00 · 00d18cbc86
commit 00d18cbc86
parent 67dddc94d9
1 changed files with 21 additions and 16 deletions
--- a/litellm/proxy/proxy_server.py
+++ b/litellm/proxy/proxy_server.py
@ -1436,6 +1436,19 @@ async def async_data_generator(response, user_api_key_dict):
        yield f"data: {str(e)}\n\n"
 def select_data_generator(response, user_api_key_dict):
    # since boto3 - sagemaker does not support async calls
    if response.custom_llm_provider == "sagemaker":
        return data_generator(
            response=response,
        )
    else:
        # default to async_data_generator
        return async_data_generator(
            response=response, user_api_key_dict=user_api_key_dict
        )
 def get_litellm_model_info(model: dict = {}):
    model_info = model.get("model_info", {})
    model_to_lookup = model.get("litellm_params", {}).get("model", None)
@ -1672,16 +1685,12 @@ async def completion(
            "stream" in data and data["stream"] == True
        ):  # use generate_responses to stream responses
            custom_headers = {"x-litellm-model-id": model_id}
-            stream_content = async_data_generator(
+            selected_data_generator = select_data_generator(
-                user_api_key_dict=user_api_key_dict,
+                response=response, user_api_key_dict=user_api_key_dict
                response=response,
            )
            if response.custom_llm_provider == "sagemaker":
                stream_content = data_generator(
                    response=response,
            )
            return StreamingResponse(
-                stream_content,
+                selected_data_generator,
                media_type="text/event-stream",
                headers=custom_headers,
            )
@ -1839,16 +1848,12 @@ async def chat_completion(
            "stream" in data and data["stream"] == True
        ):  # use generate_responses to stream responses
            custom_headers = {"x-litellm-model-id": model_id}
-            stream_content = async_data_generator(
+            selected_data_generator = select_data_generator(
-                user_api_key_dict=user_api_key_dict,
+                response=response, user_api_key_dict=user_api_key_dict
                response=response,
            )
            if response.custom_llm_provider == "sagemaker":
                stream_content = data_generator(
                    response=response,
            )
            return StreamingResponse(
-                stream_content,
+                selected_data_generator,
                media_type="text/event-stream",
                headers=custom_headers,
            )