fix(groq/chat/transformation.py): handle groq streaming errors correctly

2025-04-25 02:34:29 +00:00 · 2025-04-15 20:56:04 -07:00 · 2025-04-15 20:56:04 -07:00 · 1fc9de1928
commit 1fc9de1928
parent bd5cbc0316
1 changed files with 46 additions and 1 deletions
--- a/litellm/llms/groq/chat/transformation.py
+++ b/litellm/llms/groq/chat/transformation.py
@ -2,10 +2,14 @@
 Translate from OpenAI's `/v1/chat/completions` to Groq's `/v1/chat/completions`
 """
-from typing import List, Optional, Tuple, Union
+from typing import Any, AsyncIterator, Iterator, List, Optional, Tuple, Union
 from pydantic import BaseModel
 from litellm.llms.base_llm.chat.transformation import BaseLLMException
 from litellm.llms.openai.chat.gpt_transformation import (
    OpenAIChatCompletionStreamingHandler,
 )
 from litellm.secret_managers.main import get_secret_str
 from litellm.types.llms.openai import (
    AllMessageValues,
@ -13,10 +17,15 @@ from litellm.types.llms.openai import (
    ChatCompletionToolParam,
    ChatCompletionToolParamFunctionChunk,
 )
 from litellm.types.utils import ModelResponse, ModelResponseStream
 from ...openai.chat.gpt_transformation import OpenAIGPTConfig
 class GroqError(BaseLLMException):
    pass
 class GroqChatConfig(OpenAIGPTConfig):
    frequency_penalty: Optional[int] = None
    function_call: Optional[Union[str, dict]] = None
@ -155,3 +164,39 @@ class GroqChatConfig(OpenAIGPTConfig):
        return super().map_openai_params(
            non_default_params, optional_params, model, drop_params
        )
    def get_model_response_iterator(
        self,
        streaming_response: Union[Iterator[str], AsyncIterator[str], ModelResponse],
        sync_stream: bool,
        json_mode: Optional[bool] = False,
    ) -> Any:
        return GroqChatCompletionStreamingHandler(
            streaming_response=streaming_response,
            sync_stream=sync_stream,
            json_mode=json_mode,
        )
 class GroqChatCompletionStreamingHandler(OpenAIChatCompletionStreamingHandler):
    def chunk_parser(self, chunk: dict) -> ModelResponseStream:
        try:
            ## HANDLE ERROR IN CHUNK ##
            if "error" in chunk:
                error_chunk = chunk["error"]
                raise GroqError(
                    message="{}, Failed generation: {}".format(
                        error_chunk["message"], error_chunk["failed_generation"]
                    ),
                    status_code=error_chunk["status_code"],
                )
            return super().chunk_parser(chunk)
        except KeyError as e:
            raise GroqError(
                message=f"KeyError: {e}, Got unexpected response from Groq: {chunk}",
                status_code=400,
                headers={"Content-Type": "application/json"},
            )
        except Exception as e:
            raise e