Litellm dev 04 10 2025 p3 (#9903)

* feat(managed_files.py): encode file type in unified file id simplify calling gemini models * fix(common_utils.py): fix extracting file type from unified file id * fix(litellm_logging.py): create standard logging payload for create file call * fix: fix linting error
2025-04-26 11:14:04 +00:00 · 2025-04-11 09:29:42 -07:00 · 2025-04-11 09:29:42 -07:00 · 9e27d77756
commit 9e27d77756
parent a451fc7cad
10 changed files with 99 additions and 22 deletions
--- a/litellm/litellm_core_utils/litellm_logging.py
+++ b/litellm/litellm_core_utils/litellm_logging.py
@ -56,6 +56,7 @@ from litellm.types.llms.openai import (
    Batch,
    FineTuningJob,
    HttpxBinaryResponseContent,
    OpenAIFileObject,
    ResponseCompletedEvent,
    ResponsesAPIResponse,
 )
@ -902,6 +903,7 @@ class Logging(LiteLLMLoggingBaseClass):
            FineTuningJob,
            ResponsesAPIResponse,
            ResponseCompletedEvent,
            OpenAIFileObject,
            LiteLLMRealtimeStreamLoggingObject,
        ],
        cache_hit: Optional[bool] = None,
@ -1095,6 +1097,7 @@ class Logging(LiteLLMLoggingBaseClass):
                    or isinstance(logging_result, FineTuningJob)
                    or isinstance(logging_result, LiteLLMBatch)
                    or isinstance(logging_result, ResponsesAPIResponse)
                    or isinstance(logging_result, OpenAIFileObject)
                    or isinstance(logging_result, LiteLLMRealtimeStreamLoggingObject)
                ):
                    ## HIDDEN PARAMS ##
--- a/litellm/litellm_core_utils/prompt_templates/common_utils.py
+++ b/litellm/litellm_core_utils/prompt_templates/common_utils.py
@ -4,6 +4,7 @@ Common utility functions used for translating messages across providers
 import io
 import mimetypes
 import re
 from os import PathLike
 from typing import Dict, List, Literal, Mapping, Optional, Union, cast
@ -18,6 +19,7 @@ from litellm.types.utils import (
    ExtractedFileData,
    FileTypes,
    ModelResponse,
    SpecialEnums,
    StreamingChoices,
 )
@ -325,6 +327,29 @@ def get_file_ids_from_messages(messages: List[AllMessageValues]) -> List[str]:
    return file_ids
 def get_format_from_file_id(file_id: Optional[str]) -> Optional[str]:
    """
    Gets format from file id
    unified_file_id = litellm_proxy:{};unified_id,{}
    If not a unified file id, returns 'file' as default format
    """
    if not file_id:
        return None
    try:
        if file_id.startswith(SpecialEnums.LITELM_MANAGED_FILE_ID_PREFIX.value):
            match = re.match(
                f"{SpecialEnums.LITELM_MANAGED_FILE_ID_PREFIX.value}:(.*?);unified_id",
                file_id,
            )
            if match:
                return match.group(1)
        return None
    except Exception:
        return None
 def update_messages_with_model_file_ids(
    messages: List[AllMessageValues],
    model_id: str,
@ -350,12 +375,18 @@ def update_messages_with_model_file_ids(
                        file_object = cast(ChatCompletionFileObject, c)
                        file_object_file_field = file_object["file"]
                        file_id = file_object_file_field.get("file_id")
                        format = file_object_file_field.get(
                            "format", get_format_from_file_id(file_id)
                        )
                        if file_id:
                            provider_file_id = (
                                model_file_id_mapping.get(file_id, {}).get(model_id)
                                or file_id
                            )
                            file_object_file_field["file_id"] = provider_file_id
                        if format:
                            file_object_file_field["format"] = format
    return messages
@ -421,6 +452,7 @@ def extract_file_data(file_data: FileTypes) -> ExtractedFileData:
        headers=file_headers,
    )
 def unpack_defs(schema, defs):
    properties = schema.get("properties", None)
    if properties is None:
@ -452,4 +484,3 @@ def unpack_defs(schema, defs):
                unpack_defs(ref, defs)
                value["items"] = ref
                continue
--- a/litellm/proxy/_new_secret_config.yaml
+++ b/litellm/proxy/_new_secret_config.yaml
@ -11,10 +11,6 @@ model_list:
  - model_name: "bedrock-nova"
    litellm_params:
      model: us.amazon.nova-pro-v1:0
  - model_name: "gemini-2.0-flash"
    litellm_params:
      model: gemini/gemini-2.0-flash
      api_key: os.environ/GEMINI_API_KEY
  - model_name: openrouter_model
    litellm_params:
      model: openrouter/openrouter_model
@ -33,6 +29,7 @@ model_list:
    model_info:
      base_model: azure/gpt-4o-realtime-preview-2024-10-01
 litellm_settings:
  num_retries: 0
  callbacks: ["prometheus"]
--- a/litellm/proxy/_types.py
+++ b/litellm/proxy/_types.py
@ -2692,10 +2692,6 @@ class PrismaCompatibleUpdateDBModel(TypedDict, total=False):
    updated_by: str
 class SpecialEnums(enum.Enum):
    LITELM_MANAGED_FILE_ID_PREFIX = "litellm_proxy/"
 class SpecialManagementEndpointEnums(enum.Enum):
    DEFAULT_ORGANIZATION = "default_organization"
--- a/litellm/proxy/hooks/managed_files.py
+++ b/litellm/proxy/hooks/managed_files.py
@ -9,10 +9,16 @@ from litellm import verbose_logger
 from litellm.caching.caching import DualCache
 from litellm.integrations.custom_logger import CustomLogger
 from litellm.litellm_core_utils.prompt_templates.common_utils import (
    extract_file_data,
    get_file_ids_from_messages,
 )
-from litellm.proxy._types import CallTypes, SpecialEnums, UserAPIKeyAuth
+from litellm.proxy._types import CallTypes, UserAPIKeyAuth
-from litellm.types.llms.openai import OpenAIFileObject, OpenAIFilesPurpose
+from litellm.types.llms.openai import (
    CreateFileRequest,
    OpenAIFileObject,
    OpenAIFilesPurpose,
 )
 from litellm.types.utils import SpecialEnums
 if TYPE_CHECKING:
    from opentelemetry.trace import Span as _Span
@ -106,14 +112,21 @@ class _PROXY_LiteLLMManagedFiles(CustomLogger):
    @staticmethod
    async def return_unified_file_id(
        file_objects: List[OpenAIFileObject],
        create_file_request: CreateFileRequest,
        purpose: OpenAIFilesPurpose,
        internal_usage_cache: InternalUsageCache,
        litellm_parent_otel_span: Span,
    ) -> OpenAIFileObject:
-        unified_file_id = SpecialEnums.LITELM_MANAGED_FILE_ID_PREFIX.value + str(
+        ## GET THE FILE TYPE FROM THE CREATE FILE REQUEST
-            uuid.uuid4()
+        file_data = extract_file_data(create_file_request["file"])
        file_type = file_data["content_type"]
        unified_file_id = SpecialEnums.LITELLM_MANAGED_FILE_COMPLETE_STR.value.format(
            file_type, str(uuid.uuid4())
        )
        ## CREATE RESPONSE OBJECT
        ## CREATE RESPONSE OBJECT
        response = OpenAIFileObject(
            id=unified_file_id,
--- a/litellm/proxy/openai_files_endpoints/files_endpoints.py
+++ b/litellm/proxy/openai_files_endpoints/files_endpoints.py
@ -34,7 +34,11 @@ from litellm.proxy.common_utils.openai_endpoint_utils import (
 from litellm.proxy.hooks.managed_files import _PROXY_LiteLLMManagedFiles
 from litellm.proxy.utils import ProxyLogging
 from litellm.router import Router
-from litellm.types.llms.openai import OpenAIFileObject, OpenAIFilesPurpose
+from litellm.types.llms.openai import (
    CREATE_FILE_REQUESTS_PURPOSE,
    OpenAIFileObject,
    OpenAIFilesPurpose,
 )
 router = APIRouter()
@ -147,6 +151,7 @@ async def create_file_for_each_model(
        responses.append(individual_response)
    response = await _PROXY_LiteLLMManagedFiles.return_unified_file_id(
        file_objects=responses,
        create_file_request=_create_file_request,
        purpose=purpose,
        internal_usage_cache=proxy_logging_obj.internal_usage_cache,
        litellm_parent_otel_span=user_api_key_dict.parent_otel_span,
@ -232,7 +237,7 @@ async def create_file(
        # Cast purpose to OpenAIFilesPurpose type
        purpose = cast(OpenAIFilesPurpose, purpose)
-        data = {"purpose": purpose}
+        data = {}
        # Include original request and headers in the data
        data = await add_litellm_data_to_request(
@ -258,7 +263,9 @@ async def create_file(
                    model=router_model, llm_router=llm_router
                )
-        _create_file_request = CreateFileRequest(file=file_data, **data)
+        _create_file_request = CreateFileRequest(
            file=file_data, purpose=cast(CREATE_FILE_REQUESTS_PURPOSE, purpose), **data
        )
        response: Optional[OpenAIFileObject] = None
        if (
--- a/litellm/router.py
+++ b/litellm/router.py
@ -2760,9 +2760,6 @@ class Router:
            stripped_model, custom_llm_provider, _, _ = get_llm_provider(
                model=data["model"]
            )
            # kwargs["file"] = replace_model_in_jsonl(
            #     file_content=kwargs["file"], new_model_name=stripped_model
            # )
            response = litellm.acreate_file(
                **{
--- a/litellm/types/llms/openai.py
+++ b/litellm/types/llms/openai.py
@ -288,7 +288,10 @@ class OpenAIFileObject(BaseModel):
    `error` field on `fine_tuning.job`.
    """
-    _hidden_params: dict = {}
+    _hidden_params: dict = {"response_cost": 0.0}  # no cost for writing a file
 CREATE_FILE_REQUESTS_PURPOSE = Literal["assistants", "batch", "fine-tune"]
 # OpenAI Files Types
@ -307,8 +310,8 @@ class CreateFileRequest(TypedDict, total=False):
        timeout: Optional[float] = None
    """
-    file: FileTypes
+    file: Required[FileTypes]
-    purpose: Literal["assistants", "batch", "fine-tune"]
+    purpose: Required[CREATE_FILE_REQUESTS_PURPOSE]
    extra_headers: Optional[Dict[str, str]]
    extra_body: Optional[Dict[str, str]]
    timeout: Optional[float]
--- a/litellm/types/utils.py
+++ b/litellm/types/utils.py
@ -2221,3 +2221,8 @@ class ExtractedFileData(TypedDict):
    content: bytes
    content_type: Optional[str]
    headers: Mapping[str, str]
 class SpecialEnums(Enum):
    LITELM_MANAGED_FILE_ID_PREFIX = "litellm_proxy"
    LITELLM_MANAGED_FILE_COMPLETE_STR = "litellm_proxy:{};unified_id,{}"
--- a/tests/litellm/litellm_core_utils/prompt_templates/test_litellm_core_utils_prompt_templates_common_utils.py
+++ b/tests/litellm/litellm_core_utils/prompt_templates/test_litellm_core_utils_prompt_templates_common_utils.py
@ -0,0 +1,25 @@
 import json
 import os
 import sys
 from unittest.mock import MagicMock, patch
 import pytest
 sys.path.insert(
    0, os.path.abspath("../../..")
 )  # Adds the parent directory to the system path
 from litellm.litellm_core_utils.prompt_templates.common_utils import (
    get_format_from_file_id,
    update_messages_with_model_file_ids,
 )
 def test_update_messages_with_model_file_ids():
    unified_file_id = (
        "litellm_proxy:application/pdf;unified_id,cbbe3534-8bf8-4386-af00-f5f6b7e370bf"
    )
    format = get_format_from_file_id(unified_file_id)
    assert format == "application/pdf"