Merge branch 'BerriAI:main' into main

2025-04-27 11:43:54 +00:00 · 2025-03-28 06:44:51 -04:00 · 2025-03-28 06:44:51 -04:00 · 79e98ef012
commit 79e98ef012
parent 2f268e7e2f d21631d7f4
28 changed files with 1144 additions and 33 deletions
--- a/ci_cd/baseline_db.py
+++ b/ci_cd/baseline_db.py
@ -1,4 +1,3 @@
 import os
 import subprocess
 from pathlib import Path
 from datetime import datetime
--- a/deploy/migrations/20250327180120_add_api_requests_to_daily_user_table/migration.sql
+++ b/deploy/migrations/20250327180120_add_api_requests_to_daily_user_table/migration.sql
@ -0,0 +1,3 @@
 -- AlterTable
 ALTER TABLE "LiteLLM_DailyUserSpend" ADD COLUMN     "api_requests" INTEGER NOT NULL DEFAULT 0;
--- a/docs/my-website/docs/set_keys.md
+++ b/docs/my-website/docs/set_keys.md
@ -188,7 +188,13 @@ Currently implemented for:
 - OpenAI (if OPENAI_API_KEY is set)
 - Fireworks AI (if FIREWORKS_AI_API_KEY is set)
 - LiteLLM Proxy (if LITELLM_PROXY_API_KEY is set)
 - Gemini (if GEMINI_API_KEY is set)
 - XAI (if XAI_API_KEY is set)   
 - Anthropic (if ANTHROPIC_API_KEY is set)
 You can also specify a custom provider to check:
 **All providers**:
 ```python
 from litellm import get_valid_models
@ -196,6 +202,14 @@ valid_models = get_valid_models(check_provider_endpoint=True)
 print(valid_models)
 ```
 **Specific provider**:
 ```python
 from litellm import get_valid_models
 valid_models = get_valid_models(check_provider_endpoint=True, custom_llm_provider="openai")
 print(valid_models)
 ```
 ### `validate_environment(model: str)`
 This helper tells you if you have all the required environment variables for a model, and if not - what's missing. 
--- a/litellm/init.py
+++ b/litellm/init.py
@ -813,6 +813,7 @@ from .llms.oobabooga.chat.transformation import OobaboogaConfig
 from .llms.maritalk import MaritalkConfig
 from .llms.openrouter.chat.transformation import OpenrouterConfig
 from .llms.anthropic.chat.transformation import AnthropicConfig
 from .llms.anthropic.common_utils import AnthropicModelInfo
 from .llms.groq.stt.transformation import GroqSTTConfig
 from .llms.anthropic.completion.transformation import AnthropicTextConfig
 from .llms.triton.completion.transformation import TritonConfig
@ -848,6 +849,7 @@ from .llms.vertex_ai.gemini.vertex_and_google_ai_studio_gemini import (
    VertexGeminiConfig,
    VertexGeminiConfig as VertexAIConfig,
 )
 from .llms.gemini.common_utils import GeminiModelInfo
 from .llms.gemini.chat.transformation import (
    GoogleAIStudioGeminiConfig,
    GoogleAIStudioGeminiConfig as GeminiConfig,  # aliased to maintain backwards compatibility
@ -984,6 +986,7 @@ from .llms.fireworks_ai.embed.fireworks_ai_transformation import (
 from .llms.friendliai.chat.transformation import FriendliaiChatConfig
 from .llms.jina_ai.embedding.transformation import JinaAIEmbeddingConfig
 from .llms.xai.chat.transformation import XAIChatConfig
 from .llms.xai.common_utils import XAIModelInfo
 from .llms.volcengine import VolcEngineConfig
 from .llms.codestral.completion.transformation import CodestralTextCompletionConfig
 from .llms.azure.azure import (
--- a/litellm/llms/anthropic/common_utils.py
+++ b/litellm/llms/anthropic/common_utils.py
@ -6,7 +6,10 @@ from typing import Optional, Union
 import httpx
 import litellm
 from litellm.llms.base_llm.base_utils import BaseLLMModelInfo
 from litellm.llms.base_llm.chat.transformation import BaseLLMException
 from litellm.secret_managers.main import get_secret_str
 class AnthropicError(BaseLLMException):
@ -19,6 +22,54 @@ class AnthropicError(BaseLLMException):
        super().__init__(status_code=status_code, message=message, headers=headers)
 class AnthropicModelInfo(BaseLLMModelInfo):
    @staticmethod
    def get_api_base(api_base: Optional[str] = None) -> Optional[str]:
        return (
            api_base
            or get_secret_str("ANTHROPIC_API_BASE")
            or "https://api.anthropic.com"
        )
    @staticmethod
    def get_api_key(api_key: Optional[str] = None) -> Optional[str]:
        return api_key or get_secret_str("ANTHROPIC_API_KEY")
    @staticmethod
    def get_base_model(model: Optional[str] = None) -> Optional[str]:
        return model.replace("anthropic/", "") if model else None
    def get_models(
        self, api_key: Optional[str] = None, api_base: Optional[str] = None
    ) -> list[str]:
        api_base = AnthropicModelInfo.get_api_base(api_base)
        api_key = AnthropicModelInfo.get_api_key(api_key)
        if api_base is None or api_key is None:
            raise ValueError(
                "ANTHROPIC_API_BASE or ANTHROPIC_API_KEY is not set. Please set the environment variable, to query Anthropic's `/models` endpoint."
            )
        response = litellm.module_level_client.get(
            url=f"{api_base}/v1/models",
            headers={"x-api-key": api_key, "anthropic-version": "2023-06-01"},
        )
        try:
            response.raise_for_status()
        except httpx.HTTPStatusError:
            raise Exception(
                f"Failed to fetch models from Anthropic. Status code: {response.status_code}, Response: {response.text}"
            )
        models = response.json()["data"]
        litellm_model_names = []
        for model in models:
            stripped_model_name = model["id"]
            litellm_model_name = "anthropic/" + stripped_model_name
            litellm_model_names.append(litellm_model_name)
        return litellm_model_names
 def process_anthropic_headers(headers: Union[httpx.Headers, dict]) -> dict:
    openai_headers = {}
    if "anthropic-ratelimit-requests-limit" in headers:
--- a/litellm/llms/base_llm/base_utils.py
+++ b/litellm/llms/base_llm/base_utils.py
@ -19,11 +19,19 @@ class BaseLLMModelInfo(ABC):
        self,
        model: str,
    ) -> Optional[ProviderSpecificModelInfo]:
        """
        Default values all models of this provider support.
        """
        return None
    @abstractmethod
-    def get_models(self) -> List[str]:
+    def get_models(
-        pass
+        self, api_key: Optional[str] = None, api_base: Optional[str] = None
    ) -> List[str]:
        """
        Returns a list of models supported by this provider.
        """
        return []
    @staticmethod
    @abstractmethod
--- a/litellm/llms/gemini/common_utils.py
+++ b/litellm/llms/gemini/common_utils.py
@ -0,0 +1,52 @@
 from typing import List, Optional
 import litellm
 from litellm.llms.base_llm.base_utils import BaseLLMModelInfo
 from litellm.secret_managers.main import get_secret_str
 class GeminiModelInfo(BaseLLMModelInfo):
    @staticmethod
    def get_api_base(api_base: Optional[str] = None) -> Optional[str]:
        return (
            api_base
            or get_secret_str("GEMINI_API_BASE")
            or "https://generativelanguage.googleapis.com/v1beta"
        )
    @staticmethod
    def get_api_key(api_key: Optional[str] = None) -> Optional[str]:
        return api_key or (get_secret_str("GEMINI_API_KEY"))
    @staticmethod
    def get_base_model(model: str) -> Optional[str]:
        return model.replace("gemini/", "")
    def get_models(
        self, api_key: Optional[str] = None, api_base: Optional[str] = None
    ) -> List[str]:
        api_base = GeminiModelInfo.get_api_base(api_base)
        api_key = GeminiModelInfo.get_api_key(api_key)
        if api_base is None or api_key is None:
            raise ValueError(
                "GEMINI_API_BASE or GEMINI_API_KEY is not set. Please set the environment variable, to query Gemini's `/models` endpoint."
            )
        response = litellm.module_level_client.get(
            url=f"{api_base}/models?key={api_key}",
        )
        if response.status_code != 200:
            raise ValueError(
                f"Failed to fetch models from Gemini. Status code: {response.status_code}, Response: {response.json()}"
            )
        models = response.json()["models"]
        litellm_model_names = []
        for model in models:
            stripped_model_name = model["name"].strip("models/")
            litellm_model_name = "gemini/" + stripped_model_name
            litellm_model_names.append(litellm_model_name)
        return litellm_model_names
--- a/litellm/llms/mistral/mistral_chat_transformation.py
+++ b/litellm/llms/mistral/mistral_chat_transformation.py
@ -80,6 +80,7 @@ class MistralConfig(OpenAIGPTConfig):
            "temperature",
            "top_p",
            "max_tokens",
            "max_completion_tokens",
            "tools",
            "tool_choice",
            "seed",
@ -105,6 +106,10 @@ class MistralConfig(OpenAIGPTConfig):
        for param, value in non_default_params.items():
            if param == "max_tokens":
                optional_params["max_tokens"] = value
            if (
                param == "max_completion_tokens"
            ):  # max_completion_tokens should take priority
                optional_params["max_tokens"] = value
            if param == "tools":
                optional_params["tools"] = value
            if param == "stream" and value is True:
--- a/litellm/llms/topaz/common_utils.py
+++ b/litellm/llms/topaz/common_utils.py
@ -11,7 +11,9 @@ class TopazException(BaseLLMException):
 class TopazModelInfo(BaseLLMModelInfo):
-    def get_models(self) -> List[str]:
+    def get_models(
        self, api_key: Optional[str] = None, api_base: Optional[str] = None
    ) -> List[str]:
        return [
            "topaz/Standard V2",
            "topaz/Low Resolution V2",
--- a/litellm/llms/xai/common_utils.py
+++ b/litellm/llms/xai/common_utils.py
@ -0,0 +1,51 @@
 from typing import Optional
 import httpx
 import litellm
 from litellm.llms.base_llm.base_utils import BaseLLMModelInfo
 from litellm.secret_managers.main import get_secret_str
 class XAIModelInfo(BaseLLMModelInfo):
    @staticmethod
    def get_api_base(api_base: Optional[str] = None) -> Optional[str]:
        return api_base or get_secret_str("XAI_API_BASE") or "https://api.x.ai"
    @staticmethod
    def get_api_key(api_key: Optional[str] = None) -> Optional[str]:
        return api_key or get_secret_str("XAI_API_KEY")
    @staticmethod
    def get_base_model(model: str) -> Optional[str]:
        return model.replace("xai/", "")
    def get_models(
        self, api_key: Optional[str] = None, api_base: Optional[str] = None
    ) -> list[str]:
        api_base = self.get_api_base(api_base)
        api_key = self.get_api_key(api_key)
        if api_base is None or api_key is None:
            raise ValueError(
                "XAI_API_BASE or XAI_API_KEY is not set. Please set the environment variable, to query XAI's `/models` endpoint."
            )
        response = litellm.module_level_client.get(
            url=f"{api_base}/v1/models",
            headers={"Authorization": f"Bearer {api_key}"},
        )
        try:
            response.raise_for_status()
        except httpx.HTTPStatusError:
            raise Exception(
                f"Failed to fetch models from XAI. Status code: {response.status_code}, Response: {response.text}"
            )
        models = response.json()["data"]
        litellm_model_names = []
        for model in models:
            stripped_model_name = model["id"]
            litellm_model_name = "xai/" + stripped_model_name
            litellm_model_names.append(litellm_model_name)
        return litellm_model_names
--- a/litellm/proxy/_types.py
+++ b/litellm/proxy/_types.py
@ -2718,3 +2718,4 @@ class DailyUserSpendTransaction(TypedDict):
    prompt_tokens: int
    completion_tokens: int
    spend: float
    api_requests: int
--- a/litellm/proxy/db/prisma_client.py
+++ b/litellm/proxy/db/prisma_client.py
@ -3,6 +3,7 @@ This file contains the PrismaWrapper class, which is used to wrap the Prisma cli
 """
 import asyncio
 import glob
 import os
 import random
 import subprocess
@ -178,6 +179,69 @@ class PrismaManager:
            verbose_proxy_logger.warning(f"Error creating baseline migration: {e}")
            return False
    @staticmethod
    def _copy_spend_tracking_migrations(prisma_dir: str) -> bool:
        import shutil
        from pathlib import Path
        """
        Check for and copy over spend tracking migrations if they exist in the deploy directory.
        Returns True if migrations were found and copied, False otherwise.
        """
        try:
            # Get the current file's directory
            current_dir = Path(__file__).parent
            # Check for migrations in the deploy directory (../../deploy/migrations)
            deploy_migrations_dir = (
                current_dir.parent.parent.parent / "deploy" / "migrations"
            )
            # Local migrations directory
            local_migrations_dir = Path(prisma_dir + "/migrations")
            if deploy_migrations_dir.exists():
                # Create local migrations directory if it doesn't exist
                local_migrations_dir.mkdir(parents=True, exist_ok=True)
                # Copy all migration files
                # Copy entire migrations folder recursively
                shutil.copytree(
                    deploy_migrations_dir, local_migrations_dir, dirs_exist_ok=True
                )
                return True
            return False
        except Exception:
            return False
    @staticmethod
    def _get_migration_names(migrations_dir: str) -> list:
        """Get all migration directory names from the migrations folder"""
        migration_paths = glob.glob(f"{migrations_dir}/*/migration.sql")
        return [Path(p).parent.name for p in migration_paths]
    @staticmethod
    def _resolve_all_migrations(migrations_dir: str):
        """Mark all existing migrations as applied"""
        migration_names = PrismaManager._get_migration_names(migrations_dir)
        for migration_name in migration_names:
            try:
                verbose_proxy_logger.info(f"Resolving migration: {migration_name}")
                subprocess.run(
                    ["prisma", "migrate", "resolve", "--applied", migration_name],
                    timeout=60,
                    check=True,
                    capture_output=True,
                    text=True,
                )
                verbose_proxy_logger.debug(f"Resolved migration: {migration_name}")
            except subprocess.CalledProcessError as e:
                if "is already recorded as applied in the database." not in e.stderr:
                    verbose_proxy_logger.warning(
                        f"Failed to resolve migration {migration_name}: {e.stderr}"
                    )
    @staticmethod
    def setup_database(use_migrate: bool = False) -> bool:
        """
@ -194,8 +258,10 @@ class PrismaManager:
            os.chdir(prisma_dir)
            try:
                if use_migrate:
                    PrismaManager._copy_spend_tracking_migrations(
                        prisma_dir
                    )  # place a migration in the migrations directory
                    verbose_proxy_logger.info("Running prisma migrate deploy")
                    # First try to run migrate deploy directly
                    try:
                        subprocess.run(
                            ["prisma", "migrate", "deploy"],
@ -205,25 +271,31 @@ class PrismaManager:
                            text=True,
                        )
                        verbose_proxy_logger.info("prisma migrate deploy completed")
                        # Resolve all migrations in the migrations directory
                        migrations_dir = os.path.join(prisma_dir, "migrations")
                        PrismaManager._resolve_all_migrations(migrations_dir)
                        return True
                    except subprocess.CalledProcessError as e:
-                        # Check if this is the non-empty schema error
+                        verbose_proxy_logger.warning(
                            f"prisma db error: {e.stderr}, e: {e.stdout}"
                        )
                        if (
                            "P3005" in e.stderr
                            and "database schema is not empty" in e.stderr
                        ):
-                            # Create baseline migration
+                            verbose_proxy_logger.info("Creating baseline migration")
                            if PrismaManager._create_baseline_migration(schema_path):
-                                # Try migrate deploy again after baseline
+                                verbose_proxy_logger.info(
-                                subprocess.run(
+                                    "Resolving all migrations after baseline"
                                    ["prisma", "migrate", "deploy"],
                                    timeout=60,
                                    check=True,
                                )
                                # Resolve all migrations after baseline
                                migrations_dir = os.path.join(prisma_dir, "migrations")
                                PrismaManager._resolve_all_migrations(migrations_dir)
                                return True
                        else:
                            # If it's a different error, raise it
                            raise e
                else:
                    # Use prisma db push with increased timeout
                    subprocess.run(
--- a/litellm/proxy/management_endpoints/internal_user_endpoints.py
+++ b/litellm/proxy/management_endpoints/internal_user_endpoints.py
@ -14,8 +14,9 @@ These are members of a Team on LiteLLM
 import asyncio
 import traceback
 import uuid
-from datetime import datetime, timedelta, timezone
+from datetime import date, datetime, timedelta, timezone
-from typing import Any, List, Optional, Union, cast
+from enum import Enum
 from typing import Any, Dict, List, Optional, TypedDict, Union, cast
 import fastapi
 from fastapi import APIRouter, Depends, Header, HTTPException, Request, status
@ -1242,3 +1243,291 @@ async def ui_view_users(
    except Exception as e:
        verbose_proxy_logger.exception(f"Error searching users: {str(e)}")
        raise HTTPException(status_code=500, detail=f"Error searching users: {str(e)}")
 class GroupByDimension(str, Enum):
    DATE = "date"
    MODEL = "model"
    API_KEY = "api_key"
    TEAM = "team"
    ORGANIZATION = "organization"
    MODEL_GROUP = "model_group"
    PROVIDER = "custom_llm_provider"
 class SpendMetrics(BaseModel):
    spend: float = Field(default=0.0)
    prompt_tokens: int = Field(default=0)
    completion_tokens: int = Field(default=0)
    total_tokens: int = Field(default=0)
    api_requests: int = Field(default=0)
 class BreakdownMetrics(BaseModel):
    """Breakdown of spend by different dimensions"""
    models: Dict[str, SpendMetrics] = Field(default_factory=dict)  # model -> metrics
    providers: Dict[str, SpendMetrics] = Field(
        default_factory=dict
    )  # provider -> metrics
    api_keys: Dict[str, SpendMetrics] = Field(
        default_factory=dict
    )  # api_key -> metrics
 class DailySpendData(BaseModel):
    date: date
    metrics: SpendMetrics
    breakdown: BreakdownMetrics = Field(default_factory=BreakdownMetrics)
 class DailySpendMetadata(BaseModel):
    total_spend: float = Field(default=0.0)
    total_prompt_tokens: int = Field(default=0)
    total_completion_tokens: int = Field(default=0)
    total_api_requests: int = Field(default=0)
    page: int = Field(default=1)
    total_pages: int = Field(default=1)
    has_more: bool = Field(default=False)
 class SpendAnalyticsPaginatedResponse(BaseModel):
    results: List[DailySpendData]
    metadata: DailySpendMetadata = Field(default_factory=DailySpendMetadata)
 class LiteLLM_DailyUserSpend(BaseModel):
    id: str
    user_id: str
    date: str
    api_key: str
    model: str
    model_group: Optional[str] = None
    custom_llm_provider: Optional[str] = None
    prompt_tokens: int = 0
    completion_tokens: int = 0
    spend: float = 0.0
    api_requests: int = 0
 class GroupedData(TypedDict):
    metrics: SpendMetrics
    breakdown: BreakdownMetrics
 def update_metrics(
    group_metrics: SpendMetrics, record: LiteLLM_DailyUserSpend
 ) -> SpendMetrics:
    group_metrics.spend += record.spend
    group_metrics.prompt_tokens += record.prompt_tokens
    group_metrics.completion_tokens += record.completion_tokens
    group_metrics.total_tokens += record.prompt_tokens + record.completion_tokens
    group_metrics.api_requests += record.api_requests
    return group_metrics
 def update_breakdown_metrics(
    breakdown: BreakdownMetrics, record: LiteLLM_DailyUserSpend
 ) -> BreakdownMetrics:
    """Updates breakdown metrics for a single record using the existing update_metrics function"""
    # Update model breakdown
    if record.model not in breakdown.models:
        breakdown.models[record.model] = SpendMetrics()
    breakdown.models[record.model] = update_metrics(
        breakdown.models[record.model], record
    )
    # Update provider breakdown
    provider = record.custom_llm_provider or "unknown"
    if provider not in breakdown.providers:
        breakdown.providers[provider] = SpendMetrics()
    breakdown.providers[provider] = update_metrics(
        breakdown.providers[provider], record
    )
    # Update api key breakdown
    if record.api_key not in breakdown.api_keys:
        breakdown.api_keys[record.api_key] = SpendMetrics()
    breakdown.api_keys[record.api_key] = update_metrics(
        breakdown.api_keys[record.api_key], record
    )
    return breakdown
@router.get(
    "/user/daily/activity",
    tags=["Budget & Spend Tracking", "Internal User management"],
    dependencies=[Depends(user_api_key_auth)],
    response_model=SpendAnalyticsPaginatedResponse,
 )
 async def get_user_daily_activity(
    start_date: Optional[str] = fastapi.Query(
        default=None,
        description="Start date in YYYY-MM-DD format",
    ),
    end_date: Optional[str] = fastapi.Query(
        default=None,
        description="End date in YYYY-MM-DD format",
    ),
    group_by: List[GroupByDimension] = fastapi.Query(
        default=[GroupByDimension.DATE],
        description="Dimensions to group by. Can combine multiple (e.g. date,team)",
    ),
    view_by: Literal["team", "organization", "user"] = fastapi.Query(
        default="user",
        description="View spend at team/org/user level",
    ),
    team_id: Optional[str] = fastapi.Query(
        default=None,
        description="Filter by specific team",
    ),
    org_id: Optional[str] = fastapi.Query(
        default=None,
        description="Filter by specific organization",
    ),
    model: Optional[str] = fastapi.Query(
        default=None,
        description="Filter by specific model",
    ),
    api_key: Optional[str] = fastapi.Query(
        default=None,
        description="Filter by specific API key",
    ),
    page: int = fastapi.Query(
        default=1, description="Page number for pagination", ge=1
    ),
    page_size: int = fastapi.Query(
        default=50, description="Items per page", ge=1, le=100
    ),
    user_api_key_dict: UserAPIKeyAuth = Depends(user_api_key_auth),
 ) -> SpendAnalyticsPaginatedResponse:
    """
    [BETA] This is a beta endpoint. It will change.
    Meant to optimize querying spend data for analytics for a user.
    Returns:
    (by date/team/org/user/model/api_key/model_group/provider)
    - spend
    - prompt_tokens
    - completion_tokens
    - total_tokens
    - api_requests
    - breakdown by team, organization, user, model, api_key, model_group, provider
    """
    from litellm.proxy.proxy_server import prisma_client
    if prisma_client is None:
        raise HTTPException(
            status_code=500,
            detail={"error": CommonProxyErrors.db_not_connected_error.value},
        )
    if start_date is None or end_date is None:
        raise HTTPException(
            status_code=status.HTTP_400_BAD_REQUEST,
            detail={"error": "Please provide start_date and end_date"},
        )
    try:
        # Build filter conditions
        where_conditions: Dict[str, Any] = {
            "date": {
                "gte": start_date,
                "lte": end_date,
            }
        }
        if team_id:
            where_conditions["team_id"] = team_id
        if org_id:
            where_conditions["organization_id"] = org_id
        if model:
            where_conditions["model"] = model
        if api_key:
            where_conditions["api_key"] = api_key
        # Get total count for pagination
        total_count = await prisma_client.db.litellm_dailyuserspend.count(
            where=where_conditions
        )
        # Fetch paginated results
        daily_spend_data = await prisma_client.db.litellm_dailyuserspend.find_many(
            where=where_conditions,
            order=[
                {"date": "desc"},
            ],
            skip=(page - 1) * page_size,
            take=page_size,
        )
        # Process results
        results = []
        total_metrics = SpendMetrics()
        # Group data by date and other dimensions
        grouped_data: Dict[str, Dict[str, Any]] = {}
        for record in daily_spend_data:
            date_str = record.date
            if date_str not in grouped_data:
                grouped_data[date_str] = {
                    "metrics": SpendMetrics(),
                    "breakdown": BreakdownMetrics(),
                }
            # Update metrics
            grouped_data[date_str]["metrics"] = update_metrics(
                grouped_data[date_str]["metrics"], record
            )
            # Update breakdowns
            grouped_data[date_str]["breakdown"] = update_breakdown_metrics(
                grouped_data[date_str]["breakdown"], record
            )
            # Update total metrics
            total_metrics.spend += record.spend
            total_metrics.prompt_tokens += record.prompt_tokens
            total_metrics.completion_tokens += record.completion_tokens
            total_metrics.total_tokens += (
                record.prompt_tokens + record.completion_tokens
            )
            total_metrics.api_requests += 1
        # Convert grouped data to response format
        for date_str, data in grouped_data.items():
            results.append(
                DailySpendData(
                    date=datetime.strptime(date_str, "%Y-%m-%d").date(),
                    metrics=data["metrics"],
                    breakdown=data["breakdown"],
                )
            )
        # Sort results by date
        results.sort(key=lambda x: x.date, reverse=True)
        return SpendAnalyticsPaginatedResponse(
            results=results,
            metadata=DailySpendMetadata(
                total_spend=total_metrics.spend,
                total_prompt_tokens=total_metrics.prompt_tokens,
                total_completion_tokens=total_metrics.completion_tokens,
                total_api_requests=total_metrics.api_requests,
                page=page,
                total_pages=-(-total_count // page_size),  # Ceiling division
                has_more=(page * page_size) < total_count,
            ),
        )
    except Exception as e:
        verbose_proxy_logger.exception(
            "/spend/daily/analytics: Exception occured - {}".format(str(e))
        )
        raise HTTPException(
            status_code=status.HTTP_500_INTERNAL_SERVER_ERROR,
            detail={"error": f"Failed to fetch analytics: {str(e)}"},
        )
--- a/litellm/proxy/proxy_server.py
+++ b/litellm/proxy/proxy_server.py
@ -509,9 +509,6 @@ async def proxy_startup_event(app: FastAPI):
            if isinstance(worker_config, dict):
                await initialize(**worker_config)
    ### LOAD MASTER KEY ###
    # check if master key set in environment - load from there
    master_key = get_secret("LITELLM_MASTER_KEY", None)  # type: ignore
    # check if DATABASE_URL in environment - load from there
    if prisma_client is None:
        _db_url: Optional[str] = get_secret("DATABASE_URL", None)  # type: ignore
@ -1974,6 +1971,7 @@ class ProxyConfig:
            if master_key and master_key.startswith("os.environ/"):
                master_key = get_secret(master_key)  # type: ignore
                if not isinstance(master_key, str):
                    raise Exception(
                        "Master key must be a string. Current type - {}".format(
--- a/litellm/proxy/schema.prisma
+++ b/litellm/proxy/schema.prisma
@ -314,19 +314,19 @@ model LiteLLM_AuditLog {
  updated_values     Json?       // value of the row after change
 }
 // Track daily user spend metrics per model and key
 model LiteLLM_DailyUserSpend {
  id                  String   @id @default(uuid())
  user_id             String
  date                String
-  api_key             String   // Hashed API Token
+  api_key             String   
-  model               String   // The specific model used
+  model               String   
-  model_group         String?  // public model_name / model_group
+  model_group         String?  
-  custom_llm_provider String?  // The LLM provider (e.g., "openai", "anthropic")
+  custom_llm_provider String?  
  prompt_tokens       Int      @default(0)
  completion_tokens   Int      @default(0)
  spend               Float    @default(0.0)
  api_requests        Int      @default(0)
  created_at          DateTime @default(now())
  updated_at          DateTime @updatedAt
--- a/litellm/proxy/spend_tracking/spend_management_endpoints.py
+++ b/litellm/proxy/spend_tracking/spend_management_endpoints.py
@ -3,7 +3,7 @@ import collections
 import os
 from datetime import datetime, timedelta, timezone
 from functools import lru_cache
-from typing import TYPE_CHECKING, Any, List, Optional
+from typing import TYPE_CHECKING, Any, Dict, List, Literal, Optional
 import fastapi
 from fastapi import APIRouter, Depends, HTTPException, status
--- a/litellm/proxy/utils.py
+++ b/litellm/proxy/utils.py
@ -1179,6 +1179,7 @@ class PrismaClient:
                daily_transaction["spend"] += payload["spend"]
                daily_transaction["prompt_tokens"] += payload["prompt_tokens"]
                daily_transaction["completion_tokens"] += payload["completion_tokens"]
                daily_transaction["api_requests"] += 1
            else:
                daily_transaction = DailyUserSpendTransaction(
                    user_id=payload["user"],
@ -1190,6 +1191,7 @@ class PrismaClient:
                    prompt_tokens=payload["prompt_tokens"],
                    completion_tokens=payload["completion_tokens"],
                    spend=payload["spend"],
                    api_requests=1,
                )
            self.daily_user_spend_transactions[daily_transaction_key] = (
@ -2598,6 +2600,7 @@ class ProxyUpdateSpend:
                                            "completion_tokens"
                                        ],
                                        "spend": transaction["spend"],
                                        "api_requests": transaction["api_requests"],
                                    },
                                    "update": {
                                        "prompt_tokens": {
@ -2609,6 +2612,9 @@ class ProxyUpdateSpend:
                                            ]
                                        },
                                        "spend": {"increment": transaction["spend"]},
                                        "api_requests": {
                                            "increment": transaction["api_requests"]
                                        },
                                    },
                                },
                            )
--- a/litellm/utils.py
+++ b/litellm/utils.py
@ -5744,13 +5744,15 @@ def trim_messages(
        return messages
-def get_valid_models(check_provider_endpoint: bool = False) -> List[str]:
+def get_valid_models(
    check_provider_endpoint: bool = False, custom_llm_provider: Optional[str] = None
 ) -> List[str]:
    """
    Returns a list of valid LLMs based on the set environment variables
    Args:
        check_provider_endpoint: If True, will check the provider's endpoint for valid models.
-
+        custom_llm_provider: If provided, will only check the provider's endpoint for valid models.
    Returns:
        A list of valid LLMs
    """
@ -5762,6 +5764,9 @@ def get_valid_models(check_provider_endpoint: bool = False) -> List[str]:
        valid_models = []
        for provider in litellm.provider_list:
            if custom_llm_provider and provider != custom_llm_provider:
                continue
            # edge case litellm has together_ai as a provider, it should be togetherai
            env_provider_1 = provider.replace("_", "")
            env_provider_2 = provider
@ -5783,10 +5788,17 @@ def get_valid_models(check_provider_endpoint: bool = False) -> List[str]:
                provider=LlmProviders(provider),
            )
            if custom_llm_provider and provider != custom_llm_provider:
                continue
            if provider == "azure":
                valid_models.append("Azure-LLM")
            elif provider_config is not None and check_provider_endpoint:
-                valid_models.extend(provider_config.get_models())
+                try:
                    models = provider_config.get_models()
                    valid_models.extend(models)
                except Exception as e:
                    verbose_logger.debug(f"Error getting valid models: {e}")
            else:
                models_for_provider = litellm.models_by_provider.get(provider, [])
                valid_models.extend(models_for_provider)
@ -6400,10 +6412,16 @@ class ProviderConfigManager:
            return litellm.FireworksAIConfig()
        elif LlmProviders.OPENAI == provider:
            return litellm.OpenAIGPTConfig()
        elif LlmProviders.GEMINI == provider:
            return litellm.GeminiModelInfo()
        elif LlmProviders.LITELLM_PROXY == provider:
            return litellm.LiteLLMProxyChatConfig()
        elif LlmProviders.TOPAZ == provider:
            return litellm.TopazModelInfo()
        elif LlmProviders.ANTHROPIC == provider:
            return litellm.AnthropicModelInfo()
        elif LlmProviders.XAI == provider:
            return litellm.XAIModelInfo()
        return None
--- a/schema.prisma
+++ b/schema.prisma
@ -326,6 +326,7 @@ model LiteLLM_DailyUserSpend {
  prompt_tokens       Int      @default(0)
  completion_tokens   Int      @default(0)
  spend               Float    @default(0.0)
  api_requests        Int      @default(0)
  created_at          DateTime @default(now())
  updated_at          DateTime @updatedAt
--- a/tests/litellm_utils_tests/test_utils.py
+++ b/tests/litellm_utils_tests/test_utils.py
@ -303,6 +303,24 @@ def test_aget_valid_models():
    os.environ = old_environ
@pytest.mark.parametrize("custom_llm_provider", ["gemini", "anthropic", "xai"])
 def test_get_valid_models_with_custom_llm_provider(custom_llm_provider):
    from litellm.utils import ProviderConfigManager
    from litellm.types.utils import LlmProviders
    provider_config = ProviderConfigManager.get_provider_model_info(
        model=None,
        provider=LlmProviders(custom_llm_provider),
    )
    assert provider_config is not None
    valid_models = get_valid_models(
        check_provider_endpoint=True, custom_llm_provider=custom_llm_provider
    )
    print(valid_models)
    assert len(valid_models) > 0
    assert provider_config.get_models() == valid_models
 # test_get_valid_models()
--- a/tests/proxy_unit_tests/test_key_generate_prisma.py
+++ b/tests/proxy_unit_tests/test_key_generate_prisma.py
@ -3883,8 +3883,11 @@ async def test_get_paginated_teams(prisma_client):
@pytest.mark.asyncio
-@pytest.mark.flaky(reruns=3)
+@pytest.mark.flaky(retries=3, delay=1)
@pytest.mark.parametrize("entity_type", ["key", "user", "team"])
@pytest.mark.skip(
    reason="Skipping reset budget job test. Fails on ci/cd due to db timeout errors. Need to replace with mock db."
 )
 async def test_reset_budget_job(prisma_client, entity_type):
    """
    Test that the ResetBudgetJob correctly resets budgets for keys, users, and teams.
--- a/tests/proxy_unit_tests/test_update_spend.py
+++ b/tests/proxy_unit_tests/test_update_spend.py
@ -28,6 +28,7 @@ class MockPrismaClient:
        self.team_list_transactons = {}
        self.team_member_list_transactons = {}
        self.org_list_transactons = {}
        self.daily_user_spend_transactions = {}
    def jsonify_object(self, obj):
        return obj
--- a/tests/test_end_users.py
+++ b/tests/test_end_users.py
@ -160,7 +160,7 @@ async def test_end_user_new():
@pytest.mark.asyncio
-async def test_end_user_specific_region():
+async def test_aaaend_user_specific_region():
    """
    - Specify region user can make calls in
    - Make a generic call
--- a/ui/litellm-dashboard/src/app/page.tsx
+++ b/ui/litellm-dashboard/src/app/page.tsx
@ -20,6 +20,7 @@ import PassThroughSettings from "@/components/pass_through_settings";
 import BudgetPanel from "@/components/budgets/budget_panel";
 import SpendLogsTable from "@/components/view_logs";
 import ModelHub from "@/components/model_hub";
 import NewUsagePage from "@/components/new_usage";
 import APIRef from "@/components/api_ref";
 import ChatUI from "@/components/chat_ui";
 import Sidebar from "@/components/leftnav";
@ -346,7 +347,14 @@ export default function CreateKeyPage() {
                  accessToken={accessToken}
                  allTeams={teams as Team[] ?? []}
                />
-              ) : (
+              ) : page == "new_usage" ? (
                <NewUsagePage
                  userID={userID}
                  userRole={userRole}
                  accessToken={accessToken}
                />
              ) : 
              (
                <Usage
                  userID={userID}
                  userRole={userRole}
--- a/ui/litellm-dashboard/src/components/leftnav.tsx
+++ b/ui/litellm-dashboard/src/components/leftnav.tsx
@ -68,6 +68,7 @@ const menuItems: MenuItem[] = [
      { key: "9", page: "caching", label: "Caching", icon: <DatabaseOutlined />, roles: all_admin_roles },
      { key: "10", page: "budgets", label: "Budgets", icon: <BankOutlined />, roles: all_admin_roles },
      { key: "11", page: "guardrails", label: "Guardrails", icon: <SafetyOutlined />, roles: all_admin_roles },
      { key: "12", page: "new_usage", label: "New Usage", icon: <BarChartOutlined />, roles: all_admin_roles },
    ]
  },
  {
--- a/ui/litellm-dashboard/src/components/networking.tsx
+++ b/ui/litellm-dashboard/src/components/networking.tsx
@ -1070,6 +1070,42 @@ export const organizationDeleteCall = async (
  }
 };
 export const userDailyActivityCall = async (accessToken: String, startTime: Date, endTime: Date) => {
  /**
   * Get daily user activity on proxy
   */
  try {
    let url = proxyBaseUrl ? `${proxyBaseUrl}/user/daily/activity` : `/user/daily/activity`;
    const queryParams = new URLSearchParams();
    queryParams.append('start_date', startTime.toISOString());
    queryParams.append('end_date', endTime.toISOString());
    const queryString = queryParams.toString();
    if (queryString) {
      url += `?${queryString}`;
    }
    const response = await fetch(url, {
      method: "GET",
      headers: {
        [globalLitellmHeaderName]: `Bearer ${accessToken}`,
        "Content-Type": "application/json",
      },
    });
    if (!response.ok) {
      const errorData = await response.text();
      handleError(errorData);
      throw new Error("Network response was not ok");
    }
    const data = await response.json();
    return data;
  } catch (error) {
    console.error("Failed to create key:", error);
    throw error;
  }
 };
 export const getTotalSpendCall = async (accessToken: String) => {
  /**
   * Get all models on proxy
--- a/ui/litellm-dashboard/src/components/new_usage.tsx
+++ b/ui/litellm-dashboard/src/components/new_usage.tsx
@ -0,0 +1,471 @@
 /**
 * New Usage Page
 * 
 * Uses the new `/user/daily/activity` endpoint to get daily activity data for a user.
 * 
 * Works at 1m+ spend logs, by querying an aggregate table instead.
 */
 import React, { useState, useEffect } from "react";
 import { 
  BarChart, Card, Title, Text, 
  Grid, Col, TabGroup, TabList, Tab, 
  TabPanel, TabPanels, DonutChart,
  Table, TableHead, TableRow, 
  TableHeaderCell, TableBody, TableCell,
  Subtitle
 } from "@tremor/react";
 import { AreaChart } from "@tremor/react";
 import { userDailyActivityCall } from "./networking";
 import ViewUserSpend from "./view_user_spend";
 import TopKeyView from "./top_key_view";
 interface NewUsagePageProps {
  accessToken: string | null;
  userRole: string | null;
  userID: string | null;
 }
 interface SpendMetrics {
  spend: number;
  prompt_tokens: number;
  completion_tokens: number;
  total_tokens: number;
  api_requests: number;
 }
 interface BreakdownMetrics {
  models: { [key: string]: SpendMetrics };
  providers: { [key: string]: SpendMetrics };
  api_keys: { [key: string]: SpendMetrics };
 }
 interface DailyData {
  date: string;
  metrics: SpendMetrics;
  breakdown: BreakdownMetrics;
 }
 const NewUsagePage: React.FC<NewUsagePageProps> = ({
  accessToken,
  userRole,
  userID,
 }) => {
  const [userSpendData, setUserSpendData] = useState<{
    results: DailyData[];
    metadata: any;
  }>({ results: [], metadata: {} });
  // Derived states from userSpendData
  const totalSpend = userSpendData.metadata?.total_spend || 0;
  // Calculate top models from the breakdown data
  const getTopModels = () => {
    const modelSpend: { [key: string]: SpendMetrics } = {};
    userSpendData.results.forEach(day => {
      Object.entries(day.breakdown.models || {}).forEach(([model, metrics]) => {
        if (!modelSpend[model]) {
          modelSpend[model] = {
            spend: 0,
            prompt_tokens: 0,
            completion_tokens: 0,
            total_tokens: 0,
            api_requests: 0
          };
        }
        modelSpend[model].spend += metrics.spend;
        modelSpend[model].prompt_tokens += metrics.prompt_tokens;
        modelSpend[model].completion_tokens += metrics.completion_tokens;
        modelSpend[model].total_tokens += metrics.total_tokens;
        modelSpend[model].api_requests += metrics.api_requests;
      });
    });
    return Object.entries(modelSpend)
      .map(([model, metrics]) => ({
        key: model,
        spend: metrics.spend,
        requests: metrics.api_requests,
        tokens: metrics.total_tokens
      }))
      .sort((a, b) => b.spend - a.spend)
      .slice(0, 5);
  };
  // Calculate provider spend from the breakdown data
  const getProviderSpend = () => {
    const providerSpend: { [key: string]: SpendMetrics } = {};
    userSpendData.results.forEach(day => {
      Object.entries(day.breakdown.providers || {}).forEach(([provider, metrics]) => {
        if (!providerSpend[provider]) {
          providerSpend[provider] = {
            spend: 0,
            prompt_tokens: 0,
            completion_tokens: 0,
            total_tokens: 0,
            api_requests: 0
          };
        }
        providerSpend[provider].spend += metrics.spend;
        providerSpend[provider].prompt_tokens += metrics.prompt_tokens;
        providerSpend[provider].completion_tokens += metrics.completion_tokens;
        providerSpend[provider].total_tokens += metrics.total_tokens;
        providerSpend[provider].api_requests += metrics.api_requests;
      });
    });
    return Object.entries(providerSpend)
      .map(([provider, metrics]) => ({
        provider,
        spend: metrics.spend,
        requests: metrics.api_requests,
        tokens: metrics.total_tokens
      }));
  };
  // Calculate top API keys from the breakdown data
  const getTopKeys = () => {
    const keySpend: { [key: string]: SpendMetrics } = {};
    userSpendData.results.forEach(day => {
      Object.entries(day.breakdown.api_keys || {}).forEach(([key, metrics]) => {
        if (!keySpend[key]) {
          keySpend[key] = {
            spend: 0,
            prompt_tokens: 0,
            completion_tokens: 0,
            total_tokens: 0,
            api_requests: 0
          };
        }
        keySpend[key].spend += metrics.spend;
        keySpend[key].prompt_tokens += metrics.prompt_tokens;
        keySpend[key].completion_tokens += metrics.completion_tokens;
        keySpend[key].total_tokens += metrics.total_tokens;
        keySpend[key].api_requests += metrics.api_requests;
      });
    });
    return Object.entries(keySpend)
      .map(([api_key, metrics]) => ({
        api_key,
        key_alias: api_key.substring(0, 10), // Using truncated key as alias
        spend: metrics.spend,
      }))
      .sort((a, b) => b.spend - a.spend)
      .slice(0, 5);
  };
  const fetchUserSpendData = async () => {
    if (!accessToken) return;
    const startTime = new Date(Date.now() - 28 * 24 * 60 * 60 * 1000);
    const endTime = new Date();
    const data = await userDailyActivityCall(accessToken, startTime, endTime);
    setUserSpendData(data);
  };
  useEffect(() => {
    fetchUserSpendData();
  }, [accessToken]);
  return (
    <div style={{ width: "100%" }} className="p-8">
      <Text>Experimental Usage page, using new `/user/daily/activity` endpoint.</Text>
      <TabGroup>
        <TabList variant="solid" className="mt-1">
          <Tab>Cost</Tab>
          <Tab>Activity</Tab>
        </TabList>
        <TabPanels>
          {/* Cost Panel */}
          <TabPanel>
            <Grid numItems={2} className="gap-2 h-[100vh] w-full">
              {/* Total Spend Card */}
              <Col numColSpan={2}>
                <Text className="text-tremor-default text-tremor-content dark:text-dark-tremor-content mb-2 mt-2 text-lg">
                  Project Spend {new Date().toLocaleString('default', { month: 'long' })} 1 - {new Date(new Date().getFullYear(), new Date().getMonth() + 1, 0).getDate()}
                </Text>
                <ViewUserSpend
                  userID={userID}
                  userRole={userRole}
                  accessToken={accessToken}
                  userSpend={totalSpend}
                  selectedTeam={null}
                  userMaxBudget={null}
                />
              </Col>
              {/* Daily Spend Chart */}
              <Col numColSpan={2}>
                <Card>
                  <Title>Daily Spend</Title>
                  <BarChart
                    data={userSpendData.results}
                    index="date"
                    categories={["metrics.spend"]}
                    colors={["cyan"]}
                    valueFormatter={(value) => `$${value.toFixed(2)}`}
                    yAxisWidth={100}
                    showLegend={false}
                    customTooltip={({ payload, active }) => {
                      if (!active || !payload?.[0]) return null;
                      const data = payload[0].payload;
                      return (
                        <div className="bg-white p-4 shadow-lg rounded-lg border">
                          <p className="font-bold">{data.date}</p>
                          <p className="text-cyan-500">Spend: ${data.metrics.spend.toFixed(2)}</p>
                          <p className="text-gray-600">Requests: {data.metrics.api_requests}</p>
                          <p className="text-gray-600">Tokens: {data.metrics.total_tokens}</p>
                        </div>
                      );
                    }}
                  />
                </Card>
              </Col>
              {/* Top API Keys */}
              <Col numColSpan={1}>
                <Card className="h-full">
                  <Title>Top API Keys</Title>
                  <TopKeyView
                    topKeys={getTopKeys()}
                    accessToken={accessToken}
                    userID={userID}
                    userRole={userRole}
                    teams={null}
                  />
                </Card>
              </Col>
              {/* Top Models */}
              <Col numColSpan={1}>
                <Card className="h-full">
                  <Title>Top Models</Title>
                  <BarChart
                    className="mt-4 h-40"
                    data={getTopModels()}
                    index="key"
                    categories={["spend"]}
                    colors={["cyan"]}
                    valueFormatter={(value) => `$${value.toFixed(2)}`}
                    layout="vertical"
                    yAxisWidth={200}
                    showLegend={false}
                    customTooltip={({ payload, active }) => {
                      if (!active || !payload?.[0]) return null;
                      const data = payload[0].payload;
                      return (
                        <div className="bg-white p-4 shadow-lg rounded-lg border">
                          <p className="font-bold">{data.key}</p>
                          <p className="text-cyan-500">Spend: ${data.spend.toFixed(2)}</p>
                          <p className="text-gray-600">Requests: {data.requests.toLocaleString()}</p>
                          <p className="text-gray-600">Tokens: {data.tokens.toLocaleString()}</p>
                        </div>
                      );
                    }}
                  />
                </Card>
              </Col>
              {/* Spend by Provider */}
              <Col numColSpan={2}>
                <Card className="h-full">
                  <Title>Spend by Provider</Title>
                  <Grid numItems={2}>
                    <Col numColSpan={1}>
                      <DonutChart
                        className="mt-4 h-40"
                        data={getProviderSpend()}
                        index="provider"
                        category="spend"
                        valueFormatter={(value) => `$${value.toFixed(2)}`}
                        colors={["cyan"]}
                      />
                    </Col>
                    <Col numColSpan={1}>
                      <Table>
                        <TableHead>
                          <TableRow>
                            <TableHeaderCell>Provider</TableHeaderCell>
                            <TableHeaderCell>Spend</TableHeaderCell>
                            <TableHeaderCell>Requests</TableHeaderCell>
                            <TableHeaderCell>Tokens</TableHeaderCell>
                          </TableRow>
                        </TableHead>
                        <TableBody>
                          {getProviderSpend().map((provider) => (
                            <TableRow key={provider.provider}>
                              <TableCell>{provider.provider}</TableCell>
                              <TableCell>
                                ${provider.spend < 0.00001 
                                  ? "less than 0.00" 
                                  : provider.spend.toFixed(2)}
                              </TableCell>
                              <TableCell>{provider.requests.toLocaleString()}</TableCell>
                              <TableCell>{provider.tokens.toLocaleString()}</TableCell>
                            </TableRow>
                          ))}
                        </TableBody>
                      </Table>
                    </Col>
                  </Grid>
                </Card>
              </Col>
              {/* Usage Metrics */}
              <Col numColSpan={2}>
                <Card>
                  <Title>Usage Metrics</Title>
                  <Grid numItems={3} className="gap-4 mt-4">
                    <Card>
                      <Title>Total Requests</Title>
                      <Text className="text-2xl font-bold mt-2">
                        {userSpendData.metadata?.total_api_requests?.toLocaleString() || 0}
                      </Text>
                    </Card>
                    <Card>
                      <Title>Total Tokens</Title>
                      <Text className="text-2xl font-bold mt-2">
                        {userSpendData.metadata?.total_tokens?.toLocaleString() || 0}
                      </Text>
                    </Card>
                    <Card>
                      <Title>Average Cost per Request</Title>
                      <Text className="text-2xl font-bold mt-2">
                        ${((totalSpend || 0) / (userSpendData.metadata?.total_api_requests || 1)).toFixed(4)}
                      </Text>
                    </Card>
                  </Grid>
                </Card>
              </Col>
            </Grid>
          </TabPanel>
          {/* Activity Panel */}
          <TabPanel>
            <Grid numItems={1} className="gap-2 h-[75vh] w-full">
              <Card>
                <Title>All Up</Title>
                <Grid numItems={2}>
                  <Col>
                    <Subtitle style={{ fontSize: "15px", fontWeight: "normal", color: "#535452"}}>
                      API Requests {valueFormatterNumbers(userSpendData.metadata?.total_api_requests || 0)}
                    </Subtitle>
                    <AreaChart
                      className="h-40"
                      data={[...userSpendData.results].reverse()}
                      valueFormatter={valueFormatterNumbers}
                      index="date"
                      colors={['cyan']}
                      categories={['metrics.api_requests']}
                    />
                  </Col>
                  <Col>
                    <Subtitle style={{ fontSize: "15px", fontWeight: "normal", color: "#535452"}}>
                      Tokens {valueFormatterNumbers(userSpendData.metadata?.total_tokens || 0)}
                    </Subtitle>
                    <BarChart
                      className="h-40"
                      data={[...userSpendData.results].reverse()}
                      valueFormatter={valueFormatterNumbers}
                      index="date"
                      colors={['cyan']}
                      categories={['metrics.total_tokens']}
                    />
                  </Col>
                </Grid>
              </Card>
              {/* Per Model Activity */}
              {Object.entries(getModelActivityData(userSpendData)).map(([model, data], index) => (
                <Card key={index}>
                  <Title>{model}</Title>
                  <Grid numItems={2}>
                    <Col>
                      <Subtitle style={{ fontSize: "15px", fontWeight: "normal", color: "#535452"}}>
                        API Requests {valueFormatterNumbers(data.total_requests)}
                      </Subtitle>
                      <AreaChart
                        className="h-40"
                        data={[...data.daily_data].reverse()}
                        index="date"
                        colors={['cyan']}
                        categories={['api_requests']}
                        valueFormatter={valueFormatterNumbers}
                      />
                    </Col>
                    <Col>
                      <Subtitle style={{ fontSize: "15px", fontWeight: "normal", color: "#535452"}}>
                        Tokens {valueFormatterNumbers(data.total_tokens)}
                      </Subtitle>
                      <BarChart
                        className="h-40"
                        data={data.daily_data}  
                        index="date"
                        colors={['cyan']}
                        categories={['total_tokens']}
                        valueFormatter={valueFormatterNumbers}
                      />
                    </Col>
                  </Grid>
                </Card>
              ))}
            </Grid>
          </TabPanel>
        </TabPanels>
      </TabGroup>
    </div>
  );
 };
 // Add this helper function to process model-specific activity data
 const getModelActivityData = (userSpendData: {
  results: DailyData[];
  metadata: any;
 }) => {
  const modelData: {
    [key: string]: {
      total_requests: number;
      total_tokens: number;
      daily_data: Array<{
        date: string;
        api_requests: number;
        total_tokens: number;
      }>;
    };
  } = {};
  userSpendData.results.forEach((day: DailyData) => {
    Object.entries(day.breakdown.models || {}).forEach(([model, metrics]) => {
      if (!modelData[model]) {
        modelData[model] = {
          total_requests: 0,
          total_tokens: 0,
          daily_data: []
        };
      }
      modelData[model].total_requests += metrics.api_requests;
      modelData[model].total_tokens += metrics.total_tokens;
      modelData[model].daily_data.push({
        date: day.date,
        api_requests: metrics.api_requests,
        total_tokens: metrics.total_tokens
      });
    });
  });
  return modelData;
 };
 // Add this helper function for number formatting
 function valueFormatterNumbers(number: number) {
  const formatter = new Intl.NumberFormat('en-US', {
    maximumFractionDigits: 0,
    notation: 'compact',
    compactDisplay: 'short',
  });
  return formatter.format(number);
 }
 export default NewUsagePage;
--- a/ui/litellm-dashboard/src/components/usage.tsx
+++ b/ui/litellm-dashboard/src/components/usage.tsx
@ -1035,4 +1035,4 @@ const UsagePage: React.FC<UsagePageProps> = ({
  );
 };
-export default UsagePage;
+export default UsagePage;
		`@ -0,0 +1,3 @@`
							`-- AlterTable`
							`ALTER TABLE "LiteLLM_DailyUserSpend" ADD COLUMN "api_requests" INTEGER NOT NULL DEFAULT 0;`