Merge pull request #1669 from BerriAI/litellm_feat_admin_ui_imp

[UI] Improve LiteLLM admin UI
2024-01-29 14:50:58 -08:00 · 2024-01-29 14:50:58 -08:00 · a9e215b2cc
commit a9e215b2cc
parent b6d13bf289 ceeaa70349
7 changed files with 86 additions and 4 deletions
--- a/docs/my-website/docs/proxy/virtual_keys.md
+++ b/docs/my-website/docs/proxy/virtual_keys.md
@ -278,6 +278,18 @@ Request Params:
 }
 ```
 ## Default /key/generate params
 Use this, if you need to control the default `max_budget` or any `key/generate` param per key 
 Set `litellm_settings:default_key_generate_params`:
 litellm_settings:
  default_key_generate_params:
    max_budget: 1.5000
    models: ["azure-gpt-3.5"]
    duration:     # blank means `null`
    metadata: {"setting":"default"}
    team_id: "core-infra"
 ## Set Budgets - Per Key
 Set `max_budget` in (USD $) param in the `key/generate` request. By default the `max_budget` is set to `null` and is not checked for keys
--- a/litellm/init.py
+++ b/litellm/init.py
@ -143,6 +143,7 @@ model_cost_map_url: str = "https://raw.githubusercontent.com/BerriAI/litellm/mai
 suppress_debug_info = False
 dynamodb_table_name: Optional[str] = None
 s3_callback_params: Optional[Dict] = None
 default_key_generate_params: Optional[Dict] = None
 #### RELIABILITY ####
 request_timeout: Optional[float] = 6000
 num_retries: Optional[int] = None  # per model endpoint
--- a/litellm/proxy/proxy_config.yaml
+++ b/litellm/proxy/proxy_config.yaml
@ -69,11 +69,16 @@ litellm_settings:
  success_callback: ['langfuse']
  max_budget: 10      # global budget for proxy 
  budget_duration: 30d    # global budget duration, will reset after 30d
  default_key_generate_params:
    max_budget: 1.5000
    models: ["azure-gpt-3.5"]
    duration: None
  # cache: True     
  # setting callback class
  # callbacks: custom_callbacks.proxy_handler_instance # sets litellm.callbacks = [proxy_handler_instance]
 general_settings: 
  allow_user_auth: True
  master_key: sk-1234
  alerting: ["slack"]
  alerting_threshold: 10 # sends alerts if requests hang for 2 seconds
--- a/litellm/proxy/proxy_server.py
+++ b/litellm/proxy/proxy_server.py
@ -1117,6 +1117,9 @@ class ProxyConfig:
                    # see usage here: https://docs.litellm.ai/docs/proxy/caching
                    pass
                else:
                    verbose_proxy_logger.debug(
                        f"{blue_color_code} setting litellm.{key}={value}{reset_color_code}"
                    )
                    setattr(litellm, key, value)
        ## GENERAL SERVER SETTINGS (e.g. master key,..) # do this after initializing litellm, to ensure sentry logging works for proxylogging
@ -2385,6 +2388,26 @@ async def generate_key_fn(
                raise HTTPException(
                    status_code=status.HTTP_403_FORBIDDEN, detail=message
                )
        # check if user set default key/generate params on config.yaml
        if litellm.default_key_generate_params is not None:
            for elem in data:
                key, value = elem
                if value is None and key in [
                    "max_budget",
                    "user_id",
                    "team_id",
                    "max_parallel_requests",
                    "tpm_limit",
                    "rpm_limit",
                    "budget_duration",
                ]:
                    setattr(
                        data, key, litellm.default_key_generate_params.get(key, None)
                    )
                elif key == "models" and value == []:
                    setattr(data, key, litellm.default_key_generate_params.get(key, []))
                elif key == "metadata" and value == {}:
                    setattr(data, key, litellm.default_key_generate_params.get(key, {}))
        data_json = data.json()  # type: ignore
@ -2959,6 +2982,11 @@ async def google_callback(code: str, request: Request):
            user_id = response["user_id"]  # type: ignore
            litellm_dashboard_ui = "https://litellm-dashboard.vercel.app/"
            # if user set LITELLM_UI_LINK in .env, use that
            litellm_ui_link_in_env = os.getenv("LITELLM_UI_LINK", None)
            if litellm_ui_link_in_env is not None:
                litellm_dashboard_ui = litellm_ui_link_in_env
            litellm_dashboard_ui += (
                "?userID="
                + user_id
--- a/litellm/tests/test_key_generate_prisma.py
+++ b/litellm/tests/test_key_generate_prisma.py
@ -1188,3 +1188,27 @@ async def test_key_name_set(prisma_client):
    except Exception as e:
        print("Got Exception", e)
        pytest.fail(f"Got exception {e}")
@pytest.mark.asyncio()
 async def test_default_key_params(prisma_client):
    """
    - create key
    - get key info
    - assert key_name is not null
    """
    setattr(litellm.proxy.proxy_server, "prisma_client", prisma_client)
    setattr(litellm.proxy.proxy_server, "master_key", "sk-1234")
    setattr(litellm.proxy.proxy_server, "general_settings", {"allow_user_auth": True})
    litellm.default_key_generate_params = {"max_budget": 0.000122}
    await litellm.proxy.proxy_server.prisma_client.connect()
    try:
        request = GenerateKeyRequest()
        key = await generate_key_fn(request)
        generated_key = key.key
        result = await info_key_fn(key=generated_key)
        print("result from info_key_fn", result)
        assert result["info"]["max_budget"] == 0.000122
    except Exception as e:
        print("Got Exception", e)
        pytest.fail(f"Got exception {e}")
--- a/ui/litellm-dashboard/src/components/networking.tsx
+++ b/ui/litellm-dashboard/src/components/networking.tsx
@ -15,8 +15,6 @@ export const keyCreateCall = async (
        "Content-Type": "application/json",
      },
      body: JSON.stringify({
        team_id: "core-infra-4",
        max_budget: 10,
        user_id: userID,
      }),
    });
--- a/ui/litellm-dashboard/src/components/view_key_table.tsx
+++ b/ui/litellm-dashboard/src/components/view_key_table.tsx
@ -58,7 +58,8 @@ const ViewKeyTable: React.FC<ViewKeyTableProps> = ({
        <TableHead>
          <TableRow>
            <TableHeaderCell>Secret Key</TableHeaderCell>
-            <TableHeaderCell>Spend</TableHeaderCell>
+            <TableHeaderCell>Spend (USD)</TableHeaderCell>
            <TableHeaderCell>Key Budget (USD)</TableHeaderCell>
            <TableHeaderCell>Expires</TableHeaderCell>
          </TableRow>
        </TableHead>
@ -68,11 +69,24 @@ const ViewKeyTable: React.FC<ViewKeyTableProps> = ({
            return (
              <TableRow key={item.token}>
                <TableCell>
-                  <Text>{item.key_name}</Text>
+                  {item.key_name != null ? (
                    <Text>{item.key_name}</Text>
                  ) : (
                    <Text>{item.token}</Text>
                  )
                }
                </TableCell>
                <TableCell>
                  <Text>{item.spend}</Text>
                </TableCell>
                <TableCell>
                  {item.max_budget != null ? (
                    <Text>{item.max_budget}</Text>
                  ) : (
                    <Text>Unlimited Budget</Text>
                  )
                }
                </TableCell>
                <TableCell>
                  {item.expires != null ? (
                    <Text>{item.expires}</Text>