diff --git a/litellm/llms/predibase.py b/litellm/llms/predibase.py
index 1f96e7c67..e377b02d4 100644
--- a/litellm/llms/predibase.py
+++ b/litellm/llms/predibase.py
@@ -124,9 +124,6 @@ class PredibaseConfig:
 
 class PredibaseChatCompletion(BaseLLM):
     def __init__(self) -> None:
-        self.async_handler = AsyncHTTPHandler(
-            timeout=httpx.Timeout(timeout=litellm.request_timeout, connect=5.0)
-        )
         super().__init__()
 
     def _validate_environment(self, api_key: Optional[str], user_headers: dict) -> dict:
@@ -457,8 +454,10 @@ class PredibaseChatCompletion(BaseLLM):
         logger_fn=None,
         headers={},
     ) -> ModelResponse:
-
-        response = await self.async_handler.post(
+        async_handler = AsyncHTTPHandler(
+            timeout=httpx.Timeout(timeout=600.0, connect=5.0)
+        )
+        response = await async_handler.post(
             api_base, headers=headers, data=json.dumps(data)
         )
         return self.process_response(
@@ -491,9 +490,11 @@ class PredibaseChatCompletion(BaseLLM):
         logger_fn=None,
         headers={},
     ) -> CustomStreamWrapper:
-
+        async_handler = AsyncHTTPHandler(
+            timeout=httpx.Timeout(timeout=600.0, connect=5.0)
+        )
         data["stream"] = True
-        response = await self.async_handler.post(
+        response = await async_handler.post(
             url="https://serving.app.predibase.com/c4768f95/deployments/v2/llms/llama-3-8b-instruct/generate_stream",
             headers=headers,
             data=json.dumps(data),