Litellm stable dev (#5711)

* feat(aws_base_llm.py): prevents recreating boto3 credentials during high traffic Leads to 100ms perf boost in local testing * fix(base_aws_llm.py): fix credential caching check to see if token is set * refactor(bedrock/chat): separate converse api and invoke api + isolate converse api transformation logic Make it easier to see how requests are transformed for /converse * fix: fix imports * fix(bedrock/embed): fix reordering of headers * fix(base_aws_llm.py): fix get credential logic * fix(converse_handler.py): fix ai21 streaming response
2025-04-25 10:44:24 +00:00 · 2024-09-14 23:22:59 -07:00 · 2024-09-14 23:22:59 -07:00 · da77706c26
commit da77706c26
parent 2efdd2a6a4
14 changed files with 1073 additions and 1039 deletions
--- a/litellm/main.py
+++ b/litellm/main.py
@ -2385,6 +2385,7 @@ def completion(
                    )

            if model in litellm.BEDROCK_CONVERSE_MODELS:
+
                response = bedrock_converse_chat_completion.completion(
                    model=model,
                    messages=messages,
@ -3570,7 +3571,7 @@ def embedding(
                client=client,
                timeout=timeout,
                aembedding=aembedding,
-                litellm_params=litellm_params,
+                litellm_params={},
                api_base=api_base,
                print_verbose=print_verbose,
                extra_headers=extra_headers,