feat: Add temperature support to responses API (#2065)

# What does this PR do? Add support for the temperature to the responses API ## Test Plan Manually tested simple case unit tests added for simple case and tool calls Signed-off-by: Derek Higgins <derekh@redhat.com>
2025-12-03 09:53:45 +00:00 · 2025-05-01 19:47:58 +01:00 · 2025-05-01 19:47:58 +01:00 · 64829947d0
commit 64829947d0
parent f36f68c590
6 changed files with 220 additions and 3 deletions
--- a/llama_stack/apis/agents/agents.py
+++ b/llama_stack/apis/agents/agents.py
@ -628,6 +628,7 @@ class Agents(Protocol):
        previous_response_id: Optional[str] = None,
        store: Optional[bool] = True,
        stream: Optional[bool] = False,
+        temperature: Optional[float] = None,
        tools: Optional[List[OpenAIResponseInputTool]] = None,
    ) -> Union[OpenAIResponseObject, AsyncIterator[OpenAIResponseObjectStream]]:
        """Create a new OpenAI response.
--- a/llama_stack/providers/inline/agents/meta_reference/agents.py
+++ b/llama_stack/providers/inline/agents/meta_reference/agents.py
@ -270,8 +270,9 @@ class MetaReferenceAgentsImpl(Agents):
        previous_response_id: Optional[str] = None,
        store: Optional[bool] = True,
        stream: Optional[bool] = False,
+        temperature: Optional[float] = None,
        tools: Optional[List[OpenAIResponseInputTool]] = None,
    ) -> OpenAIResponseObject:
        return await self.openai_responses_impl.create_openai_response(
-            input, model, previous_response_id, store, stream, tools
+            input, model, previous_response_id, store, stream, temperature, tools
        )
--- a/llama_stack/providers/inline/agents/meta_reference/openai_responses.py
+++ b/llama_stack/providers/inline/agents/meta_reference/openai_responses.py
@ -106,6 +106,7 @@ class OpenAIResponsesImpl:
        previous_response_id: Optional[str] = None,
        store: Optional[bool] = True,
        stream: Optional[bool] = False,
+        temperature: Optional[float] = None,
        tools: Optional[List[OpenAIResponseInputTool]] = None,
    ):
        stream = False if stream is None else stream
@ -141,6 +142,7 @@ class OpenAIResponsesImpl:
            messages=messages,
            tools=chat_tools,
            stream=stream,
+            temperature=temperature,
        )

        if stream:
@ -180,7 +182,7 @@ class OpenAIResponsesImpl:
        output_messages: List[OpenAIResponseOutput] = []
        if chat_response.choices[0].message.tool_calls:
            output_messages.extend(
-                await self._execute_tool_and_return_final_output(model, stream, chat_response, messages)
+                await self._execute_tool_and_return_final_output(model, stream, chat_response, messages, temperature)
            )
        else:
            output_messages.extend(await _openai_choices_to_output_messages(chat_response.choices))
@ -241,7 +243,12 @@ class OpenAIResponsesImpl:
        return chat_tools

    async def _execute_tool_and_return_final_output(
-        self, model_id: str, stream: bool, chat_response: OpenAIChatCompletion, messages: List[OpenAIMessageParam]
+        self,
+        model_id: str,
+        stream: bool,
+        chat_response: OpenAIChatCompletion,
+        messages: List[OpenAIMessageParam],
+        temperature: float,
    ) -> List[OpenAIResponseOutput]:
        output_messages: List[OpenAIResponseOutput] = []
        choice = chat_response.choices[0]
@ -295,6 +302,7 @@ class OpenAIResponsesImpl:
            model=model_id,
            messages=messages,
            stream=stream,
+            temperature=temperature,
        )
        # type cast to appease mypy
        tool_results_chat_response = cast(OpenAIChatCompletion, tool_results_chat_response)