impls -> inline, adapters -> remote (#381)

2024-11-06 14:54:05 -08:00 · 2024-11-06 14:54:05 -08:00 · 994732e2e0
commit 994732e2e0
parent b10e9f46bb
169 changed files with 106 additions and 105 deletions
--- a/llama_stack/providers/inline/meta_reference/agents/tests/init.py
+++ b/llama_stack/providers/inline/meta_reference/agents/tests/init.py
@ -0,0 +1,5 @@
+# Copyright (c) Meta Platforms, Inc. and affiliates.
+# All rights reserved.
+#
+# This source code is licensed under the terms described in the LICENSE file in
+# the root directory of this source tree.
--- a/llama_stack/providers/inline/meta_reference/agents/tests/code_execution.py
+++ b/llama_stack/providers/inline/meta_reference/agents/tests/code_execution.py
@ -0,0 +1,93 @@
+# Copyright (c) Meta Platforms, Inc. and affiliates.
+# All rights reserved.
+#
+# This source code is licensed under the terms described in the LICENSE file in
+# the root directory of this source tree.
+
+import unittest
+
+from llama_models.llama3.api.datatypes import (
+    Attachment,
+    BuiltinTool,
+    CompletionMessage,
+    StopReason,
+    ToolCall,
+)
+
+from ..tools.builtin import CodeInterpreterTool
+
+
+class TestCodeInterpreter(unittest.IsolatedAsyncioTestCase):
+    async def test_matplotlib(self):
+        tool = CodeInterpreterTool()
+        code = """
+import matplotlib.pyplot as plt
+import numpy as np
+
+x = np.array([1, 1])
+y = np.array([0, 10])
+
+plt.plot(x, y)
+plt.title('x = 1')
+plt.xlabel('x')
+plt.ylabel('y')
+plt.grid(True)
+plt.axvline(x=1, color='r')
+plt.show()
+        """
+        message = CompletionMessage(
+            role="assistant",
+            content="",
+            tool_calls=[
+                ToolCall(
+                    call_id="call_id",
+                    tool_name=BuiltinTool.code_interpreter,
+                    arguments={"code": code},
+                )
+            ],
+            stop_reason=StopReason.end_of_message,
+        )
+        ret = await tool.run([message])
+
+        self.assertEqual(len(ret), 1)
+
+        output = ret[0].content
+        self.assertIsInstance(output, Attachment)
+        self.assertEqual(output.mime_type, "image/png")
+
+    async def test_path_unlink(self):
+        tool = CodeInterpreterTool()
+        code = """
+import os
+from pathlib import Path
+import tempfile
+
+dpath = Path(os.environ["MPLCONFIGDIR"])
+with open(dpath / "test", "w") as f:
+    f.write("hello")
+
+Path(dpath / "test").unlink()
+print("_OK_")
+        """
+        message = CompletionMessage(
+            role="assistant",
+            content="",
+            tool_calls=[
+                ToolCall(
+                    call_id="call_id",
+                    tool_name=BuiltinTool.code_interpreter,
+                    arguments={"code": code},
+                )
+            ],
+            stop_reason=StopReason.end_of_message,
+        )
+        ret = await tool.run([message])
+
+        self.assertEqual(len(ret), 1)
+
+        output = ret[0].content
+        self.assertTrue("_OK_" in output)
+
+
+if __name__ == "__main__":
+    unittest.main()
--- a/llama_stack/providers/inline/meta_reference/agents/tests/test_chat_agent.py
+++ b/llama_stack/providers/inline/meta_reference/agents/tests/test_chat_agent.py
@ -0,0 +1,306 @@
+# Copyright (c) Meta Platforms, Inc. and affiliates.
+# All rights reserved.
+#
+# This source code is licensed under the terms described in the LICENSE file in
+# the root directory of this source tree.
+
+from typing import AsyncIterator, List, Optional, Union
+
+import pytest
+
+from llama_stack.apis.inference import *  # noqa: F403
+from llama_stack.apis.memory import *  # noqa: F403
+from llama_stack.apis.safety import *  # noqa: F403
+from llama_stack.apis.agents import *  # noqa: F403
+
+from ..agents import (
+    AGENT_INSTANCES_BY_ID,
+    MetaReferenceAgentsImpl,
+    MetaReferenceInferenceConfig,
+)
+
+
+class MockInferenceAPI:
+    async def chat_completion(
+        self,
+        model: str,
+        messages: List[Message],
+        sampling_params: Optional[SamplingParams] = SamplingParams(),
+        response_format: Optional[ResponseFormat] = None,
+        tools: Optional[List[ToolDefinition]] = None,
+        tool_choice: Optional[ToolChoice] = None,
+        tool_prompt_format: Optional[ToolPromptFormat] = None,
+        stream: Optional[bool] = False,
+        logprobs: Optional[LogProbConfig] = None,
+    ) -> AsyncIterator[
+        Union[ChatCompletionResponseStreamChunk, ChatCompletionResponse]
+    ]:
+        if stream:
+            yield ChatCompletionResponseStreamChunk(
+                event=ChatCompletionResponseEvent(
+                    event_type="start",
+                    delta="",
+                )
+            )
+
+            yield ChatCompletionResponseStreamChunk(
+                event=ChatCompletionResponseEvent(
+                    event_type="progress",
+                    delta="AI is a fascinating field...",
+                )
+            )
+            # yield ChatCompletionResponseStreamChunk(
+            #     event=ChatCompletionResponseEvent(
+            #         event_type="progress",
+            #         delta=ToolCallDelta(
+            #             content=ToolCall(
+            #                 call_id="123",
+            #                 tool_name=BuiltinTool.brave_search.value,
+            #                 arguments={"query": "AI history"},
+            #             ),
+            #             parse_status="success",
+            #         ),
+            #     )
+            # )
+            yield ChatCompletionResponseStreamChunk(
+                event=ChatCompletionResponseEvent(
+                    event_type="complete",
+                    delta="",
+                    stop_reason="end_of_turn",
+                )
+            )
+        else:
+            yield ChatCompletionResponse(
+                completion_message=CompletionMessage(
+                    role="assistant", content="Mock response", stop_reason="end_of_turn"
+                ),
+                logprobs=[0.1, 0.2, 0.3] if logprobs else None,
+            )
+
+
+class MockSafetyAPI:
+    async def run_shield(
+        self, shield_type: str, messages: List[Message]
+    ) -> RunShieldResponse:
+        return RunShieldResponse(violation=None)
+
+
+class MockMemoryAPI:
+    def __init__(self):
+        self.memory_banks = {}
+        self.documents = {}
+
+    async def create_memory_bank(self, name, config, url=None):
+        bank_id = f"bank_{len(self.memory_banks)}"
+        bank = MemoryBank(bank_id, name, config, url)
+        self.memory_banks[bank_id] = bank
+        self.documents[bank_id] = {}
+        return bank
+
+    async def list_memory_banks(self):
+        return list(self.memory_banks.values())
+
+    async def get_memory_bank(self, bank_id):
+        return self.memory_banks.get(bank_id)
+
+    async def drop_memory_bank(self, bank_id):
+        if bank_id in self.memory_banks:
+            del self.memory_banks[bank_id]
+            del self.documents[bank_id]
+        return bank_id
+
+    async def insert_documents(self, bank_id, documents, ttl_seconds=None):
+        if bank_id not in self.documents:
+            raise ValueError(f"Bank {bank_id} not found")
+        for doc in documents:
+            self.documents[bank_id][doc.document_id] = doc
+
+    async def update_documents(self, bank_id, documents):
+        if bank_id not in self.documents:
+            raise ValueError(f"Bank {bank_id} not found")
+        for doc in documents:
+            if doc.document_id in self.documents[bank_id]:
+                self.documents[bank_id][doc.document_id] = doc
+
+    async def query_documents(self, bank_id, query, params=None):
+        if bank_id not in self.documents:
+            raise ValueError(f"Bank {bank_id} not found")
+        # Simple mock implementation: return all documents
+        chunks = [
+            {"content": doc.content, "token_count": 10, "document_id": doc.document_id}
+            for doc in self.documents[bank_id].values()
+        ]
+        scores = [1.0] * len(chunks)
+        return {"chunks": chunks, "scores": scores}
+
+    async def get_documents(self, bank_id, document_ids):
+        if bank_id not in self.documents:
+            raise ValueError(f"Bank {bank_id} not found")
+        return [
+            self.documents[bank_id][doc_id]
+            for doc_id in document_ids
+            if doc_id in self.documents[bank_id]
+        ]
+
+    async def delete_documents(self, bank_id, document_ids):
+        if bank_id not in self.documents:
+            raise ValueError(f"Bank {bank_id} not found")
+        for doc_id in document_ids:
+            self.documents[bank_id].pop(doc_id, None)
+
+
+@pytest.fixture
+def mock_inference_api():
+    return MockInferenceAPI()
+
+
+@pytest.fixture
+def mock_safety_api():
+    return MockSafetyAPI()
+
+
+@pytest.fixture
+def mock_memory_api():
+    return MockMemoryAPI()
+
+
+@pytest.fixture
+async def chat_agent(mock_inference_api, mock_safety_api, mock_memory_api):
+    impl = MetaReferenceAgentsImpl(
+        config=MetaReferenceInferenceConfig(),
+        inference_api=mock_inference_api,
+        safety_api=mock_safety_api,
+        memory_api=mock_memory_api,
+    )
+    await impl.initialize()
+
+    agent_config = AgentConfig(
+        model="test_model",
+        instructions="You are a helpful assistant.",
+        sampling_params=SamplingParams(),
+        tools=[
+            # SearchToolDefinition(
+            #     name="brave_search",
+            #     api_key="test_key",
+            # ),
+        ],
+        tool_choice=ToolChoice.auto,
+        enable_session_persistence=False,
+        input_shields=[],
+        output_shields=[],
+    )
+    response = await impl.create_agent(agent_config)
+    agent = AGENT_INSTANCES_BY_ID[response.agent_id]
+    return agent
+
+
+@pytest.mark.asyncio
+async def test_chat_agent_create_session(chat_agent):
+    session = chat_agent.create_session("Test Session")
+    assert session.session_name == "Test Session"
+    assert session.turns == []
+    assert session.session_id in chat_agent.sessions
+
+
+@pytest.mark.asyncio
+async def test_chat_agent_create_and_execute_turn(chat_agent):
+    session = chat_agent.create_session("Test Session")
+    request = AgentTurnCreateRequest(
+        agent_id="random",
+        session_id=session.session_id,
+        messages=[UserMessage(content="Hello")],
+    )
+
+    responses = []
+    async for response in chat_agent.create_and_execute_turn(request):
+        responses.append(response)
+
+    print(responses)
+    assert len(responses) > 0
+    assert len(responses) == 4  # TurnStart, StepStart, StepComplete, TurnComplete
+    assert responses[0].event.payload.turn_id is not None
+
+
+@pytest.mark.asyncio
+async def test_run_multiple_shields_wrapper(chat_agent):
+    messages = [UserMessage(content="Test message")]
+    shields = ["test_shield"]
+
+    responses = [
+        chunk
+        async for chunk in chat_agent.run_multiple_shields_wrapper(
+            turn_id="test_turn_id",
+            messages=messages,
+            shields=shields,
+            touchpoint="user-input",
+        )
+    ]
+
+    assert len(responses) == 2  # StepStart, StepComplete
+    assert responses[0].event.payload.step_type.value == "shield_call"
+    assert not responses[1].event.payload.step_details.response.is_violation
+
+
+@pytest.mark.asyncio
+@pytest.mark.skip(reason="Not yet implemented; need to mock out tool execution easily")
+async def test_chat_agent_complex_turn(chat_agent):
+    # Setup
+    session = chat_agent.create_session("Test Session")
+    request = AgentTurnCreateRequest(
+        agent_id="random",
+        session_id=session.session_id,
+        messages=[UserMessage(content="Tell me about AI and then use a tool.")],
+        stream=True,
+    )
+
+    # Execute the turn
+    responses = []
+    async for response in chat_agent.create_and_execute_turn(request):
+        responses.append(response)
+
+    # Assertions
+    assert len(responses) > 0
+
+    # Check for the presence of different step types
+    step_types = [
+        response.event.payload.step_type
+        for response in responses
+        if hasattr(response.event.payload, "step_type")
+    ]
+
+    assert "shield_call" in step_types, "Shield call step is missing"
+    assert "inference" in step_types, "Inference step is missing"
+    assert "tool_execution" in step_types, "Tool execution step is missing"
+
+    # Check for the presence of start and complete events
+    event_types = [
+        response.event.payload.event_type
+        for response in responses
+        if hasattr(response.event.payload, "event_type")
+    ]
+    assert "start" in event_types, "Start event is missing"
+    assert "complete" in event_types, "Complete event is missing"
+
+    # Check for the presence of tool call
+    tool_calls = [
+        response.event.payload.tool_call
+        for response in responses
+        if hasattr(response.event.payload, "tool_call")
+    ]
+    assert any(
+        tool_call
+        for tool_call in tool_calls
+        if tool_call and tool_call.content.get("name") == "memory"
+    ), "Memory tool call is missing"
+
+    # Check for the final turn complete event
+    assert any(
+        isinstance(response.event.payload, AgentTurnResponseTurnCompletePayload)
+        for response in responses
+    ), "Turn complete event is missing"
+
+    # Verify the turn was added to the session
+    assert len(session.turns) == 1, "Turn was not added to the session"
+    assert (
+        session.turns[0].input_messages == request.messages
+    ), "Input messages do not match"