Fix agents tests

2025-12-16 20:49:26 +00:00 · 2024-11-11 22:31:09 -08:00 · 2024-11-11 22:31:09 -08:00 · abe1cc6303
commit abe1cc6303
parent 38257a9cbe
7 changed files with 51 additions and 24 deletions
--- a/llama_stack/providers/inline/agents/meta_reference/agent_instance.py
+++ b/llama_stack/providers/inline/agents/meta_reference/agent_instance.py
@ -641,12 +641,13 @@ class ChatAgent(ShieldRunnerMixin):
        if session_info.memory_bank_id is None:
            bank_id = f"memory_bank_{session_id}"
-            memory_bank = VectorMemoryBank(
+            await self.memory_banks_api.register_memory_bank(
-                identifier=bank_id,
+                memory_bank_id=bank_id,
-                embedding_model="all-MiniLM-L6-v2",
+                params=VectorMemoryBankParams(
-                chunk_size_in_tokens=512,
+                    embedding_model="all-MiniLM-L6-v2",
                    chunk_size_in_tokens=512,
                ),
            )
            await self.memory_banks_api.register_memory_bank(memory_bank)
            await self.storage.add_memory_bank_to_session(session_id, bank_id)
        else:
            bank_id = session_info.memory_bank_id
--- a/llama_stack/providers/tests/agents/conftest.py
+++ b/llama_stack/providers/tests/agents/conftest.py
@ -19,7 +19,7 @@ DEFAULT_PROVIDER_COMBINATIONS = [
        {
            "inference": "meta_reference",
            "safety": "llama_guard",
-            "memory": "meta_reference",
+            "memory": "faiss",
            "agents": "meta_reference",
        },
        id="meta_reference",
@ -29,7 +29,7 @@ DEFAULT_PROVIDER_COMBINATIONS = [
        {
            "inference": "ollama",
            "safety": "llama_guard",
-            "memory": "meta_reference",
+            "memory": "faiss",
            "agents": "meta_reference",
        },
        id="ollama",
@ -40,7 +40,7 @@ DEFAULT_PROVIDER_COMBINATIONS = [
            "inference": "together",
            "safety": "llama_guard",
            # make this work with Weaviate which is what the together distro supports
-            "memory": "meta_reference",
+            "memory": "faiss",
            "agents": "meta_reference",
        },
        id="together",
--- a/llama_stack/providers/tests/agents/fixtures.py
+++ b/llama_stack/providers/tests/agents/fixtures.py
@ -9,6 +9,7 @@ import tempfile
 import pytest
 import pytest_asyncio
 from llama_stack.apis.models import Model
 from llama_stack.distribution.datatypes import Api, Provider
 from llama_stack.providers.inline.agents.meta_reference import (
@ -17,8 +18,18 @@ from llama_stack.providers.inline.agents.meta_reference import (
 from llama_stack.providers.tests.resolver import resolve_impls_for_test_v2
 from llama_stack.providers.utils.kvstore.config import SqliteKVStoreConfig
 from ..conftest import ProviderFixture, remote_stack_fixture
 from ..safety.fixtures import get_shield_to_register
 def pick_inference_model(inference_model):
    # This is not entirely satisfactory. The fixture `inference_model` can correspond to
    # multiple models when you need to run a safety model in addition to normal agent
    # inference model. We filter off the safety model by looking for "Llama-Guard"
    if isinstance(inference_model, list):
        inference_model = next(m for m in inference_model if "Llama-Guard" not in m)
        assert inference_model is not None
    return inference_model
@pytest.fixture(scope="session")
@ -49,7 +60,7 @@ AGENTS_FIXTURES = ["meta_reference", "remote"]
@pytest_asyncio.fixture(scope="session")
-async def agents_stack(request):
+async def agents_stack(request, inference_model, safety_model):
    fixture_dict = request.param
    providers = {}
@ -60,9 +71,28 @@ async def agents_stack(request):
        if fixture.provider_data:
            provider_data.update(fixture.provider_data)
    inf_provider_id = providers["inference"][0].provider_id
    safety_provider_id = providers["safety"][0].provider_id
    shield = get_shield_to_register(
        providers["safety"][0].provider_type, safety_provider_id, safety_model
    )
    inference_models = (
        inference_model if isinstance(inference_model, list) else [inference_model]
    )
    impls = await resolve_impls_for_test_v2(
        [Api.agents, Api.inference, Api.safety, Api.memory],
        providers,
        provider_data,
        models=[
            Model(
                identifier=model,
                provider_id=inf_provider_id,
                provider_resource_id=model,
            )
            for model in inference_models
        ],
        shields=[shield],
    )
    return impls[Api.agents], impls[Api.memory]
--- a/llama_stack/providers/tests/agents/test_agents.py
+++ b/llama_stack/providers/tests/agents/test_agents.py
@ -16,15 +16,12 @@ from llama_stack.providers.datatypes import *  # noqa: F403
 # pytest -v -s llama_stack/providers/tests/agents/test_agents.py
 #   -m "meta_reference"
 from .fixtures import pick_inference_model
@pytest.fixture
 def common_params(inference_model):
-    # This is not entirely satisfactory. The fixture `inference_model` can correspond to
+    inference_model = pick_inference_model(inference_model)
    # multiple models when you need to run a safety model in addition to normal agent
    # inference model. We filter off the safety model by looking for "Llama-Guard"
    if isinstance(inference_model, list):
        inference_model = next(m for m in inference_model if "Llama-Guard" not in m)
        assert inference_model is not None
    return dict(
        model=inference_model,
--- a/llama_stack/providers/tests/memory/fixtures.py
+++ b/llama_stack/providers/tests/memory/fixtures.py
@ -26,13 +26,13 @@ def memory_remote() -> ProviderFixture:
@pytest.fixture(scope="session")
-def memory_meta_reference() -> ProviderFixture:
+def memory_faiss() -> ProviderFixture:
    temp_file = tempfile.NamedTemporaryFile(delete=False, suffix=".db")
    return ProviderFixture(
        providers=[
            Provider(
-                provider_id="meta-reference",
+                provider_id="faiss",
-                provider_type="meta-reference",
+                provider_type="inline::faiss",
                config=FaissImplConfig(
                    kvstore=SqliteKVStoreConfig(db_path=temp_file.name).model_dump(),
                ).model_dump(),
@ -93,7 +93,7 @@ def memory_chroma() -> ProviderFixture:
    )
-MEMORY_FIXTURES = ["meta_reference", "pgvector", "weaviate", "remote", "chroma"]
+MEMORY_FIXTURES = ["faiss", "pgvector", "weaviate", "remote", "chroma"]
@pytest_asyncio.fixture(scope="session")
--- a/llama_stack/providers/tests/memory/test_memory.py
+++ b/llama_stack/providers/tests/memory/test_memory.py
@ -44,7 +44,6 @@ def sample_documents():
 async def register_memory_bank(banks_impl: MemoryBanks):
    return await banks_impl.register_memory_bank(
        memory_bank_id="test_bank",
        params=VectorMemoryBankParams(
@ -71,7 +70,7 @@ class TestMemory:
        # but so far we don't have an unregister API unfortunately, so be careful
        _, banks_impl = memory_stack
-        bank = await banks_impl.register_memory_bank(
+        await banks_impl.register_memory_bank(
            memory_bank_id="test_bank_no_provider",
            params=VectorMemoryBankParams(
                embedding_model="all-MiniLM-L6-v2",
--- a/llama_stack/providers/tests/safety/fixtures.py
+++ b/llama_stack/providers/tests/safety/fixtures.py
@ -99,7 +99,7 @@ async def safety_stack(inference_model, safety_model, request):
        provider_data.update(safety_fixture.provider_data)
    shield_provider_type = safety_fixture.providers[0].provider_type
-    shield = get_shield(
+    shield = get_shield_to_register(
        shield_provider_type, safety_fixture.providers[0].provider_id, safety_model
    )
@ -120,7 +120,7 @@ async def safety_stack(inference_model, safety_model, request):
    return impls[Api.safety], impls[Api.shields], shield
-def get_shield(provider_type: str, provider_id: str, safety_model: str):
+def get_shield_to_register(provider_type: str, provider_id: str, safety_model: str):
    shield_config = {}
    shield_type = ShieldType.llama_guard
    identifier = "llama_guard"