scoring fn braintrust fixture

2025-12-16 10:12:37 +00:00 · 2024-11-11 16:42:16 -05:00 · 2024-11-11 16:42:16 -05:00 · 258e01ec67
commit 258e01ec67
parent ca2cd71182
3 changed files with 31 additions and 2 deletions
--- a/llama_stack/providers/tests/scoring/conftest.py
+++ b/llama_stack/providers/tests/scoring/conftest.py
@ -31,6 +31,15 @@ DEFAULT_PROVIDER_COMBINATIONS = [
        id="meta_reference_scoring_together_inference",
        marks=pytest.mark.meta_reference_scoring_together_inference,
    ),
    pytest.param(
        {
            "scoring": "braintrust",
            "datasetio": "localfs",
            "inference": "together",
        },
        id="braintrust_scoring_together_inference",
        marks=pytest.mark.braintrust_scoring_together_inference,
    ),
 ]
@ -38,6 +47,7 @@ def pytest_configure(config):
    for fixture_name in [
        "meta_reference_scoring_fireworks_inference",
        "meta_reference_scoring_together_inference",
        "braintrust_scoring_together_inference",
    ]:
        config.addinivalue_line(
            "markers",
--- a/llama_stack/providers/tests/scoring/fixtures.py
+++ b/llama_stack/providers/tests/scoring/fixtures.py
@ -31,7 +31,20 @@ def scoring_meta_reference() -> ProviderFixture:
    )
-SCORING_FIXTURES = ["meta_reference", "remote"]
+@pytest.fixture(scope="session")
 def scoring_braintrust() -> ProviderFixture:
    return ProviderFixture(
        providers=[
            Provider(
                provider_id="braintrust",
                provider_type="braintrust",
                config={},
            )
        ],
    )
 SCORING_FIXTURES = ["meta_reference", "remote", "braintrust"]
@pytest_asyncio.fixture(scope="session")
--- a/llama_stack/providers/tests/scoring/test_scoring.py
+++ b/llama_stack/providers/tests/scoring/test_scoring.py
@ -60,8 +60,9 @@ class TestScoring:
        )
        assert len(rows.rows) == 3
        scoring_fns_list = await scoring_functions_impl.list_scoring_functions()
        scoring_functions = {
-            "meta-reference::equality": None,
+            scoring_fns_list[0].identifier: None,
        }
        response = await scoring_impl.score(
@ -108,6 +109,11 @@ class TestScoring:
                provider_id="",
            )
        scoring_fns_list = await scoring_functions_impl.list_scoring_functions()
        provider_id = scoring_fns_list[0].provider_id
        if provider_id == "braintrust":
            pytest.skip("Braintrust provider does not support scoring with params")
        # scoring individual rows
        rows = await datasetio_impl.get_rows_paginated(
            dataset_id="test_dataset",