move folder

2025-07-29 15:23:51 +00:00 · 2024-10-05 11:57:21 -07:00 · 2024-10-05 11:57:21 -07:00 · 041634192a
commit 041634192a
parent 6234dd97d5
9 changed files with 18 additions and 6 deletions
--- a/llama_stack/apis/evals/client.py
+++ b/llama_stack/apis/evals/client.py
@ -42,12 +42,21 @@ class EvaluationClient(Evals):
 async def run_main(host: str, port: int):
    client = EvaluationClient(f"http://{host}:{port}")
    # CustomDataset
    # response = await client.run_evals(
    #     "Llama3.1-8B-Instruct",
    #     "mmlu-simple-eval-en",
    #     "mmlu",
    # )
    # cprint(f"evaluate response={response}", "green")
    # Eleuther Eval
    response = await client.run_evals(
        "Llama3.1-8B-Instruct",
-        "mmlu-simple-eval-en",
+        "PLACEHOLDER_DATASET_NAME",
        "mmlu",
    )
-    cprint(f"evaluate response={response}", "green")
+    cprint(response.metrics["metrics_table"], "red")
 def main(host: str, port: int):
--- a/llama_stack/apis/inference/client.py
+++ b/llama_stack/apis/inference/client.py
@ -109,7 +109,7 @@ async def run_main(host: str, port: int, stream: bool):
    cprint(f"User>{message.content}", "green")
    iterator = client.chat_completion(
        model="Llama3.1-8B-Instruct",
-        messages=[message, UserMessage(content="write me 3 sentence about the sun.")],
+        messages=[message],
        stream=stream,
    )
    async for log in EventLogger().log(iterator):
--- a/llama_stack/providers/impls/meta_reference/evals/tasks/mmlu_task.py
+++ b/llama_stack/providers/impls/meta_reference/evals/tasks/mmlu_task.py
@ -146,5 +146,5 @@ class MMLUTask(BaseTask):
    def aggregate_results(self, eval_results):
        return EvaluateResponse(
-            metrics={"score": sum(eval_results) / len(eval_results)}
+            metrics={"score": str(sum(eval_results) / len(eval_results))}
        )
--- a/llama_stack/providers/impls/third_party/evals/init.py
+++ b/llama_stack/providers/impls/third_party/evals/init.py
--- a/llama_stack/providers/impls/third_party/evals/eleuther/init.py
+++ b/llama_stack/providers/impls/third_party/evals/eleuther/init.py
--- a/llama_stack/providers/impls/third_party/evals/eleuther/config.py
+++ b/llama_stack/providers/impls/third_party/evals/eleuther/config.py
--- a/llama_stack/providers/impls/third_party/evals/eleuther/eleuther.py
+++ b/llama_stack/providers/impls/third_party/evals/eleuther/eleuther.py
--- a/llama_stack/providers/registry/evals.py
+++ b/llama_stack/providers/registry/evals.py
@ -33,8 +33,8 @@ def available_providers() -> List[ProviderSpec]:
            pip_packages=[
                "lm-eval",
            ],
-            module="llama_stack.providers.adapters.evals.eleuther",
+            module="llama_stack.providers.impls.third_party.evals.eleuther",
-            config_class="llama_stack.providers.adapters.evals.eleuther.EleutherEvalsImplConfig",
+            config_class="llama_stack.providers.impls.third_party.evals.eleuther.EleutherEvalsImplConfig",
            api_dependencies=[
                Api.inference,
            ],
--- a/tests/examples/local-run.yaml
+++ b/tests/examples/local-run.yaml
@ -15,6 +15,9 @@ api_providers:
  evals:
    provider_type: eleuther
    config: {}
  # evals:
  #   provider_type: meta-reference
  #   config: {}
  inference:
    providers:
    - meta-reference