add completion() for ollama (#280)

2024-10-21 22:26:33 -07:00 · 2024-10-21 22:26:33 -07:00 · 1d241bf3fe
commit 1d241bf3fe
parent e2a5a2e10d
5 changed files with 138 additions and 15 deletions
--- a/llama_stack/providers/tests/inference/provider_config_example.yaml
+++ b/llama_stack/providers/tests/inference/provider_config_example.yaml
@ -4,6 +4,10 @@ providers:
    config:
      host: localhost
      port: 11434
+  - provider_id: meta-reference
+    provider_type: meta-reference
+    config:
+      model: Llama3.2-1B-Instruct
  - provider_id: test-tgi
    provider_type: remote::tgi
    config:
--- a/llama_stack/providers/tests/inference/test_inference.py
+++ b/llama_stack/providers/tests/inference/test_inference.py
@ -132,7 +132,10 @@ async def test_completion(inference_settings):
    params = inference_settings["common_params"]

    provider = inference_impl.routing_table.get_provider_impl(params["model"])
-    if provider.__provider_id__ != "meta-reference":
+    if provider.__provider_spec__.provider_type not in (
+        "meta-reference",
+        "remote::ollama",
+    ):
        pytest.skip("Other inference providers don't support completion() yet")

    response = await inference_impl.completion(