add safety adapters, configuration handling, server + clients

2025-10-04 04:04:14 +00:00 · 2024-08-03 19:46:59 -07:00 · 2024-08-03 19:46:59 -07:00 · fe582a739d
commit fe582a739d
parent 9dafa6ad94
13 changed files with 286 additions and 67 deletions
--- a/llama_toolchain/inference/inference.py
+++ b/llama_toolchain/inference/inference.py
@ -54,7 +54,7 @@ class MetaReferenceInferenceImpl(Inference):

    async def initialize(self) -> None:
        self.generator = LlamaModelParallelGenerator(self.config)
-        self.generator.start()
+        # self.generator.start()

    async def shutdown(self) -> None:
        self.generator.stop()