Add default for max_seq_len

2025-12-03 09:53:45 +00:00 · 2024-09-18 21:59:10 -07:00 · 2024-09-18 21:59:10 -07:00 · f5eda1decf
commit f5eda1decf
parent 9ab27e852b
1 changed files with 3 additions and 3 deletions
--- a/llama_stack/providers/impls/meta_reference/inference/config.py
+++ b/llama_stack/providers/impls/meta_reference/inference/config.py
@ -11,10 +11,10 @@ from llama_models.datatypes import ModelFamily
 from llama_models.schema_utils import json_schema_type
 from llama_models.sku_list import all_registered_models, resolve_model

-from llama_stack.apis.inference import QuantizationConfig
-
 from pydantic import BaseModel, Field, field_validator

+from llama_stack.apis.inference import QuantizationConfig
+

@json_schema_type
 class MetaReferenceImplConfig(BaseModel):
@ -24,7 +24,7 @@ class MetaReferenceImplConfig(BaseModel):
    )
    quantization: Optional[QuantizationConfig] = None
    torch_seed: Optional[int] = None
-    max_seq_len: int
+    max_seq_len: int = 4096
    max_batch_size: int = 1

    @field_validator("model")