fix(pr specific): passes pre-commit

2025-10-04 04:04:14 +00:00 · 2025-10-03 12:35:09 -04:00 · 2025-10-03 12:35:09 -04:00 · 2b7a765d02
commit 2b7a765d02
parent 4aa2dc110d
20 changed files with 547 additions and 516 deletions
--- a/tests/integration/telemetry/mocking/servers.py
+++ b/tests/integration/telemetry/mocking/servers.py
@ -20,7 +20,7 @@ import json
 import socket
 import threading
 import time
-from typing import Any, Dict, List
+from typing import Any

 from pydantic import Field

@ -30,10 +30,10 @@ from .mock_base import MockServerBase
 class MockOTLPCollector(MockServerBase):
    """
    Mock OTLP collector HTTP server.
-    
+
    Receives real OTLP exports from Llama Stack and stores them for verification.
    Runs on localhost:4318 (standard OTLP HTTP port).
-    
+
    Usage:
        collector = MockOTLPCollector()
        await collector.await_start()
@ -41,115 +41,119 @@ class MockOTLPCollector(MockServerBase):
        print(f"Received {collector.get_trace_count()} traces")
        collector.stop()
    """
-    
+
    port: int = Field(default=4318, description="Port to run collector on")
-    
+
    # Non-Pydantic fields (set after initialization)
-    traces: List[Dict] = Field(default_factory=list, exclude=True)
-    metrics: List[Dict] = Field(default_factory=list, exclude=True)
+    traces: list[dict] = Field(default_factory=list, exclude=True)
+    metrics: list[dict] = Field(default_factory=list, exclude=True)
    server: Any = Field(default=None, exclude=True)
    server_thread: Any = Field(default=None, exclude=True)
-    
+
    def model_post_init(self, __context):
        """Initialize after Pydantic validation."""
        self.traces = []
        self.metrics = []
        self.server = None
        self.server_thread = None
-    
+
    def _create_handler_class(self):
        """Create the HTTP handler class for this collector instance."""
        collector_self = self
-        
+
        class OTLPHandler(http.server.BaseHTTPRequestHandler):
            """HTTP request handler for OTLP requests."""
-            
+
            def log_message(self, format, *args):
                """Suppress HTTP server logs."""
                pass
-            
-            def do_GET(self):
+
+            def do_GET(self):  # noqa: N802
                """Handle GET requests."""
                # No readiness endpoint needed - using await_start() instead
                self.send_response(404)
                self.end_headers()
-            
-            def do_POST(self):
+
+            def do_POST(self):  # noqa: N802
                """Handle OTLP POST requests."""
-                content_length = int(self.headers.get('Content-Length', 0))
-                body = self.rfile.read(content_length) if content_length > 0 else b''
-                
+                content_length = int(self.headers.get("Content-Length", 0))
+                body = self.rfile.read(content_length) if content_length > 0 else b""
+
                # Store the export request
-                if '/v1/traces' in self.path:
-                    collector_self.traces.append({
-                        'body': body,
-                        'timestamp': time.time(),
-                    })
-                elif '/v1/metrics' in self.path:
-                    collector_self.metrics.append({
-                        'body': body,
-                        'timestamp': time.time(),
-                    })
-                
+                if "/v1/traces" in self.path:
+                    collector_self.traces.append(
+                        {
+                            "body": body,
+                            "timestamp": time.time(),
+                        }
+                    )
+                elif "/v1/metrics" in self.path:
+                    collector_self.metrics.append(
+                        {
+                            "body": body,
+                            "timestamp": time.time(),
+                        }
+                    )
+
                # Always return success (200 OK)
                self.send_response(200)
-                self.send_header('Content-Type', 'application/json')
+                self.send_header("Content-Type", "application/json")
                self.end_headers()
-                self.wfile.write(b'{}')
-        
+                self.wfile.write(b"{}")
+
        return OTLPHandler
-    
+
    async def await_start(self):
        """
        Start the OTLP collector and wait until ready.
-        
+
        This method is async and can be awaited to ensure the server is ready.
        """
        # Create handler and start the HTTP server
        handler_class = self._create_handler_class()
-        self.server = http.server.HTTPServer(('localhost', self.port), handler_class)
+        self.server = http.server.HTTPServer(("localhost", self.port), handler_class)
        self.server_thread = threading.Thread(target=self.server.serve_forever, daemon=True)
        self.server_thread.start()
-        
+
        # Wait for server to be listening on the port
        for _ in range(10):
            try:
                sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
-                result = sock.connect_ex(('localhost', self.port))
+                result = sock.connect_ex(("localhost", self.port))
                sock.close()
                if result == 0:
                    # Port is listening
                    return
-            except:
+            except Exception:
                pass
            await asyncio.sleep(0.1)
-        
+
        raise RuntimeError(f"OTLP collector failed to start on port {self.port}")
-    
+
    def stop(self):
        """Stop the OTLP collector server."""
        if self.server:
            self.server.shutdown()
            self.server.server_close()
-    
+
    def clear(self):
        """Clear all captured telemetry data."""
        self.traces = []
        self.metrics = []
-    
+
    def get_trace_count(self) -> int:
        """Get number of trace export requests received."""
        return len(self.traces)
-    
+
    def get_metric_count(self) -> int:
        """Get number of metric export requests received."""
        return len(self.metrics)
-    
-    def get_all_traces(self) -> List[Dict]:
+
+    def get_all_traces(self) -> list[dict]:
        """Get all captured trace exports."""
        return self.traces
-    
-    def get_all_metrics(self) -> List[Dict]:
+
+    def get_all_metrics(self) -> list[dict]:
        """Get all captured metric exports."""
        return self.metrics

@ -157,14 +161,14 @@ class MockOTLPCollector(MockServerBase):
 class MockVLLMServer(MockServerBase):
    """
    Mock vLLM inference server with OpenAI-compatible API.
-    
+
    Returns valid OpenAI Python client response objects for:
    - Chat completions (/v1/chat/completions)
    - Text completions (/v1/completions)
    - Model listing (/v1/models)
-    
+
    Runs on localhost:8000 (standard vLLM port).
-    
+
    Usage:
        server = MockVLLMServer(models=["my-model"])
        await server.await_start()
@ -172,94 +176,97 @@ class MockVLLMServer(MockServerBase):
        print(f"Handled {server.get_request_count()} requests")
        server.stop()
    """
-    
+
    port: int = Field(default=8000, description="Port to run server on")
-    models: List[str] = Field(
-        default_factory=lambda: ["meta-llama/Llama-3.2-1B-Instruct"],
-        description="List of model IDs to serve"
+    models: list[str] = Field(
+        default_factory=lambda: ["meta-llama/Llama-3.2-1B-Instruct"], description="List of model IDs to serve"
    )
-    
+
    # Non-Pydantic fields
-    requests_received: List[Dict] = Field(default_factory=list, exclude=True)
+    requests_received: list[dict] = Field(default_factory=list, exclude=True)
    server: Any = Field(default=None, exclude=True)
    server_thread: Any = Field(default=None, exclude=True)
-    
+
    def model_post_init(self, __context):
        """Initialize after Pydantic validation."""
        self.requests_received = []
        self.server = None
        self.server_thread = None
-    
+
    def _create_handler_class(self):
        """Create the HTTP handler class for this vLLM instance."""
        server_self = self
-        
+
        class VLLMHandler(http.server.BaseHTTPRequestHandler):
            """HTTP request handler for vLLM API."""
-            
+
            def log_message(self, format, *args):
                """Suppress HTTP server logs."""
                pass
-            
-            def log_request(self, code='-', size='-'):
+
+            def log_request(self, code="-", size="-"):
                """Log incoming requests for debugging."""
                print(f"[DEBUG] Mock vLLM received: {self.command} {self.path} -> {code}")
-            
-            def do_GET(self):
+
+            def do_GET(self):  # noqa: N802
                """Handle GET requests (models list, health check)."""
                # Log GET requests too
-                server_self.requests_received.append({
-                    'path': self.path,
-                    'method': 'GET',
-                    'timestamp': time.time(),
-                })
-                
-                if self.path == '/v1/models':
+                server_self.requests_received.append(
+                    {
+                        "path": self.path,
+                        "method": "GET",
+                        "timestamp": time.time(),
+                    }
+                )
+
+                if self.path == "/v1/models":
                    response = self._create_models_list_response()
                    self._send_json_response(200, response)
-                
-                elif self.path == '/health' or self.path == '/v1/health':
+
+                elif self.path == "/health" or self.path == "/v1/health":
                    self._send_json_response(200, {"status": "healthy"})
-                
+
                else:
                    self.send_response(404)
                    self.end_headers()
-            
-            def do_POST(self):
+
+            def do_POST(self):  # noqa: N802
                """Handle POST requests (chat/text completions)."""
-                content_length = int(self.headers.get('Content-Length', 0))
-                body = self.rfile.read(content_length) if content_length > 0 else b'{}'
-                
+                content_length = int(self.headers.get("Content-Length", 0))
+                body = self.rfile.read(content_length) if content_length > 0 else b"{}"
+
                try:
                    request_data = json.loads(body)
-                except:
+                except Exception:
                    request_data = {}
-                
+
                # Log the request
-                server_self.requests_received.append({
-                    'path': self.path,
-                    'body': request_data,
-                    'timestamp': time.time(),
-                })
-                
+                server_self.requests_received.append(
+                    {
+                        "path": self.path,
+                        "body": request_data,
+                        "timestamp": time.time(),
+                    }
+                )
+
                # Route to appropriate handler
-                if '/chat/completions' in self.path:
+                if "/chat/completions" in self.path:
                    response = self._create_chat_completion_response(request_data)
                    self._send_json_response(200, response)
-                
-                elif '/completions' in self.path:
+
+                elif "/completions" in self.path:
                    response = self._create_text_completion_response(request_data)
                    self._send_json_response(200, response)
-                
+
                else:
                    self._send_json_response(200, {"status": "ok"})
-            
+
            # ----------------------------------------------------------------
            # Response Generators
            # **TO MODIFY RESPONSES:** Edit these methods
            # ----------------------------------------------------------------
-            
-            def _create_models_list_response(self) -> Dict:
+
+            def _create_models_list_response(self) -> dict:
                """Create OpenAI models list response with configured models."""
                return {
                    "object": "list",
@ -271,13 +278,13 @@ class MockVLLMServer(MockServerBase):
                            "owned_by": "meta",
                        }
                        for model_id in server_self.models
-                    ]
+                    ],
                }
-            
-            def _create_chat_completion_response(self, request_data: Dict) -> Dict:
+
+            def _create_chat_completion_response(self, request_data: dict) -> dict:
                """
                Create OpenAI ChatCompletion response.
-                
+
                Returns a valid response matching openai.types.ChatCompletion
                """
                return {
@ -285,16 +292,18 @@ class MockVLLMServer(MockServerBase):
                    "object": "chat.completion",
                    "created": int(time.time()),
                    "model": request_data.get("model", "meta-llama/Llama-3.2-1B-Instruct"),
-                    "choices": [{
-                        "index": 0,
-                        "message": {
-                            "role": "assistant",
-                            "content": "This is a test response from mock vLLM server.",
-                            "tool_calls": None,
-                        },
-                        "logprobs": None,
-                        "finish_reason": "stop",
-                    }],
+                    "choices": [
+                        {
+                            "index": 0,
+                            "message": {
+                                "role": "assistant",
+                                "content": "This is a test response from mock vLLM server.",
+                                "tool_calls": None,
+                            },
+                            "logprobs": None,
+                            "finish_reason": "stop",
+                        }
+                    ],
                    "usage": {
                        "prompt_tokens": 25,
                        "completion_tokens": 15,
@ -304,11 +313,11 @@ class MockVLLMServer(MockServerBase):
                    "system_fingerprint": None,
                    "service_tier": None,
                }
-            
-            def _create_text_completion_response(self, request_data: Dict) -> Dict:
+
+            def _create_text_completion_response(self, request_data: dict) -> dict:
                """
                Create OpenAI Completion response.
-                
+
                Returns a valid response matching openai.types.Completion
                """
                return {
@ -316,12 +325,14 @@ class MockVLLMServer(MockServerBase):
                    "object": "text_completion",
                    "created": int(time.time()),
                    "model": request_data.get("model", "meta-llama/Llama-3.2-1B-Instruct"),
-                    "choices": [{
-                        "text": "This is a test completion.",
-                        "index": 0,
-                        "logprobs": None,
-                        "finish_reason": "stop",
-                    }],
+                    "choices": [
+                        {
+                            "text": "This is a test completion.",
+                            "index": 0,
+                            "logprobs": None,
+                            "finish_reason": "stop",
+                        }
+                    ],
                    "usage": {
                        "prompt_tokens": 10,
                        "completion_tokens": 8,
@ -330,58 +341,57 @@ class MockVLLMServer(MockServerBase):
                    },
                    "system_fingerprint": None,
                }
-            
-            def _send_json_response(self, status_code: int, data: Dict):
+
+            def _send_json_response(self, status_code: int, data: dict):
                """Helper to send JSON response."""
                self.send_response(status_code)
-                self.send_header('Content-Type', 'application/json')
+                self.send_header("Content-Type", "application/json")
                self.end_headers()
                self.wfile.write(json.dumps(data).encode())
-        
+
        return VLLMHandler
-    
+
    async def await_start(self):
        """
        Start the vLLM server and wait until ready.
-        
+
        This method is async and can be awaited to ensure the server is ready.
        """
        # Create handler and start the HTTP server
        handler_class = self._create_handler_class()
-        self.server = http.server.HTTPServer(('localhost', self.port), handler_class)
+        self.server = http.server.HTTPServer(("localhost", self.port), handler_class)
        self.server_thread = threading.Thread(target=self.server.serve_forever, daemon=True)
        self.server_thread.start()
-        
+
        # Wait for server to be listening on the port
        for _ in range(10):
            try:
                sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
-                result = sock.connect_ex(('localhost', self.port))
+                result = sock.connect_ex(("localhost", self.port))
                sock.close()
                if result == 0:
                    # Port is listening
                    return
-            except:
+            except Exception:
                pass
            await asyncio.sleep(0.1)
-        
+
        raise RuntimeError(f"vLLM server failed to start on port {self.port}")
-    
+
    def stop(self):
        """Stop the vLLM server."""
        if self.server:
            self.server.shutdown()
            self.server.server_close()
-    
+
    def clear(self):
        """Clear request history."""
        self.requests_received = []
-    
+
    def get_request_count(self) -> int:
        """Get number of requests received."""
        return len(self.requests_received)
-    
-    def get_all_requests(self) -> List[Dict]:
+
+    def get_all_requests(self) -> list[dict]:
        """Get all received requests with their bodies."""
        return self.requests_received
-