PyPI - kubectl-mcp-server - Versions diffs - 1.16.0__py3-none-any.whl → 1.17.0__py3-none-any.whl - Mend

kubectl-mcp-server 1.16.0py3-none-any.whl → 1.17.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (28) hide show

{kubectl_mcp_server-1.16.0.dist-info → kubectl_mcp_server-1.17.0.dist-info}/METADATA +1 -1
{kubectl_mcp_server-1.16.0.dist-info → kubectl_mcp_server-1.17.0.dist-info}/RECORD +28 -14
kubectl_mcp_tool/__init__.py +1 -1
kubectl_mcp_tool/cli/cli.py +83 -9
kubectl_mcp_tool/cli/output.py +14 -0
kubectl_mcp_tool/config/__init__.py +46 -0
kubectl_mcp_tool/config/loader.py +386 -0
kubectl_mcp_tool/config/schema.py +184 -0
kubectl_mcp_tool/mcp_server.py +219 -8
kubectl_mcp_tool/observability/__init__.py +59 -0
kubectl_mcp_tool/observability/metrics.py +223 -0
kubectl_mcp_tool/observability/stats.py +255 -0
kubectl_mcp_tool/observability/tracing.py +335 -0
kubectl_mcp_tool/prompts/__init__.py +43 -0
kubectl_mcp_tool/prompts/builtin.py +695 -0
kubectl_mcp_tool/prompts/custom.py +298 -0
kubectl_mcp_tool/prompts/prompts.py +180 -4
kubectl_mcp_tool/safety.py +155 -0
kubectl_mcp_tool/tools/cluster.py +384 -0
tests/test_config.py +386 -0
tests/test_mcp_integration.py +251 -0
tests/test_observability.py +521 -0
tests/test_prompts.py +716 -0
tests/test_safety.py +218 -0
{kubectl_mcp_server-1.16.0.dist-info → kubectl_mcp_server-1.17.0.dist-info}/WHEEL +0 -0
{kubectl_mcp_server-1.16.0.dist-info → kubectl_mcp_server-1.17.0.dist-info}/entry_points.txt +0 -0
{kubectl_mcp_server-1.16.0.dist-info → kubectl_mcp_server-1.17.0.dist-info}/licenses/LICENSE +0 -0
{kubectl_mcp_server-1.16.0.dist-info → kubectl_mcp_server-1.17.0.dist-info}/top_level.txt +0 -0

kubectl_mcp_tool/observability/stats.py ADDED Viewed

@@ -0,0 +1,255 @@
+"""
+Runtime statistics collection for kubectl-mcp-server.
+Provides a singleton StatsCollector that tracks:
+- tool_calls_total: Total number of tool invocations
+- tool_errors_total: Total number of tool errors
+- tool_calls_by_name: Breakdown of calls by tool name
+- http_requests_total: Total HTTP requests (for SSE/HTTP transports)
+- uptime: Server uptime in seconds
+"""
+import time
+import threading
+from collections import defaultdict
+from dataclasses import dataclass, field
+from typing import Dict, Any, Optional
+@dataclass
+class ToolStats:
+    """Statistics for a single tool."""
+    calls: int = 0
+    errors: int = 0
+    total_duration: float = 0.0
+    last_call_time: Optional[float] = None
+    last_error_time: Optional[float] = None
+class StatsCollector:
+    """
+    Singleton class for collecting runtime statistics.
+    Thread-safe statistics collection for production observability.
+    Usage:
+        stats = get_stats_collector()
+        stats.record_tool_call("get_pods", success=True, duration=0.5)
+        # Get current stats
+        data = stats.get_stats()
+    """
+    _instance: Optional["StatsCollector"] = None
+    _lock = threading.Lock()
+    def __new__(cls) -> "StatsCollector":
+        """Ensure singleton pattern."""
+        if cls._instance is None:
+            with cls._lock:
+                if cls._instance is None:
+                    cls._instance = super().__new__(cls)
+                    cls._instance._initialized = False
+        return cls._instance
+    def __init__(self):
+        """Initialize the stats collector (only once)."""
+        if self._initialized:
+            return
+        self._stats_lock = threading.Lock()
+        self._start_time = time.time()
+        # Core counters
+        self._tool_calls_total = 0
+        self._tool_errors_total = 0
+        self._http_requests_total = 0
+        # Per-tool statistics
+        self._tool_stats: Dict[str, ToolStats] = defaultdict(ToolStats)
+        # HTTP request breakdown
+        self._http_requests_by_endpoint: Dict[str, int] = defaultdict(int)
+        self._http_requests_by_method: Dict[str, int] = defaultdict(int)
+        self._initialized = True
+    def record_tool_call(
+        self,
+        tool_name: str,
+        success: bool = True,
+        duration: float = 0.0
+    ) -> None:
+        """
+        Record a tool call.
+        Args:
+            tool_name: Name of the tool that was called
+            success: Whether the call succeeded
+            duration: Call duration in seconds
+        """
+        with self._stats_lock:
+            self._tool_calls_total += 1
+            stats = self._tool_stats[tool_name]
+            stats.calls += 1
+            stats.total_duration += duration
+            stats.last_call_time = time.time()
+            if not success:
+                self._tool_errors_total += 1
+                stats.errors += 1
+                stats.last_error_time = time.time()
+    def record_tool_error(self, tool_name: str) -> None:
+        """
+        Record a tool error (shorthand for failed call).
+        Args:
+            tool_name: Name of the tool that errored
+        """
+        self.record_tool_call(tool_name, success=False)
+    def record_http_request(
+        self,
+        endpoint: str = "/",
+        method: str = "POST"
+    ) -> None:
+        """
+        Record an HTTP request.
+        Args:
+            endpoint: Request endpoint path
+            method: HTTP method (GET, POST, etc.)
+        """
+        with self._stats_lock:
+            self._http_requests_total += 1
+            self._http_requests_by_endpoint[endpoint] += 1
+            self._http_requests_by_method[method] += 1
+    @property
+    def uptime(self) -> float:
+        """Get server uptime in seconds."""
+        return time.time() - self._start_time
+    @property
+    def tool_calls_total(self) -> int:
+        """Get total tool calls."""
+        with self._stats_lock:
+            return self._tool_calls_total
+    @property
+    def tool_errors_total(self) -> int:
+        """Get total tool errors."""
+        with self._stats_lock:
+            return self._tool_errors_total
+    @property
+    def http_requests_total(self) -> int:
+        """Get total HTTP requests."""
+        with self._stats_lock:
+            return self._http_requests_total
+    def get_tool_stats(self, tool_name: str) -> Optional[Dict[str, Any]]:
+        """
+        Get statistics for a specific tool.
+        Args:
+            tool_name: Name of the tool
+        Returns:
+            Dictionary with tool statistics or None if not found
+        """
+        with self._stats_lock:
+            if tool_name not in self._tool_stats:
+                return None
+            stats = self._tool_stats[tool_name]
+            avg_duration = (
+                stats.total_duration / stats.calls
+                if stats.calls > 0 else 0.0
+            )
+            return {
+                "calls": stats.calls,
+                "errors": stats.errors,
+                "error_rate": stats.errors / stats.calls if stats.calls > 0 else 0.0,
+                "total_duration_seconds": stats.total_duration,
+                "average_duration_seconds": avg_duration,
+                "last_call_time": stats.last_call_time,
+                "last_error_time": stats.last_error_time,
+            }
+    def get_stats(self) -> Dict[str, Any]:
+        """
+        Get all statistics as a JSON-serializable dictionary.
+        Returns:
+            Dictionary containing all collected statistics
+        """
+        with self._stats_lock:
+            # Calculate tool-level stats
+            tool_stats_dict = {}
+            for tool_name, stats in self._tool_stats.items():
+                avg_duration = (
+                    stats.total_duration / stats.calls
+                    if stats.calls > 0 else 0.0
+                )
+                tool_stats_dict[tool_name] = {
+                    "calls": stats.calls,
+                    "errors": stats.errors,
+                    "error_rate": stats.errors / stats.calls if stats.calls > 0 else 0.0,
+                    "average_duration_seconds": round(avg_duration, 4),
+                }
+            # Sort tools by call count (descending)
+            sorted_tools = dict(
+                sorted(
+                    tool_stats_dict.items(),
+                    key=lambda x: x[1]["calls"],
+                    reverse=True
+                )
+            )
+            return {
+                "uptime_seconds": round(self.uptime, 2),
+                "tool_calls_total": self._tool_calls_total,
+                "tool_errors_total": self._tool_errors_total,
+                "tool_error_rate": (
+                    self._tool_errors_total / self._tool_calls_total
+                    if self._tool_calls_total > 0 else 0.0
+                ),
+                "http_requests_total": self._http_requests_total,
+                "http_requests_by_endpoint": dict(self._http_requests_by_endpoint),
+                "http_requests_by_method": dict(self._http_requests_by_method),
+                "tool_calls_by_name": sorted_tools,
+                "unique_tools_called": len(self._tool_stats),
+            }
+    def reset(self) -> None:
+        """Reset all statistics (useful for testing)."""
+        with self._stats_lock:
+            self._start_time = time.time()
+            self._tool_calls_total = 0
+            self._tool_errors_total = 0
+            self._http_requests_total = 0
+            self._tool_stats.clear()
+            self._http_requests_by_endpoint.clear()
+            self._http_requests_by_method.clear()
+# Module-level singleton accessor
+_stats_collector: Optional[StatsCollector] = None
+def get_stats_collector() -> StatsCollector:
+    """
+    Get the singleton StatsCollector instance.
+    Returns:
+        The global StatsCollector instance
+    """
+    global _stats_collector
+    if _stats_collector is None:
+        _stats_collector = StatsCollector()
+    return _stats_collector

kubectl_mcp_tool/observability/tracing.py ADDED Viewed

@@ -0,0 +1,335 @@
+"""
+OpenTelemetry tracing for kubectl-mcp-server.
+Provides distributed tracing with OTLP export for production observability.
+Environment Variables:
+    OTEL_EXPORTER_OTLP_ENDPOINT: OTLP endpoint URL (e.g., http://localhost:4317)
+    OTEL_EXPORTER_OTLP_HEADERS: Optional headers for OTLP exporter
+    OTEL_TRACES_SAMPLER: Sampler type (always_on, always_off, traceidratio, parentbased_always_on)
+    OTEL_TRACES_SAMPLER_ARG: Sampler argument (e.g., 0.5 for 50% sampling)
+    OTEL_SERVICE_NAME: Service name (default: kubectl-mcp-server)
+    OTEL_RESOURCE_ATTRIBUTES: Additional resource attributes
+Requires: opentelemetry-api, opentelemetry-sdk, opentelemetry-exporter-otlp (optional dependencies)
+"""
+import os
+import logging
+from contextlib import contextmanager
+from typing import Optional, Generator, Any, Dict
+logger = logging.getLogger(__name__)
+# Check if OpenTelemetry is available
+_otel_available = False
+_tracer = None
+_tracer_provider = None
+try:
+    from opentelemetry import trace
+    from opentelemetry.sdk.trace import TracerProvider, Span
+    from opentelemetry.sdk.trace.export import (
+        BatchSpanProcessor,
+        ConsoleSpanExporter,
+    )
+    from opentelemetry.sdk.resources import Resource, SERVICE_NAME
+    from opentelemetry.trace import Status, StatusCode
+    from opentelemetry.trace.propagation.tracecontext import TraceContextTextMapPropagator
+    _otel_available = True
+    logger.debug("OpenTelemetry tracing modules available")
+except ImportError:
+    logger.debug(
+        "OpenTelemetry not installed. Tracing disabled. "
+        "Install with: pip install kubectl-mcp-server[observability]"
+    )
+def is_tracing_available() -> bool:
+    """Check if OpenTelemetry tracing is available."""
+    return _otel_available
+def _get_sampler():
+    """
+    Get the configured sampler based on environment variables.
+    Supports:
+    - always_on: Always sample
+    - always_off: Never sample
+    - traceidratio: Sample based on ratio (OTEL_TRACES_SAMPLER_ARG)
+    - parentbased_always_on: Parent-based with always_on default
+    """
+    if not _otel_available:
+        return None
+    from opentelemetry.sdk.trace.sampling import (
+        ALWAYS_ON,
+        ALWAYS_OFF,
+        TraceIdRatioBased,
+        ParentBasedTraceIdRatio,
+    )
+    sampler_type = os.environ.get("OTEL_TRACES_SAMPLER", "parentbased_always_on").lower()
+    sampler_arg = os.environ.get("OTEL_TRACES_SAMPLER_ARG", "1.0")
+    try:
+        ratio = float(sampler_arg)
+    except ValueError:
+        ratio = 1.0
+        logger.warning(f"Invalid OTEL_TRACES_SAMPLER_ARG: {sampler_arg}, using 1.0")
+    if sampler_type == "always_on":
+        return ALWAYS_ON
+    elif sampler_type == "always_off":
+        return ALWAYS_OFF
+    elif sampler_type == "traceidratio":
+        return TraceIdRatioBased(ratio)
+    elif sampler_type in ("parentbased_always_on", "parentbased_traceidratio"):
+        return ParentBasedTraceIdRatio(ratio)
+    else:
+        logger.warning(f"Unknown sampler type: {sampler_type}, using parentbased_always_on")
+        return ParentBasedTraceIdRatio(ratio)
+def init_tracing(
+    service_name: Optional[str] = None,
+    service_version: Optional[str] = None,
+) -> bool:
+    """
+    Initialize OpenTelemetry tracing.
+    Args:
+        service_name: Service name (default from OTEL_SERVICE_NAME or kubectl-mcp-server)
+        service_version: Service version (default from package version)
+    Returns:
+        True if tracing was initialized, False otherwise
+    """
+    global _tracer, _tracer_provider
+    if not _otel_available:
+        logger.debug("OpenTelemetry not available, skipping tracing init")
+        return False
+    # Already initialized
+    if _tracer is not None:
+        return True
+    try:
+        from opentelemetry import trace
+        from opentelemetry.sdk.trace import TracerProvider
+        from opentelemetry.sdk.trace.export import BatchSpanProcessor
+        from opentelemetry.sdk.resources import Resource, SERVICE_NAME
+        # Get service name
+        if service_name is None:
+            service_name = os.environ.get("OTEL_SERVICE_NAME", "kubectl-mcp-server")
+        # Get service version
+        if service_version is None:
+            try:
+                from kubectl_mcp_tool import __version__
+                service_version = __version__
+            except ImportError:
+                service_version = "unknown"
+        # Parse additional resource attributes
+        resource_attrs = {
+            SERVICE_NAME: service_name,
+            "service.version": service_version,
+        }
+        # Add custom attributes from environment
+        custom_attrs = os.environ.get("OTEL_RESOURCE_ATTRIBUTES", "")
+        if custom_attrs:
+            for attr in custom_attrs.split(","):
+                if "=" in attr:
+                    key, value = attr.split("=", 1)
+                    resource_attrs[key.strip()] = value.strip()
+        # Create resource
+        resource = Resource.create(resource_attrs)
+        # Create tracer provider with sampler
+        sampler = _get_sampler()
+        _tracer_provider = TracerProvider(resource=resource, sampler=sampler)
+        # Add exporter based on environment
+        otlp_endpoint = os.environ.get("OTEL_EXPORTER_OTLP_ENDPOINT")
+        if otlp_endpoint:
+            # Use OTLP exporter
+            try:
+                from opentelemetry.exporter.otlp.proto.grpc.trace_exporter import OTLPSpanExporter
+                otlp_headers = os.environ.get("OTEL_EXPORTER_OTLP_HEADERS", "")
+                headers_dict = {}
+                if otlp_headers:
+                    for header in otlp_headers.split(","):
+                        if "=" in header:
+                            key, value = header.split("=", 1)
+                            headers_dict[key.strip()] = value.strip()
+                exporter = OTLPSpanExporter(
+                    endpoint=otlp_endpoint,
+                    headers=headers_dict if headers_dict else None,
+                )
+                _tracer_provider.add_span_processor(BatchSpanProcessor(exporter))
+                logger.info(f"OpenTelemetry OTLP exporter configured: {otlp_endpoint}")
+            except ImportError:
+                # Try HTTP exporter as fallback
+                try:
+                    from opentelemetry.exporter.otlp.proto.http.trace_exporter import OTLPSpanExporter as HTTPOTLPSpanExporter
+                    exporter = HTTPOTLPSpanExporter(endpoint=f"{otlp_endpoint}/v1/traces")
+                    _tracer_provider.add_span_processor(BatchSpanProcessor(exporter))
+                    logger.info(f"OpenTelemetry HTTP OTLP exporter configured: {otlp_endpoint}")
+                except ImportError:
+                    logger.warning(
+                        "OTLP exporter not available. "
+                        "Install with: pip install opentelemetry-exporter-otlp"
+                    )
+                    # Fall back to console exporter for debugging
+                    from opentelemetry.sdk.trace.export import ConsoleSpanExporter
+                    _tracer_provider.add_span_processor(BatchSpanProcessor(ConsoleSpanExporter()))
+                    logger.info("Using console span exporter (OTLP exporter not available)")
+        elif os.environ.get("OTEL_TRACES_EXPORTER") == "console":
+            # Explicitly use console exporter
+            from opentelemetry.sdk.trace.export import ConsoleSpanExporter
+            _tracer_provider.add_span_processor(BatchSpanProcessor(ConsoleSpanExporter()))
+            logger.info("Using console span exporter")
+        else:
+            # No exporter configured, log a message
+            logger.debug(
+                "No OTEL_EXPORTER_OTLP_ENDPOINT set, tracing spans will not be exported. "
+                "Set OTEL_TRACES_EXPORTER=console for debug output."
+            )
+        # Set the global tracer provider
+        trace.set_tracer_provider(_tracer_provider)
+        # Create tracer
+        _tracer = trace.get_tracer(
+            "kubectl-mcp-server",
+            service_version,
+        )
+        logger.info(f"OpenTelemetry tracing initialized for {service_name} v{service_version}")
+        return True
+    except Exception as e:
+        logger.error(f"Failed to initialize OpenTelemetry tracing: {e}")
+        return False
+def get_tracer():
+    """
+    Get the OpenTelemetry tracer.
+    Returns:
+        The tracer instance, or None if not initialized
+    """
+    return _tracer
+def shutdown_tracing() -> None:
+    """Shutdown the tracer provider and flush any pending spans."""
+    global _tracer, _tracer_provider
+    if _tracer_provider is not None:
+        try:
+            _tracer_provider.shutdown()
+            logger.debug("OpenTelemetry tracing shut down")
+        except Exception as e:
+            logger.error(f"Error shutting down tracing: {e}")
+    _tracer = None
+    _tracer_provider = None
+@contextmanager
+def traced_tool_call(
+    tool_name: str,
+    attributes: Optional[Dict[str, Any]] = None,
+) -> Generator[Any, None, None]:
+    """
+    Context manager for tracing a tool call.
+    Creates a span for the tool call and records attributes and errors.
+    Args:
+        tool_name: Name of the tool being called
+        attributes: Optional additional span attributes
+    Yields:
+        The span object (or a no-op if tracing is disabled)
+    Example:
+        with traced_tool_call("get_pods", {"namespace": "default"}) as span:
+            result = await get_pods(namespace="default")
+            span.set_attribute("pod_count", len(result))
+    """
+    if not _otel_available or _tracer is None:
+        # Return a no-op context
+        yield None
+        return
+    from opentelemetry.trace import Status, StatusCode
+    with _tracer.start_as_current_span(
+        f"mcp.tool.{tool_name}",
+        kind=trace.SpanKind.INTERNAL,
+    ) as span:
+        # Set base attributes
+        span.set_attribute("mcp.tool.name", tool_name)
+        # Set additional attributes
+        if attributes:
+            for key, value in attributes.items():
+                if isinstance(value, (str, int, float, bool)):
+                    span.set_attribute(f"mcp.tool.{key}", value)
+        try:
+            yield span
+            span.set_status(Status(StatusCode.OK))
+        except Exception as e:
+            span.set_status(Status(StatusCode.ERROR, str(e)))
+            span.record_exception(e)
+            raise
+def add_span_attribute(key: str, value: Any) -> None:
+    """
+    Add an attribute to the current span.
+    Args:
+        key: Attribute key
+        value: Attribute value (must be str, int, float, or bool)
+    """
+    if not _otel_available:
+        return
+    span = trace.get_current_span()
+    if span is not None and isinstance(value, (str, int, float, bool)):
+        span.set_attribute(key, value)
+def record_span_exception(exception: Exception) -> None:
+    """
+    Record an exception on the current span.
+    Args:
+        exception: The exception to record
+    """
+    if not _otel_available:
+        return
+    span = trace.get_current_span()
+    if span is not None:
+        span.record_exception(exception)

kubectl_mcp_tool/prompts/__init__.py CHANGED Viewed

@@ -1,5 +1,48 @@
 from .prompts import register_prompts
+from .custom import (
+    CustomPrompt,
+    PromptArgument,
+    PromptMessage,
+    render_prompt,
+    load_prompts_from_config,
+    load_prompts_from_toml_file,
+    validate_prompt_args,
+    apply_defaults,
+    get_prompt_schema,
+)
+from .builtin import (
+    BUILTIN_PROMPTS,
+    get_builtin_prompts,
+    get_builtin_prompt_by_name,
+    CLUSTER_HEALTH_CHECK,
+    DEBUG_WORKLOAD,
+    RESOURCE_USAGE,
+    SECURITY_POSTURE,
+    DEPLOYMENT_CHECKLIST,
+    INCIDENT_RESPONSE,
+)
 __all__ = [
+    # Main registration function
     "register_prompts",
+    # Custom prompt types and functions
+    "CustomPrompt",
+    "PromptArgument",
+    "PromptMessage",
+    "render_prompt",
+    "load_prompts_from_config",
+    "load_prompts_from_toml_file",
+    "validate_prompt_args",
+    "apply_defaults",
+    "get_prompt_schema",
+    # Built-in prompts
+    "BUILTIN_PROMPTS",
+    "get_builtin_prompts",
+    "get_builtin_prompt_by_name",
+    "CLUSTER_HEALTH_CHECK",
+    "DEBUG_WORKLOAD",
+    "RESOURCE_USAGE",
+    "SECURITY_POSTURE",
+    "DEPLOYMENT_CHECKLIST",
+    "INCIDENT_RESPONSE",
 ]

kubectl-mcp-server 1.16.0__py3-none-any.whl → 1.17.0__py3-none-any.whl

kubectl-mcp-server 1.16.0py3-none-any.whl → 1.17.0py3-none-any.whl