PyPI - opspilot-ai - Versions diffs - 0.1.0__py3-none-any.whl - Mend

opspilot-ai 0.1.0__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (35) hide show

opspilot/__init__.py +0 -0
opspilot/agents/fixer.py +46 -0
opspilot/agents/planner.py +74 -0
opspilot/agents/remediation.py +200 -0
opspilot/agents/verifier.py +67 -0
opspilot/cli.py +360 -0
opspilot/config.py +22 -0
opspilot/context/__init__.py +26 -0
opspilot/context/deployment_history.py +347 -0
opspilot/context/deps.py +14 -0
opspilot/context/docker.py +17 -0
opspilot/context/env.py +17 -0
opspilot/context/logs.py +16 -0
opspilot/context/production_logs.py +262 -0
opspilot/context/project.py +19 -0
opspilot/diffs/redis.py +23 -0
opspilot/graph/engine.py +33 -0
opspilot/graph/nodes.py +41 -0
opspilot/memory.py +24 -0
opspilot/memory_redis.py +322 -0
opspilot/state.py +18 -0
opspilot/tools/__init__.py +52 -0
opspilot/tools/dep_tools.py +5 -0
opspilot/tools/env_tools.py +5 -0
opspilot/tools/log_tools.py +11 -0
opspilot/tools/pattern_analysis.py +194 -0
opspilot/utils/__init__.py +1 -0
opspilot/utils/llm.py +23 -0
opspilot/utils/llm_providers.py +499 -0
opspilot_ai-0.1.0.dist-info/METADATA +408 -0
opspilot_ai-0.1.0.dist-info/RECORD +35 -0
opspilot_ai-0.1.0.dist-info/WHEEL +5 -0
opspilot_ai-0.1.0.dist-info/entry_points.txt +2 -0
opspilot_ai-0.1.0.dist-info/licenses/LICENSE +21 -0
opspilot_ai-0.1.0.dist-info/top_level.txt +1 -0

opspilot/diffs/redis.py ADDED Viewed

@@ -0,0 +1,23 @@
+def redis_timeout_diff():
+    return {
+        "file": ".env",
+        "diff": """--- a/.env
++++ b/.env
+@@
+-REDIS_TIMEOUT=1
++REDIS_TIMEOUT=5
+""",
+        "rationale": "Increase Redis timeout to reduce transient timeout errors under load."
+    }
+def redis_pooling_diff():
+    return {
+        "file": "app/config/redis.py",
+        "diff": """--- a/app/config/redis.py
++++ b/app/config/redis.py
+@@
+-redis.Redis(host=host, port=port)
++redis.Redis(host=host, port=port, socket_timeout=5, max_connections=20)
+""",
+        "rationale": "Enable connection pooling and reasonable timeouts to improve reliability."
+    }

opspilot/graph/engine.py ADDED Viewed

@@ -0,0 +1,33 @@
+from opspilot.state import AgentState
+from opspilot.graph.nodes import (
+    collect_context_node,
+    planner_node,
+    verifier_node,
+    fixer_node,
+)
+CONFIDENCE_THRESHOLD = 0.6
+def run_agent(state: AgentState) -> AgentState:
+    # START → CONTEXT
+    state = collect_context_node(state)
+    while not state.terminated:
+        # PLAN
+        state = planner_node(state)
+        # VERIFY
+        state = verifier_node(state)
+        # DECISION
+        if state.confidence >= CONFIDENCE_THRESHOLD:
+            state = fixer_node(state)
+            state.terminated = True
+        elif state.iteration >= state.max_iterations:
+            state.terminated = True
+        # else → loop back to PLAN
+    return state

opspilot/graph/nodes.py ADDED Viewed

@@ -0,0 +1,41 @@
+from opspilot.state import AgentState
+from opspilot.context import collect_context
+from opspilot.agents.planner import plan
+from opspilot.agents.verifier import verify
+from opspilot.agents.fixer import suggest
+from opspilot.tools import collect_evidence
+CONFIDENCE_THRESHOLD = 0.6
+def collect_context_node(state: AgentState) -> AgentState:
+    state.context = collect_context(state.project_root)
+    return state
+def planner_node(state: AgentState) -> AgentState:
+    if state.hypothesis:
+        return state  # already planned this iteration
+    result = plan(state.context)
+    state.hypothesis = result.get("hypothesis")
+    state.confidence = result.get("confidence", 0.0)
+    state.iteration += 1
+    return state
+def verifier_node(state: AgentState) -> AgentState:
+    state.evidence = collect_evidence(state.context)
+    verdict = verify(state.hypothesis, state.evidence)
+    state.confidence = verdict.get("confidence", state.confidence)
+    return state
+def fixer_node(state: AgentState) -> AgentState:
+    if state.confidence >= CONFIDENCE_THRESHOLD:
+        fixes = suggest(state.hypothesis, state.evidence)
+        state.suggestions = fixes.get("suggestions", [])
+    return state

opspilot/memory.py ADDED Viewed

@@ -0,0 +1,24 @@
+import json
+from pathlib import Path
+from typing import Dict, List
+MEMORY_FILE = Path.home() / ".opspilot_memory.json"
+def load_memory() -> List[Dict]:
+    if MEMORY_FILE.exists():
+        return json.loads(MEMORY_FILE.read_text())
+    return []
+def save_memory(entry: Dict):
+    memory = load_memory()
+    memory.append(entry)
+    MEMORY_FILE.write_text(json.dumps(memory, indent=2))
+def find_similar_issues(project_root: str, threshold: float = 0.6):
+    memory = load_memory()
+    return [
+        m for m in memory
+        if m["project"] == project_root and m["confidence"] >= threshold
+    ]

opspilot/memory_redis.py ADDED Viewed

@@ -0,0 +1,322 @@
+"""Redis-based memory system for OpsPilot with user isolation."""
+import json
+import hashlib
+import time
+import os
+from typing import Dict, List, Optional
+from datetime import datetime
+try:
+    import redis
+    REDIS_AVAILABLE = True
+except ImportError:
+    REDIS_AVAILABLE = False
+class RedisMemory:
+    """Redis-based memory with automatic TTL and user isolation."""
+    def __init__(
+        self,
+        host: str = "localhost",
+        port: int = 6379,
+        db: int = 0,
+        password: Optional[str] = None,
+        ttl_days: Optional[int] = None
+    ):
+        """
+        Initialize Redis connection.
+        Args:
+            host: Redis host
+            port: Redis port
+            db: Redis database number
+            password: Redis password (if required)
+            ttl_days: Days to keep incidents (default: from env or 30)
+        """
+        if not REDIS_AVAILABLE:
+            raise ImportError(
+                "redis package not installed. Install with: pip install redis"
+            )
+        self.redis_client = redis.Redis(
+            host=host,
+            port=port,
+            db=db,
+            password=password,
+            decode_responses=True
+        )
+        # TTL from environment variable or default
+        if ttl_days is None:
+            ttl_days = int(os.getenv("OPSPILOT_REDIS_TTL_DAYS", "30"))
+        self.ttl_seconds = ttl_days * 24 * 60 * 60
+    @staticmethod
+    def _get_project_hash(project_root: str) -> str:
+        """
+        Generate unique hash for project (user isolation).
+        Args:
+            project_root: Absolute path to project
+        Returns:
+            16-character hash
+        """
+        return hashlib.sha256(project_root.encode()).hexdigest()[:16]
+    def save_incident(
+        self,
+        project_root: str,
+        hypothesis: str,
+        confidence: float,
+        severity: str,
+        error_patterns: Dict,
+        evidence: Dict,
+        remediation: Optional[Dict] = None
+    ) -> str:
+        """
+        Save incident analysis to Redis with TTL.
+        Args:
+            project_root: Project path (for user isolation)
+            hypothesis: Root cause hypothesis
+            confidence: Confidence score (0.0 - 1.0)
+            severity: P0/P1/P2/P3
+            error_patterns: Detected error patterns
+            evidence: Collected evidence
+            remediation: Remediation plan (optional)
+        Returns:
+            incident_key: Unique key for this incident
+        """
+        project_hash = self._get_project_hash(project_root)
+        timestamp = int(time.time())
+        # Create incident data
+        incident_data = {
+            "project": project_root,
+            "hypothesis": hypothesis,
+            "confidence": confidence,
+            "severity": severity,
+            "error_patterns": error_patterns,
+            "evidence": evidence,
+            "remediation": remediation,
+            "timestamp": timestamp,
+            "created_at": datetime.fromtimestamp(timestamp).isoformat()
+        }
+        # Generate incident key
+        incident_key = f"incident:{project_hash}:{timestamp}"
+        # Store incident with TTL
+        self.redis_client.setex(
+            incident_key,
+            self.ttl_seconds,
+            json.dumps(incident_data)
+        )
+        # Add to similarity index (sorted set by confidence)
+        similarity_key = f"incidents:similar:{project_hash}"
+        self.redis_client.zadd(
+            similarity_key,
+            {incident_key: confidence}
+        )
+        self.redis_client.expire(similarity_key, self.ttl_seconds)
+        # Add to severity index
+        severity_key = f"incidents:severity:{project_hash}:{severity}"
+        self.redis_client.sadd(severity_key, incident_key)
+        self.redis_client.expire(severity_key, self.ttl_seconds)
+        return incident_key
+    def find_similar_issues(
+        self,
+        project_root: str,
+        min_confidence: float = 0.6,
+        limit: int = 5
+    ) -> List[Dict]:
+        """
+        Find similar incidents for a project (user-isolated).
+        Args:
+            project_root: Project path
+            min_confidence: Minimum confidence threshold
+            limit: Max number of results
+        Returns:
+            List of similar incidents, sorted by confidence (desc)
+        """
+        project_hash = self._get_project_hash(project_root)
+        similarity_key = f"incidents:similar:{project_hash}"
+        # Get top incidents by confidence (sorted set)
+        incident_keys = self.redis_client.zrevrangebyscore(
+            similarity_key,
+            max=1.0,
+            min=min_confidence,
+            start=0,
+            num=limit
+        )
+        # Fetch incident data
+        incidents = []
+        for key in incident_keys:
+            data = self.redis_client.get(key)
+            if data:
+                incidents.append(json.loads(data))
+        return incidents
+    def get_incidents_by_severity(
+        self,
+        project_root: str,
+        severity: str
+    ) -> List[Dict]:
+        """
+        Get all incidents of a specific severity.
+        Args:
+            project_root: Project path
+            severity: P0/P1/P2/P3
+        Returns:
+            List of incidents
+        """
+        project_hash = self._get_project_hash(project_root)
+        severity_key = f"incidents:severity:{project_hash}:{severity}"
+        incident_keys = self.redis_client.smembers(severity_key)
+        incidents = []
+        for key in incident_keys:
+            data = self.redis_client.get(key)
+            if data:
+                incidents.append(json.loads(data))
+        return incidents
+    def record_llm_metrics(
+        self,
+        provider: str,
+        success: bool,
+        latency_ms: float
+    ):
+        """
+        Record LLM provider performance metrics.
+        Args:
+            provider: Provider name (OllamaProvider, OpenRouterProvider, etc.)
+            success: Whether call succeeded
+            latency_ms: Response time in milliseconds
+        """
+        metrics_key = f"llm:health:{provider}"
+        if success:
+            self.redis_client.hincrby(metrics_key, "success_count", 1)
+            self.redis_client.hset(metrics_key, "last_success", int(time.time()))
+        else:
+            self.redis_client.hincrby(metrics_key, "failure_count", 1)
+        # Update average latency (moving average)
+        current_avg = float(self.redis_client.hget(metrics_key, "avg_latency_ms") or 0)
+        total_calls = int(self.redis_client.hget(metrics_key, "success_count") or 0)
+        if total_calls > 0:
+            new_avg = ((current_avg * (total_calls - 1)) + latency_ms) / total_calls
+            self.redis_client.hset(metrics_key, "avg_latency_ms", new_avg)
+        # Set TTL (refresh metrics every hour)
+        self.redis_client.expire(metrics_key, 3600)
+    def get_llm_health(self, provider: str) -> Dict:
+        """
+        Get health metrics for LLM provider.
+        Args:
+            provider: Provider name
+        Returns:
+            Dict with success_count, failure_count, avg_latency_ms
+        """
+        metrics_key = f"llm:health:{provider}"
+        metrics = self.redis_client.hgetall(metrics_key)
+        return {
+            "success_count": int(metrics.get("success_count", 0)),
+            "failure_count": int(metrics.get("failure_count", 0)),
+            "avg_latency_ms": float(metrics.get("avg_latency_ms", 0)),
+            "last_success": int(metrics.get("last_success", 0))
+        }
+    def clear_project_memory(self, project_root: str):
+        """
+        Clear all incidents for a project (useful for testing).
+        Args:
+            project_root: Project path
+        """
+        project_hash = self._get_project_hash(project_root)
+        # Delete similarity index
+        self.redis_client.delete(f"incidents:similar:{project_hash}")
+        # Delete severity indexes
+        for severity in ["P0", "P1", "P2", "P3"]:
+            severity_key = f"incidents:severity:{project_hash}:{severity}"
+            incident_keys = self.redis_client.smembers(severity_key)
+            # Delete individual incidents
+            for key in incident_keys:
+                self.redis_client.delete(key)
+            # Delete severity index
+            self.redis_client.delete(severity_key)
+    def health_check(self) -> bool:
+        """
+        Check if Redis is available.
+        Returns:
+            True if Redis is reachable
+        """
+        try:
+            return self.redis_client.ping()
+        except Exception:
+            return False
+# Fallback to file-based memory if Redis unavailable
+def get_memory_backend(
+    redis_host: str = "localhost",
+    redis_port: int = 6379,
+    fallback_to_file: bool = True
+):
+    """
+    Get memory backend (Redis or file-based fallback).
+    Args:
+        redis_host: Redis host
+        redis_port: Redis port
+        fallback_to_file: Use file-based storage if Redis unavailable
+    Returns:
+        Memory backend instance
+    """
+    if REDIS_AVAILABLE:
+        try:
+            memory = RedisMemory(host=redis_host, port=redis_port)
+            if memory.health_check():
+                return memory
+        except Exception as e:
+            print(f"[WARNING] Redis unavailable: {e}")
+    if fallback_to_file:
+        print("[INFO] Using file-based memory (Redis unavailable)")
+        from opspilot.memory import load_memory, save_memory
+        return None  # Use existing file-based system
+    raise RuntimeError("Redis unavailable and fallback disabled")

opspilot/state.py ADDED Viewed

@@ -0,0 +1,18 @@
+from dataclasses import dataclass, field
+from typing import Dict, Any, List, Optional
+@dataclass
+class AgentState:
+    project_root: str
+    context: Dict[str, Any] = field(default_factory=dict)
+    hypothesis: Optional[str] = None
+    confidence: float = 0.0
+    evidence: Dict[str, Any] = field(default_factory=dict)
+    suggestions: List[Dict[str, Any]] = field(default_factory=list)
+    iteration: int = 0
+    max_iterations: int = 2
+    terminated: bool = False

opspilot/tools/__init__.py ADDED Viewed

@@ -0,0 +1,52 @@
+"""Tool functions for evidence collection."""
+from opspilot.tools.log_tools import analyze_log_errors
+from opspilot.tools.env_tools import find_missing_env
+from opspilot.tools.dep_tools import has_dependency
+from opspilot.tools.pattern_analysis import identify_error_patterns, build_error_timeline
+def collect_evidence(context: dict) -> dict:
+    """
+    Collect evidence from project context with advanced pattern analysis.
+    Args:
+        context: Project context dictionary
+    Returns:
+        Dictionary containing collected evidence with error patterns, severity, and timeline
+    """
+    evidence = {}
+    logs = context.get("logs")
+    env = context.get("env", {})
+    deps = context.get("dependencies", [])
+    # Advanced pattern analysis
+    if logs:
+        error_patterns = identify_error_patterns(logs)
+        if error_patterns:
+            evidence["error_patterns"] = error_patterns
+            evidence["severity"] = error_patterns.get("severity", "P3")
+            evidence["error_count"] = error_patterns.get("error_count", 0)
+        # Timeline analysis
+        timeline = build_error_timeline(logs)
+        if timeline:
+            evidence["timeline"] = timeline
+    # Basic log error counting (keep for backward compatibility)
+    log_errors = analyze_log_errors(logs)
+    if log_errors:
+        evidence["log_errors"] = log_errors
+    # Dependency detection
+    if has_dependency(deps, "redis"):
+        evidence["uses_redis"] = True
+    # Environment variable validation
+    missing_env = find_missing_env(["REDIS_URL"], env)
+    if missing_env:
+        evidence["missing_env"] = missing_env
+    return evidence

opspilot/tools/dep_tools.py ADDED Viewed

@@ -0,0 +1,5 @@
+from typing import List
+def has_dependency(deps: List[str], keyword: str) -> bool:
+    return any(keyword.lower() in d.lower() for d in deps)

opspilot/tools/env_tools.py ADDED Viewed

@@ -0,0 +1,5 @@
+from typing import Dict, List
+def find_missing_env(required_keys: List[str], env: Dict[str, str]) -> List[str]:
+    return [k for k in required_keys if k not in env]

opspilot/tools/log_tools.py ADDED Viewed

@@ -0,0 +1,11 @@
+from collections import Counter
+import re
+from typing import Dict
+def analyze_log_errors(log_text: str) -> Dict[str, int]:
+    if not log_text:
+        return {}
+    errors = re.findall(r"(ERROR|Exception|Traceback|Timeout)", log_text)
+    return dict(Counter(errors))