PyPI - codevira - Versions diffs - 1.6.0__py3-none-any.whl - Mend

codevira 1.6.0__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (58) hide show

codevira-1.6.0.dist-info/LICENSE +21 -0
codevira-1.6.0.dist-info/METADATA +477 -0
codevira-1.6.0.dist-info/RECORD +58 -0
codevira-1.6.0.dist-info/WHEEL +5 -0
codevira-1.6.0.dist-info/entry_points.txt +2 -0
codevira-1.6.0.dist-info/top_level.txt +2 -0
indexer/__init__.py +1 -0
indexer/chunker.py +428 -0
indexer/global_db.py +197 -0
indexer/graph_generator.py +380 -0
indexer/index_codebase.py +588 -0
indexer/outcome_tracker.py +172 -0
indexer/rule_learner.py +186 -0
indexer/sqlite_graph.py +640 -0
indexer/treesitter_parser.py +423 -0
mcp_server/__init__.py +1 -0
mcp_server/__main__.py +20 -0
mcp_server/auto_init.py +257 -0
mcp_server/cli.py +622 -0
mcp_server/crash_logger.py +236 -0
mcp_server/data/__init__.py +1 -0
mcp_server/data/agents/builder.md +84 -0
mcp_server/data/agents/developer.md +111 -0
mcp_server/data/agents/documenter.md +138 -0
mcp_server/data/agents/orchestrator.md +96 -0
mcp_server/data/agents/planner.md +106 -0
mcp_server/data/agents/reviewer.md +82 -0
mcp_server/data/agents/tester.md +83 -0
mcp_server/data/config.example.yaml +33 -0
mcp_server/data/rules/coding-standards.md +48 -0
mcp_server/data/rules/engineering-excellence.md +28 -0
mcp_server/data/rules/git-cicd-governance.md +32 -0
mcp_server/data/rules/git_commits.md +130 -0
mcp_server/data/rules/incremental-updates.md +5 -0
mcp_server/data/rules/master_rule.md +187 -0
mcp_server/data/rules/multi-language.md +19 -0
mcp_server/data/rules/persistence.md +21 -0
mcp_server/data/rules/resilience-observability.md +17 -0
mcp_server/data/rules/smoke-testing.md +48 -0
mcp_server/data/rules/testing-standards.md +23 -0
mcp_server/detect.py +284 -0
mcp_server/gitignore.py +284 -0
mcp_server/global_sync.py +187 -0
mcp_server/http_server.py +341 -0
mcp_server/ide_inject.py +444 -0
mcp_server/launchd.py +156 -0
mcp_server/migrate.py +215 -0
mcp_server/paths.py +256 -0
mcp_server/prompts.py +136 -0
mcp_server/server.py +1049 -0
mcp_server/tools/__init__.py +0 -0
mcp_server/tools/changesets.py +223 -0
mcp_server/tools/code_reader.py +335 -0
mcp_server/tools/graph.py +637 -0
mcp_server/tools/learning.py +238 -0
mcp_server/tools/playbook.py +89 -0
mcp_server/tools/roadmap.py +599 -0
mcp_server/tools/search.py +145 -0

indexer/outcome_tracker.py ADDED Viewed

@@ -0,0 +1,172 @@
+"""
+Outcome Tracker — Git-based feedback loop for Codevira's adaptive memory.
+After an agent session ends and changes are committed, this module analyzes
+what happened to the agent's changes:
+  - 'kept':     Code survived untouched in subsequent commits
+  - 'modified': Developer edited the agent's output (correction signal)
+  - 'reverted': Code was reverted within N commits (negative signal)
+This feedback feeds into confidence scoring, preference learning, and
+automatic rule generation.
+"""
+from __future__ import annotations
+import difflib
+import logging
+import subprocess
+from pathlib import Path
+from mcp_server.paths import get_data_dir, get_project_root
+from indexer.sqlite_graph import SQLiteGraph
+logger = logging.getLogger(__name__)
+def _project_root():
+    return get_project_root()
+def _git_cmd(*args: str) -> str | None:
+    try:
+        return subprocess.check_output(
+            ["git", "-C", str(_project_root())] + list(args),
+            stderr=subprocess.DEVNULL,
+        ).decode("utf-8", errors="replace").strip()
+    except (subprocess.CalledProcessError, FileNotFoundError):
+        return None
+def analyze_session_outcomes(session_id: str | None = None):
+    """
+    Analyze git history to determine outcomes for recent sessions.
+    If session_id is provided, only analyzes that session.
+    Otherwise, analyzes all sessions that don't yet have outcomes.
+    """
+    db = SQLiteGraph(get_data_dir() / "graph" / "graph.db")
+    try:
+        if session_id:
+            sessions = [{"session_id": session_id}]
+        else:
+            # Find sessions that have decisions but no outcomes yet
+            cur = db.conn.execute('''
+                SELECT DISTINCT d.session_id FROM decisions d
+                LEFT JOIN outcomes o ON d.session_id = o.session_id
+                WHERE o.id IS NULL
+                ORDER BY d.created_at DESC LIMIT 20
+            ''')
+            sessions = [dict(r) for r in cur.fetchall()]
+        for sess in sessions:
+            sid = sess["session_id"]
+            _analyze_single_session(db, sid)
+    finally:
+        db.close()
+def _analyze_single_session(db: SQLiteGraph, session_id: str):
+    """Analyze outcomes for a single session's decisions."""
+    decisions = db.conn.execute('''
+        SELECT id, file_path, decision, created_at FROM decisions
+        WHERE session_id = ? AND file_path IS NOT NULL
+    ''', (session_id,)).fetchall()
+    if not decisions:
+        return
+    for dec in decisions:
+        file_path = dec["file_path"]
+        decision_id = dec["id"]
+        created_at = dec["created_at"]
+        outcome = _determine_file_outcome(file_path, created_at)
+        if outcome:
+            db.record_outcome(
+                session_id=session_id,
+                file_path=file_path,
+                outcome_type=outcome["type"],
+                decision_id=decision_id,
+                delta_summary=outcome.get("delta"),
+            )
+            # If modified, try to learn preferences from the diff
+            if outcome["type"] == "modified" and outcome.get("delta"):
+                _learn_from_modification(db, file_path, outcome["delta"])
+def _determine_file_outcome(file_path: str, session_date: str) -> dict | None:
+    """
+    Check git history to see what happened to a file after a session.
+    Returns {'type': 'kept'|'modified'|'reverted', 'delta': ...}
+    """
+    abs_path = _project_root() / file_path
+    if not abs_path.exists():
+        return {"type": "reverted", "delta": "File no longer exists"}
+    # Normalize date to ISO 8601 for git --since compatibility
+    try:
+        from datetime import datetime
+        dt = datetime.fromisoformat(session_date.replace(" ", "T"))
+        since_date = dt.isoformat()
+    except (ValueError, AttributeError):
+        since_date = session_date
+    # Get commits touching this file after the session date
+    log_output = _git_cmd(
+        "log", "--oneline", "--follow", f"--since={since_date}",
+        "--", file_path
+    )
+    if not log_output:
+        return {"type": "kept", "delta": None}
+    commits = log_output.split("\n")
+    if not commits or commits == [""]:
+        return {"type": "kept", "delta": None}
+    # Check if any commit message suggests a revert
+    for commit_line in commits:
+        lower = commit_line.lower()
+        if any(word in lower for word in ["revert", "undo", "rollback", "roll back"]):
+            return {"type": "reverted", "delta": commit_line}
+    # If there are subsequent commits but no revert, it was modified
+    if len(commits) >= 1:
+        # Get a summary of changes
+        diff_stat = _git_cmd("diff", "--stat", f"HEAD~{min(len(commits), 5)}", "--", file_path)
+        if not diff_stat:
+            logger.debug("Could not get diff stats for %s, using commit count", file_path)
+        return {"type": "modified", "delta": diff_stat or f"{len(commits)} subsequent commits"}
+    return {"type": "kept", "delta": None}
+def _learn_from_modification(db: SQLiteGraph, file_path: str, delta: str):
+    """
+    When a developer modifies agent output, try to extract preference signals.
+    This is a lightweight heuristic — not perfect, but builds up over time.
+    """
+    # Detect naming convention changes
+    if "camelCase" in delta or "snake_case" in delta:
+        db.record_preference("naming", "Prefers consistent naming convention", example=file_path)
+    # Detect structural patterns from file extension
+    ext = Path(file_path).suffix
+    if ext in ('.py', '.ts', '.tsx', '.go', '.rs'):
+        db.record_preference("structure", f"Developer modifies AI output in {ext} files", example=file_path)
+def get_file_outcome_summary(file_path: str) -> dict:
+    """Get a summary of all outcomes for a specific file."""
+    db = SQLiteGraph(get_data_dir() / "graph" / "graph.db")
+    try:
+        outcomes = db.get_outcomes_for_file(file_path)
+        confidence = db.get_decision_confidence(file_path=file_path)
+        return {
+            "file_path": file_path,
+            "outcomes": outcomes,
+            "confidence": confidence,
+        }
+    finally:
+        db.close()

indexer/rule_learner.py ADDED Viewed

@@ -0,0 +1,186 @@
+"""
+Rule Learner — Automatic rule generation from observed patterns.
+Analyzes session decisions and outcomes to infer recurring patterns
+and generate rules that future agents can use. Rules are stored in
+SQLite and served alongside static rules from rules/*.md.
+This is the engine that makes Codevira's memory adaptive:
+the more sessions that happen, the less ambiguous future decisions become.
+"""
+from __future__ import annotations
+import json
+import logging
+import re
+from collections import Counter, defaultdict
+from pathlib import Path
+from mcp_server.paths import get_data_dir
+from indexer.sqlite_graph import SQLiteGraph
+logger = logging.getLogger(__name__)
+def run_rule_inference():
+    """
+    Main entry point: analyze all decisions and outcomes,
+    detect patterns, and create or update learned rules.
+    """
+    db = SQLiteGraph(get_data_dir() / "graph" / "graph.db")
+    try:
+        _infer_test_pairing_rules(db)
+        _infer_import_pattern_rules(db)
+        _infer_decision_pattern_rules(db)
+        _infer_file_co_change_rules(db)
+    finally:
+        db.close()
+def _infer_test_pairing_rules(db: SQLiteGraph):
+    """Detect test file pairing patterns (e.g., src/foo.py always has tests/test_foo.py)."""
+    nodes = db.list_file_nodes()
+    test_files = [n for n in nodes if n.get("layer") == "test"]
+    source_files = [n for n in nodes if n.get("layer") != "test"]
+    pairings = Counter()
+    for tf in test_files:
+        test_path = tf["file_path"]
+        for sf in source_files:
+            src_path = sf["file_path"]
+            src_stem = Path(src_path).stem
+            if src_stem in test_path:
+                # Found a pairing pattern
+                src_dir = str(Path(src_path).parent)
+                test_dir = str(Path(test_path).parent)
+                pairings[(src_dir, test_dir)] += 1
+    for (src_dir, test_dir), count in pairings.items():
+        if count >= 2:
+            rule_text = f"Files in '{src_dir}/' should have corresponding tests in '{test_dir}/'."
+            confidence = min(count / 5.0, 1.0)  # Max confidence at 5+ pairings
+            _upsert_rule(db, rule_text, confidence, category="testing", file_pattern=f"{src_dir}/*")
+def _infer_import_pattern_rules(db: SQLiteGraph):
+    """Detect common import patterns from the dependency graph edges."""
+    edges = db.get_all_edges()
+    if not edges:
+        return
+    # Count how many files import each target
+    import_counts = Counter()
+    for edge in edges:
+        if edge["kind"] == "imports":
+            import_counts[edge["target_id"]] += 1
+    # Files imported by many others are "core" and should be stable
+    for target_id, count in import_counts.items():
+        if count >= 3:
+            file_path = target_id.replace("file:", "")
+            rule_text = f"'{file_path}' is imported by {count} files — changes here have wide blast radius. Review carefully."
+            confidence = min(count / 10.0, 0.95)
+            _upsert_rule(db, rule_text, confidence, category="imports", file_pattern=file_path)
+def _infer_decision_pattern_rules(db: SQLiteGraph):
+    """Detect recurring decision patterns from session history."""
+    decisions = db.conn.execute('''
+        SELECT d.decision, d.file_path, o.outcome_type
+        FROM decisions d
+        LEFT JOIN outcomes o ON d.id = o.decision_id
+        WHERE d.decision IS NOT NULL
+        ORDER BY d.created_at DESC LIMIT 200
+    ''').fetchall()
+    if len(decisions) < 3:
+        return
+    # Group decisions by file directory to find area-specific patterns
+    dir_decisions = defaultdict(list)
+    for dec in decisions:
+        if dec["file_path"]:
+            dir_name = str(Path(dec["file_path"]).parent)
+            dir_decisions[dir_name].append({
+                "decision": dec["decision"],
+                "outcome": dec["outcome_type"],
+            })
+    # Look for repeated decision keywords per directory
+    for dir_name, decs in dir_decisions.items():
+        if len(decs) < 2:
+            continue
+        # Extract common phrases from successful decisions
+        successful = [d["decision"] for d in decs if d.get("outcome") in ("kept", None)]
+        if len(successful) >= 2:
+            common = _find_common_phrases(successful)
+            for phrase, count in common:
+                if count >= 2 and len(phrase) > 10:
+                    rule_text = f"In '{dir_name}/': recurring pattern — {phrase}"
+                    confidence = min(count / 5.0, 0.9)
+                    _upsert_rule(db, rule_text, confidence, category="patterns", file_pattern=f"{dir_name}/*")
+def _infer_file_co_change_rules(db: SQLiteGraph):
+    """Detect files that are frequently modified together across sessions."""
+    sessions = db.conn.execute('''
+        SELECT session_id, GROUP_CONCAT(DISTINCT file_path) as files
+        FROM decisions
+        WHERE file_path IS NOT NULL
+        GROUP BY session_id
+        HAVING COUNT(DISTINCT file_path) >= 2
+    ''').fetchall()
+    if len(sessions) < 2:
+        return
+    co_change = Counter()
+    for sess in sessions:
+        files = sorted(sess["files"].split(","))
+        for i, f1 in enumerate(files):
+            for f2 in files[i + 1:]:
+                co_change[(f1, f2)] += 1
+    for (f1, f2), count in co_change.items():
+        if count >= 2:
+            rule_text = f"'{Path(f1).name}' and '{Path(f2).name}' are frequently modified together. Changes to one likely require changes to the other."
+            confidence = min(count / 4.0, 0.9)
+            _upsert_rule(db, rule_text, confidence, category="structure")
+def _find_common_phrases(texts: list[str], min_words: int = 3) -> list[tuple[str, int]]:
+    """Find common multi-word phrases across a list of texts."""
+    phrase_counts = Counter()
+    for text in texts:
+        words = re.findall(r'\b\w+\b', text.lower())
+        for length in range(min_words, min(len(words) + 1, 8)):
+            for i in range(len(words) - length + 1):
+                phrase = " ".join(words[i:i + length])
+                phrase_counts[phrase] += 1
+    # Return phrases that appear in multiple texts
+    return [(phrase, count) for phrase, count in phrase_counts.most_common(10) if count >= 2]
+def _upsert_rule(db: SQLiteGraph, rule_text: str, confidence: float,
+                 category: str, file_pattern: str | None = None):
+    """Insert a new learned rule or update confidence if a similar one exists."""
+    with db.transaction() as conn:
+        existing = conn.execute(
+            'SELECT id, confidence FROM learned_rules WHERE rule_text = ?',
+            (rule_text,)
+        ).fetchone()
+        if existing:
+            # Update confidence (weighted average — new evidence matters)
+            new_confidence = (existing["confidence"] * 0.7) + (confidence * 0.3)
+            conn.execute(
+                'UPDATE learned_rules SET confidence = ?, updated_at = CURRENT_TIMESTAMP WHERE id = ?',
+                (new_confidence, existing["id"]),
+            )
+        else:
+            conn.execute(
+                'INSERT INTO learned_rules (rule_text, confidence, source_sessions, category, file_pattern) VALUES (?, ?, ?, ?, ?)',
+                (rule_text, confidence, json.dumps([]), category, file_pattern),
+            )