PyPI - stravinsky - Versions diffs - 0.2.67__py3-none-any.whl → 0.4.66__py3-none-any.whl - Mend

stravinsky 0.2.67py3-none-any.whl → 0.4.66py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of stravinsky might be problematic. Click here for more details.

Files changed (190) hide show

mcp_bridge/__init__.py +1 -1
mcp_bridge/auth/__init__.py +16 -6
mcp_bridge/auth/cli.py +202 -11
mcp_bridge/auth/oauth.py +1 -2
mcp_bridge/auth/openai_oauth.py +4 -7
mcp_bridge/auth/token_store.py +112 -11
mcp_bridge/cli/__init__.py +1 -1
mcp_bridge/cli/install_hooks.py +503 -107
mcp_bridge/cli/session_report.py +0 -3
mcp_bridge/config/MANIFEST_SCHEMA.md +305 -0
mcp_bridge/config/README.md +276 -0
mcp_bridge/config/__init__.py +2 -2
mcp_bridge/config/hook_config.py +247 -0
mcp_bridge/config/hooks_manifest.json +138 -0
mcp_bridge/config/rate_limits.py +317 -0
mcp_bridge/config/skills_manifest.json +128 -0
mcp_bridge/hooks/HOOKS_SETTINGS.json +17 -4
mcp_bridge/hooks/__init__.py +19 -4
mcp_bridge/hooks/agent_reminder.py +4 -4
mcp_bridge/hooks/auto_slash_command.py +5 -5
mcp_bridge/hooks/budget_optimizer.py +2 -2
mcp_bridge/hooks/claude_limits_hook.py +114 -0
mcp_bridge/hooks/comment_checker.py +3 -4
mcp_bridge/hooks/compaction.py +2 -2
mcp_bridge/hooks/context.py +2 -1
mcp_bridge/hooks/context_monitor.py +2 -2
mcp_bridge/hooks/delegation_policy.py +85 -0
mcp_bridge/hooks/directory_context.py +3 -3
mcp_bridge/hooks/edit_recovery.py +3 -2
mcp_bridge/hooks/edit_recovery_policy.py +49 -0
mcp_bridge/hooks/empty_message_sanitizer.py +2 -2
mcp_bridge/hooks/events.py +160 -0
mcp_bridge/hooks/git_noninteractive.py +4 -4
mcp_bridge/hooks/keyword_detector.py +8 -10
mcp_bridge/hooks/manager.py +43 -22
mcp_bridge/hooks/notification_hook.py +13 -6
mcp_bridge/hooks/parallel_enforcement_policy.py +67 -0
mcp_bridge/hooks/parallel_enforcer.py +5 -5
mcp_bridge/hooks/parallel_execution.py +22 -10
mcp_bridge/hooks/post_tool/parallel_validation.py +103 -0
mcp_bridge/hooks/pre_compact.py +8 -9
mcp_bridge/hooks/pre_tool/agent_spawn_validator.py +115 -0
mcp_bridge/hooks/preemptive_compaction.py +2 -3
mcp_bridge/hooks/routing_notifications.py +80 -0
mcp_bridge/hooks/rules_injector.py +11 -19
mcp_bridge/hooks/session_idle.py +4 -4
mcp_bridge/hooks/session_notifier.py +4 -4
mcp_bridge/hooks/session_recovery.py +4 -5
mcp_bridge/hooks/stravinsky_mode.py +1 -1
mcp_bridge/hooks/subagent_stop.py +1 -3
mcp_bridge/hooks/task_validator.py +2 -2
mcp_bridge/hooks/tmux_manager.py +7 -8
mcp_bridge/hooks/todo_delegation.py +4 -1
mcp_bridge/hooks/todo_enforcer.py +180 -10
mcp_bridge/hooks/tool_messaging.py +113 -10
mcp_bridge/hooks/truncation_policy.py +37 -0
mcp_bridge/hooks/truncator.py +1 -2
mcp_bridge/metrics/cost_tracker.py +115 -0
mcp_bridge/native_search.py +93 -0
mcp_bridge/native_watcher.py +118 -0
mcp_bridge/notifications.py +150 -0
mcp_bridge/orchestrator/enums.py +11 -0
mcp_bridge/orchestrator/router.py +165 -0
mcp_bridge/orchestrator/state.py +32 -0
mcp_bridge/orchestrator/visualization.py +14 -0
mcp_bridge/orchestrator/wisdom.py +34 -0
mcp_bridge/prompts/__init__.py +1 -8
mcp_bridge/prompts/dewey.py +1 -1
mcp_bridge/prompts/planner.py +2 -4
mcp_bridge/prompts/stravinsky.py +53 -31
mcp_bridge/proxy/__init__.py +0 -0
mcp_bridge/proxy/client.py +70 -0
mcp_bridge/proxy/model_server.py +157 -0
mcp_bridge/routing/__init__.py +43 -0
mcp_bridge/routing/config.py +250 -0
mcp_bridge/routing/model_tiers.py +135 -0
mcp_bridge/routing/provider_state.py +261 -0
mcp_bridge/routing/task_classifier.py +190 -0
mcp_bridge/server.py +542 -59
mcp_bridge/server_tools.py +738 -6
mcp_bridge/tools/__init__.py +40 -25
mcp_bridge/tools/agent_manager.py +616 -697
mcp_bridge/tools/background_tasks.py +13 -17
mcp_bridge/tools/code_search.py +70 -53
mcp_bridge/tools/continuous_loop.py +0 -1
mcp_bridge/tools/dashboard.py +19 -0
mcp_bridge/tools/find_code.py +296 -0
mcp_bridge/tools/init.py +1 -0
mcp_bridge/tools/list_directory.py +42 -0
mcp_bridge/tools/lsp/__init__.py +12 -5
mcp_bridge/tools/lsp/manager.py +471 -0
mcp_bridge/tools/lsp/tools.py +723 -207
mcp_bridge/tools/model_invoke.py +1195 -273
mcp_bridge/tools/mux_client.py +75 -0
mcp_bridge/tools/project_context.py +1 -2
mcp_bridge/tools/query_classifier.py +406 -0
mcp_bridge/tools/read_file.py +84 -0
mcp_bridge/tools/replace.py +45 -0
mcp_bridge/tools/run_shell_command.py +38 -0
mcp_bridge/tools/search_enhancements.py +347 -0
mcp_bridge/tools/semantic_search.py +3627 -0
mcp_bridge/tools/session_manager.py +0 -2
mcp_bridge/tools/skill_loader.py +0 -1
mcp_bridge/tools/task_runner.py +5 -7
mcp_bridge/tools/templates.py +3 -3
mcp_bridge/tools/tool_search.py +331 -0
mcp_bridge/tools/write_file.py +29 -0
mcp_bridge/update_manager.py +585 -0
mcp_bridge/update_manager_pypi.py +297 -0
mcp_bridge/utils/cache.py +82 -0
mcp_bridge/utils/process.py +71 -0
mcp_bridge/utils/session_state.py +51 -0
mcp_bridge/utils/truncation.py +76 -0
stravinsky-0.4.66.dist-info/METADATA +517 -0
stravinsky-0.4.66.dist-info/RECORD +198 -0
{stravinsky-0.2.67.dist-info → stravinsky-0.4.66.dist-info}/entry_points.txt +1 -0
stravinsky_claude_assets/HOOKS_INTEGRATION.md +316 -0
stravinsky_claude_assets/agents/HOOKS.md +437 -0
stravinsky_claude_assets/agents/code-reviewer.md +210 -0
stravinsky_claude_assets/agents/comment_checker.md +580 -0
stravinsky_claude_assets/agents/debugger.md +254 -0
stravinsky_claude_assets/agents/delphi.md +495 -0
stravinsky_claude_assets/agents/dewey.md +248 -0
stravinsky_claude_assets/agents/explore.md +1198 -0
stravinsky_claude_assets/agents/frontend.md +472 -0
stravinsky_claude_assets/agents/implementation-lead.md +164 -0
stravinsky_claude_assets/agents/momus.md +464 -0
stravinsky_claude_assets/agents/research-lead.md +141 -0
stravinsky_claude_assets/agents/stravinsky.md +730 -0
stravinsky_claude_assets/commands/delphi.md +9 -0
stravinsky_claude_assets/commands/dewey.md +54 -0
stravinsky_claude_assets/commands/git-master.md +112 -0
stravinsky_claude_assets/commands/index.md +49 -0
stravinsky_claude_assets/commands/publish.md +86 -0
stravinsky_claude_assets/commands/review.md +73 -0
stravinsky_claude_assets/commands/str/agent_cancel.md +70 -0
stravinsky_claude_assets/commands/str/agent_list.md +56 -0
stravinsky_claude_assets/commands/str/agent_output.md +92 -0
stravinsky_claude_assets/commands/str/agent_progress.md +74 -0
stravinsky_claude_assets/commands/str/agent_retry.md +94 -0
stravinsky_claude_assets/commands/str/cancel.md +51 -0
stravinsky_claude_assets/commands/str/clean.md +97 -0
stravinsky_claude_assets/commands/str/continue.md +38 -0
stravinsky_claude_assets/commands/str/index.md +199 -0
stravinsky_claude_assets/commands/str/list_watchers.md +96 -0
stravinsky_claude_assets/commands/str/search.md +205 -0
stravinsky_claude_assets/commands/str/start_filewatch.md +136 -0
stravinsky_claude_assets/commands/str/stats.md +71 -0
stravinsky_claude_assets/commands/str/stop_filewatch.md +89 -0
stravinsky_claude_assets/commands/str/unwatch.md +42 -0
stravinsky_claude_assets/commands/str/watch.md +45 -0
stravinsky_claude_assets/commands/strav.md +53 -0
stravinsky_claude_assets/commands/stravinsky.md +292 -0
stravinsky_claude_assets/commands/verify.md +60 -0
stravinsky_claude_assets/commands/version.md +5 -0
stravinsky_claude_assets/hooks/README.md +248 -0
stravinsky_claude_assets/hooks/comment_checker.py +193 -0
stravinsky_claude_assets/hooks/context.py +38 -0
stravinsky_claude_assets/hooks/context_monitor.py +153 -0
stravinsky_claude_assets/hooks/dependency_tracker.py +73 -0
stravinsky_claude_assets/hooks/edit_recovery.py +46 -0
stravinsky_claude_assets/hooks/execution_state_tracker.py +68 -0
stravinsky_claude_assets/hooks/notification_hook.py +103 -0
stravinsky_claude_assets/hooks/notification_hook_v2.py +96 -0
stravinsky_claude_assets/hooks/parallel_execution.py +241 -0
stravinsky_claude_assets/hooks/parallel_reinforcement.py +106 -0
stravinsky_claude_assets/hooks/parallel_reinforcement_v2.py +112 -0
stravinsky_claude_assets/hooks/pre_compact.py +123 -0
stravinsky_claude_assets/hooks/ralph_loop.py +173 -0
stravinsky_claude_assets/hooks/session_recovery.py +263 -0
stravinsky_claude_assets/hooks/stop_hook.py +89 -0
stravinsky_claude_assets/hooks/stravinsky_metrics.py +164 -0
stravinsky_claude_assets/hooks/stravinsky_mode.py +146 -0
stravinsky_claude_assets/hooks/subagent_stop.py +98 -0
stravinsky_claude_assets/hooks/todo_continuation.py +111 -0
stravinsky_claude_assets/hooks/todo_delegation.py +96 -0
stravinsky_claude_assets/hooks/tool_messaging.py +281 -0
stravinsky_claude_assets/hooks/truncator.py +23 -0
stravinsky_claude_assets/rules/deployment_safety.md +51 -0
stravinsky_claude_assets/rules/integration_wiring.md +89 -0
stravinsky_claude_assets/rules/pypi_deployment.md +220 -0
stravinsky_claude_assets/rules/stravinsky_orchestrator.md +32 -0
stravinsky_claude_assets/settings.json +152 -0
stravinsky_claude_assets/skills/chrome-devtools/SKILL.md +81 -0
stravinsky_claude_assets/skills/sqlite/SKILL.md +77 -0
stravinsky_claude_assets/skills/supabase/SKILL.md +74 -0
stravinsky_claude_assets/task_dependencies.json +34 -0
stravinsky-0.2.67.dist-info/METADATA +0 -284
stravinsky-0.2.67.dist-info/RECORD +0 -76
{stravinsky-0.2.67.dist-info → stravinsky-0.4.66.dist-info}/WHEEL +0 -0

mcp_bridge/tools/mux_client.py ADDED Viewed

@@ -0,0 +1,75 @@
+import asyncio
+import json
+import logging
+import os
+import socket
+import time
+from dataclasses import asdict, dataclass
+from datetime import datetime
+from typing import Any
+logger = logging.getLogger(__name__)
+SOCKET_PATH = "/tmp/stravinsky.sock"
+@dataclass
+class LogMessage:
+    agent_id: str
+    type: str  # stdout, stderr, event, lifecycle
+    content: str
+    timestamp: str
+class MuxClient:
+    def __init__(self, agent_id: str):
+        self.agent_id = agent_id
+        self._socket: socket.socket | None = None
+        self._connected = False
+    def connect(self):
+        try:
+            if not os.path.exists(SOCKET_PATH):
+                return
+            self._socket = socket.socket(socket.AF_UNIX, socket.SOCK_STREAM)
+            self._socket.connect(SOCKET_PATH)
+            self._socket.setblocking(False)
+            self._connected = True
+        except Exception as e:
+            logger.debug(f"Failed to connect to mux: {e}")
+            self._connected = False
+    def log(self, content: str, stream: str = "stdout"):
+        if not self._connected:
+            self.connect()
+        if not self._connected or not self._socket:
+            return
+        msg = LogMessage(
+            agent_id=self.agent_id,
+            type=stream,
+            content=content,
+            timestamp=datetime.now().isoformat()
+        )
+        try:
+            data = json.dumps(asdict(msg)) + "\n"
+            self._socket.sendall(data.encode('utf-8'))
+        except (BrokenPipeError, OSError):
+            self._connected = False
+            self._socket.close()
+            self._socket = None
+    def close(self):
+        if self._socket:
+            self._socket.close()
+            self._connected = False
+# Global instance for the main process
+_global_mux: MuxClient | None = None
+def get_mux(agent_id: str = "main") -> MuxClient:
+    global _global_mux
+    if _global_mux is None:
+        _global_mux = MuxClient(agent_id)
+    return _global_mux

mcp_bridge/tools/project_context.py CHANGED Viewed

@@ -10,12 +10,11 @@ import shutil
 import subprocess
 import sys
 from pathlib import Path
-from typing import Any, Dict, List, Optional
 from ..auth.token_store import TokenStore
-async def get_project_context(project_path: Optional[str] = None) -> str:
+async def get_project_context(project_path: str | None = None) -> str:
     """
     Summarize project environment: Git status, local rules, and pending todos.

mcp_bridge/tools/query_classifier.py ADDED Viewed

@@ -0,0 +1,406 @@
+"""Query classifier for intelligent search routing.
+This module provides a fast, regex-based system that categorizes search queries
+into four types: PATTERN (exact text matching), STRUCTURAL (AST-aware code structure),
+SEMANTIC (conceptual/behavioral), and HYBRID (multi-modal).
+It enables intelligent routing to the optimal search tool without LLM overhead.
+Design Goals:
+- Fast: <10ms classification per query
+- No LLM calls: Pure regex-based detection (no API overhead)
+- Confidence scoring: Return probability (0.0-1.0) for each category
+- Fallback safe: Default to HYBRID when ambiguous
+- Extensible: Easy to add new patterns/indicators
+"""
+import logging
+import re
+from dataclasses import dataclass
+from enum import Enum
+from typing import Literal
+# Module-level logger
+logger = logging.getLogger(__name__)
+class QueryCategory(Enum):
+    """Query classification categories."""
+    SEMANTIC = "semantic"      # Conceptual, "what it does" queries
+    PATTERN = "pattern"        # Exact text/regex matching
+    STRUCTURAL = "structural"  # AST-aware code structure queries
+    HYBRID = "hybrid"          # Multi-modal search recommended
+@dataclass
+class QueryClassification:
+    """Result of query classification.
+    Attributes:
+        category: The classified query category (SEMANTIC, PATTERN, STRUCTURAL, HYBRID)
+        confidence: Confidence score from 0.0 (low) to 1.0 (high)
+        indicators: List of matched patterns/reasons that led to this classification
+        suggested_tool: The recommended search tool to use
+            - "grep_search" for PATTERN queries
+            - "ast_grep_search" for STRUCTURAL queries
+            - "semantic_search" for SEMANTIC queries
+            - "enhanced_search" for HYBRID queries
+        reasoning: Human-readable explanation of the classification
+    """
+    category: QueryCategory
+    confidence: float  # 0.0-1.0
+    indicators: list[str]  # Matched patterns/reasons
+    suggested_tool: Literal[
+        "semantic_search", "grep_search", "ast_grep_search", "enhanced_search"
+    ]
+    reasoning: str  # Human-readable explanation
+# Phase 1: Exact Pattern Detection (High Confidence)
+# Triggered when query contains quoted strings, exact identifiers with code syntax,
+# file paths, regular expressions, or known constant patterns.
+# Format: (regex_pattern, indicator_name)
+PATTERN_INDICATORS = [
+    (r'\bgrep\b', 'explicit_grep'),                     # Explicit "grep" in query
+    (r'["\'][\w_()\.]+["\']', 'quoted_identifier'),     # Quoted identifiers like "authenticate()" or 'API_KEY'
+    (r'\b\w+\(\)', 'function_call'),                    # Function calls with () like authenticate()
+    (r'[\w_]+\.[\w_]+', 'dot_notation'),                # Dot notation (Class.method) like database.query()
+    (r'[\w/]+\.\w{2,4}$', 'file_path'),                 # File paths with extension
+    (r'/.*?/', 'regex_pattern'),                        # Regex patterns
+    (r'\b[A-Z_]{4,}\b', 'constant_name'),               # CONSTANT_NAMES (4+ uppercase chars)
+]
+# Phase 2: Structural Detection (High Confidence)
+# Triggered when query contains AST keywords, structural relationships,
+# or code structure terms.
+# Format: (regex_pattern, indicator_name)
+STRUCTURAL_INDICATORS = [
+    (r'\b(class|function|method|async|interface)\b', 'ast_keyword'),  # AST keywords
+    (r'\b(inherits?|inheriting)\b', 'inheritance'),  # Inheritance
+    (r'\b(extends?|extending)\b', 'extends'),  # Extension
+    (r'\b(implements?|implementing)\b', 'implements'),  # Implementation
+    (r'\b(overrides?|overriding)\b', 'override'),  # Override
+    (r'\b(decorated?)\s+(with|by)\b', 'decorator_pattern'),  # Decorator patterns
+    (r'\@\w+', 'decorator_syntax'),  # Decorator syntax
+    (r'\b(definition|declaration|signature)\b', 'code_structure'),  # Code structure terms
+]
+# Phase 3: Conceptual Detection (Medium-High Confidence)
+# Triggered when query contains intent verbs, how/why/where questions,
+# design patterns, conceptual nouns, or cross-cutting concerns.
+# Format: (regex_pattern, indicator_name)
+SEMANTIC_INDICATORS = [
+    (r'\bhow\s+(?:does|is|are)', 'how'),  # How questions (non-capturing group)
+    (r'\bwhy\s+(?:does|is|are)', 'why'),  # Why questions (non-capturing group)
+    (r'\bwhere\s+(?:does|is|are)', 'where'),  # Where questions (non-capturing group)
+    (r'\b(handles?|manages?|processes?|validates?|validated?|transforms?)\b', 'intent'),  # Intent verbs
+    (r'\b(logic|mechanism|strategy|approach|workflow|implementation)\b', 'conceptual'),  # Conceptual nouns
+    (r'\b(patterns?|anti-patterns?)\b', 'design_pattern'),  # Design patterns
+    (r'\b(authentication|authorization|caching|logging|error handling|middleware)\b', 'cross_cutting'),  # Cross-cutting
+    (r'\bfind\s+(all\s+)?(code|places|instances|implementations)\s+that\b', 'find_pattern'),  # Find code pattern
+]
+# Phase 4: Hybrid Detection (Medium Confidence)
+# Triggered when query contains multiple concepts, both exact + conceptual,
+# broad scopes, or vague qualifiers.
+# Format: (regex_pattern, indicator_name)
+HYBRID_INDICATORS = [
+    (r'\s+(and|then|also|plus|with)\s+', 'conjunction'),  # Conjunctions
+    (r'\b(across|throughout|in all|system-wide)\b', 'broad_scope'),  # Broad scopes
+    (r'\b(similar|related|like|kind of|type of)\b', 'vague_qualifier'),  # Vague qualifiers
+    (r'\b(all|every|any)\s+\w+\s+(that|which|where)\b', 'broad_quantifier'),  # Broad quantifiers
+]
+# Tool routing based on category
+TOOL_ROUTING = {
+    QueryCategory.PATTERN: "grep_search",
+    QueryCategory.STRUCTURAL: "ast_grep_search",
+    QueryCategory.SEMANTIC: "semantic_search",
+    QueryCategory.HYBRID: "enhanced_search",
+}
+def classify_query(query: str) -> QueryClassification:
+    """Classify a search query into one of four categories.
+    This function analyzes a search query using regex-based pattern matching
+    to determine its type (PATTERN, STRUCTURAL, SEMANTIC, or HYBRID) and
+    recommends the most appropriate search tool.
+    The classification process has 4 phases:
+    1. Pattern Detection: Looks for exact identifiers, quoted strings, file paths
+    2. Structural Detection: Looks for AST keywords (class, function, etc.)
+    3. Conceptual Detection: Looks for intent verbs and semantic concepts
+    4. Hybrid Detection: Looks for conjunctions and broad scopes
+    5. Fallback: Defaults to HYBRID with 0.5 confidence if no strong match
+    Args:
+        query: Natural language search query (e.g., "Find authenticate()" or
+               "Where is authentication handled?")
+    Returns:
+        QueryClassification object containing:
+        - category: One of SEMANTIC, PATTERN, STRUCTURAL, HYBRID
+        - confidence: Score from 0.0 to 1.0 (capped at 0.95, never 1.0)
+        - indicators: List of matched pattern names
+        - suggested_tool: Recommended tool (grep_search, ast_grep_search,
+                         semantic_search, or enhanced_search)
+        - reasoning: Human-readable explanation
+    Examples:
+        >>> result = classify_query("Find all calls to authenticate()")
+        >>> result.category
+        <QueryCategory.PATTERN: 'pattern'>
+        >>> result.confidence
+        0.9
+        >>> result.suggested_tool
+        'grep_search'
+        >>> result = classify_query("Where is authentication handled?")
+        >>> result.category
+        <QueryCategory.SEMANTIC: 'semantic'>
+        >>> result.confidence
+        0.85
+        >>> result.suggested_tool
+        'semantic_search'
+        >>> result = classify_query("Find class definitions inheriting from Base")
+        >>> result.category
+        <QueryCategory.STRUCTURAL: 'structural'>
+        >>> result.confidence
+        0.95
+        >>> result.suggested_tool
+        'ast_grep_search'
+    Performance:
+        - Target: <10ms per classification
+        - Uses only pure Python stdlib (re module)
+        - No external dependencies or API calls
+    """
+    try:
+        # Input validation
+        if not query or not isinstance(query, str):
+            return QueryClassification(
+                category=QueryCategory.HYBRID,
+                confidence=0.5,
+                indicators=["invalid_input"],
+                suggested_tool="enhanced_search",
+                reasoning="Invalid or empty query, using safe default",
+            )
+        # Normalize query
+        query_normalized = query.strip()
+        if len(query_normalized) < 3:
+            return QueryClassification(
+                category=QueryCategory.HYBRID,
+                confidence=0.5,
+                indicators=["too_short"],
+                suggested_tool="enhanced_search",
+                reasoning="Query too short for accurate classification",
+            )
+        query_lower = query_normalized.lower()
+        # Phase 1: Pattern Detection (use original case for case-sensitive patterns)
+        pattern_matches = []
+        pattern_indicators = []
+        for pattern, indicator_name in PATTERN_INDICATORS:
+            # Case-insensitive for 'explicit_grep', case-sensitive for others (CONSTANTS, etc.)
+            query_to_match = query_lower if indicator_name == 'explicit_grep' else query_normalized
+            if re.search(pattern, query_to_match):
+                pattern_matches.append(pattern)
+                pattern_indicators.append(indicator_name)
+        # Phase 2: Structural Detection
+        structural_matches = []
+        structural_indicators = []
+        for pattern, indicator_name in STRUCTURAL_INDICATORS:
+            if re.search(pattern, query_lower):
+                structural_matches.append(pattern)
+                structural_indicators.append(indicator_name)
+        # Phase 3: Semantic Detection
+        semantic_matches = []
+        semantic_indicators = []
+        for pattern, indicator_name in SEMANTIC_INDICATORS:
+            match = re.search(pattern, query_lower)
+            if match:
+                semantic_matches.append(pattern)
+                # Use captured group (matched word) if available, else use indicator name
+                matched_word = match.group(1) if match.groups() else indicator_name
+                semantic_indicators.append(matched_word if matched_word else indicator_name)
+        # Phase 4: Hybrid Detection
+        hybrid_matches = []
+        hybrid_indicators = []
+        for pattern, indicator_name in HYBRID_INDICATORS:
+            match = re.search(pattern, query_lower)
+            if match:
+                hybrid_matches.append(pattern)
+                # Use captured group (matched word) if available, else use indicator name
+                matched_word = match.group(1) if match.groups() else indicator_name
+                hybrid_indicators.append(matched_word if matched_word else indicator_name)
+        # Confidence Scoring
+        # Base scores per match:
+        # - PATTERN: 0.50 base + 0.45 bonus for high-value patterns = 0.95 max
+        # - STRUCTURAL: 0.95 (single AST keyword should be high confidence)
+        # - SEMANTIC: 0.95 (single intent/concept should be high confidence)
+        # - HYBRID: 0.40 (multi-modal indicators)
+        # Note: Scores capped at 0.95 max
+        # Apply bonus for high-value patterns (CONSTANTS, quoted identifiers, explicit grep)
+        pattern_score = len(pattern_matches) * 0.50
+        if pattern_matches:
+            # Check if query contains CONSTANTS (4+ uppercase), quoted strings, or explicit grep
+            if (re.search(r'\b[A-Z_]{4,}\b', query_normalized) or
+                re.search(r'["\'][\w_()\.]+["\']', query_normalized) or
+                re.search(r'\bgrep\b', query_lower)):
+                pattern_score += 0.45  # Bonus to reach 0.95
+        scores = {
+            QueryCategory.PATTERN: pattern_score,
+            QueryCategory.STRUCTURAL: len(structural_matches) * 0.95,
+            QueryCategory.SEMANTIC: len(semantic_matches) * 0.95,
+            QueryCategory.HYBRID: len(hybrid_matches) * 0.40,
+        }
+        # HYBRID preference logic
+        # Exception: Don't boost if PATTERN has high-value matches (they take precedence)
+        has_high_value_pattern = (
+            pattern_matches and
+            (re.search(r'\b[A-Z_]{4,}\b', query_normalized) or
+             re.search(r'["\'][\w_()\.]+["\']', query_normalized) or
+             re.search(r'\bgrep\b', query_lower))
+        )
+        # Count how many non-HYBRID categories have matches
+        categories_with_matches = sum([
+            1 if pattern_matches else 0,
+            1 if structural_matches else 0,
+            1 if semantic_matches else 0,
+        ])
+        # Boost HYBRID score based on type of HYBRID indicator and what categories match
+        # Exception: Don't boost if PATTERN has high-value matches (they take precedence)
+        if hybrid_matches and not has_high_value_pattern:
+            # Check if we have strong HYBRID signals
+            # Look for the actual captured words, not indicator names
+            broad_scope_words = ['across', 'throughout', 'in all', 'system-wide']
+            conjunction_words = ['and', 'then', 'also', 'plus', 'with']
+            vague_words = ['related', 'like']  # Strong vague qualifiers (but not "similar" with design patterns)
+            has_broad_scope = any(word in str(hybrid_indicators).lower() for word in broad_scope_words)
+            has_conjunction = any(word in hybrid_indicators for word in conjunction_words)
+            has_vague = any(word in hybrid_indicators for word in vague_words)
+            # Boost to 0.95 if:
+            # 1. Multiple categories match (PATTERN+SEMANTIC, STRUCTURAL+SEMANTIC, etc.), OR
+            # 2. Broad scope, conjunction, or vague qualifiers (strong HYBRID signals)
+            if categories_with_matches >= 2 or has_broad_scope or has_conjunction or has_vague:
+                scores[QueryCategory.HYBRID] = 0.95
+            # Or if PATTERN or STRUCTURAL matches (even with just 1), boost slightly
+            elif pattern_matches or structural_matches:
+                scores[QueryCategory.HYBRID] = 0.90
+            # For SEMANTIC + "similar" only: don't boost above, handled by tie-breaking
+        # Find maximum score
+        max_score = max(scores.values())
+        # Fallback to HYBRID if no matches
+        if max_score == 0:
+            result = QueryClassification(
+                category=QueryCategory.HYBRID,
+                confidence=0.5,
+                indicators=[],
+                suggested_tool="enhanced_search",
+                reasoning="No clear indicators found, using multi-modal search",
+            )
+            logger.debug(
+                f"QUERY-CLASSIFY: query='{query_normalized[:50]}...' "
+                f"category={result.category.value} "
+                f"confidence={result.confidence:.2f} "
+                f"tool={result.suggested_tool}"
+            )
+            return result
+        # Find all categories with maximum score (potential ties)
+        winners = [cat for cat, score in scores.items() if score == max_score]
+        # Tie-breaking logic
+        if len(winners) > 1:
+            confidence = min(max_score, 0.95)
+            # Prefer PATTERN if it has high-value matches (CONSTANTS, quoted strings, explicit grep)
+            if QueryCategory.PATTERN in winners and has_high_value_pattern:
+                category = QueryCategory.PATTERN
+            # Prefer SEMANTIC if it has design pattern indicators (semantic concept wins over vague "similar")
+            elif QueryCategory.SEMANTIC in winners and any('pattern' in str(ind).lower() for ind in semantic_indicators):
+                category = QueryCategory.SEMANTIC
+            else:
+                # Otherwise use HYBRID for mixed queries
+                category = QueryCategory.HYBRID
+        else:
+            confidence = min(max_score, 0.95)
+            category = winners[0]
+        # Gather all indicators for reporting (use specific names)
+        all_indicators = []
+        if pattern_indicators:
+            all_indicators.extend(pattern_indicators)
+        if structural_indicators:
+            all_indicators.extend(structural_indicators)
+        if semantic_indicators:
+            all_indicators.extend(semantic_indicators)
+        if hybrid_indicators:
+            all_indicators.extend(hybrid_indicators)
+        # Generate reasoning
+        reasoning_parts = []
+        if category == QueryCategory.PATTERN:
+            reasoning_parts.append(
+                "Query contains exact identifiers or code syntax"
+            )
+        elif category == QueryCategory.STRUCTURAL:
+            reasoning_parts.append(
+                "Query requires AST-level understanding of code structure"
+            )
+        elif category == QueryCategory.SEMANTIC:
+            reasoning_parts.append(
+                "Query asks about conceptual logic or behavior"
+            )
+        elif category == QueryCategory.HYBRID:
+            reasoning_parts.append(
+                "Query combines multiple search approaches or is ambiguous"
+            )
+        reasoning = "; ".join(reasoning_parts)
+        result = QueryClassification(
+            category=category,
+            confidence=confidence,
+            indicators=all_indicators,
+            suggested_tool=TOOL_ROUTING[category],
+            reasoning=reasoning,
+        )
+        # Log classification for analytics
+        logger.debug(
+            f"QUERY-CLASSIFY: query='{query_normalized[:50]}...' "
+            f"category={result.category.value} "
+            f"confidence={result.confidence:.2f} "
+            f"tool={result.suggested_tool}"
+        )
+        return result
+    except Exception as e:
+        # Safe fallback on any error
+        logger.exception(f"Error classifying query: {e}")
+        return QueryClassification(
+            category=QueryCategory.HYBRID,
+            confidence=0.5,
+            indicators=["error"],
+            suggested_tool="enhanced_search",
+            reasoning=f"Classification error: {str(e)}, using safe default",
+        )

mcp_bridge/tools/read_file.py ADDED Viewed

@@ -0,0 +1,84 @@
+import os
+from pathlib import Path
+from typing import Optional
+from mcp_bridge.utils.truncation import truncate_output, TruncationStrategy
+from mcp_bridge.utils.cache import IOCache
+async def read_file(
+    path: str,
+    offset: int = 0,
+    limit: Optional[int] = None,
+    max_chars: int = 20000
+) -> str:
+    """
+    Read the contents of a file with smart truncation and log-awareness.
+    """
+    # USER-VISIBLE NOTIFICATION
+    import sys
+    print(f"📖 READ: {path} (offset={offset}, limit={limit})", file=sys.stderr)
+    cache = IOCache.get_instance()
+    cache_key = f"read_file:{os.path.realpath(path)}:{offset}:{limit}:{max_chars}"
+    cached_result = cache.get(cache_key)
+    if cached_result:
+        return cached_result
+    file_path = Path(path)
+    if not file_path.exists():
+        return f"Error: File not found: {path}"
+    if not file_path.is_file():
+        return f"Error: Path is not a file: {path}"
+    try:
+        # Detect log files
+        is_log = file_path.suffix.lower() in (".log", ".out", ".err")
+        # Read lines
+        with open(file_path, "r", encoding="utf-8", errors="replace") as f:
+            lines = f.readlines()
+        total_lines = len(lines)
+        # Default behavior for log files if no limit/offset specified
+        if is_log and limit is None and offset == 0 and total_lines > 100:
+            # Default to last 100 lines for large logs
+            offset = max(0, total_lines - 100)
+            limit = 100
+            strategy = TruncationStrategy.TAIL
+            guidance = "Log file detected. Reading last 100 lines by default."
+        else:
+            strategy = TruncationStrategy.MIDDLE
+            guidance = None
+        # Apply line-based filtering
+        start = offset
+        end = total_lines
+        if limit is not None:
+            end = start + limit
+        selected_lines = lines[start:end]
+        content = "".join(selected_lines)
+        # Apply character-based truncation (universal cap)
+        result = truncate_output(
+            content,
+            limit=max_chars,
+            strategy=strategy,
+            custom_guidance=guidance
+        )
+        # If truncate_output didn't add guidance (because content < max_chars)
+        # but we have log-based guidance, add it manually
+        if guidance and guidance not in result:
+            result = f"{result}\n\n[{guidance}]"
+        # Cache for 5 seconds
+        cache.set(cache_key, result)
+        return result
+    except Exception as e:
+        return f"Error reading file {path}: {str(e)}"

mcp_bridge/tools/replace.py ADDED Viewed

@@ -0,0 +1,45 @@
+import os
+from pathlib import Path
+from mcp_bridge.utils.cache import IOCache
+async def replace(
+    path: str,
+    old_string: str,
+    new_string: str,
+    instruction: str,
+    expected_replacements: int = 1
+) -> str:
+    """
+    Replace text in a file and invalidate cache.
+    """
+    # USER-VISIBLE NOTIFICATION
+    import sys
+    print(f"🔄 REPLACE: {path} (instruction: {instruction})", file=sys.stderr)
+    file_path = Path(path)
+    if not file_path.exists():
+        return f"Error: File not found: {path}"
+    try:
+        content = file_path.read_text(encoding="utf-8")
+        # Check occurrence count
+        count = content.count(old_string)
+        if count == 0:
+            return f"Error: Could not find exact match for old_string in {path}"
+        if count != expected_replacements:
+            return f"Error: Found {count} occurrences of old_string, but expected {expected_replacements} in {path}"
+        # Perform replacement
+        new_content = content.replace(old_string, new_string)
+        file_path.write_text(new_content, encoding="utf-8")
+        # Invalidate cache
+        cache = IOCache.get_instance()
+        cache.invalidate_path(str(file_path))
+        return f"Successfully modified file: {path} ({count} replacements)."
+    except Exception as e:
+        return f"Error modifying file {path}: {str(e)}"

mcp_bridge/tools/run_shell_command.py ADDED Viewed

@@ -0,0 +1,38 @@
+import os
+from mcp_bridge.utils.cache import IOCache
+from mcp_bridge.utils.process import async_execute
+async def run_shell_command(command: str, description: str, dir_path: str = ".") -> str:
+    """
+    Execute a shell command and invalidate cache if it looks like a write.
+    """
+    # USER-VISIBLE NOTIFICATION
+    import sys
+    print(f"🐚 BASH: {command} ({description})", file=sys.stderr)
+    try:
+        # Run command asynchronously
+        result = await async_execute(command, cwd=dir_path, timeout=300)
+        # Check if it looks like a write command (simplistic heuristic)
+        write_keywords = ["git commit", "git push", "rm ", "mv ", "cp ", "touch ", "> ", ">> ", "sed ", "chmod "]
+        is_write = any(kw in command for kw in write_keywords)
+        if is_write:
+            # Broad invalidation for write commands
+            cache = IOCache.get_instance()
+            # If we're in a specific dir, invalidate that dir
+            cache.invalidate_path(os.path.abspath(dir_path))
+        # Format output
+        output = []
+        output.append(f"Command: {command}")
+        output.append(f"Directory: {dir_path}")
+        output.append(f"Stdout: {result.stdout}")
+        output.append(f"Stderr: {result.stderr}")
+        output.append(f"Exit Code: {result.returncode}")
+        return "\n".join(output)
+    except Exception as e:
+        return f"Error executing command: {str(e)}"

stravinsky 0.2.67__py3-none-any.whl → 0.4.66__py3-none-any.whl

Potentially problematic release.

stravinsky 0.2.67py3-none-any.whl → 0.4.66py3-none-any.whl