PyPI - mcp-vector-search - Versions diffs - 0.12.6__py3-none-any.whl → 1.0.3__py3-none-any.whl - Mend

mcp-vector-search 0.12.6py3-none-any.whl → 1.0.3py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (65) hide show

mcp_vector_search/__init__.py +2 -2
mcp_vector_search/analysis/__init__.py +64 -0
mcp_vector_search/analysis/collectors/__init__.py +39 -0
mcp_vector_search/analysis/collectors/base.py +164 -0
mcp_vector_search/analysis/collectors/complexity.py +743 -0
mcp_vector_search/analysis/metrics.py +341 -0
mcp_vector_search/analysis/reporters/__init__.py +5 -0
mcp_vector_search/analysis/reporters/console.py +222 -0
mcp_vector_search/cli/commands/analyze.py +408 -0
mcp_vector_search/cli/commands/chat.py +1262 -0
mcp_vector_search/cli/commands/index.py +21 -3
mcp_vector_search/cli/commands/init.py +13 -0
mcp_vector_search/cli/commands/install.py +597 -335
mcp_vector_search/cli/commands/install_old.py +8 -4
mcp_vector_search/cli/commands/mcp.py +78 -6
mcp_vector_search/cli/commands/reset.py +68 -26
mcp_vector_search/cli/commands/search.py +30 -7
mcp_vector_search/cli/commands/setup.py +1133 -0
mcp_vector_search/cli/commands/status.py +37 -2
mcp_vector_search/cli/commands/uninstall.py +276 -357
mcp_vector_search/cli/commands/visualize/__init__.py +39 -0
mcp_vector_search/cli/commands/visualize/cli.py +276 -0
mcp_vector_search/cli/commands/visualize/exporters/__init__.py +12 -0
mcp_vector_search/cli/commands/visualize/exporters/html_exporter.py +33 -0
mcp_vector_search/cli/commands/visualize/exporters/json_exporter.py +29 -0
mcp_vector_search/cli/commands/visualize/graph_builder.py +714 -0
mcp_vector_search/cli/commands/visualize/layout_engine.py +469 -0
mcp_vector_search/cli/commands/visualize/server.py +311 -0
mcp_vector_search/cli/commands/visualize/state_manager.py +428 -0
mcp_vector_search/cli/commands/visualize/templates/__init__.py +16 -0
mcp_vector_search/cli/commands/visualize/templates/base.py +180 -0
mcp_vector_search/cli/commands/visualize/templates/scripts.py +2507 -0
mcp_vector_search/cli/commands/visualize/templates/styles.py +1313 -0
mcp_vector_search/cli/commands/visualize.py.original +2536 -0
mcp_vector_search/cli/didyoumean.py +22 -2
mcp_vector_search/cli/main.py +115 -159
mcp_vector_search/cli/output.py +24 -8
mcp_vector_search/config/__init__.py +4 -0
mcp_vector_search/config/default_thresholds.yaml +52 -0
mcp_vector_search/config/settings.py +12 -0
mcp_vector_search/config/thresholds.py +185 -0
mcp_vector_search/core/auto_indexer.py +3 -3
mcp_vector_search/core/boilerplate.py +186 -0
mcp_vector_search/core/config_utils.py +394 -0
mcp_vector_search/core/database.py +369 -94
mcp_vector_search/core/exceptions.py +11 -0
mcp_vector_search/core/git_hooks.py +4 -4
mcp_vector_search/core/indexer.py +221 -4
mcp_vector_search/core/llm_client.py +751 -0
mcp_vector_search/core/models.py +3 -0
mcp_vector_search/core/project.py +17 -0
mcp_vector_search/core/scheduler.py +11 -11
mcp_vector_search/core/search.py +179 -29
mcp_vector_search/mcp/server.py +24 -5
mcp_vector_search/utils/__init__.py +2 -0
mcp_vector_search/utils/gitignore_updater.py +212 -0
mcp_vector_search/utils/monorepo.py +66 -4
mcp_vector_search/utils/timing.py +10 -6
{mcp_vector_search-0.12.6.dist-info → mcp_vector_search-1.0.3.dist-info}/METADATA +182 -52
mcp_vector_search-1.0.3.dist-info/RECORD +97 -0
{mcp_vector_search-0.12.6.dist-info → mcp_vector_search-1.0.3.dist-info}/WHEEL +1 -1
{mcp_vector_search-0.12.6.dist-info → mcp_vector_search-1.0.3.dist-info}/entry_points.txt +1 -0
mcp_vector_search/cli/commands/visualize.py +0 -1467
mcp_vector_search-0.12.6.dist-info/RECORD +0 -68
{mcp_vector_search-0.12.6.dist-info → mcp_vector_search-1.0.3.dist-info}/licenses/LICENSE +0 -0

mcp_vector_search/core/git_hooks.py CHANGED Viewed

@@ -126,7 +126,7 @@ class GitHookManager:
         python_path = sys.executable
         project_root = str(self.project_root)
-        script = f'''#!/bin/bash
+        script = f"""#!/bin/bash
 # MCP Vector Search Hook - {hook_type}
 # Auto-generated - do not edit manually
@@ -158,7 +158,7 @@ $MCP_CMD auto-index check --auto-reindex --max-files 10 &> /dev/null || true
 # Exit successfully (don't block Git operations)
 exit 0
-'''
+"""
         return script
     def _integrate_with_existing_hook(self, hook_file: Path, our_script: str) -> bool:
@@ -275,7 +275,7 @@ class GitChangeDetector:
             Set of changed file paths
         """
         try:
-            result = subprocess.run(
+            result = subprocess.run(  # nosec B607
                 ["git", "diff", "--name-only", commit_hash, "HEAD"],
                 cwd=project_root,
                 capture_output=True,
@@ -306,7 +306,7 @@ class GitChangeDetector:
             Set of changed file paths
         """
         try:
-            result = subprocess.run(
+            result = subprocess.run(  # nosec B607
                 ["git", "diff", "--name-only", "HEAD~1", "HEAD"],
                 cwd=project_root,
                 capture_output=True,

mcp_vector_search/core/indexer.py CHANGED Viewed

@@ -5,11 +5,14 @@ import json
 import os
 from datetime import UTC, datetime
 from pathlib import Path
+from typing import Any
 from loguru import logger
 from packaging import version
 from .. import __version__
+from ..analysis.collectors.base import MetricCollector
+from ..analysis.metrics import ChunkMetrics
 from ..config.defaults import ALLOWED_DOTFILES, DEFAULT_IGNORE_PATTERNS
 from ..config.settings import ProjectConfig
 from ..parsers.registry import get_parser_registry
@@ -20,6 +23,19 @@ from .directory_index import DirectoryIndex
 from .exceptions import ParsingError
 from .models import CodeChunk, IndexStats
+# Extension to language mapping for metric collection
+EXTENSION_TO_LANGUAGE = {
+    ".py": "python",
+    ".js": "javascript",
+    ".ts": "typescript",
+    ".jsx": "javascript",
+    ".tsx": "typescript",
+    ".java": "java",
+    ".rs": "rust",
+    ".php": "php",
+    ".rb": "ruby",
+}
 class SemanticIndexer:
     """Semantic indexer for parsing and indexing code files."""
@@ -33,6 +49,7 @@ class SemanticIndexer:
         max_workers: int | None = None,
         batch_size: int = 10,
         debug: bool = False,
+        collectors: list[MetricCollector] | None = None,
     ) -> None:
         """Initialize semantic indexer.
@@ -44,6 +61,7 @@ class SemanticIndexer:
             max_workers: Maximum number of worker threads for parallel processing
             batch_size: Number of files to process in each batch
             debug: Enable debug output for hierarchy building
+            collectors: Metric collectors to run during indexing (defaults to all complexity collectors)
         """
         self.database = database
         self.project_root = project_root
@@ -63,6 +81,11 @@ class SemanticIndexer:
         self._ignore_patterns = set(DEFAULT_IGNORE_PATTERNS)
         self.debug = debug
+        # Initialize metric collectors
+        self.collectors = (
+            collectors if collectors is not None else self._default_collectors()
+        )
         # Safely get event loop for max_workers
         try:
             loop = asyncio.get_event_loop()
@@ -110,6 +133,144 @@ class SemanticIndexer:
         # Load existing directory index
         self.directory_index.load()
+    def _default_collectors(self) -> list[MetricCollector]:
+        """Return default set of metric collectors.
+        Returns:
+            List of all complexity collectors (cognitive, cyclomatic, nesting, parameters, methods)
+        """
+        from ..analysis.collectors.complexity import (
+            CognitiveComplexityCollector,
+            CyclomaticComplexityCollector,
+            MethodCountCollector,
+            NestingDepthCollector,
+            ParameterCountCollector,
+        )
+        return [
+            CognitiveComplexityCollector(),
+            CyclomaticComplexityCollector(),
+            NestingDepthCollector(),
+            ParameterCountCollector(),
+            MethodCountCollector(),
+        ]
+    def _collect_metrics(
+        self, chunk: CodeChunk, source_code: bytes, language: str
+    ) -> ChunkMetrics | None:
+        """Collect metrics for a code chunk.
+        This is a simplified version that estimates metrics from chunk content
+        without full TreeSitter traversal. Future implementation will use
+        TreeSitter node traversal for accurate metric collection.
+        Args:
+            chunk: The parsed code chunk
+            source_code: Raw source code bytes
+            language: Programming language identifier
+        Returns:
+            ChunkMetrics for the chunk, or None if no metrics collected
+        """
+        # For now, create basic metrics from chunk content
+        # TODO: Implement full TreeSitter traversal in Phase 2
+        lines_of_code = chunk.line_count
+        # Estimate complexity from simple heuristics
+        content = chunk.content
+        cognitive_complexity = self._estimate_cognitive_complexity(content)
+        cyclomatic_complexity = self._estimate_cyclomatic_complexity(content)
+        max_nesting_depth = self._estimate_nesting_depth(content)
+        parameter_count = len(chunk.parameters) if chunk.parameters else 0
+        metrics = ChunkMetrics(
+            cognitive_complexity=cognitive_complexity,
+            cyclomatic_complexity=cyclomatic_complexity,
+            max_nesting_depth=max_nesting_depth,
+            parameter_count=parameter_count,
+            lines_of_code=lines_of_code,
+        )
+        return metrics
+    def _estimate_cognitive_complexity(self, content: str) -> int:
+        """Estimate cognitive complexity from content (simplified heuristic).
+        Args:
+            content: Code content
+        Returns:
+            Estimated cognitive complexity score
+        """
+        # Simple heuristic: count control flow keywords
+        keywords = [
+            "if",
+            "elif",
+            "else",
+            "for",
+            "while",
+            "try",
+            "except",
+            "case",
+            "when",
+        ]
+        complexity = 0
+        for keyword in keywords:
+            complexity += content.count(f" {keyword} ")
+            complexity += content.count(f"\t{keyword} ")
+            complexity += content.count(f"\n{keyword} ")
+        return complexity
+    def _estimate_cyclomatic_complexity(self, content: str) -> int:
+        """Estimate cyclomatic complexity from content (simplified heuristic).
+        Args:
+            content: Code content
+        Returns:
+            Estimated cyclomatic complexity score (minimum 1)
+        """
+        # Start with baseline of 1
+        complexity = 1
+        # Count decision points
+        keywords = [
+            "if",
+            "elif",
+            "for",
+            "while",
+            "case",
+            "when",
+            "&&",
+            "||",
+            "and",
+            "or",
+        ]
+        for keyword in keywords:
+            complexity += content.count(keyword)
+        return complexity
+    def _estimate_nesting_depth(self, content: str) -> int:
+        """Estimate maximum nesting depth from indentation (simplified heuristic).
+        Args:
+            content: Code content
+        Returns:
+            Estimated maximum nesting depth
+        """
+        max_depth = 0
+        for line in content.split("\n"):
+            # Count leading whitespace (4 spaces or 1 tab = 1 level)
+            leading = len(line) - len(line.lstrip())
+            if "\t" in line[:leading]:
+                depth = line[:leading].count("\t")
+            else:
+                depth = leading // 4
+            max_depth = max(max_depth, depth)
+        return max_depth
     async def index_project(
         self,
         force_reindex: bool = False,
@@ -379,8 +540,34 @@ class SemanticIndexer:
                 f"After hierarchy build: {methods_with_parents}/{len([c for c in chunks_with_hierarchy if c.chunk_type in ('method', 'function')])} methods have parents"
             )
-            # Add chunks to database
-            await self.database.add_chunks(chunks_with_hierarchy)
+            # Collect metrics for chunks (if collectors are enabled)
+            chunk_metrics: dict[str, Any] | None = None
+            if self.collectors:
+                try:
+                    # Read source code
+                    source_code = file_path.read_bytes()
+                    # Detect language from file extension
+                    language = EXTENSION_TO_LANGUAGE.get(
+                        file_path.suffix.lower(), "unknown"
+                    )
+                    # Collect metrics for each chunk
+                    chunk_metrics = {}
+                    for chunk in chunks_with_hierarchy:
+                        metrics = self._collect_metrics(chunk, source_code, language)
+                        if metrics:
+                            chunk_metrics[chunk.chunk_id] = metrics.to_metadata()
+                    logger.debug(
+                        f"Collected metrics for {len(chunk_metrics)} chunks from {file_path}"
+                    )
+                except Exception as e:
+                    logger.warning(f"Failed to collect metrics for {file_path}: {e}")
+                    chunk_metrics = None
+            # Add chunks to database with metrics
+            await self.database.add_chunks(chunks_with_hierarchy, metrics=chunk_metrics)
             # Update metadata after successful indexing
             metadata = self._load_index_metadata()
@@ -839,8 +1026,38 @@ class SemanticIndexer:
                         # Build hierarchical relationships
                         chunks_with_hierarchy = self._build_chunk_hierarchy(chunks)
-                        # Add chunks to database
-                        await self.database.add_chunks(chunks_with_hierarchy)
+                        # Collect metrics for chunks (if collectors are enabled)
+                        chunk_metrics: dict[str, Any] | None = None
+                        if self.collectors:
+                            try:
+                                # Read source code
+                                source_code = file_path.read_bytes()
+                                # Detect language from file extension
+                                language = EXTENSION_TO_LANGUAGE.get(
+                                    file_path.suffix.lower(), "unknown"
+                                )
+                                # Collect metrics for each chunk
+                                chunk_metrics = {}
+                                for chunk in chunks_with_hierarchy:
+                                    metrics = self._collect_metrics(
+                                        chunk, source_code, language
+                                    )
+                                    if metrics:
+                                        chunk_metrics[chunk.chunk_id] = (
+                                            metrics.to_metadata()
+                                        )
+                            except Exception as e:
+                                logger.warning(
+                                    f"Failed to collect metrics for {file_path}: {e}"
+                                )
+                                chunk_metrics = None
+                        # Add chunks to database with metrics
+                        await self.database.add_chunks(
+                            chunks_with_hierarchy, metrics=chunk_metrics
+                        )
                         chunks_added = len(chunks)
                         logger.debug(f"Indexed {chunks_added} chunks from {file_path}")

mcp-vector-search 0.12.6__py3-none-any.whl → 1.0.3__py3-none-any.whl

mcp-vector-search 0.12.6py3-none-any.whl → 1.0.3py3-none-any.whl