PyPI - tree-sitter-analyzer - Versions diffs - 0.9.4__py3-none-any.whl → 0.9.6__py3-none-any.whl - Mend

tree-sitter-analyzer 0.9.4py3-none-any.whl → 0.9.6py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of tree-sitter-analyzer might be problematic. Click here for more details.

Files changed (18) hide show

tree_sitter_analyzer/__init__.py +1 -1
tree_sitter_analyzer/cli/commands/query_command.py +50 -35
tree_sitter_analyzer/cli_main.py +21 -0
tree_sitter_analyzer/core/query_filter.py +200 -0
tree_sitter_analyzer/core/query_service.py +162 -0
tree_sitter_analyzer/encoding_utils.py +7 -4
tree_sitter_analyzer/mcp/resources/code_file_resource.py +1 -2
tree_sitter_analyzer/mcp/server.py +7 -1
tree_sitter_analyzer/mcp/tools/query_tool.py +238 -0
tree_sitter_analyzer/queries/java.py +5 -0
tree_sitter_analyzer/security/boundary_manager.py +10 -2
tree_sitter_analyzer/table_formatter.py +6 -1
tree_sitter_analyzer/utils.py +51 -40
tree_sitter_analyzer-0.9.6.dist-info/METADATA +631 -0
{tree_sitter_analyzer-0.9.4.dist-info → tree_sitter_analyzer-0.9.6.dist-info}/RECORD +17 -14
tree_sitter_analyzer-0.9.4.dist-info/METADATA +0 -409
{tree_sitter_analyzer-0.9.4.dist-info → tree_sitter_analyzer-0.9.6.dist-info}/WHEEL +0 -0
{tree_sitter_analyzer-0.9.4.dist-info → tree_sitter_analyzer-0.9.6.dist-info}/entry_points.txt +0 -0

tree_sitter_analyzer/mcp/tools/query_tool.py ADDED Viewed

@@ -0,0 +1,238 @@
+#!/usr/bin/env python3
+"""
+Query Tool for MCP
+MCP tool providing tree-sitter query functionality using unified QueryService.
+Supports both predefined query keys and custom query strings.
+"""
+import logging
+from typing import Any
+from ...core.query_service import QueryService
+from ...language_detector import detect_language_from_file
+from ...security import SecurityValidator
+from ..utils.error_handler import handle_mcp_errors
+logger = logging.getLogger(__name__)
+class QueryTool:
+    """MCP query tool providing tree-sitter query functionality"""
+    def __init__(self, project_root: str | None = None) -> None:
+        """Initialize query tool"""
+        self.project_root = project_root
+        self.query_service = QueryService(project_root)
+        self.security_validator = SecurityValidator(project_root)
+    def get_tool_definition(self) -> dict[str, Any]:
+        """
+        Get MCP tool definition
+        Returns:
+            Tool definition dictionary
+        """
+        return {
+            "name": "query_code",
+            "description": "Execute tree-sitter queries on code files to extract specific code elements",
+            "inputSchema": {
+                "type": "object",
+                "properties": {
+                    "file_path": {
+                        "type": "string",
+                        "description": "Path to the code file to query (relative to project root)",
+                    },
+                    "language": {
+                        "type": "string",
+                        "description": "Programming language (optional, auto-detected if not provided)",
+                    },
+                    "query_key": {
+                        "type": "string",
+                        "description": "Predefined query key (e.g., 'methods', 'class', 'functions')",
+                    },
+                    "query_string": {
+                        "type": "string",
+                        "description": "Custom tree-sitter query string (e.g., '(method_declaration) @method')",
+                    },
+                    "filter": {
+                        "type": "string",
+                        "description": "Filter expression to refine results (e.g., 'name=main', 'name=~get*,public=true')",
+                    },
+                    "output_format": {
+                        "type": "string",
+                        "enum": ["json", "summary"],
+                        "default": "json",
+                        "description": "Output format",
+                    },
+                },
+                "required": ["file_path"],
+                "anyOf": [
+                    {"required": ["query_key"]},
+                    {"required": ["query_string"]},
+                ],
+            },
+        }
+    @handle_mcp_errors
+    async def execute(self, arguments: dict[str, Any]) -> dict[str, Any]:
+        """
+        Execute query tool
+        Args:
+            arguments: Tool arguments
+        Returns:
+            Query results
+        """
+        # Validate input parameters
+        file_path = arguments.get("file_path")
+        if not file_path:
+            raise ValueError("file_path is required")
+        # Security validation
+        validated_path = self.security_validator.validate_file_path(file_path)
+        # Get query parameters
+        query_key = arguments.get("query_key")
+        query_string = arguments.get("query_string")
+        filter_expression = arguments.get("filter")
+        output_format = arguments.get("output_format", "json")
+        if not query_key and not query_string:
+            raise ValueError("Either query_key or query_string must be provided")
+        if query_key and query_string:
+            raise ValueError("Cannot provide both query_key and query_string")
+        # Detect language
+        language = arguments.get("language")
+        if not language:
+            language = detect_language_from_file(validated_path)
+            if not language:
+                raise ValueError(f"Could not detect language for file: {file_path}")
+        try:
+            # Execute query
+            results = await self.query_service.execute_query(
+                validated_path, language, query_key, query_string, filter_expression
+            )
+            if not results:
+                return {
+                    "success": True,
+                    "message": "No results found matching the query",
+                    "results": [],
+                    "count": 0,
+                }
+            # Format output
+            if output_format == "summary":
+                return self._format_summary(results, query_key or "custom", language)
+            else:
+                return {
+                    "success": True,
+                    "results": results,
+                    "count": len(results),
+                    "file_path": file_path,
+                    "language": language,
+                    "query": query_key or query_string,
+                }
+        except Exception as e:
+            logger.error(f"Query execution failed: {e}")
+            return {
+                "success": False,
+                "error": str(e),
+                "file_path": file_path,
+                "language": language,
+            }
+    def _format_summary(
+        self, results: list[dict[str, Any]], query_type: str, language: str
+    ) -> dict[str, Any]:
+        """
+        Format summary output
+        Args:
+            results: Query results
+            query_type: Query type
+            language: Programming language
+        Returns:
+            Summary formatted results
+        """
+        # Group by capture name
+        by_capture = {}
+        for result in results:
+            capture_name = result["capture_name"]
+            if capture_name not in by_capture:
+                by_capture[capture_name] = []
+            by_capture[capture_name].append(result)
+        # Create summary
+        summary = {
+            "success": True,
+            "query_type": query_type,
+            "language": language,
+            "total_count": len(results),
+            "captures": {},
+        }
+        for capture_name, items in by_capture.items():
+            summary["captures"][capture_name] = {
+                "count": len(items),
+                "items": [
+                    {
+                        "name": self._extract_name_from_content(item["content"]),
+                        "line_range": f"{item['start_line']}-{item['end_line']}",
+                        "node_type": item["node_type"],
+                    }
+                    for item in items
+                ],
+            }
+        return summary
+    def _extract_name_from_content(self, content: str) -> str:
+        """
+        Extract name from content (simple heuristic method)
+        Args:
+            content: Code content
+        Returns:
+            Extracted name
+        """
+        # Simple name extraction logic, can be improved as needed
+        lines = content.strip().split("\n")
+        if lines:
+            first_line = lines[0].strip()
+            # Extract method names, class names, etc.
+            import re
+            # Match common declaration patterns
+            patterns = [
+                r"(?:public|private|protected)?\s*(?:static)?\s*(?:class|interface)\s+(\w+)",  # class/interface
+                r"(?:public|private|protected)?\s*(?:static)?\s*\w+\s+(\w+)\s*\(",  # method
+                r"(\w+)\s*\(",  # simple function call
+            ]
+            for pattern in patterns:
+                match = re.search(pattern, first_line)
+                if match:
+                    return match.group(1)
+        return "unnamed"
+    def get_available_queries(self, language: str) -> list[str]:
+        """
+        Get available query keys
+        Args:
+            language: Programming language
+        Returns:
+            List of available query keys
+        """
+        return self.query_service.get_available_queries(language)

tree_sitter_analyzer/queries/java.py CHANGED Viewed

@@ -356,6 +356,11 @@ ALL_QUERIES["functions"] = {
     "description": "Search all function/method declarations (alias for method)",
 }
+ALL_QUERIES["methods"] = {
+    "query": JAVA_QUERIES["method"],
+    "description": "Search all method declarations (alias for method)",
+}
 ALL_QUERIES["classes"] = {
     "query": JAVA_QUERIES["class"],
     "description": "Search all class declarations (alias for class)",

tree_sitter_analyzer/security/boundary_manager.py CHANGED Viewed

@@ -189,7 +189,15 @@ class ProjectBoundaryManager:
             if not os.path.exists(file_path):
                 return True  # Non-existent files are safe
-            # Check if any component in the path is a symlink
+            # If the fully resolved path is within project boundaries, we treat it as safe.
+            # This makes the check tolerant to system-level symlinks like
+            # /var -> /private/var on macOS runners.
+            resolved = os.path.realpath(file_path)
+            if self.is_within_project(resolved):
+                return True
+            # Otherwise, inspect each path component symlink to ensure no hop jumps outside
+            # the allowed directories.
             path_parts = Path(file_path).parts
             current_path = ""
@@ -199,7 +207,6 @@ class ProjectBoundaryManager:
                 )
                 if os.path.islink(current_path):
-                    # Check if symlink target is within boundaries
                     target = os.path.realpath(current_path)
                     if not self.is_within_project(target):
                         log_warning(
@@ -207,6 +214,7 @@ class ProjectBoundaryManager:
                         )
                         return False
+            # If no unsafe hop found, consider safe
             return True
         except Exception as e:

tree_sitter_analyzer/table_formatter.py CHANGED Viewed

@@ -616,7 +616,12 @@ class TableFormatter:
             type_name = str(type_name)
         # At this point, type_name is guaranteed to be a string
-        assert isinstance(type_name, str)
+        # Defensive check (avoid using assert for runtime safety and security checks)
+        if not isinstance(type_name, str):
+            try:
+                type_name = str(type_name)
+            except Exception:
+                type_name = "O"
         type_mapping = {
             "String": "S",

tree_sitter_analyzer/utils.py CHANGED Viewed

@@ -51,10 +51,13 @@ def setup_logger(
             logger.addHandler(file_handler)
         except Exception as e:
             # Never let logging configuration break runtime behavior; log to stderr if possible
-            try:
-                sys.stderr.write(f"[logging_setup] file handler init skipped: {e}\n")
-            except Exception:
-                pass
+            if hasattr(sys, "stderr") and hasattr(sys.stderr, "write"):
+                try:
+                    sys.stderr.write(
+                        f"[logging_setup] file handler init skipped: {e}\n"
+                    )
+                except Exception:
+                    ...
         logger.setLevel(level)
@@ -111,17 +114,19 @@ def setup_safe_logging_shutdown() -> None:
                         handler.close()
                         logger.removeHandler(handler)
                     except Exception as e:
-                        try:
-                            sys.stderr.write(
-                                f"[logging_cleanup] handler close/remove skipped: {e}\n"
-                            )
-                        except Exception:
-                            pass
+                        if hasattr(sys, "stderr") and hasattr(sys.stderr, "write"):
+                            try:
+                                sys.stderr.write(
+                                    f"[logging_cleanup] handler close/remove skipped: {e}\n"
+                                )
+                            except Exception:
+                                ...
         except Exception as e:
-            try:
-                sys.stderr.write(f"[logging_cleanup] cleanup skipped: {e}\n")
-            except Exception:
-                pass
+            if hasattr(sys, "stderr") and hasattr(sys.stderr, "write"):
+                try:
+                    sys.stderr.write(f"[logging_cleanup] cleanup skipped: {e}\n")
+                except Exception:
+                    ...
     # Register cleanup function
     atexit.register(cleanup_logging)
@@ -140,10 +145,11 @@ def log_info(message: str, *args: Any, **kwargs: Any) -> None:
     try:
         logger.info(message, *args, **kwargs)
     except (ValueError, OSError) as e:
-        try:
-            sys.stderr.write(f"[log_info] suppressed: {e}\n")
-        except Exception:
-            pass
+        if hasattr(sys, "stderr") and hasattr(sys.stderr, "write"):
+            try:
+                sys.stderr.write(f"[log_info] suppressed: {e}\n")
+            except Exception:
+                ...
 def log_warning(message: str, *args: Any, **kwargs: Any) -> None:
@@ -151,10 +157,11 @@ def log_warning(message: str, *args: Any, **kwargs: Any) -> None:
     try:
         logger.warning(message, *args, **kwargs)
     except (ValueError, OSError) as e:
-        try:
-            sys.stderr.write(f"[log_warning] suppressed: {e}\n")
-        except Exception:
-            pass
+        if hasattr(sys, "stderr") and hasattr(sys.stderr, "write"):
+            try:
+                sys.stderr.write(f"[log_warning] suppressed: {e}\n")
+            except Exception:
+                ...
 def log_error(message: str, *args: Any, **kwargs: Any) -> None:
@@ -162,10 +169,11 @@ def log_error(message: str, *args: Any, **kwargs: Any) -> None:
     try:
         logger.error(message, *args, **kwargs)
     except (ValueError, OSError) as e:
-        try:
-            sys.stderr.write(f"[log_error] suppressed: {e}\n")
-        except Exception:
-            pass
+        if hasattr(sys, "stderr") and hasattr(sys.stderr, "write"):
+            try:
+                sys.stderr.write(f"[log_error] suppressed: {e}\n")
+            except Exception:
+                ...
 def log_debug(message: str, *args: Any, **kwargs: Any) -> None:
@@ -173,10 +181,11 @@ def log_debug(message: str, *args: Any, **kwargs: Any) -> None:
     try:
         logger.debug(message, *args, **kwargs)
     except (ValueError, OSError) as e:
-        try:
-            sys.stderr.write(f"[log_debug] suppressed: {e}\n")
-        except Exception:
-            pass
+        if hasattr(sys, "stderr") and hasattr(sys.stderr, "write"):
+            try:
+                sys.stderr.write(f"[log_debug] suppressed: {e}\n")
+            except Exception:
+                ...
 def suppress_output(func: Any) -> Any:
@@ -199,12 +208,13 @@ def suppress_output(func: Any) -> Any:
             try:
                 sys.stdout.close()
             except Exception as e:
-                try:
-                    sys.stderr.write(
-                        f"[suppress_output] stdout close suppressed: {e}\n"
-                    )
-                except Exception:
-                    pass
+                if hasattr(sys, "stderr") and hasattr(sys.stderr, "write"):
+                    try:
+                        sys.stderr.write(
+                            f"[suppress_output] stdout close suppressed: {e}\n"
+                        )
+                    except Exception:
+                        ...
             sys.stdout = old_stdout
         return result
@@ -282,10 +292,11 @@ def log_performance(
             message += f" - {detail_str}"
         perf_logger.debug(message)  # Change to DEBUG level
     except (ValueError, OSError) as e:
-        try:
-            sys.stderr.write(f"[log_performance] suppressed: {e}\n")
-        except Exception:
-            pass
+        if hasattr(sys, "stderr") and hasattr(sys.stderr, "write"):
+            try:
+                sys.stderr.write(f"[log_performance] suppressed: {e}\n")
+            except Exception:
+                ...
 def setup_performance_logger() -> logging.Logger:

tree-sitter-analyzer 0.9.4__py3-none-any.whl → 0.9.6__py3-none-any.whl

Potentially problematic release.

tree-sitter-analyzer 0.9.4py3-none-any.whl → 0.9.6py3-none-any.whl