PyPI - kailash - Versions diffs - 0.2.0__py3-none-any.whl → 0.2.2__py3-none-any.whl - Mend

kailash 0.2.0py3-none-any.whl → 0.2.2py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (30) hide show

kailash/api/custom_nodes_secure.py +2 -2
kailash/api/studio_secure.py +1 -1
kailash/mcp/client_new.py +1 -1
kailash/mcp/server_new.py +6 -6
kailash/nodes/ai/a2a.py +1 -1
kailash/nodes/api/__init__.py +21 -0
kailash/nodes/code/python.py +6 -0
kailash/nodes/data/__init__.py +4 -2
kailash/nodes/data/directory.py +278 -0
kailash/nodes/data/sql.py +699 -256
kailash/nodes/transform/processors.py +31 -0
kailash/runtime/local.py +13 -0
kailash/workflow/convergence.py +1 -1
kailash/workflow/cycle_analyzer.py +346 -225
kailash/workflow/cycle_builder.py +75 -69
kailash/workflow/cycle_config.py +62 -46
kailash/workflow/cycle_debugger.py +284 -184
kailash/workflow/cycle_exceptions.py +111 -97
kailash/workflow/cycle_profiler.py +272 -202
kailash/workflow/graph.py +15 -0
kailash/workflow/migration.py +238 -197
kailash/workflow/templates.py +124 -105
kailash/workflow/validation.py +356 -298
kailash-0.2.2.dist-info/METADATA +121 -0
{kailash-0.2.0.dist-info → kailash-0.2.2.dist-info}/RECORD +29 -28
kailash-0.2.0.dist-info/METADATA +0 -1614
{kailash-0.2.0.dist-info → kailash-0.2.2.dist-info}/WHEEL +0 -0
{kailash-0.2.0.dist-info → kailash-0.2.2.dist-info}/entry_points.txt +0 -0
{kailash-0.2.0.dist-info → kailash-0.2.2.dist-info}/licenses/LICENSE +0 -0
{kailash-0.2.0.dist-info → kailash-0.2.2.dist-info}/top_level.txt +0 -0

kailash/api/custom_nodes_secure.py CHANGED Viewed

@@ -350,7 +350,7 @@ async def _execute_api_node(
 ) -> Dict[str, Any]:
     """Execute an API-based custom node"""
-    from kailash.nodes.api.http import HTTPClientNode
+    from kailash.nodes.api.http import HTTPRequestNode
     from kailash.security import TenantContext
     # Execute in tenant context
@@ -359,7 +359,7 @@ async def _execute_api_node(
         api_config = node.implementation.get("api", {})
         # Create HTTP client node
-        http_node = HTTPClientNode(
+        http_node = HTTPRequestNode(
             url=api_config.get("url", ""),
             method=api_config.get("method", "GET"),
             headers=api_config.get("headers", {}),

kailash/api/studio_secure.py CHANGED Viewed

@@ -369,7 +369,7 @@ class WorkflowStudioAPI:
                                 ),
                             }
                         )
-                    except:
+                    except Exception:
                         outputs.append({"name": "output", "type": "any"})
                 else:
                     # Default output for all nodes

kailash/mcp/client_new.py CHANGED Viewed

@@ -292,7 +292,7 @@ class MCPClient:
 # Convenience functions for LLM agents
 async def discover_and_prepare_tools(
-    mcp_servers: List[Union[str, Dict[str, Any]]]
+    mcp_servers: List[Union[str, Dict[str, Any]]],
 ) -> List[Dict[str, Any]]:
     """
     Discover tools from multiple MCP servers and prepare them for LLM use.

kailash/mcp/server_new.py CHANGED Viewed

@@ -14,7 +14,7 @@ from typing import Callable, List, Optional
 try:
     from mcp.server import Server
     from mcp.server.models import InitializationOptions
-    from mcp.types import EmbeddedResource, ImageContent, Resource, TextContent, Tool
+    from mcp.types import Resource, TextContent, Tool
     MCP_AVAILABLE = True
 except ImportError:
@@ -202,15 +202,15 @@ class MCPServer:
                     # Determine type
                     param_type = "string"  # Default
                     if param.annotation != inspect.Parameter.empty:
-                        if param.annotation == int:
+                        if param.annotation is int:
                             param_type = "integer"
-                        elif param.annotation == float:
+                        elif param.annotation is float:
                             param_type = "number"
-                        elif param.annotation == bool:
+                        elif param.annotation is bool:
                             param_type = "boolean"
-                        elif param.annotation == dict:
+                        elif param.annotation is dict:
                             param_type = "object"
-                        elif param.annotation == list:
+                        elif param.annotation is list:
                             param_type = "array"
                     properties[param_name] = {

kailash/nodes/ai/a2a.py CHANGED Viewed

@@ -832,7 +832,7 @@ Focus on actionable intelligence rather than just listing what each agent said."
                     summary = result.get("response", {}).get("content", "")
                     if summary:
                         return f"Shared Context Summary:\n{summary}"
-        except:
+        except Exception:
             pass
         # Fallback to simple summary

kailash/nodes/api/__init__.py CHANGED Viewed

@@ -18,6 +18,8 @@ Design philosophy:
 - Enable both synchronous and asynchronous operation
 """
+import warnings
 from .auth import APIKeyNode, BasicAuthNode, OAuth2Node
 from .graphql import AsyncGraphQLClientNode, GraphQLClientNode
 from .http import AsyncHTTPRequestNode, HTTPRequestNode
@@ -32,6 +34,23 @@ from .rate_limiting import (
 )
 from .rest import AsyncRESTClientNode, RESTClientNode
+# Backwards compatibility aliases
+HTTPClientNode = HTTPRequestNode  # Deprecated: Use HTTPRequestNode instead
+def __getattr__(name):
+    """Provide deprecation warnings for backwards compatibility."""
+    if name == "HTTPClientNode":
+        warnings.warn(
+            "HTTPClientNode is deprecated and will be removed in v0.3.0. "
+            "Use HTTPRequestNode instead.",
+            DeprecationWarning,
+            stacklevel=2,
+        )
+        return HTTPRequestNode
+    raise AttributeError(f"module '{__name__}' has no attribute '{name}'")
 __all__ = [
     "HTTPRequestNode",
     "AsyncHTTPRequestNode",
@@ -49,4 +68,6 @@ __all__ = [
     "RateLimitedAPINode",
     "AsyncRateLimitedAPINode",
     "create_rate_limiter",
+    # Backwards compatibility
+    "HTTPClientNode",  # Deprecated alias
 ]

kailash/nodes/code/python.py CHANGED Viewed

@@ -93,6 +93,12 @@ ALLOWED_MODULES = {
     "matplotlib",
     "seaborn",
     "plotly",
+    # File processing modules
+    "csv",  # For CSV file processing
+    "mimetypes",  # For MIME type detection
+    "pathlib",  # For modern path operations
+    "glob",  # For file pattern matching
+    "xml",  # For XML processing
 }

kailash/nodes/data/__init__.py CHANGED Viewed

@@ -80,6 +80,7 @@ Example Workflows:
     workflow.connect('process', 'publish')
 """
+from kailash.nodes.data.directory import DirectoryReaderNode
 from kailash.nodes.data.readers import CSVReaderNode, JSONReaderNode, TextReaderNode
 from kailash.nodes.data.retrieval import RelevanceScorerNode
 from kailash.nodes.data.sharepoint_graph import (
@@ -87,7 +88,7 @@ from kailash.nodes.data.sharepoint_graph import (
     SharePointGraphWriter,
 )
 from kailash.nodes.data.sources import DocumentSourceNode, QuerySourceNode
-from kailash.nodes.data.sql import SQLDatabaseNode, SQLQueryBuilderNode
+from kailash.nodes.data.sql import SQLDatabaseNode
 from kailash.nodes.data.streaming import (
     EventStreamNode,
     KafkaConsumerNode,
@@ -102,6 +103,8 @@ from kailash.nodes.data.vector_db import (
 from kailash.nodes.data.writers import CSVWriterNode, JSONWriterNode, TextWriterNode
 __all__ = [
+    # Directory
+    "DirectoryReaderNode",
     # Readers
     "CSVReaderNode",
     "JSONReaderNode",
@@ -119,7 +122,6 @@ __all__ = [
     "RelevanceScorerNode",
     # SQL
     "SQLDatabaseNode",
-    "SQLQueryBuilderNode",
     # Vector DB
     "EmbeddingNode",
     "VectorDatabaseNode",

kailash/nodes/data/directory.py ADDED Viewed

@@ -0,0 +1,278 @@
+"""Directory processing nodes for file discovery and batch operations."""
+import mimetypes
+import os
+from datetime import datetime
+from typing import Any, Dict, List, Optional
+from kailash.nodes.base import Node, NodeParameter, register_node
+from kailash.security import validate_file_path
+@register_node()
+class DirectoryReaderNode(Node):
+    """
+    Discovers and catalogs files in a directory with metadata extraction.
+    This node provides comprehensive directory scanning capabilities, handling
+    file discovery, metadata extraction, and filtering. It's designed for
+    batch file processing workflows and dynamic data source discovery.
+    Design Philosophy:
+        The DirectoryReaderNode embodies the principle of "dynamic data discovery."
+        Instead of hardcoding file paths, workflows can dynamically discover
+        available data sources at runtime. This makes workflows more flexible
+        and adaptable to changing data environments.
+    Features:
+        - Recursive directory scanning
+        - File type detection and filtering
+        - Metadata extraction (size, timestamps, MIME types)
+        - Pattern-based filtering
+        - Security-validated path operations
+    Use Cases:
+        - Batch file processing workflows
+        - Dynamic data pipeline creation
+        - File monitoring and cataloging
+        - Multi-format document processing
+        - Data lake exploration
+    Output Format:
+        Returns a structured catalog of discovered files with:
+        - File paths and names
+        - File types and MIME types
+        - File sizes and timestamps
+        - Directory structure information
+    """
+    def get_parameters(self) -> Dict[str, NodeParameter]:
+        """Define input parameters for directory scanning."""
+        return {
+            "directory_path": NodeParameter(
+                name="directory_path",
+                type=str,
+                required=True,
+                description="Path to the directory to scan",
+            ),
+            "recursive": NodeParameter(
+                name="recursive",
+                type=bool,
+                required=False,
+                default=False,
+                description="Whether to scan subdirectories recursively",
+            ),
+            "file_patterns": NodeParameter(
+                name="file_patterns",
+                type=list,
+                required=False,
+                default=[],
+                description="List of file patterns to include (e.g., ['*.csv', '*.json'])",
+            ),
+            "exclude_patterns": NodeParameter(
+                name="exclude_patterns",
+                type=list,
+                required=False,
+                default=[],
+                description="List of file patterns to exclude",
+            ),
+            "include_hidden": NodeParameter(
+                name="include_hidden",
+                type=bool,
+                required=False,
+                default=False,
+                description="Whether to include hidden files (starting with .)",
+            ),
+        }
+    def run(self, **kwargs) -> Dict[str, Any]:
+        """Execute directory scanning operation.
+        Returns:
+            Dictionary containing:
+            - discovered_files: List of file information dictionaries
+            - files_by_type: Files grouped by type
+            - directory_stats: Summary statistics
+        """
+        directory_path = kwargs.get("directory_path")
+        recursive = kwargs.get("recursive", False)
+        file_patterns = kwargs.get("file_patterns", [])
+        exclude_patterns = kwargs.get("exclude_patterns", [])
+        include_hidden = kwargs.get("include_hidden", False)
+        # Validate directory path for security
+        validated_path = validate_file_path(directory_path, operation="directory scan")
+        if not os.path.isdir(validated_path):
+            raise FileNotFoundError(f"Directory not found: {directory_path}")
+        discovered_files = []
+        try:
+            if recursive:
+                # Recursive scan
+                for root, dirs, files in os.walk(validated_path):
+                    for filename in files:
+                        file_path = os.path.join(root, filename)
+                        file_info = self._extract_file_info(
+                            file_path,
+                            filename,
+                            include_hidden,
+                            file_patterns,
+                            exclude_patterns,
+                        )
+                        if file_info:
+                            discovered_files.append(file_info)
+            else:
+                # Single directory scan
+                for filename in os.listdir(validated_path):
+                    file_path = os.path.join(validated_path, filename)
+                    # Skip directories in non-recursive mode
+                    if os.path.isdir(file_path):
+                        continue
+                    file_info = self._extract_file_info(
+                        file_path,
+                        filename,
+                        include_hidden,
+                        file_patterns,
+                        exclude_patterns,
+                    )
+                    if file_info:
+                        discovered_files.append(file_info)
+        except PermissionError as e:
+            raise PermissionError(f"Permission denied accessing directory: {e}")
+        except Exception as e:
+            raise RuntimeError(f"Error scanning directory: {e}")
+        # Group files by type
+        files_by_type = {}
+        for file_info in discovered_files:
+            file_type = file_info["file_type"]
+            if file_type not in files_by_type:
+                files_by_type[file_type] = []
+            files_by_type[file_type].append(file_info)
+        # Generate directory statistics
+        directory_stats = {
+            "total_files": len(discovered_files),
+            "file_types": list(files_by_type.keys()),
+            "files_by_type_count": {
+                file_type: len(files) for file_type, files in files_by_type.items()
+            },
+            "total_size": sum(f["file_size"] for f in discovered_files),
+            "scan_time": datetime.now().isoformat(),
+            "directory_path": directory_path,
+            "recursive": recursive,
+        }
+        return {
+            "discovered_files": discovered_files,
+            "files_by_type": files_by_type,
+            "directory_stats": directory_stats,
+        }
+    def _extract_file_info(
+        self,
+        file_path: str,
+        filename: str,
+        include_hidden: bool,
+        file_patterns: List[str],
+        exclude_patterns: List[str],
+    ) -> Optional[Dict[str, Any]]:
+        """Extract metadata from a single file.
+        Args:
+            file_path: Full path to the file
+            filename: Name of the file
+            include_hidden: Whether to include hidden files
+            file_patterns: Patterns to include
+            exclude_patterns: Patterns to exclude
+        Returns:
+            File information dictionary or None if file should be excluded
+        """
+        # Skip hidden files if not included
+        if not include_hidden and filename.startswith("."):
+            return None
+        # Check exclude patterns
+        for pattern in exclude_patterns:
+            if self._matches_pattern(filename, pattern):
+                return None
+        # Check include patterns (if specified)
+        if file_patterns:
+            included = any(
+                self._matches_pattern(filename, pattern) for pattern in file_patterns
+            )
+            if not included:
+                return None
+        try:
+            # Get file statistics
+            file_stat = os.stat(file_path)
+            file_ext = os.path.splitext(filename)[1].lower()
+            # Map extensions to types
+            ext_to_type = {
+                ".csv": "csv",
+                ".json": "json",
+                ".txt": "txt",
+                ".xml": "xml",
+                ".md": "markdown",
+                ".py": "python",
+                ".js": "javascript",
+                ".html": "html",
+                ".css": "css",
+                ".pdf": "pdf",
+                ".doc": "word",
+                ".docx": "word",
+                ".xls": "excel",
+                ".xlsx": "excel",
+                ".png": "image",
+                ".jpg": "image",
+                ".jpeg": "image",
+                ".gif": "image",
+                ".svg": "image",
+            }
+            file_type = ext_to_type.get(file_ext, "unknown")
+            # Get MIME type
+            mime_type, _ = mimetypes.guess_type(file_path)
+            if not mime_type:
+                mime_type = "application/octet-stream"
+            return {
+                "file_path": file_path,
+                "file_name": filename,
+                "file_type": file_type,
+                "file_extension": file_ext,
+                "file_size": file_stat.st_size,
+                "mime_type": mime_type,
+                "created_time": datetime.fromtimestamp(file_stat.st_ctime).isoformat(),
+                "modified_time": datetime.fromtimestamp(file_stat.st_mtime).isoformat(),
+                "discovered_at": datetime.now().isoformat(),
+            }
+        except (OSError, PermissionError) as e:
+            # Log error but continue with other files
+            self.logger.warning(f"Could not process file {file_path}: {e}")
+            return None
+    def _matches_pattern(self, filename: str, pattern: str) -> bool:
+        """Check if filename matches a glob-style pattern.
+        Args:
+            filename: Name of the file to check
+            pattern: Glob pattern (e.g., '*.csv', 'data*', 'file?.txt')
+        Returns:
+            True if filename matches pattern
+        """
+        import fnmatch
+        return fnmatch.fnmatch(filename, pattern)

kailash 0.2.0__py3-none-any.whl → 0.2.2__py3-none-any.whl

kailash 0.2.0py3-none-any.whl → 0.2.2py3-none-any.whl