PyPI - alita-sdk - Versions diffs - 0.3.462__py3-none-any.whl → 0.3.627__py3-none-any.whl - Mend

alita-sdk 0.3.462py3-none-any.whl → 0.3.627py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (261) hide show

alita_sdk/cli/agent/__init__.py +5 -0
alita_sdk/cli/agent/default.py +258 -0
alita_sdk/cli/agent_executor.py +15 -3
alita_sdk/cli/agent_loader.py +56 -8
alita_sdk/cli/agent_ui.py +93 -31
alita_sdk/cli/agents.py +2274 -230
alita_sdk/cli/callbacks.py +96 -25
alita_sdk/cli/cli.py +10 -1
alita_sdk/cli/config.py +162 -9
alita_sdk/cli/context/__init__.py +30 -0
alita_sdk/cli/context/cleanup.py +198 -0
alita_sdk/cli/context/manager.py +731 -0
alita_sdk/cli/context/message.py +285 -0
alita_sdk/cli/context/strategies.py +289 -0
alita_sdk/cli/context/token_estimation.py +127 -0
alita_sdk/cli/input_handler.py +419 -0
alita_sdk/cli/inventory.py +1073 -0
alita_sdk/cli/testcases/__init__.py +94 -0
alita_sdk/cli/testcases/data_generation.py +119 -0
alita_sdk/cli/testcases/discovery.py +96 -0
alita_sdk/cli/testcases/executor.py +84 -0
alita_sdk/cli/testcases/logger.py +85 -0
alita_sdk/cli/testcases/parser.py +172 -0
alita_sdk/cli/testcases/prompts.py +91 -0
alita_sdk/cli/testcases/reporting.py +125 -0
alita_sdk/cli/testcases/setup.py +108 -0
alita_sdk/cli/testcases/test_runner.py +282 -0
alita_sdk/cli/testcases/utils.py +39 -0
alita_sdk/cli/testcases/validation.py +90 -0
alita_sdk/cli/testcases/workflow.py +196 -0
alita_sdk/cli/toolkit.py +14 -17
alita_sdk/cli/toolkit_loader.py +35 -5
alita_sdk/cli/tools/__init__.py +36 -2
alita_sdk/cli/tools/approval.py +224 -0
alita_sdk/cli/tools/filesystem.py +910 -64
alita_sdk/cli/tools/planning.py +389 -0
alita_sdk/cli/tools/terminal.py +414 -0
alita_sdk/community/__init__.py +72 -12
alita_sdk/community/inventory/__init__.py +236 -0
alita_sdk/community/inventory/config.py +257 -0
alita_sdk/community/inventory/enrichment.py +2137 -0
alita_sdk/community/inventory/extractors.py +1469 -0
alita_sdk/community/inventory/ingestion.py +3172 -0
alita_sdk/community/inventory/knowledge_graph.py +1457 -0
alita_sdk/community/inventory/parsers/__init__.py +218 -0
alita_sdk/community/inventory/parsers/base.py +295 -0
alita_sdk/community/inventory/parsers/csharp_parser.py +907 -0
alita_sdk/community/inventory/parsers/go_parser.py +851 -0
alita_sdk/community/inventory/parsers/html_parser.py +389 -0
alita_sdk/community/inventory/parsers/java_parser.py +593 -0
alita_sdk/community/inventory/parsers/javascript_parser.py +629 -0
alita_sdk/community/inventory/parsers/kotlin_parser.py +768 -0
alita_sdk/community/inventory/parsers/markdown_parser.py +362 -0
alita_sdk/community/inventory/parsers/python_parser.py +604 -0
alita_sdk/community/inventory/parsers/rust_parser.py +858 -0
alita_sdk/community/inventory/parsers/swift_parser.py +832 -0
alita_sdk/community/inventory/parsers/text_parser.py +322 -0
alita_sdk/community/inventory/parsers/yaml_parser.py +370 -0
alita_sdk/community/inventory/patterns/__init__.py +61 -0
alita_sdk/community/inventory/patterns/ast_adapter.py +380 -0
alita_sdk/community/inventory/patterns/loader.py +348 -0
alita_sdk/community/inventory/patterns/registry.py +198 -0
alita_sdk/community/inventory/presets.py +535 -0
alita_sdk/community/inventory/retrieval.py +1403 -0
alita_sdk/community/inventory/toolkit.py +173 -0
alita_sdk/community/inventory/toolkit_utils.py +176 -0
alita_sdk/community/inventory/visualize.py +1370 -0
alita_sdk/configurations/__init__.py +1 -1
alita_sdk/configurations/ado.py +141 -20
alita_sdk/configurations/bitbucket.py +0 -3
alita_sdk/configurations/confluence.py +76 -42
alita_sdk/configurations/figma.py +76 -0
alita_sdk/configurations/gitlab.py +17 -5
alita_sdk/configurations/openapi.py +329 -0
alita_sdk/configurations/qtest.py +72 -1
alita_sdk/configurations/report_portal.py +96 -0
alita_sdk/configurations/sharepoint.py +148 -0
alita_sdk/configurations/testio.py +83 -0
alita_sdk/runtime/clients/artifact.py +3 -3
alita_sdk/runtime/clients/client.py +353 -48
alita_sdk/runtime/clients/sandbox_client.py +0 -21
alita_sdk/runtime/langchain/_constants_bkup.py +1318 -0
alita_sdk/runtime/langchain/assistant.py +123 -26
alita_sdk/runtime/langchain/constants.py +642 -1
alita_sdk/runtime/langchain/document_loaders/AlitaExcelLoader.py +103 -60
alita_sdk/runtime/langchain/document_loaders/AlitaJSONLinesLoader.py +77 -0
alita_sdk/runtime/langchain/document_loaders/AlitaJSONLoader.py +6 -3
alita_sdk/runtime/langchain/document_loaders/AlitaPowerPointLoader.py +226 -7
alita_sdk/runtime/langchain/document_loaders/AlitaTextLoader.py +5 -2
alita_sdk/runtime/langchain/document_loaders/constants.py +12 -7
alita_sdk/runtime/langchain/langraph_agent.py +279 -73
alita_sdk/runtime/langchain/utils.py +82 -15
alita_sdk/runtime/llms/preloaded.py +2 -6
alita_sdk/runtime/skills/__init__.py +91 -0
alita_sdk/runtime/skills/callbacks.py +498 -0
alita_sdk/runtime/skills/discovery.py +540 -0
alita_sdk/runtime/skills/executor.py +610 -0
alita_sdk/runtime/skills/input_builder.py +371 -0
alita_sdk/runtime/skills/models.py +330 -0
alita_sdk/runtime/skills/registry.py +355 -0
alita_sdk/runtime/skills/skill_runner.py +330 -0
alita_sdk/runtime/toolkits/__init__.py +7 -0
alita_sdk/runtime/toolkits/application.py +21 -9
alita_sdk/runtime/toolkits/artifact.py +15 -5
alita_sdk/runtime/toolkits/datasource.py +13 -6
alita_sdk/runtime/toolkits/mcp.py +139 -251
alita_sdk/runtime/toolkits/mcp_config.py +1048 -0
alita_sdk/runtime/toolkits/planning.py +178 -0
alita_sdk/runtime/toolkits/skill_router.py +238 -0
alita_sdk/runtime/toolkits/subgraph.py +251 -6
alita_sdk/runtime/toolkits/tools.py +238 -32
alita_sdk/runtime/toolkits/vectorstore.py +11 -5
alita_sdk/runtime/tools/__init__.py +3 -1
alita_sdk/runtime/tools/application.py +20 -6
alita_sdk/runtime/tools/artifact.py +511 -28
alita_sdk/runtime/tools/data_analysis.py +183 -0
alita_sdk/runtime/tools/function.py +43 -15
alita_sdk/runtime/tools/image_generation.py +50 -44
alita_sdk/runtime/tools/llm.py +852 -67
alita_sdk/runtime/tools/loop.py +3 -1
alita_sdk/runtime/tools/loop_output.py +3 -1
alita_sdk/runtime/tools/mcp_remote_tool.py +25 -10
alita_sdk/runtime/tools/mcp_server_tool.py +7 -6
alita_sdk/runtime/tools/planning/__init__.py +36 -0
alita_sdk/runtime/tools/planning/models.py +246 -0
alita_sdk/runtime/tools/planning/wrapper.py +607 -0
alita_sdk/runtime/tools/router.py +2 -4
alita_sdk/runtime/tools/sandbox.py +9 -6
alita_sdk/runtime/tools/skill_router.py +776 -0
alita_sdk/runtime/tools/tool.py +3 -1
alita_sdk/runtime/tools/vectorstore.py +7 -2
alita_sdk/runtime/tools/vectorstore_base.py +51 -11
alita_sdk/runtime/utils/AlitaCallback.py +137 -21
alita_sdk/runtime/utils/constants.py +5 -1
alita_sdk/runtime/utils/mcp_client.py +492 -0
alita_sdk/runtime/utils/mcp_oauth.py +202 -5
alita_sdk/runtime/utils/mcp_sse_client.py +36 -7
alita_sdk/runtime/utils/mcp_tools_discovery.py +124 -0
alita_sdk/runtime/utils/serialization.py +155 -0
alita_sdk/runtime/utils/streamlit.py +6 -10
alita_sdk/runtime/utils/toolkit_utils.py +16 -5
alita_sdk/runtime/utils/utils.py +36 -0
alita_sdk/tools/__init__.py +113 -29
alita_sdk/tools/ado/repos/__init__.py +51 -33
alita_sdk/tools/ado/repos/repos_wrapper.py +148 -89
alita_sdk/tools/ado/test_plan/__init__.py +25 -9
alita_sdk/tools/ado/test_plan/test_plan_wrapper.py +23 -1
alita_sdk/tools/ado/utils.py +1 -18
alita_sdk/tools/ado/wiki/__init__.py +25 -8
alita_sdk/tools/ado/wiki/ado_wrapper.py +291 -22
alita_sdk/tools/ado/work_item/__init__.py +26 -9
alita_sdk/tools/ado/work_item/ado_wrapper.py +56 -3
alita_sdk/tools/advanced_jira_mining/__init__.py +11 -8
alita_sdk/tools/aws/delta_lake/__init__.py +13 -9
alita_sdk/tools/aws/delta_lake/tool.py +5 -1
alita_sdk/tools/azure_ai/search/__init__.py +11 -8
alita_sdk/tools/azure_ai/search/api_wrapper.py +1 -1
alita_sdk/tools/base/tool.py +5 -1
alita_sdk/tools/base_indexer_toolkit.py +170 -45
alita_sdk/tools/bitbucket/__init__.py +17 -12
alita_sdk/tools/bitbucket/api_wrapper.py +59 -11
alita_sdk/tools/bitbucket/cloud_api_wrapper.py +49 -35
alita_sdk/tools/browser/__init__.py +5 -4
alita_sdk/tools/carrier/__init__.py +5 -6
alita_sdk/tools/carrier/backend_reports_tool.py +6 -6
alita_sdk/tools/carrier/run_ui_test_tool.py +6 -6
alita_sdk/tools/carrier/ui_reports_tool.py +5 -5
alita_sdk/tools/chunkers/__init__.py +3 -1
alita_sdk/tools/chunkers/code/treesitter/treesitter.py +37 -13
alita_sdk/tools/chunkers/sematic/json_chunker.py +1 -0
alita_sdk/tools/chunkers/sematic/markdown_chunker.py +97 -6
alita_sdk/tools/chunkers/universal_chunker.py +270 -0
alita_sdk/tools/cloud/aws/__init__.py +10 -7
alita_sdk/tools/cloud/azure/__init__.py +10 -7
alita_sdk/tools/cloud/gcp/__init__.py +10 -7
alita_sdk/tools/cloud/k8s/__init__.py +10 -7
alita_sdk/tools/code/linter/__init__.py +10 -8
alita_sdk/tools/code/loaders/codesearcher.py +3 -2
alita_sdk/tools/code/sonar/__init__.py +10 -7
alita_sdk/tools/code_indexer_toolkit.py +73 -23
alita_sdk/tools/confluence/__init__.py +21 -15
alita_sdk/tools/confluence/api_wrapper.py +78 -23
alita_sdk/tools/confluence/loader.py +4 -2
alita_sdk/tools/custom_open_api/__init__.py +12 -5
alita_sdk/tools/elastic/__init__.py +11 -8
alita_sdk/tools/elitea_base.py +493 -30
alita_sdk/tools/figma/__init__.py +58 -11
alita_sdk/tools/figma/api_wrapper.py +1235 -143
alita_sdk/tools/figma/figma_client.py +73 -0
alita_sdk/tools/figma/toon_tools.py +2748 -0
alita_sdk/tools/github/__init__.py +13 -14
alita_sdk/tools/github/github_client.py +224 -100
alita_sdk/tools/github/graphql_client_wrapper.py +119 -33
alita_sdk/tools/github/schemas.py +14 -5
alita_sdk/tools/github/tool.py +5 -1
alita_sdk/tools/github/tool_prompts.py +9 -22
alita_sdk/tools/gitlab/__init__.py +15 -11
alita_sdk/tools/gitlab/api_wrapper.py +207 -41
alita_sdk/tools/gitlab_org/__init__.py +10 -8
alita_sdk/tools/gitlab_org/api_wrapper.py +63 -64
alita_sdk/tools/google/bigquery/__init__.py +13 -12
alita_sdk/tools/google/bigquery/tool.py +5 -1
alita_sdk/tools/google_places/__init__.py +10 -8
alita_sdk/tools/google_places/api_wrapper.py +1 -1
alita_sdk/tools/jira/__init__.py +17 -11
alita_sdk/tools/jira/api_wrapper.py +91 -40
alita_sdk/tools/keycloak/__init__.py +11 -8
alita_sdk/tools/localgit/__init__.py +9 -3
alita_sdk/tools/localgit/local_git.py +62 -54
alita_sdk/tools/localgit/tool.py +5 -1
alita_sdk/tools/memory/__init__.py +11 -3
alita_sdk/tools/non_code_indexer_toolkit.py +1 -0
alita_sdk/tools/ocr/__init__.py +11 -8
alita_sdk/tools/openapi/__init__.py +490 -114
alita_sdk/tools/openapi/api_wrapper.py +1368 -0
alita_sdk/tools/openapi/tool.py +20 -0
alita_sdk/tools/pandas/__init__.py +20 -12
alita_sdk/tools/pandas/api_wrapper.py +38 -25
alita_sdk/tools/pandas/dataframe/generator/base.py +3 -1
alita_sdk/tools/postman/__init__.py +11 -11
alita_sdk/tools/pptx/__init__.py +10 -9
alita_sdk/tools/pptx/pptx_wrapper.py +1 -1
alita_sdk/tools/qtest/__init__.py +30 -10
alita_sdk/tools/qtest/api_wrapper.py +430 -13
alita_sdk/tools/rally/__init__.py +10 -8
alita_sdk/tools/rally/api_wrapper.py +1 -1
alita_sdk/tools/report_portal/__init__.py +12 -9
alita_sdk/tools/salesforce/__init__.py +10 -9
alita_sdk/tools/servicenow/__init__.py +17 -14
alita_sdk/tools/servicenow/api_wrapper.py +1 -1
alita_sdk/tools/sharepoint/__init__.py +10 -8
alita_sdk/tools/sharepoint/api_wrapper.py +4 -4
alita_sdk/tools/slack/__init__.py +10 -8
alita_sdk/tools/slack/api_wrapper.py +2 -2
alita_sdk/tools/sql/__init__.py +11 -9
alita_sdk/tools/testio/__init__.py +10 -8
alita_sdk/tools/testrail/__init__.py +11 -8
alita_sdk/tools/testrail/api_wrapper.py +1 -1
alita_sdk/tools/utils/__init__.py +9 -4
alita_sdk/tools/utils/content_parser.py +77 -3
alita_sdk/tools/utils/text_operations.py +410 -0
alita_sdk/tools/utils/tool_prompts.py +79 -0
alita_sdk/tools/vector_adapters/VectorStoreAdapter.py +17 -13
alita_sdk/tools/xray/__init__.py +12 -9
alita_sdk/tools/yagmail/__init__.py +9 -3
alita_sdk/tools/zephyr/__init__.py +9 -7
alita_sdk/tools/zephyr_enterprise/__init__.py +11 -8
alita_sdk/tools/zephyr_essential/__init__.py +10 -8
alita_sdk/tools/zephyr_essential/api_wrapper.py +30 -13
alita_sdk/tools/zephyr_essential/client.py +2 -2
alita_sdk/tools/zephyr_scale/__init__.py +11 -9
alita_sdk/tools/zephyr_scale/api_wrapper.py +2 -2
alita_sdk/tools/zephyr_squad/__init__.py +10 -8
{alita_sdk-0.3.462.dist-info → alita_sdk-0.3.627.dist-info}/METADATA +147 -7
alita_sdk-0.3.627.dist-info/RECORD +468 -0
alita_sdk-0.3.627.dist-info/entry_points.txt +2 -0
alita_sdk-0.3.462.dist-info/RECORD +0 -384
alita_sdk-0.3.462.dist-info/entry_points.txt +0 -2
{alita_sdk-0.3.462.dist-info → alita_sdk-0.3.627.dist-info}/WHEEL +0 -0
{alita_sdk-0.3.462.dist-info → alita_sdk-0.3.627.dist-info}/licenses/LICENSE +0 -0
{alita_sdk-0.3.462.dist-info → alita_sdk-0.3.627.dist-info}/top_level.txt +0 -0

alita_sdk/runtime/tools/artifact.py CHANGED Viewed

@@ -1,3 +1,4 @@
+import base64
 import hashlib
 import io
 import json
@@ -13,13 +14,262 @@ from pydantic import create_model, Field, model_validator
 from ...tools.non_code_indexer_toolkit import NonCodeIndexerToolkit
 from ...tools.utils.available_tools_decorator import extend_with_parent_available_tools
-from ...runtime.utils.utils import IndexerKeywords
+from ...tools.elitea_base import extend_with_file_operations, BaseCodeToolApiWrapper
+from ...runtime.utils.utils import IndexerKeywords, resolve_image_from_cache
 class ArtifactWrapper(NonCodeIndexerToolkit):
     bucket: str
     artifact: Optional[Any] = None
+    # Override file operation methods to support bucket_name parameter
+    # (instead of importing from BaseCodeToolApiWrapper which uses 'branch')
+    def read_file_chunk(
+        self,
+        file_path: str,
+        start_line: int,
+        end_line: Optional[int] = None,
+        bucket_name: str = None
+    ) -> str:
+        """
+        Read a specific range of lines from a file in an artifact bucket.
+        Args:
+            file_path: Path to the file to read
+            start_line: Starting line number (1-indexed, inclusive)
+            end_line: Ending line number (1-indexed, inclusive). If None, reads to end.
+            bucket_name: Bucket name. If not provided, uses toolkit-configured default bucket.
+        Returns:
+            File content for the specified line range
+        """
+        from ...tools.utils.text_operations import apply_line_slice
+        # Calculate offset and limit from start_line and end_line
+        offset = start_line
+        limit = (end_line - start_line + 1) if end_line is not None else None
+        # Read the file with bucket_name support
+        content = self._read_file(file_path, branch=None, bucket_name=bucket_name, offset=offset, limit=limit)
+        # Apply client-side slicing if toolkit doesn't support partial reads
+        return apply_line_slice(content, offset=offset, limit=limit)
+    def read_multiple_files(
+        self,
+        file_paths: List[str],
+        bucket_name: str = None,
+        offset: Optional[int] = None,
+        limit: Optional[int] = None
+    ) -> dict:
+        """
+        Read multiple files in batch from an artifact bucket.
+        Args:
+            file_paths: List of file paths to read
+            bucket_name: Bucket name. If not provided, uses toolkit-configured default bucket.
+            offset: Starting line number for all files (1-indexed)
+            limit: Number of lines to read from offset for all files
+        Returns:
+            Dict mapping file paths to their content
+        """
+        from ...tools.utils.text_operations import apply_line_slice
+        results = {}
+        for path in file_paths:
+            try:
+                content = self._read_file(path, branch=None, bucket_name=bucket_name, offset=offset, limit=limit)
+                results[path] = apply_line_slice(content, offset=offset, limit=limit)
+            except Exception as e:
+                results[path] = f"Error reading file: {str(e)}"
+        return results
+    def search_file(
+        self,
+        file_path: str,
+        pattern: str,
+        bucket_name: str = None,
+        is_regex: bool = True,
+        context_lines: int = 2
+    ) -> str:
+        """
+        Search for a pattern in a file from an artifact bucket.
+        Args:
+            file_path: Path to the file to search
+            pattern: Search pattern. Treated as regex by default unless is_regex=False.
+            bucket_name: Bucket name. If not provided, uses toolkit-configured default bucket.
+            is_regex: Whether pattern is a regex. Default is True for flexible matching.
+            context_lines: Number of lines before/after match to include for context
+        Returns:
+            Formatted string with match results and context
+        """
+        from ...tools.utils.text_operations import search_in_content
+        content = self._read_file(file_path, branch=None, bucket_name=bucket_name)
+        matches = search_in_content(content, pattern, is_regex=is_regex, context_lines=context_lines)
+        if not matches:
+            return f"No matches found for pattern '{pattern}' in {file_path}"
+        # Format results
+        results = [f"Found {len(matches)} match(es) in {file_path}:\n"]
+        for match in matches:
+            results.append(f"\n--- Line {match['line_number']} ---")
+            if match['context_before']:
+                results.append("\n".join(f"  {l}" for l in match['context_before']))
+            results.append(f"> {match['line_content']}")
+            if match['context_after']:
+                results.append("\n".join(f"  {l}" for l in match['context_after']))
+        return "\n".join(results)
+    def edit_file(
+        self,
+        file_path: str,
+        file_query: str,
+        bucket_name: str = None,
+        commit_message: str = None
+    ) -> str:
+        """
+        Edit a file in an artifact bucket using OLD/NEW markers.
+        Args:
+            file_path: Path to the file to edit. Must be a text file.
+            file_query: Edit instructions with OLD/NEW markers.
+            bucket_name: Bucket name. If not provided, uses toolkit-configured default bucket.
+            commit_message: Not used for artifacts (kept for API consistency)
+        Returns:
+            Success message or error description
+        """
+        from ...tools.utils.text_operations import parse_old_new_markers, is_text_editable, try_apply_edit
+        from langchain_core.tools import ToolException
+        # Validate file type
+        if not is_text_editable(file_path):
+            raise ToolException(f"File '{file_path}' is not a text-editable file type")
+        # Read current content
+        content = self._read_file(file_path, branch=None, bucket_name=bucket_name)
+        # Parse edit instructions
+        edits = parse_old_new_markers(file_query)
+        if not edits:
+            raise ToolException("No valid OLD/NEW marker pairs found in edit instructions")
+        # Apply edits
+        updated_content = content
+        applied_count = 0
+        for old_text, new_text in edits:
+            updated_content, used_fallback = try_apply_edit(updated_content, old_text, new_text, file_path)
+            if updated_content != content or used_fallback:
+                applied_count += 1
+                content = updated_content
+        if applied_count == 0:
+            return f"No edits were applied to {file_path}. The OLD blocks may not match the file content."
+        # Write updated content
+        self._write_file(file_path, updated_content, branch=None, commit_message=commit_message, bucket_name=bucket_name)
+        return f"Successfully applied {applied_count} edit(s) to {file_path}"
+    def _get_file_operation_schemas(self):
+        """
+        Returns custom schemas for file operations that use bucket_name instead of branch.
+        This method is called by the @extend_with_file_operations decorator to get
+        toolkit-specific schemas for file operation tools.
+        """
+        # Artifact-specific schemas with bucket_name instead of branch
+        ArtifactReadFileChunkInput = create_model(
+            "ArtifactReadFileChunkInput",
+            file_path=(str, Field(description="Path to the file to read")),
+            bucket_name=(Optional[str], Field(
+                description="Bucket name. If not provided, uses toolkit-configured default bucket.",
+                default=None
+            )),
+            start_line=(int, Field(description="Starting line number (1-indexed, inclusive)", ge=1)),
+            end_line=(Optional[int], Field(
+                description="Ending line number (1-indexed, inclusive). If None, reads to end.",
+                default=None,
+                ge=1
+            )),
+        )
+        ArtifactReadMultipleFilesInput = create_model(
+            "ArtifactReadMultipleFilesInput",
+            file_paths=(List[str], Field(description="List of file paths to read", min_length=1)),
+            bucket_name=(Optional[str], Field(
+                description="Bucket name. If not provided, uses toolkit-configured default bucket.",
+                default=None
+            )),
+            offset=(Optional[int], Field(
+                description="Starting line number for all files (1-indexed)",
+                default=None,
+                ge=1
+            )),
+            limit=(Optional[int], Field(
+                description="Number of lines to read from offset for all files",
+                default=None,
+                ge=1
+            )),
+        )
+        ArtifactSearchFileInput = create_model(
+            "ArtifactSearchFileInput",
+            file_path=(str, Field(description="Path to the file to search")),
+            pattern=(str, Field(description="Search pattern. Treated as regex by default unless is_regex=False.")),
+            bucket_name=(Optional[str], Field(
+                description="Bucket name. If not provided, uses toolkit-configured default bucket.",
+                default=None
+            )),
+            is_regex=(bool, Field(
+                description="Whether pattern is a regex. Default is True for flexible matching.",
+                default=True
+            )),
+            context_lines=(int, Field(
+                description="Number of lines before/after match to include for context",
+                default=2,
+                ge=0
+            )),
+        )
+        ArtifactEditFileInput = create_model(
+            "ArtifactEditFileInput",
+            file_path=(str, Field(
+                description="Path to the file to edit. Must be a text file (markdown, txt, csv, json, xml, html, yaml, etc.)"
+            )),
+            file_query=(str, Field(description="""Edit instructions with OLD/NEW markers. Format:
+OLD <<<<
+old content to replace
+>>>> OLD
+NEW <<<<
+new content
+>>>> NEW
+Multiple OLD/NEW pairs can be provided for multiple edits.""")),
+            bucket_name=(Optional[str], Field(
+                description="Bucket name. If not provided, uses toolkit-configured default bucket.",
+                default=None
+            )),
+            commit_message=(Optional[str], Field(
+                description="Not used for artifacts (kept for API consistency)",
+                default=None
+            )),
+        )
+        return {
+            "read_file_chunk": ArtifactReadFileChunkInput,
+            "read_multiple_files": ArtifactReadMultipleFilesInput,
+            "search_file": ArtifactSearchFileInput,
+            "edit_file": ArtifactEditFileInput,
+        }
     @model_validator(mode='before')
     @classmethod
     def validate_toolkit(cls, values):
@@ -31,20 +281,46 @@ class ArtifactWrapper(NonCodeIndexerToolkit):
         return super().validate_toolkit(values)
     def list_files(self, bucket_name = None, return_as_string = True):
-        return self.artifact.list(bucket_name, return_as_string)
+        """List all files in the artifact bucket with API download links."""
+        result = self.artifact.list(bucket_name, return_as_string=False)
+        # Add API download link to each file
+        if isinstance(result, dict) and 'rows' in result:
+            bucket = bucket_name or self.bucket
+            # Get base_url and project_id from alita client
+            base_url = getattr(self.alita, 'base_url', '').rstrip('/')
+            project_id = getattr(self.alita, 'project_id', '')
+            for file_info in result['rows']:
+                if 'name' in file_info:
+                    # Generate API download link
+                    file_name = file_info['name']
+                    file_info['link'] = f"{base_url}/api/v2/artifacts/artifact/default/{project_id}/{bucket}/{file_name}"
+        return str(result) if return_as_string else result
     def create_file(self, filename: str, filedata: str, bucket_name = None):
-        if filename.endswith(".xlsx"):
+        # Sanitize filename to prevent regex errors during indexing
+        sanitized_filename, was_modified = self._sanitize_filename(filename)
+        if was_modified:
+            logging.warning(f"Filename sanitized: '{filename}' -> '{sanitized_filename}'")
+        # Auto-detect and extract base64 from image_url structures (from image_generation tool)
+        # Returns tuple: (processed_data, is_from_image_generation)
+        filedata, is_from_image_generation = self._extract_base64_if_needed(filedata)
+        if sanitized_filename.endswith(".xlsx"):
             data = json.loads(filedata)
             filedata = self.create_xlsx_filedata(data)
-        result = self.artifact.create(filename, filedata, bucket_name)
+        result = self.artifact.create(sanitized_filename, filedata, bucket_name)
-        # Dispatch custom event for file creation
-        self._log_tool_event(
-            tool_name="file_modified",
-            message="""
-            {
+        # Skip file_modified event for images from image_generation tool
+        # These are already tracked in the tool output and don't need duplicate events
+        if not is_from_image_generation:
+            # Dispatch custom event for file creation
+            dispatch_custom_event("file_modified", {
                 "message": f"File '{filename}' created successfully",
                 "filename": filename,
                 "tool_name": "createFile",
@@ -53,9 +329,73 @@ class ArtifactWrapper(NonCodeIndexerToolkit):
                 "meta": {
                     "bucket": bucket_name or self.bucket
                 }
-            }""")
+            })
         return result
+    @staticmethod
+    def _sanitize_filename(filename: str) -> tuple:
+        """Sanitize filename for safe storage and regex pattern matching."""
+        from pathlib import Path
+        if not filename or not filename.strip():
+            return "unnamed_file", True
+        original = filename
+        path_obj = Path(filename)
+        name = path_obj.stem
+        extension = path_obj.suffix
+        # Whitelist: alphanumeric, underscore, hyphen, space, Unicode letters/digits
+        sanitized_name = re.sub(r'[^\w\s-]', '', name, flags=re.UNICODE)
+        sanitized_name = re.sub(r'[-\s]+', '-', sanitized_name)
+        sanitized_name = sanitized_name.strip('-').strip()
+        if not sanitized_name:
+            sanitized_name = "file"
+        if extension:
+            extension = re.sub(r'[^\w.-]', '', extension, flags=re.UNICODE)
+        sanitized = sanitized_name + extension
+        return sanitized, (sanitized != original)
+    def _extract_base64_if_needed(self, filedata: str) -> tuple[str | bytes, bool]:
+        """
+        Resolve cached_image_id references from cache and decode to binary data.
+        Requires JSON format with cached_image_id field: {"cached_image_id": "img_xxx"}
+        LLM must extract specific cached_image_id from generate_image response.
+        Returns:
+            tuple: (processed_data, is_from_image_generation)
+                - processed_data: Original filedata or resolved binary image data
+                - is_from_image_generation: True if data came from image_generation cache
+        """
+        if not filedata or not isinstance(filedata, str):
+            return filedata, False
+        # Require JSON format - fail fast if not JSON
+        if '{' not in filedata:
+            return filedata, False
+        try:
+            data = json.loads(filedata)
+        except json.JSONDecodeError:
+            # Not valid JSON, return as-is (regular file content)
+            return filedata, False
+        if not isinstance(data, dict):
+            return filedata, False
+        # Only accept direct cached_image_id format: {"cached_image_id": "img_xxx"}
+        # LLM must parse generate_image response and extract specific cached_image_id
+        if 'cached_image_id' in data:
+            binary_data = resolve_image_from_cache(self.alita, data['cached_image_id'])
+            return binary_data, True  # Mark as from image_generation
+        # If JSON doesn't have cached_image_id, treat as regular file content
+        return filedata, False
     def create_xlsx_filedata(self, data: dict[str, list[list]]) -> bytes:
         try:
@@ -99,9 +439,112 @@ class ArtifactWrapper(NonCodeIndexerToolkit):
                                   sheet_name=sheet_name,
                                   excel_by_sheets=excel_by_sheets,
                                   llm=self.llm)
+    def _read_file(
+        self,
+        file_path: str,
+        branch: str = None,
+        bucket_name: str = None,
+        **kwargs
+    ) -> str:
+        """
+        Read a file from artifact bucket with optional partial read support.
+        Parameters:
+            file_path: Name of the file in the bucket
+            branch: Not used for artifacts (kept for API consistency)
+            bucket_name: Name of the bucket (uses default if None)
+            **kwargs: Additional parameters (offset, limit, head, tail) - currently ignored,
+                     partial read handled client-side by base class methods
+        Returns:
+            File content as string
+        """
+        return self.read_file(filename=file_path, bucket_name=bucket_name)
+    def _write_file(
+        self,
+        file_path: str,
+        content: str,
+        branch: str = None,
+        commit_message: str = None,
+        bucket_name: str = None
+    ) -> str:
+        """
+        Write content to a file (create or overwrite).
+        Parameters:
+            file_path: Name of the file in the bucket
+            content: New file content
+            branch: Not used for artifacts (kept for API consistency)
+            commit_message: Not used for artifacts (kept for API consistency)
+            bucket_name: Name of the bucket (uses default if None)
+        Returns:
+            Success message
+        """
+        try:
+            # Sanitize filename
+            sanitized_filename, was_modified = self._sanitize_filename(file_path)
+            if was_modified:
+                logging.warning(f"Filename sanitized: '{file_path}' -> '{sanitized_filename}'")
+            # Check if file exists
+            try:
+                self.artifact.get(artifact_name=sanitized_filename, bucket_name=bucket_name, llm=self.llm)
+                # File exists, overwrite it
+                result = self.artifact.overwrite(sanitized_filename, content, bucket_name)
+                # Dispatch custom event
+                dispatch_custom_event("file_modified", {
+                    "message": f"File '{sanitized_filename}' updated successfully",
+                    "filename": sanitized_filename,
+                    "tool_name": "edit_file",
+                    "toolkit": "artifact",
+                    "operation_type": "modify",
+                    "meta": {
+                        "bucket": bucket_name or self.bucket
+                    }
+                })
+                return f"Updated file {sanitized_filename}"
+            except:
+                # File doesn't exist, create it
+                result = self.artifact.create(sanitized_filename, content, bucket_name)
+                # Dispatch custom event
+                dispatch_custom_event("file_modified", {
+                    "message": f"File '{sanitized_filename}' created successfully",
+                    "filename": sanitized_filename,
+                    "tool_name": "edit_file",
+                    "toolkit": "artifact",
+                    "operation_type": "create",
+                    "meta": {
+                        "bucket": bucket_name or self.bucket
+                    }
+                })
+                return f"Created file {sanitized_filename}"
+        except Exception as e:
+            raise ToolException(f"Unable to write file {file_path}: {str(e)}")
     def delete_file(self, filename: str, bucket_name = None):
-        return self.artifact.delete(filename, bucket_name)
+        # Check if file exists before attempting deletion
+        # S3/MinIO delete is idempotent and won't fail for non-existing files
+        try:
+            files = self.list_files(bucket_name, return_as_string=False)
+            file_names = [f['name'] for f in files.get('rows', [])]
+            if filename not in file_names:
+                raise ToolException(f'Error (deleteFile): ENOENT: no such file or directory: \'{filename}\'')
+        except ToolException:
+            raise
+        except Exception as e:
+            raise ToolException(f'Error (deleteFile): Unable to verify file existence for \'{filename}\': {str(e)}')
+        result = self.artifact.delete(filename, bucket_name)
+        if result and isinstance(result, dict) and result.get('error'):
+            raise ToolException(f'Error (deleteFile): {result.get("error")} for file \'{filename}\'')
+        return f'File "{filename}" deleted successfully.'
     def append_data(self, filename: str, filedata: str, bucket_name = None):
         result = self.artifact.append(filename, filedata, bucket_name)
@@ -138,7 +581,11 @@ class ArtifactWrapper(NonCodeIndexerToolkit):
         return result
     def create_new_bucket(self, bucket_name: str, expiration_measure = "weeks", expiration_value = 1):
-        return self.artifact.client.create_bucket(bucket_name, expiration_measure, expiration_value)
+        # Sanitize bucket name: replace underscores with hyphens and ensure lowercase
+        sanitized_name = bucket_name.replace('_', '-').lower()
+        if sanitized_name != bucket_name:
+            logging.warning(f"Bucket name '{bucket_name}' was sanitized to '{sanitized_name}' (underscores replaced with hyphens, converted to lowercase)")
+        return self.artifact.client.create_bucket(sanitized_name, expiration_measure, expiration_value)
     def _index_tool_params(self):
         return {
@@ -160,6 +607,21 @@ class ArtifactWrapper(NonCodeIndexerToolkit):
         include_extensions = kwargs.get('include_extensions', [])
         skip_extensions = kwargs.get('skip_extensions', [])
+        chunking_config = kwargs.get('chunking_config', {})
+        # Auto-include extensions from chunking_config if include_extensions is specified
+        # This allows chunking config to work without manually adding extensions to include_extensions
+        if chunking_config and include_extensions:
+            for ext_pattern in chunking_config.keys():
+                # Normalize extension pattern (both ".cbl" and "*.cbl" should work)
+                normalized = ext_pattern if ext_pattern.startswith('*') else f'*{ext_pattern}'
+                if normalized not in include_extensions:
+                    include_extensions.append(normalized)
+                    self._log_tool_event(
+                        message=f"Auto-included extension '{normalized}' from chunking_config",
+                        tool_name="loader"
+                    )
         self._log_tool_event(message=f"Files filtering started. Include extensions: {include_extensions}. "
                                      f"Skip extensions: {skip_extensions}", tool_name="loader")
         # show the progress of filtering
@@ -173,13 +635,13 @@ class ArtifactWrapper(NonCodeIndexerToolkit):
             file_name = file['name']
             # Check if file should be skipped based on skip_extensions
-            if any(re.match(pattern.replace('*', '.*') + '$', file_name, re.IGNORECASE)
+            if any(re.match(re.escape(pattern).replace(r'\*', '.*') + '$', file_name, re.IGNORECASE)
                    for pattern in skip_extensions):
                 continue
             # Check if file should be included based on include_extensions
             # If include_extensions is empty, process all files (that weren't skipped)
-            if include_extensions and not (any(re.match(pattern.replace('*', '.*') + '$', file_name, re.IGNORECASE)
+            if include_extensions and not (any(re.match(re.escape(pattern).replace(r'\*', '.*') + '$', file_name, re.IGNORECASE)
                                                for pattern in include_extensions)):
                 continue
@@ -207,14 +669,17 @@ class ArtifactWrapper(NonCodeIndexerToolkit):
                 logging.error(f"Failed while parsing the file '{document.metadata['name']}': {e}")
                 yield document
-    @extend_with_parent_available_tools
+    @extend_with_file_operations
     def get_available_tools(self):
+        """Get available tools. Returns all tools for schema; filtering happens at toolkit level."""
         bucket_name = (Optional[str], Field(description="Name of the bucket to work with."
                                                         "If bucket is not specified by user directly, the name should be taken from chat history."
                                                         "If bucket never mentioned in chat, the name will be taken from tool configuration."
                                                         " ***IMPORTANT*** Underscore `_` is prohibited in bucket name and should be replaced by `-`",
                                             default=None))
-        return [
+        # Basic artifact tools (always available)
+        basic_tools = [
             {
                 "ref": self.list_files,
                 "name": "listFiles",
@@ -229,15 +694,19 @@ class ArtifactWrapper(NonCodeIndexerToolkit):
                     "createFile",
                     filename=(str, Field(description="Filename")),
                     filedata=(str, Field(description="""Stringified content of the file.
-                    Example for .xlsx filedata format:
-                    {
-                        "Sheet1":[
-                            ["Name", "Age", "City"],
-                            ["Alice", 25, "New York"],
-                            ["Bob", 30, "San Francisco"],
-                            ["Charlie", 35, "Los Angeles"]
-                        ]
-                    }
+                    Supports three input formats:
+                    1. CACHED IMAGE REFERENCE (for generated/cached images):
+                       Pass JSON with cached_image_id field: {"cached_image_id": "img_xxx"}
+                       The tool will automatically resolve and decode the image from cache.
+                       This is typically used when another tool returns an image reference.
+                    2. EXCEL FILES (.xlsx extension):
+                       Pass JSON with sheet structure: {"Sheet1": [["Name", "Age"], ["Alice", 25], ["Bob", 30]]}
+                    3. TEXT/OTHER FILES:
+                       Pass the plain text string directly.
                     """)),
                     bucket_name=bucket_name
                 )
@@ -299,11 +768,25 @@ class ArtifactWrapper(NonCodeIndexerToolkit):
                 "description": "Creates new bucket specified by user.",
                 "args_schema": create_model(
                     "createNewBucket",
-                    bucket_name=(str, Field(description="Bucket name to create. ***IMPORTANT*** Underscore `_` is prohibited in bucket name and should be replaced by `-`.")),
+                    bucket_name=(str, Field(
+                        description="Bucket name to create. Must start with lowercase letter and contain only lowercase letters, numbers, and hyphens. Underscores will be automatically converted to hyphens.",
+                        pattern=r'^[a-z][a-z0-9_-]*$'  # Allow underscores in input, will be sanitized
+                    )),
                     expiration_measure=(Optional[str], Field(description="Measure of expiration time for bucket configuration."
                                                                          "Possible values: `days`, `weeks`, `months`, `years`.",
                                                              default="weeks")),
                     expiration_value=(Optional[int], Field(description="Expiration time values.", default=1))
                 )
             }
-        ]
+        ]
+        # Always include indexing tools in available tools list
+        # Filtering based on vector store config happens at toolkit level via decorator
+        try:
+            # Get indexing tools from parent class
+            indexing_tools = super(ArtifactWrapper, self).get_available_tools()
+            return indexing_tools + basic_tools
+        except Exception as e:
+            # If getting parent tools fails, log warning and return basic tools only
+            logging.warning(f"Failed to load indexing tools: {e}. Only basic artifact tools will be available.")
+            return basic_tools

alita-sdk 0.3.462__py3-none-any.whl → 0.3.627__py3-none-any.whl

alita-sdk 0.3.462py3-none-any.whl → 0.3.627py3-none-any.whl