PyPI - alita-sdk - Versions diffs - 0.3.257__py3-none-any.whl → 0.3.562__py3-none-any.whl - Mend

alita-sdk 0.3.257py3-none-any.whl → 0.3.562py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (278) hide show

alita_sdk/cli/__init__.py +10 -0
alita_sdk/cli/__main__.py +17 -0
alita_sdk/cli/agent/__init__.py +5 -0
alita_sdk/cli/agent/default.py +258 -0
alita_sdk/cli/agent_executor.py +155 -0
alita_sdk/cli/agent_loader.py +215 -0
alita_sdk/cli/agent_ui.py +228 -0
alita_sdk/cli/agents.py +3601 -0
alita_sdk/cli/callbacks.py +647 -0
alita_sdk/cli/cli.py +168 -0
alita_sdk/cli/config.py +306 -0
alita_sdk/cli/context/__init__.py +30 -0
alita_sdk/cli/context/cleanup.py +198 -0
alita_sdk/cli/context/manager.py +731 -0
alita_sdk/cli/context/message.py +285 -0
alita_sdk/cli/context/strategies.py +289 -0
alita_sdk/cli/context/token_estimation.py +127 -0
alita_sdk/cli/formatting.py +182 -0
alita_sdk/cli/input_handler.py +419 -0
alita_sdk/cli/inventory.py +1073 -0
alita_sdk/cli/mcp_loader.py +315 -0
alita_sdk/cli/toolkit.py +327 -0
alita_sdk/cli/toolkit_loader.py +85 -0
alita_sdk/cli/tools/__init__.py +43 -0
alita_sdk/cli/tools/approval.py +224 -0
alita_sdk/cli/tools/filesystem.py +1751 -0
alita_sdk/cli/tools/planning.py +389 -0
alita_sdk/cli/tools/terminal.py +414 -0
alita_sdk/community/__init__.py +72 -12
alita_sdk/community/inventory/__init__.py +236 -0
alita_sdk/community/inventory/config.py +257 -0
alita_sdk/community/inventory/enrichment.py +2137 -0
alita_sdk/community/inventory/extractors.py +1469 -0
alita_sdk/community/inventory/ingestion.py +3172 -0
alita_sdk/community/inventory/knowledge_graph.py +1457 -0
alita_sdk/community/inventory/parsers/__init__.py +218 -0
alita_sdk/community/inventory/parsers/base.py +295 -0
alita_sdk/community/inventory/parsers/csharp_parser.py +907 -0
alita_sdk/community/inventory/parsers/go_parser.py +851 -0
alita_sdk/community/inventory/parsers/html_parser.py +389 -0
alita_sdk/community/inventory/parsers/java_parser.py +593 -0
alita_sdk/community/inventory/parsers/javascript_parser.py +629 -0
alita_sdk/community/inventory/parsers/kotlin_parser.py +768 -0
alita_sdk/community/inventory/parsers/markdown_parser.py +362 -0
alita_sdk/community/inventory/parsers/python_parser.py +604 -0
alita_sdk/community/inventory/parsers/rust_parser.py +858 -0
alita_sdk/community/inventory/parsers/swift_parser.py +832 -0
alita_sdk/community/inventory/parsers/text_parser.py +322 -0
alita_sdk/community/inventory/parsers/yaml_parser.py +370 -0
alita_sdk/community/inventory/patterns/__init__.py +61 -0
alita_sdk/community/inventory/patterns/ast_adapter.py +380 -0
alita_sdk/community/inventory/patterns/loader.py +348 -0
alita_sdk/community/inventory/patterns/registry.py +198 -0
alita_sdk/community/inventory/presets.py +535 -0
alita_sdk/community/inventory/retrieval.py +1403 -0
alita_sdk/community/inventory/toolkit.py +173 -0
alita_sdk/community/inventory/toolkit_utils.py +176 -0
alita_sdk/community/inventory/visualize.py +1370 -0
alita_sdk/configurations/__init__.py +11 -0
alita_sdk/configurations/ado.py +148 -2
alita_sdk/configurations/azure_search.py +1 -1
alita_sdk/configurations/bigquery.py +1 -1
alita_sdk/configurations/bitbucket.py +94 -2
alita_sdk/configurations/browser.py +18 -0
alita_sdk/configurations/carrier.py +19 -0
alita_sdk/configurations/confluence.py +130 -1
alita_sdk/configurations/delta_lake.py +1 -1
alita_sdk/configurations/figma.py +76 -5
alita_sdk/configurations/github.py +65 -1
alita_sdk/configurations/gitlab.py +81 -0
alita_sdk/configurations/google_places.py +17 -0
alita_sdk/configurations/jira.py +103 -0
alita_sdk/configurations/openapi.py +111 -0
alita_sdk/configurations/postman.py +1 -1
alita_sdk/configurations/qtest.py +72 -3
alita_sdk/configurations/report_portal.py +115 -0
alita_sdk/configurations/salesforce.py +19 -0
alita_sdk/configurations/service_now.py +1 -12
alita_sdk/configurations/sharepoint.py +167 -0
alita_sdk/configurations/sonar.py +18 -0
alita_sdk/configurations/sql.py +20 -0
alita_sdk/configurations/testio.py +101 -0
alita_sdk/configurations/testrail.py +88 -0
alita_sdk/configurations/xray.py +94 -1
alita_sdk/configurations/zephyr_enterprise.py +94 -1
alita_sdk/configurations/zephyr_essential.py +95 -0
alita_sdk/runtime/clients/artifact.py +21 -4
alita_sdk/runtime/clients/client.py +458 -67
alita_sdk/runtime/clients/mcp_discovery.py +342 -0
alita_sdk/runtime/clients/mcp_manager.py +262 -0
alita_sdk/runtime/clients/sandbox_client.py +352 -0
alita_sdk/runtime/langchain/_constants_bkup.py +1318 -0
alita_sdk/runtime/langchain/assistant.py +183 -43
alita_sdk/runtime/langchain/constants.py +647 -1
alita_sdk/runtime/langchain/document_loaders/AlitaDocxMammothLoader.py +315 -3
alita_sdk/runtime/langchain/document_loaders/AlitaExcelLoader.py +209 -31
alita_sdk/runtime/langchain/document_loaders/AlitaImageLoader.py +1 -1
alita_sdk/runtime/langchain/document_loaders/AlitaJSONLinesLoader.py +77 -0
alita_sdk/runtime/langchain/document_loaders/AlitaJSONLoader.py +10 -3
alita_sdk/runtime/langchain/document_loaders/AlitaMarkdownLoader.py +66 -0
alita_sdk/runtime/langchain/document_loaders/AlitaPDFLoader.py +79 -10
alita_sdk/runtime/langchain/document_loaders/AlitaPowerPointLoader.py +52 -15
alita_sdk/runtime/langchain/document_loaders/AlitaPythonLoader.py +9 -0
alita_sdk/runtime/langchain/document_loaders/AlitaTableLoader.py +1 -4
alita_sdk/runtime/langchain/document_loaders/AlitaTextLoader.py +15 -2
alita_sdk/runtime/langchain/document_loaders/ImageParser.py +30 -0
alita_sdk/runtime/langchain/document_loaders/constants.py +189 -41
alita_sdk/runtime/langchain/interfaces/llm_processor.py +4 -2
alita_sdk/runtime/langchain/langraph_agent.py +407 -92
alita_sdk/runtime/langchain/utils.py +102 -8
alita_sdk/runtime/llms/preloaded.py +2 -6
alita_sdk/runtime/models/mcp_models.py +61 -0
alita_sdk/runtime/skills/__init__.py +91 -0
alita_sdk/runtime/skills/callbacks.py +498 -0
alita_sdk/runtime/skills/discovery.py +540 -0
alita_sdk/runtime/skills/executor.py +610 -0
alita_sdk/runtime/skills/input_builder.py +371 -0
alita_sdk/runtime/skills/models.py +330 -0
alita_sdk/runtime/skills/registry.py +355 -0
alita_sdk/runtime/skills/skill_runner.py +330 -0
alita_sdk/runtime/toolkits/__init__.py +28 -0
alita_sdk/runtime/toolkits/application.py +14 -4
alita_sdk/runtime/toolkits/artifact.py +24 -9
alita_sdk/runtime/toolkits/datasource.py +13 -6
alita_sdk/runtime/toolkits/mcp.py +780 -0
alita_sdk/runtime/toolkits/planning.py +178 -0
alita_sdk/runtime/toolkits/skill_router.py +238 -0
alita_sdk/runtime/toolkits/subgraph.py +11 -6
alita_sdk/runtime/toolkits/tools.py +314 -70
alita_sdk/runtime/toolkits/vectorstore.py +11 -5
alita_sdk/runtime/tools/__init__.py +24 -0
alita_sdk/runtime/tools/application.py +16 -4
alita_sdk/runtime/tools/artifact.py +367 -33
alita_sdk/runtime/tools/data_analysis.py +183 -0
alita_sdk/runtime/tools/function.py +100 -4
alita_sdk/runtime/tools/graph.py +81 -0
alita_sdk/runtime/tools/image_generation.py +218 -0
alita_sdk/runtime/tools/llm.py +1013 -177
alita_sdk/runtime/tools/loop.py +3 -1
alita_sdk/runtime/tools/loop_output.py +3 -1
alita_sdk/runtime/tools/mcp_inspect_tool.py +284 -0
alita_sdk/runtime/tools/mcp_remote_tool.py +181 -0
alita_sdk/runtime/tools/mcp_server_tool.py +3 -1
alita_sdk/runtime/tools/planning/__init__.py +36 -0
alita_sdk/runtime/tools/planning/models.py +246 -0
alita_sdk/runtime/tools/planning/wrapper.py +607 -0
alita_sdk/runtime/tools/router.py +2 -1
alita_sdk/runtime/tools/sandbox.py +375 -0
alita_sdk/runtime/tools/skill_router.py +776 -0
alita_sdk/runtime/tools/tool.py +3 -1
alita_sdk/runtime/tools/vectorstore.py +69 -65
alita_sdk/runtime/tools/vectorstore_base.py +163 -90
alita_sdk/runtime/utils/AlitaCallback.py +137 -21
alita_sdk/runtime/utils/mcp_client.py +492 -0
alita_sdk/runtime/utils/mcp_oauth.py +361 -0
alita_sdk/runtime/utils/mcp_sse_client.py +434 -0
alita_sdk/runtime/utils/mcp_tools_discovery.py +124 -0
alita_sdk/runtime/utils/streamlit.py +41 -14
alita_sdk/runtime/utils/toolkit_utils.py +28 -9
alita_sdk/runtime/utils/utils.py +48 -0
alita_sdk/tools/__init__.py +135 -37
alita_sdk/tools/ado/__init__.py +2 -2
alita_sdk/tools/ado/repos/__init__.py +15 -19
alita_sdk/tools/ado/repos/repos_wrapper.py +12 -20
alita_sdk/tools/ado/test_plan/__init__.py +26 -8
alita_sdk/tools/ado/test_plan/test_plan_wrapper.py +56 -28
alita_sdk/tools/ado/wiki/__init__.py +27 -12
alita_sdk/tools/ado/wiki/ado_wrapper.py +114 -40
alita_sdk/tools/ado/work_item/__init__.py +27 -12
alita_sdk/tools/ado/work_item/ado_wrapper.py +95 -11
alita_sdk/tools/advanced_jira_mining/__init__.py +12 -8
alita_sdk/tools/aws/delta_lake/__init__.py +14 -11
alita_sdk/tools/aws/delta_lake/tool.py +5 -1
alita_sdk/tools/azure_ai/search/__init__.py +13 -8
alita_sdk/tools/base/tool.py +5 -1
alita_sdk/tools/base_indexer_toolkit.py +454 -110
alita_sdk/tools/bitbucket/__init__.py +27 -19
alita_sdk/tools/bitbucket/api_wrapper.py +285 -27
alita_sdk/tools/bitbucket/cloud_api_wrapper.py +5 -5
alita_sdk/tools/browser/__init__.py +41 -16
alita_sdk/tools/browser/crawler.py +3 -1
alita_sdk/tools/browser/utils.py +15 -6
alita_sdk/tools/carrier/__init__.py +18 -17
alita_sdk/tools/carrier/backend_reports_tool.py +8 -4
alita_sdk/tools/carrier/excel_reporter.py +8 -4
alita_sdk/tools/chunkers/__init__.py +3 -1
alita_sdk/tools/chunkers/code/codeparser.py +1 -1
alita_sdk/tools/chunkers/sematic/json_chunker.py +2 -1
alita_sdk/tools/chunkers/sematic/markdown_chunker.py +97 -6
alita_sdk/tools/chunkers/sematic/proposal_chunker.py +1 -1
alita_sdk/tools/chunkers/universal_chunker.py +270 -0
alita_sdk/tools/cloud/aws/__init__.py +11 -7
alita_sdk/tools/cloud/azure/__init__.py +11 -7
alita_sdk/tools/cloud/gcp/__init__.py +11 -7
alita_sdk/tools/cloud/k8s/__init__.py +11 -7
alita_sdk/tools/code/linter/__init__.py +9 -8
alita_sdk/tools/code/loaders/codesearcher.py +3 -2
alita_sdk/tools/code/sonar/__init__.py +20 -13
alita_sdk/tools/code_indexer_toolkit.py +199 -0
alita_sdk/tools/confluence/__init__.py +21 -14
alita_sdk/tools/confluence/api_wrapper.py +197 -58
alita_sdk/tools/confluence/loader.py +14 -2
alita_sdk/tools/custom_open_api/__init__.py +11 -5
alita_sdk/tools/elastic/__init__.py +10 -8
alita_sdk/tools/elitea_base.py +546 -64
alita_sdk/tools/figma/__init__.py +11 -8
alita_sdk/tools/figma/api_wrapper.py +352 -153
alita_sdk/tools/github/__init__.py +17 -17
alita_sdk/tools/github/api_wrapper.py +9 -26
alita_sdk/tools/github/github_client.py +81 -12
alita_sdk/tools/github/schemas.py +2 -1
alita_sdk/tools/github/tool.py +5 -1
alita_sdk/tools/gitlab/__init__.py +18 -13
alita_sdk/tools/gitlab/api_wrapper.py +224 -80
alita_sdk/tools/gitlab_org/__init__.py +13 -10
alita_sdk/tools/google/bigquery/__init__.py +13 -13
alita_sdk/tools/google/bigquery/tool.py +5 -1
alita_sdk/tools/google_places/__init__.py +20 -11
alita_sdk/tools/jira/__init__.py +21 -11
alita_sdk/tools/jira/api_wrapper.py +315 -168
alita_sdk/tools/keycloak/__init__.py +10 -8
alita_sdk/tools/localgit/__init__.py +8 -3
alita_sdk/tools/localgit/local_git.py +62 -54
alita_sdk/tools/localgit/tool.py +5 -1
alita_sdk/tools/memory/__init__.py +38 -14
alita_sdk/tools/non_code_indexer_toolkit.py +7 -2
alita_sdk/tools/ocr/__init__.py +10 -8
alita_sdk/tools/openapi/__init__.py +281 -108
alita_sdk/tools/openapi/api_wrapper.py +883 -0
alita_sdk/tools/openapi/tool.py +20 -0
alita_sdk/tools/pandas/__init__.py +18 -11
alita_sdk/tools/pandas/api_wrapper.py +40 -45
alita_sdk/tools/pandas/dataframe/generator/base.py +3 -1
alita_sdk/tools/postman/__init__.py +10 -11
alita_sdk/tools/postman/api_wrapper.py +19 -8
alita_sdk/tools/postman/postman_analysis.py +8 -1
alita_sdk/tools/pptx/__init__.py +10 -10
alita_sdk/tools/qtest/__init__.py +21 -14
alita_sdk/tools/qtest/api_wrapper.py +1784 -88
alita_sdk/tools/rally/__init__.py +12 -10
alita_sdk/tools/report_portal/__init__.py +22 -16
alita_sdk/tools/salesforce/__init__.py +21 -16
alita_sdk/tools/servicenow/__init__.py +20 -16
alita_sdk/tools/servicenow/api_wrapper.py +1 -1
alita_sdk/tools/sharepoint/__init__.py +16 -14
alita_sdk/tools/sharepoint/api_wrapper.py +179 -39
alita_sdk/tools/sharepoint/authorization_helper.py +191 -1
alita_sdk/tools/sharepoint/utils.py +8 -2
alita_sdk/tools/slack/__init__.py +11 -7
alita_sdk/tools/sql/__init__.py +21 -19
alita_sdk/tools/sql/api_wrapper.py +71 -23
alita_sdk/tools/testio/__init__.py +20 -13
alita_sdk/tools/testrail/__init__.py +12 -11
alita_sdk/tools/testrail/api_wrapper.py +214 -46
alita_sdk/tools/utils/__init__.py +28 -4
alita_sdk/tools/utils/content_parser.py +182 -62
alita_sdk/tools/utils/text_operations.py +254 -0
alita_sdk/tools/vector_adapters/VectorStoreAdapter.py +83 -27
alita_sdk/tools/xray/__init__.py +17 -14
alita_sdk/tools/xray/api_wrapper.py +58 -113
alita_sdk/tools/yagmail/__init__.py +8 -3
alita_sdk/tools/zephyr/__init__.py +11 -7
alita_sdk/tools/zephyr_enterprise/__init__.py +15 -9
alita_sdk/tools/zephyr_enterprise/api_wrapper.py +30 -15
alita_sdk/tools/zephyr_essential/__init__.py +15 -10
alita_sdk/tools/zephyr_essential/api_wrapper.py +297 -54
alita_sdk/tools/zephyr_essential/client.py +6 -4
alita_sdk/tools/zephyr_scale/__init__.py +12 -8
alita_sdk/tools/zephyr_scale/api_wrapper.py +39 -31
alita_sdk/tools/zephyr_squad/__init__.py +11 -7
{alita_sdk-0.3.257.dist-info → alita_sdk-0.3.562.dist-info}/METADATA +184 -37
alita_sdk-0.3.562.dist-info/RECORD +450 -0
alita_sdk-0.3.562.dist-info/entry_points.txt +2 -0
alita_sdk/tools/bitbucket/tools.py +0 -304
alita_sdk-0.3.257.dist-info/RECORD +0 -343
{alita_sdk-0.3.257.dist-info → alita_sdk-0.3.562.dist-info}/WHEEL +0 -0
{alita_sdk-0.3.257.dist-info → alita_sdk-0.3.562.dist-info}/licenses/LICENSE +0 -0
{alita_sdk-0.3.257.dist-info → alita_sdk-0.3.562.dist-info}/top_level.txt +0 -0

alita_sdk/tools/chunkers/universal_chunker.py ADDED Viewed

@@ -0,0 +1,270 @@
+"""
+Universal Chunker - Routes documents to appropriate chunkers based on file type.
+This module provides a universal chunking interface that automatically selects
+the appropriate chunking strategy based on the file extension:
+- .md, .markdown → Markdown chunker (header-based splitting)
+- .py, .js, .ts, .java, etc. → TreeSitter code chunker
+- .json → JSON chunker
+- other → Default text chunker
+Usage:
+    from alita_sdk.tools.chunkers.universal_chunker import universal_chunker
+    # Chunk documents from a loader
+    for chunk in universal_chunker(document_generator, config):
+        print(chunk.page_content)
+"""
+import logging
+import os
+from typing import Generator, Dict, Any, Optional
+from langchain_core.documents import Document
+from langchain.text_splitter import RecursiveCharacterTextSplitter
+from .code.codeparser import parse_code_files_for_db
+from .sematic.markdown_chunker import markdown_chunker
+from .sematic.json_chunker import json_chunker
+logger = logging.getLogger(__name__)
+# File extension mappings
+MARKDOWN_EXTENSIONS = {'.md', '.markdown', '.mdown', '.mkd', '.mdx'}
+JSON_EXTENSIONS = {'.json', '.jsonl', '.jsonc'}
+CODE_EXTENSIONS = {
+    '.py', '.js', '.jsx', '.mjs', '.cjs', '.ts', '.tsx',
+    '.java', '.kt', '.rs', '.go', '.cpp', '.c', '.cs',
+    '.hs', '.rb', '.scala', '.lua'
+}
+def get_file_extension(file_path: str) -> str:
+    """Extract file extension from path."""
+    return os.path.splitext(file_path)[-1].lower()
+def get_file_type(file_path: str) -> str:
+    """
+    Determine the file type category for chunking.
+    Returns:
+        'markdown', 'json', 'code', or 'text'
+    """
+    ext = get_file_extension(file_path)
+    if ext in MARKDOWN_EXTENSIONS:
+        return 'markdown'
+    elif ext in JSON_EXTENSIONS:
+        return 'json'
+    elif ext in CODE_EXTENSIONS:
+        return 'code'
+    else:
+        return 'text'
+def _default_text_chunker(
+    documents: Generator[Document, None, None],
+    config: Dict[str, Any]
+) -> Generator[Document, None, None]:
+    """
+    Default text chunker for unknown file types.
+    Uses recursive character splitting.
+    """
+    chunk_size = config.get('chunk_size', 1000)
+    chunk_overlap = config.get('chunk_overlap', 100)
+    splitter = RecursiveCharacterTextSplitter(
+        chunk_size=chunk_size,
+        chunk_overlap=chunk_overlap,
+        length_function=len,
+    )
+    for doc in documents:
+        chunks = splitter.split_documents([doc])
+        for idx, chunk in enumerate(chunks, 1):
+            chunk.metadata['chunk_id'] = idx
+            chunk.metadata['chunk_type'] = 'text'
+            chunk.metadata['method_name'] = 'text'
+            yield chunk
+def _code_chunker_from_documents(
+    documents: Generator[Document, None, None],
+    config: Dict[str, Any]
+) -> Generator[Document, None, None]:
+    """
+    Adapter to convert Document generator to code parser format.
+    """
+    def file_content_generator():
+        for doc in documents:
+            yield {
+                'file_name': doc.metadata.get('file_path', doc.metadata.get('filename', 'unknown')),
+                'file_content': doc.page_content,
+                'commit_hash': doc.metadata.get('commit_hash', ''),
+            }
+    # parse_code_files_for_db returns chunks with proper metadata
+    for chunk in parse_code_files_for_db(file_content_generator()):
+        # Ensure file_path is preserved
+        if 'file_path' not in chunk.metadata and 'filename' in chunk.metadata:
+            chunk.metadata['file_path'] = chunk.metadata['filename']
+        yield chunk
+def universal_chunker(
+    documents: Generator[Document, None, None],
+    config: Optional[Dict[str, Any]] = None
+) -> Generator[Document, None, None]:
+    """
+    Universal chunker that routes documents to appropriate chunkers based on file type.
+    Each document is inspected for its file extension (from metadata.file_path or
+    metadata.file_name) and routed to the appropriate chunker:
+    - Markdown files → markdown_chunker (header-based splitting)
+    - JSON files → json_chunker (recursive JSON splitting)
+    - Code files → code parser (TreeSitter-based parsing)
+    - Other files → default text chunker (recursive character splitting)
+    Args:
+        documents: Generator yielding Document objects with file content
+        config: Optional configuration dict with:
+            - markdown_config: Config for markdown chunker
+            - json_config: Config for JSON chunker
+            - code_config: Config for code chunker
+            - text_config: Config for default text chunker
+    Yields:
+        Document objects with chunked content and preserved metadata
+    """
+    if config is None:
+        config = {}
+    # Default configs for each chunker type
+    markdown_config = config.get('markdown_config', {
+        'strip_header': False,
+        'return_each_line': False,
+        'headers_to_split_on': [
+            ('#', 'Header 1'),
+            ('##', 'Header 2'),
+            ('###', 'Header 3'),
+            ('####', 'Header 4'),
+        ],
+        'max_tokens': 1024,
+        'token_overlap': 50,
+        'min_chunk_chars': 100,  # Merge chunks smaller than this
+    })
+    json_config = config.get('json_config', {
+        'max_tokens': 512,
+    })
+    code_config = config.get('code_config', {})
+    text_config = config.get('text_config', {
+        'chunk_size': 1000,
+        'chunk_overlap': 100,
+    })
+    # Buffer documents by type for batch processing
+    # This is more efficient than processing one at a time
+    markdown_docs = []
+    json_docs = []
+    code_docs = []
+    text_docs = []
+    # Buffer size before flushing
+    BUFFER_SIZE = 10
+    def flush_markdown():
+        if markdown_docs:
+            def gen():
+                for d in markdown_docs:
+                    yield d
+            for chunk in markdown_chunker(gen(), markdown_config):
+                yield chunk
+            markdown_docs.clear()
+    def flush_json():
+        if json_docs:
+            def gen():
+                for d in json_docs:
+                    yield d
+            for chunk in json_chunker(gen(), json_config):
+                yield chunk
+            json_docs.clear()
+    def flush_code():
+        if code_docs:
+            def gen():
+                for d in code_docs:
+                    yield d
+            for chunk in _code_chunker_from_documents(gen(), code_config):
+                yield chunk
+            code_docs.clear()
+    def flush_text():
+        if text_docs:
+            def gen():
+                for d in text_docs:
+                    yield d
+            for chunk in _default_text_chunker(gen(), text_config):
+                yield chunk
+            text_docs.clear()
+    for doc in documents:
+        # Get file path from metadata
+        file_path = (doc.metadata.get('file_path') or
+                    doc.metadata.get('file_name') or
+                    doc.metadata.get('source') or
+                    'unknown')
+        # Ensure file_path is in metadata for downstream use
+        doc.metadata['file_path'] = file_path
+        file_type = get_file_type(file_path)
+        if file_type == 'markdown':
+            markdown_docs.append(doc)
+            if len(markdown_docs) >= BUFFER_SIZE:
+                yield from flush_markdown()
+        elif file_type == 'json':
+            json_docs.append(doc)
+            if len(json_docs) >= BUFFER_SIZE:
+                yield from flush_json()
+        elif file_type == 'code':
+            code_docs.append(doc)
+            if len(code_docs) >= BUFFER_SIZE:
+                yield from flush_code()
+        else:
+            text_docs.append(doc)
+            if len(text_docs) >= BUFFER_SIZE:
+                yield from flush_text()
+    # Flush remaining documents
+    yield from flush_markdown()
+    yield from flush_json()
+    yield from flush_code()
+    yield from flush_text()
+def chunk_single_document(
+    doc: Document,
+    config: Optional[Dict[str, Any]] = None
+) -> Generator[Document, None, None]:
+    """
+    Convenience function to chunk a single document.
+    Args:
+        doc: Single Document to chunk
+        config: Optional chunker configuration
+    Yields:
+        Chunked Document objects
+    """
+    def single_doc_gen():
+        yield doc
+    yield from universal_chunker(single_doc_gen(), config)

alita_sdk/tools/cloud/aws/__init__.py CHANGED Viewed

@@ -5,7 +5,8 @@ from langchain_core.tools import BaseToolkit, BaseTool
 from .api_wrapper import AWSToolConfig
 from ...base.tool import BaseAction
-from ...utils import clean_string, TOOLKIT_SPLITTER, get_max_toolkit_length
+from ...elitea_base import filter_missconfigured_index_tools
+from ...utils import clean_string, get_max_toolkit_length
 name = "aws"
@@ -21,12 +22,10 @@ def get_tools(tool):
 class AWSToolkit(BaseToolkit):
     tools: list[BaseTool] = []
-    toolkit_max_length: int = 0
     @staticmethod
     def toolkit_config_schema() -> BaseModel:
         selected_tools = {x['name']: x['args_schema'].schema() for x in AWSToolConfig.model_construct().get_available_tools()}
-        AWSToolkit.toolkit_max_length = get_max_toolkit_length(selected_tools)
         return create_model(
             name,
             region=(str, Field(default="", title="Region", description="AWS region")),
@@ -46,21 +45,26 @@ class AWSToolkit(BaseToolkit):
         )
     @classmethod
+    @filter_missconfigured_index_tools
     def get_toolkit(cls, selected_tools: list[str] | None = None, toolkit_name: Optional[str] = None, **kwargs):
         if selected_tools is None:
             selected_tools = []
         aws_tool_config = AWSToolConfig(**kwargs)
         available_tools = aws_tool_config.get_available_tools()
         tools = []
-        prefix = clean_string(toolkit_name, cls.toolkit_max_length) + TOOLKIT_SPLITTER if toolkit_name else ''
         for tool in available_tools:
             if selected_tools and tool["name"] not in selected_tools:
                 continue
+            description = tool["description"]
+            if toolkit_name:
+                description = f"Toolkit: {toolkit_name}\n{description}"
+            description = description[:1000]
             tools.append(BaseAction(
                 api_wrapper=aws_tool_config,
-                name=prefix + tool["name"],
-                description=tool["description"],
-                args_schema=tool["args_schema"]
+                name=tool["name"],
+                description=description,
+                args_schema=tool["args_schema"],
+                metadata={"toolkit_name": toolkit_name} if toolkit_name else {}
             ))
         return cls(tools=tools)

alita_sdk/tools/cloud/azure/__init__.py CHANGED Viewed

@@ -5,7 +5,8 @@ from pydantic import create_model, BaseModel, ConfigDict, Field, SecretStr
 from .api_wrapper import AzureApiWrapper
 from ...base.tool import BaseAction
-from ...utils import clean_string, TOOLKIT_SPLITTER, get_max_toolkit_length
+from ...elitea_base import filter_missconfigured_index_tools
+from ...utils import clean_string, get_max_toolkit_length
 name = "azure"
@@ -22,12 +23,10 @@ def get_tools(tool):
 class AzureToolkit(BaseToolkit):
     tools: list[BaseTool] = []
-    toolkit_max_length: int = 0
     @staticmethod
     def toolkit_config_schema() -> BaseModel:
         selected_tools = {x['name']: x['args_schema'].schema() for x in AzureApiWrapper.model_construct().get_available_tools()}
-        AzureToolkit.toolkit_max_length = get_max_toolkit_length(selected_tools)
         return create_model(
             name,
             subscription_id=(str, Field(default="", title="Subscription ID", description="Azure subscription ID")),
@@ -39,21 +38,26 @@ class AzureToolkit(BaseToolkit):
         )
     @classmethod
+    @filter_missconfigured_index_tools
     def get_toolkit(cls, selected_tools: list[str] | None = None, toolkit_name: Optional[str] = None, **kwargs):
         if selected_tools is None:
             selected_tools = []
         azure_api_wrapper = AzureApiWrapper(**kwargs)
         available_tools = azure_api_wrapper.get_available_tools()
         tools = []
-        prefix = clean_string(toolkit_name, cls.toolkit_max_length) + TOOLKIT_SPLITTER if toolkit_name else ''
         for tool in available_tools:
             if selected_tools and tool["name"] not in selected_tools:
                 continue
+            description = tool["description"]
+            if toolkit_name:
+                description = f"Toolkit: {toolkit_name}\n{description}"
+            description = description[:1000]
             tools.append(BaseAction(
                 api_wrapper=azure_api_wrapper,
-                name=prefix + tool["name"],
-                description=tool["description"],
-                args_schema=tool["args_schema"]
+                name=tool["name"],
+                description=description,
+                args_schema=tool["args_schema"],
+                metadata={"toolkit_name": toolkit_name} if toolkit_name else {}
             ))
         return cls(tools=tools)

alita_sdk/tools/cloud/gcp/__init__.py CHANGED Viewed

@@ -5,7 +5,8 @@ from pydantic import create_model, BaseModel, ConfigDict, Field, SecretStr
 from .api_wrapper import GCPApiWrapper
 from ...base.tool import BaseAction
-from ...utils import clean_string, TOOLKIT_SPLITTER, get_max_toolkit_length
+from ...elitea_base import filter_missconfigured_index_tools
+from ...utils import clean_string, get_max_toolkit_length
 name = "gcp"
@@ -19,12 +20,10 @@ def get_tools(tool):
 class GCPToolkit(BaseToolkit):
     tools: list[BaseTool] = []
-    toolkit_max_length: int = 0
     @staticmethod
     def toolkit_config_schema() -> BaseModel:
         selected_tools = {x['name']: x['args_schema'].schema() for x in GCPApiWrapper.model_construct().get_available_tools()}
-        GCPToolkit.toolkit_max_length = get_max_toolkit_length(selected_tools)
         return create_model(
             name,
             api_key=(SecretStr, Field(default="", title="API key", description="GCP API key", json_schema_extra={'secret': True})),
@@ -33,21 +32,26 @@ class GCPToolkit(BaseToolkit):
         )
     @classmethod
+    @filter_missconfigured_index_tools
     def get_toolkit(cls, selected_tools: list[str] | None = None, toolkit_name: Optional[str] = None, **kwargs):
         if selected_tools is None:
             selected_tools = []
         gcp_api_wrapper = GCPApiWrapper(**kwargs)
         available_tools = gcp_api_wrapper.get_available_tools()
         tools = []
-        prefix = clean_string(toolkit_name, cls.toolkit_max_length) + TOOLKIT_SPLITTER if toolkit_name else ''
         for tool in available_tools:
             if selected_tools and tool["name"] not in selected_tools:
                 continue
+            description = tool["description"]
+            if toolkit_name:
+                description = f"Toolkit: {toolkit_name}\n{description}"
+            description = description[:1000]
             tools.append(BaseAction(
                 api_wrapper=gcp_api_wrapper,
-                name=prefix + tool["name"],
-                description=tool["description"],
-                args_schema=tool["args_schema"]
+                name=tool["name"],
+                description=description,
+                args_schema=tool["args_schema"],
+                metadata={"toolkit_name": toolkit_name} if toolkit_name else {}
             ))
         return cls(tools=tools)

alita_sdk/tools/cloud/k8s/__init__.py CHANGED Viewed

@@ -5,7 +5,8 @@ from pydantic import create_model, BaseModel, ConfigDict, Field, SecretStr
 from .api_wrapper import KubernetesApiWrapper
 from ...base.tool import BaseAction
-from ...utils import clean_string, TOOLKIT_SPLITTER, get_max_toolkit_length
+from ...elitea_base import filter_missconfigured_index_tools
+from ...utils import clean_string, get_max_toolkit_length
 name = "kubernetes"
@@ -20,12 +21,10 @@ def get_tools(tool):
 class KubernetesToolkit(BaseToolkit):
     tools: list[BaseTool] = []
-    toolkit_max_length: int = 0
     @staticmethod
     def toolkit_config_schema() -> BaseModel:
         selected_tools = {x['name']: x['args_schema'].schema() for x in KubernetesApiWrapper.model_construct().get_available_tools()}
-        KubernetesToolkit.toolkit_max_length = get_max_toolkit_length(selected_tools)
         return create_model(
             name,
             url=(str, Field(default="", title="Cluster URL", description="The URL of the Kubernetes cluster")),
@@ -43,21 +42,26 @@ class KubernetesToolkit(BaseToolkit):
         )
     @classmethod
+    @filter_missconfigured_index_tools
     def get_toolkit(cls, selected_tools: list[str] | None = None, toolkit_name: Optional[str] = None, **kwargs):
         if selected_tools is None:
             selected_tools = []
         kubernetes_api_wrapper = KubernetesApiWrapper(**kwargs)
         available_tools = kubernetes_api_wrapper.get_available_tools()
         tools = []
-        prefix = clean_string(toolkit_name, cls.toolkit_max_length) + TOOLKIT_SPLITTER if toolkit_name else ''
         for tool in available_tools:
             if selected_tools and tool["name"] not in selected_tools:
                 continue
+            description = tool["description"]
+            if toolkit_name:
+                description = f"Toolkit: {toolkit_name}\n{description}"
+            description = description[:1000]
             tools.append(BaseAction(
                 api_wrapper=kubernetes_api_wrapper,
-                name=prefix + tool["name"],
-                description=tool["description"],
-                args_schema=tool["args_schema"]
+                name=tool["name"],
+                description=description,
+                args_schema=tool["args_schema"],
+                metadata={"toolkit_name": toolkit_name} if toolkit_name else {}
             ))
         return cls(tools=tools)

alita_sdk/tools/code/linter/__init__.py CHANGED Viewed

@@ -5,7 +5,7 @@ from pydantic import BaseModel, create_model, Field
 from .api_wrapper import PythonLinter
 from ...base.tool import BaseAction
-from ...utils import clean_string, TOOLKIT_SPLITTER, get_max_toolkit_length
+from ...utils import clean_string, get_max_toolkit_length
 name = "python_linter"
@@ -19,11 +19,9 @@ def get_tools(tool):
 class PythonLinterToolkit(BaseToolkit):
     tools: list[BaseTool] = []
-    toolkit_max_length: int = 0
     @staticmethod
     def toolkit_config_schema() -> BaseModel:
-        PythonLinterToolkit.toolkit_max_length = get_max_toolkit_length([])
         return create_model(
             name,
             error_codes=(str, Field(description="Error codes to be used by the linter")),
@@ -39,16 +37,19 @@ class PythonLinterToolkit(BaseToolkit):
         python_linter = PythonLinter(**kwargs)
         available_tools = python_linter.get_available_tools()
         tools = []
-        toolkit_max_length = get_max_toolkit_length(selected_tools)
-        prefix = clean_string(toolkit_name, PythonLinterToolkit.toolkit_max_length) + TOOLKIT_SPLITTER if toolkit_name else ''
         for tool in available_tools:
             if selected_tools and tool["name"] not in selected_tools:
                 continue
+            description = tool["description"]
+            if toolkit_name:
+                description = f"Toolkit: {toolkit_name}\n{description}"
+            description = description[:1000]
             tools.append(BaseAction(
                 api_wrapper=python_linter,
-                name=prefix + tool["name"],
-                description=tool["description"],
-                args_schema=tool["args_schema"]
+                name=tool["name"],
+                description=description,
+                args_schema=tool["args_schema"],
+                metadata={"toolkit_name": toolkit_name} if toolkit_name else {}
             ))
         return cls(tools=tools)

alita_sdk/tools/code/loaders/codesearcher.py CHANGED Viewed

@@ -4,8 +4,9 @@ def search_format(items):
     results = []
     for (doc, score) in items:
         res_chunk = ''
-        language = get_programming_language(get_file_extension(doc.metadata["filename"]))
-        res_chunk += doc.metadata["filename"] + " -> " + doc.metadata["method_name"] + " (score: " + str(score) + ")"
+        language = get_programming_language(get_file_extension(doc.metadata.get("filename", "unknown")))
+        method_name = doc.metadata.get("method_name", "text")
+        res_chunk += doc.metadata.get("filename", "unknown") + " -> " + method_name + " (score: " + str(score) + ")"
         res_chunk += "\n\n```" + language.value + "\n"+ doc.page_content + "\n```\n\n"
         results.append(res_chunk)
     return results

alita_sdk/tools/code/sonar/__init__.py CHANGED Viewed

@@ -1,36 +1,34 @@
 from typing import List, Literal, Optional
 from langchain_core.tools import BaseToolkit, BaseTool
-from pydantic import create_model, BaseModel, ConfigDict, Field, SecretStr
+from pydantic import create_model, BaseModel, ConfigDict, Field
 from .api_wrapper import SonarApiWrapper
 from ...base.tool import BaseAction
-from ...utils import clean_string, TOOLKIT_SPLITTER, get_max_toolkit_length
+from ...elitea_base import filter_missconfigured_index_tools
+from ...utils import clean_string, get_max_toolkit_length
+from ....configurations.sonar import SonarConfiguration
 name = "sonar"
 def get_tools(tool):
     return SonarToolkit().get_toolkit(
         selected_tools=tool['settings'].get('selected_tools', []),
-        url=tool['settings']['url'],
-        sonar_token=tool['settings']['sonar_token'],
         sonar_project_name=tool['settings']['sonar_project_name'],
+        sonar_configuration=tool['settings']['sonar_configuration'],
         toolkit_name=tool.get('toolkit_name')
     ).get_tools()
 class SonarToolkit(BaseToolkit):
     tools: list[BaseTool] = []
-    toolkit_max_length: int = 0
     @staticmethod
     def toolkit_config_schema() -> BaseModel:
         selected_tools = {x['name']: x['args_schema'].schema() for x in SonarApiWrapper.model_construct().get_available_tools()}
-        SonarToolkit.toolkit_max_length = get_max_toolkit_length(selected_tools)
         return create_model(
             name,
-            url=(str, Field(description="SonarQube Server URL", json_schema_extra={'toolkit_name': True, 'max_toolkit_length': SonarToolkit.toolkit_max_length})),
-            sonar_token=(SecretStr, Field(description="SonarQube user token for authentication", json_schema_extra={'secret': True})),
             sonar_project_name=(str, Field(description="Project name of the desired repository")),
+            sonar_configuration=(SonarConfiguration, Field(description="Sonar Configuration", json_schema_extra={'configuration_types': ['sonar']})),
             selected_tools=(List[Literal[tuple(selected_tools)]], Field(default=[], json_schema_extra={'args_schemas': selected_tools})),
             __config__=ConfigDict(json_schema_extra=
                                   {
@@ -44,21 +42,30 @@ class SonarToolkit(BaseToolkit):
         )
     @classmethod
+    @filter_missconfigured_index_tools
     def get_toolkit(cls, selected_tools: list[str] | None = None, toolkit_name: Optional[str] = None, **kwargs):
         if selected_tools is None:
             selected_tools = []
-        sonar_api_wrapper = SonarApiWrapper(**kwargs)
+        wrapper_payload = {
+            **kwargs,
+            **kwargs.get('sonar_configuration', {}),
+        }
+        sonar_api_wrapper = SonarApiWrapper(**wrapper_payload)
         available_tools = sonar_api_wrapper.get_available_tools()
         tools = []
-        prefix = clean_string(toolkit_name, SonarToolkit.toolkit_max_length) + TOOLKIT_SPLITTER if toolkit_name else ''
         for tool in available_tools:
             if selected_tools and tool["name"] not in selected_tools:
                 continue
+            description = tool["description"]
+            if toolkit_name:
+                description = f"Toolkit: {toolkit_name}\n{description}"
+            description = description[:1000]
             tools.append(BaseAction(
                 api_wrapper=sonar_api_wrapper,
-                name=prefix + tool["name"],
-                description=tool["description"],
-                args_schema=tool["args_schema"]
+                name=tool["name"],
+                description=description,
+                args_schema=tool["args_schema"],
+                metadata={"toolkit_name": toolkit_name} if toolkit_name else {}
             ))
         return cls(tools=tools)

alita-sdk 0.3.257__py3-none-any.whl → 0.3.562__py3-none-any.whl

alita-sdk 0.3.257py3-none-any.whl → 0.3.562py3-none-any.whl