PyPI - kiln-ai - Versions diffs - 0.20.1__py3-none-any.whl → 0.22.0__py3-none-any.whl - Mend

kiln-ai 0.20.1py3-none-any.whl → 0.22.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of kiln-ai might be problematic. Click here for more details.

Files changed (133) hide show

kiln_ai/adapters/__init__.py +6 -0
kiln_ai/adapters/adapter_registry.py +43 -226
kiln_ai/adapters/chunkers/__init__.py +13 -0
kiln_ai/adapters/chunkers/base_chunker.py +42 -0
kiln_ai/adapters/chunkers/chunker_registry.py +16 -0
kiln_ai/adapters/chunkers/fixed_window_chunker.py +39 -0
kiln_ai/adapters/chunkers/helpers.py +23 -0
kiln_ai/adapters/chunkers/test_base_chunker.py +63 -0
kiln_ai/adapters/chunkers/test_chunker_registry.py +28 -0
kiln_ai/adapters/chunkers/test_fixed_window_chunker.py +346 -0
kiln_ai/adapters/chunkers/test_helpers.py +75 -0
kiln_ai/adapters/data_gen/test_data_gen_task.py +9 -3
kiln_ai/adapters/embedding/__init__.py +0 -0
kiln_ai/adapters/embedding/base_embedding_adapter.py +44 -0
kiln_ai/adapters/embedding/embedding_registry.py +32 -0
kiln_ai/adapters/embedding/litellm_embedding_adapter.py +199 -0
kiln_ai/adapters/embedding/test_base_embedding_adapter.py +283 -0
kiln_ai/adapters/embedding/test_embedding_registry.py +166 -0
kiln_ai/adapters/embedding/test_litellm_embedding_adapter.py +1149 -0
kiln_ai/adapters/eval/eval_runner.py +6 -2
kiln_ai/adapters/eval/test_base_eval.py +1 -3
kiln_ai/adapters/eval/test_g_eval.py +1 -1
kiln_ai/adapters/extractors/__init__.py +18 -0
kiln_ai/adapters/extractors/base_extractor.py +72 -0
kiln_ai/adapters/extractors/encoding.py +20 -0
kiln_ai/adapters/extractors/extractor_registry.py +44 -0
kiln_ai/adapters/extractors/extractor_runner.py +112 -0
kiln_ai/adapters/extractors/litellm_extractor.py +406 -0
kiln_ai/adapters/extractors/test_base_extractor.py +244 -0
kiln_ai/adapters/extractors/test_encoding.py +54 -0
kiln_ai/adapters/extractors/test_extractor_registry.py +181 -0
kiln_ai/adapters/extractors/test_extractor_runner.py +181 -0
kiln_ai/adapters/extractors/test_litellm_extractor.py +1290 -0
kiln_ai/adapters/fine_tune/test_dataset_formatter.py +2 -2
kiln_ai/adapters/fine_tune/test_fireworks_tinetune.py +2 -6
kiln_ai/adapters/fine_tune/test_together_finetune.py +2 -6
kiln_ai/adapters/ml_embedding_model_list.py +494 -0
kiln_ai/adapters/ml_model_list.py +876 -18
kiln_ai/adapters/model_adapters/litellm_adapter.py +40 -75
kiln_ai/adapters/model_adapters/test_litellm_adapter.py +79 -1
kiln_ai/adapters/model_adapters/test_litellm_adapter_tools.py +119 -5
kiln_ai/adapters/model_adapters/test_saving_adapter_results.py +9 -3
kiln_ai/adapters/model_adapters/test_structured_output.py +9 -10
kiln_ai/adapters/ollama_tools.py +69 -12
kiln_ai/adapters/provider_tools.py +190 -46
kiln_ai/adapters/rag/deduplication.py +49 -0
kiln_ai/adapters/rag/progress.py +252 -0
kiln_ai/adapters/rag/rag_runners.py +844 -0
kiln_ai/adapters/rag/test_deduplication.py +195 -0
kiln_ai/adapters/rag/test_progress.py +785 -0
kiln_ai/adapters/rag/test_rag_runners.py +2376 -0
kiln_ai/adapters/remote_config.py +80 -8
kiln_ai/adapters/test_adapter_registry.py +579 -86
kiln_ai/adapters/test_ml_embedding_model_list.py +239 -0
kiln_ai/adapters/test_ml_model_list.py +202 -0
kiln_ai/adapters/test_ollama_tools.py +340 -1
kiln_ai/adapters/test_prompt_builders.py +1 -1
kiln_ai/adapters/test_provider_tools.py +199 -8
kiln_ai/adapters/test_remote_config.py +551 -56
kiln_ai/adapters/vector_store/__init__.py +1 -0
kiln_ai/adapters/vector_store/base_vector_store_adapter.py +83 -0
kiln_ai/adapters/vector_store/lancedb_adapter.py +389 -0
kiln_ai/adapters/vector_store/test_base_vector_store.py +160 -0
kiln_ai/adapters/vector_store/test_lancedb_adapter.py +1841 -0
kiln_ai/adapters/vector_store/test_vector_store_registry.py +199 -0
kiln_ai/adapters/vector_store/vector_store_registry.py +33 -0
kiln_ai/datamodel/__init__.py +16 -13
kiln_ai/datamodel/basemodel.py +201 -4
kiln_ai/datamodel/chunk.py +158 -0
kiln_ai/datamodel/datamodel_enums.py +27 -0
kiln_ai/datamodel/embedding.py +64 -0
kiln_ai/datamodel/external_tool_server.py +206 -54
kiln_ai/datamodel/extraction.py +317 -0
kiln_ai/datamodel/project.py +33 -1
kiln_ai/datamodel/rag.py +79 -0
kiln_ai/datamodel/task.py +5 -0
kiln_ai/datamodel/task_output.py +41 -11
kiln_ai/datamodel/test_attachment.py +649 -0
kiln_ai/datamodel/test_basemodel.py +270 -14
kiln_ai/datamodel/test_chunk_models.py +317 -0
kiln_ai/datamodel/test_dataset_split.py +1 -1
kiln_ai/datamodel/test_datasource.py +50 -0
kiln_ai/datamodel/test_embedding_models.py +448 -0
kiln_ai/datamodel/test_eval_model.py +6 -6
kiln_ai/datamodel/test_external_tool_server.py +534 -152
kiln_ai/datamodel/test_extraction_chunk.py +206 -0
kiln_ai/datamodel/test_extraction_model.py +501 -0
kiln_ai/datamodel/test_rag.py +641 -0
kiln_ai/datamodel/test_task.py +35 -1
kiln_ai/datamodel/test_tool_id.py +187 -1
kiln_ai/datamodel/test_vector_store.py +320 -0
kiln_ai/datamodel/tool_id.py +58 -0
kiln_ai/datamodel/vector_store.py +141 -0
kiln_ai/tools/base_tool.py +12 -3
kiln_ai/tools/built_in_tools/math_tools.py +12 -4
kiln_ai/tools/kiln_task_tool.py +158 -0
kiln_ai/tools/mcp_server_tool.py +2 -2
kiln_ai/tools/mcp_session_manager.py +51 -22
kiln_ai/tools/rag_tools.py +164 -0
kiln_ai/tools/test_kiln_task_tool.py +527 -0
kiln_ai/tools/test_mcp_server_tool.py +4 -15
kiln_ai/tools/test_mcp_session_manager.py +187 -227
kiln_ai/tools/test_rag_tools.py +929 -0
kiln_ai/tools/test_tool_registry.py +290 -7
kiln_ai/tools/tool_registry.py +69 -16
kiln_ai/utils/__init__.py +3 -0
kiln_ai/utils/async_job_runner.py +62 -17
kiln_ai/utils/config.py +2 -2
kiln_ai/utils/env.py +15 -0
kiln_ai/utils/filesystem.py +14 -0
kiln_ai/utils/filesystem_cache.py +60 -0
kiln_ai/utils/litellm.py +94 -0
kiln_ai/utils/lock.py +100 -0
kiln_ai/utils/mime_type.py +38 -0
kiln_ai/utils/open_ai_types.py +19 -2
kiln_ai/utils/pdf_utils.py +59 -0
kiln_ai/utils/test_async_job_runner.py +151 -35
kiln_ai/utils/test_env.py +142 -0
kiln_ai/utils/test_filesystem_cache.py +316 -0
kiln_ai/utils/test_litellm.py +206 -0
kiln_ai/utils/test_lock.py +185 -0
kiln_ai/utils/test_mime_type.py +66 -0
kiln_ai/utils/test_open_ai_types.py +88 -12
kiln_ai/utils/test_pdf_utils.py +86 -0
kiln_ai/utils/test_uuid.py +111 -0
kiln_ai/utils/test_validation.py +524 -0
kiln_ai/utils/uuid.py +9 -0
kiln_ai/utils/validation.py +90 -0
{kiln_ai-0.20.1.dist-info → kiln_ai-0.22.0.dist-info}/METADATA +9 -1
kiln_ai-0.22.0.dist-info/RECORD +213 -0
kiln_ai-0.20.1.dist-info/RECORD +0 -138
{kiln_ai-0.20.1.dist-info → kiln_ai-0.22.0.dist-info}/WHEEL +0 -0
{kiln_ai-0.20.1.dist-info → kiln_ai-0.22.0.dist-info}/licenses/LICENSE.txt +0 -0

kiln_ai/tools/test_tool_registry.py CHANGED Viewed

@@ -1,15 +1,22 @@
+from pathlib import Path
 from unittest.mock import Mock
 import pytest
-from kiln_ai.datamodel.external_tool_server import ExternalToolServer, ToolServerType
+from kiln_ai.datamodel.external_tool_server import (
+    ExternalToolServer,
+    ToolServerType,
+)
 from kiln_ai.datamodel.project import Project
 from kiln_ai.datamodel.task import Task
 from kiln_ai.datamodel.tool_id import (
+    KILN_TASK_TOOL_ID_PREFIX,
     MCP_LOCAL_TOOL_ID_PREFIX,
     MCP_REMOTE_TOOL_ID_PREFIX,
+    RAG_TOOL_ID_PREFIX,
     KilnBuiltInToolId,
     _check_tool_id,
+    kiln_task_server_id_from_tool_id,
     mcp_server_and_tool_name_from_id,
 )
 from kiln_ai.tools.built_in_tools.math_tools import (
@@ -18,6 +25,7 @@ from kiln_ai.tools.built_in_tools.math_tools import (
     MultiplyTool,
     SubtractTool,
 )
+from kiln_ai.tools.kiln_task_tool import KilnTaskTool
 from kiln_ai.tools.mcp_server_tool import MCPServerTool
 from kiln_ai.tools.tool_registry import tool_from_id
@@ -85,7 +93,6 @@ class TestToolRegistry:
             type=ToolServerType.remote_mcp,
             properties={
                 "server_url": "https://example.com",
-                "headers": {},
             },
         )
@@ -143,7 +150,7 @@ class TestToolRegistry:
         tool_id = f"{MCP_LOCAL_TOOL_ID_PREFIX}test_server::test_tool"
         with pytest.raises(
             ValueError,
-            match="Unable to resolve tool from id.*Requires a parent project/task",
+            match=r"Unable to resolve tool from id.*Requires a parent project/task",
         ):
             tool_from_id(tool_id, task=None)
@@ -155,7 +162,6 @@ class TestToolRegistry:
             type=ToolServerType.remote_mcp,
             properties={
                 "server_url": "https://example.com",
-                "headers": {},
             },
         )
@@ -181,6 +187,93 @@ class TestToolRegistry:
             ):
                 tool_from_id(tool_id, task=mock_task)
+    def test_tool_from_id_rag_tool_success(self):
+        """Test that tool_from_id works with RAG tool IDs."""
+        # Create mock RAG config
+        from unittest.mock import patch
+        with (
+            patch("kiln_ai.tools.tool_registry.RagConfig") as mock_rag_config_class,
+            patch("kiln_ai.tools.rag_tools.RagTool") as mock_rag_tool_class,
+        ):
+            # Setup mock RAG config
+            mock_rag_config = Mock()
+            mock_rag_config.id = "test_rag_config"
+            mock_rag_config_class.from_id_and_parent_path.return_value = mock_rag_config
+            # Setup mock RAG tool
+            mock_rag_tool = Mock()
+            mock_rag_tool_class.return_value = mock_rag_tool
+            # Create mock project
+            mock_project = Mock(spec=Project)
+            mock_project.id = "test_project_id"
+            mock_project.path = Path("/test/path")
+            # Create mock task with parent project
+            mock_task = Mock(spec=Task)
+            mock_task.parent_project.return_value = mock_project
+            # Test with RAG tool ID
+            tool_id = f"{RAG_TOOL_ID_PREFIX}test_rag_config"
+            tool = tool_from_id(tool_id, task=mock_task)
+            # Verify the tool is RagTool
+            assert tool == mock_rag_tool
+            mock_rag_config_class.from_id_and_parent_path.assert_called_once_with(
+                "test_rag_config", Path("/test/path")
+            )
+            mock_rag_tool_class.assert_called_once_with(tool_id, mock_rag_config)
+    def test_tool_from_id_rag_tool_no_task(self):
+        """Test that RAG tool ID without task raises ValueError."""
+        tool_id = f"{RAG_TOOL_ID_PREFIX}test_rag_config"
+        with pytest.raises(
+            ValueError,
+            match=r"Unable to resolve tool from id.*Requires a parent project/task",
+        ):
+            tool_from_id(tool_id, task=None)
+    def test_tool_from_id_rag_tool_no_project(self):
+        """Test that RAG tool ID with task but no project raises ValueError."""
+        # Create mock task without parent project
+        mock_task = Mock(spec=Task)
+        mock_task.parent_project.return_value = None
+        tool_id = f"{RAG_TOOL_ID_PREFIX}test_rag_config"
+        with pytest.raises(
+            ValueError,
+            match=r"Unable to resolve tool from id.*Requires a parent project/task",
+        ):
+            tool_from_id(tool_id, task=mock_task)
+    def test_tool_from_id_rag_config_not_found(self):
+        """Test that RAG tool ID with missing RAG config raises ValueError."""
+        from unittest.mock import patch
+        with patch("kiln_ai.tools.tool_registry.RagConfig") as mock_rag_config_class:
+            # Setup mock to return None (config not found)
+            mock_rag_config_class.from_id_and_parent_path.return_value = None
+            # Create mock project
+            mock_project = Mock(spec=Project)
+            mock_project.id = "test_project_id"
+            mock_project.path = Path("/test/path")
+            # Create mock task with parent project
+            mock_task = Mock(spec=Task)
+            mock_task.parent_project.return_value = mock_project
+            tool_id = f"{RAG_TOOL_ID_PREFIX}missing_rag_config"
+            with pytest.raises(
+                ValueError,
+                match="RAG config not found: missing_rag_config in project test_project_id for tool",
+            ):
+                tool_from_id(tool_id, task=mock_task)
     def test_all_built_in_tools_are_registered(self):
         """Test that all KilnBuiltInToolId enum members are handled by the registry."""
         for tool_id in KilnBuiltInToolId:
@@ -272,6 +365,48 @@ class TestToolRegistry:
             with pytest.raises(ValueError, match=f"Invalid tool ID: {invalid_id}"):
                 _check_tool_id(invalid_id)
+    def test_check_tool_id_valid_kiln_task_tool_id(self):
+        """Test that _check_tool_id accepts valid Kiln task tool IDs."""
+        valid_kiln_task_ids = [
+            f"{KILN_TASK_TOOL_ID_PREFIX}server123",
+            f"{KILN_TASK_TOOL_ID_PREFIX}my_task_server",
+            f"{KILN_TASK_TOOL_ID_PREFIX}123456789",
+            f"{KILN_TASK_TOOL_ID_PREFIX}server_with_underscores",
+            f"{KILN_TASK_TOOL_ID_PREFIX}server-with-dashes",
+        ]
+        for tool_id in valid_kiln_task_ids:
+            result = _check_tool_id(tool_id)
+            assert result == tool_id
+    def test_check_tool_id_invalid_kiln_task_tool_id(self):
+        """Test that _check_tool_id rejects invalid Kiln task tool IDs."""
+        # These start with the prefix but have wrong format
+        invalid_kiln_task_format_ids = [
+            f"{KILN_TASK_TOOL_ID_PREFIX}",  # Missing server ID
+            f"{KILN_TASK_TOOL_ID_PREFIX}::",  # Empty server ID
+            f"{KILN_TASK_TOOL_ID_PREFIX}server::tool",  # Too many parts (3 instead of 2)
+            f"{KILN_TASK_TOOL_ID_PREFIX}server::tool::extra",  # Too many parts (4 instead of 2)
+        ]
+        for invalid_id in invalid_kiln_task_format_ids:
+            with pytest.raises(
+                ValueError, match=f"Invalid Kiln task tool ID format: {invalid_id}"
+            ):
+                _check_tool_id(invalid_id)
+        # These don't match the prefix - get generic error
+        invalid_generic_ids = [
+            "kiln_task:",  # Missing last colon (doesn't match full prefix)
+            "kiln:task::server",  # Wrong prefix format
+            "kiln_task_server",  # Missing colons
+            "task::server",  # Missing kiln prefix
+        ]
+        for invalid_id in invalid_generic_ids:
+            with pytest.raises(ValueError, match=f"Invalid tool ID: {invalid_id}"):
+                _check_tool_id(invalid_id)
     def test_mcp_server_and_tool_name_from_id_valid_inputs(self):
         """Test that mcp_server_and_tool_name_from_id correctly parses valid MCP tool IDs."""
         test_cases = [
@@ -400,13 +535,71 @@ class TestToolRegistry:
         assert server_id == expected_server
         assert tool_name == expected_tool
+    def test_kiln_task_server_id_from_tool_id_valid_inputs(self):
+        """Test that kiln_task_server_id_from_tool_id correctly parses valid Kiln task tool IDs."""
+        test_cases = [
+            ("kiln_task::server123", "server123"),
+            ("kiln_task::my_task_server", "my_task_server"),
+            ("kiln_task::123456789", "123456789"),
+            ("kiln_task::server_with_underscores", "server_with_underscores"),
+            ("kiln_task::server-with-dashes", "server-with-dashes"),
+            ("kiln_task::a", "a"),  # Minimal valid case
+            (
+                "kiln_task::very_long_server_name_with_numbers_123",
+                "very_long_server_name_with_numbers_123",
+            ),
+        ]
+        for tool_id, expected_server_id in test_cases:
+            result = kiln_task_server_id_from_tool_id(tool_id)
+            assert result == expected_server_id, (
+                f"Failed for {tool_id}: expected {expected_server_id}, got {result}"
+            )
+    def test_kiln_task_server_id_from_tool_id_invalid_inputs(self):
+        """Test that kiln_task_server_id_from_tool_id raises ValueError for invalid Kiln task tool IDs."""
+        invalid_inputs = [
+            "kiln_task::",  # Empty server ID
+            "kiln_task::server::tool",  # Too many parts (3 instead of 2)
+            "kiln_task::server::tool::extra",  # Too many parts (4 instead of 2)
+            "invalid::format",  # Wrong prefix
+            "",  # Empty string
+            "single_part",  # No separators
+            "two::parts",  # Only 2 parts but wrong prefix
+            "kiln_task",  # Missing colons
+        ]
+        for invalid_id in invalid_inputs:
+            with pytest.raises(
+                ValueError,
+                match=r"Invalid Kiln task tool ID format:.*Expected format.*kiln_task::<server_id>",
+            ):
+                kiln_task_server_id_from_tool_id(invalid_id)
+    @pytest.mark.parametrize(
+        "tool_id,expected_server_id",
+        [
+            ("kiln_task::test_server", "test_server"),
+            ("kiln_task::s", "s"),
+            ("kiln_task::long_server_name_123", "long_server_name_123"),
+            ("kiln_task::server-with-dashes", "server-with-dashes"),
+            ("kiln_task::server_with_underscores", "server_with_underscores"),
+        ],
+    )
+    def test_kiln_task_server_id_from_tool_id_parametrized(
+        self, tool_id, expected_server_id
+    ):
+        """Parametrized test for kiln_task_server_id_from_tool_id with various valid inputs."""
+        server_id = kiln_task_server_id_from_tool_id(tool_id)
+        assert server_id == expected_server_id
     def test_tool_from_id_mcp_missing_task_raises_error(self):
         """Test that MCP tool ID with missing task raises ValueError."""
         mcp_tool_id = f"{MCP_REMOTE_TOOL_ID_PREFIX}test_server::test_tool"
         with pytest.raises(
             ValueError,
-            match="Unable to resolve tool from id.*Requires a parent project/task",
+            match=r"Unable to resolve tool from id.*Requires a parent project/task",
         ):
             tool_from_id(mcp_tool_id, task=None)
@@ -419,7 +612,6 @@ class TestToolRegistry:
             description="Test MCP server",
             properties={
                 "server_url": "https://example.com",
-                "headers": {},
             },
         )
@@ -450,7 +642,6 @@ class TestToolRegistry:
             description="Different MCP server",
             properties={
                 "server_url": "https://example.com",
-                "headers": {},
             },
         )
@@ -471,3 +662,95 @@ class TestToolRegistry:
             match="External tool server not found: nonexistent_server in project ID test_project_id",
         ):
             tool_from_id(mcp_tool_id, task=mock_task)
+    def test_tool_from_id_kiln_task_tool_success(self):
+        """Test that tool_from_id works with Kiln task tool IDs."""
+        # Create mock external tool server for Kiln task
+        mock_server = ExternalToolServer(
+            name="test_kiln_task_server",
+            type=ToolServerType.kiln_task,
+            description="Test Kiln task server",
+            properties={
+                "name": "test_task_tool",
+                "description": "A test task tool",
+                "task_id": "test_task_123",
+                "run_config_id": "test_config_456",
+                "is_archived": False,
+            },
+        )
+        # Create mock project with the external tool server
+        mock_project = Mock(spec=Project)
+        mock_project.id = "test_project_id"
+        mock_project.external_tool_servers.return_value = [mock_server]
+        # Create mock task with parent project
+        mock_task = Mock(spec=Task)
+        mock_task.parent_project.return_value = mock_project
+        # Test with Kiln task tool ID
+        tool_id = f"{KILN_TASK_TOOL_ID_PREFIX}{mock_server.id}"
+        tool = tool_from_id(tool_id, task=mock_task)
+        # Verify the tool is KilnTaskTool
+        assert isinstance(tool, KilnTaskTool)
+        assert tool._project_id == "test_project_id"
+        assert tool._tool_id == tool_id
+        assert tool._tool_server_model == mock_server
+    def test_tool_from_id_kiln_task_tool_no_task(self):
+        """Test that Kiln task tool ID without task raises ValueError."""
+        tool_id = f"{KILN_TASK_TOOL_ID_PREFIX}test_server"
+        with pytest.raises(
+            ValueError,
+            match=r"Unable to resolve tool from id.*Requires a parent project/task",
+        ):
+            tool_from_id(tool_id, task=None)
+    def test_tool_from_id_kiln_task_tool_no_project(self):
+        """Test that Kiln task tool ID with task but no project raises ValueError."""
+        # Create mock task without parent project
+        mock_task = Mock(spec=Task)
+        mock_task.parent_project.return_value = None
+        tool_id = f"{KILN_TASK_TOOL_ID_PREFIX}test_server"
+        with pytest.raises(
+            ValueError,
+            match=r"Unable to resolve tool from id.*Requires a parent project/task",
+        ):
+            tool_from_id(tool_id, task=mock_task)
+    def test_tool_from_id_kiln_task_tool_server_not_found(self):
+        """Test that Kiln task tool ID with server not found raises ValueError."""
+        # Create mock external tool server with different ID
+        mock_server = ExternalToolServer(
+            name="different_server",
+            type=ToolServerType.kiln_task,
+            description="Different Kiln task server",
+            properties={
+                "name": "different_tool",
+                "description": "A different task tool",
+                "task_id": "different_task_123",
+                "run_config_id": "different_config_456",
+                "is_archived": False,
+            },
+        )
+        # Create mock project with the external tool server
+        mock_project = Mock(spec=Project)
+        mock_project.id = "test_project_id"
+        mock_project.external_tool_servers.return_value = [mock_server]
+        # Create mock task with parent project
+        mock_task = Mock(spec=Task)
+        mock_task.parent_project.return_value = mock_project
+        # Use a tool ID with a server that doesn't exist in the project
+        tool_id = f"{KILN_TASK_TOOL_ID_PREFIX}nonexistent_server"
+        with pytest.raises(
+            ValueError,
+            match="Kiln Task External tool server not found: nonexistent_server in project ID test_project_id",
+        ):
+            tool_from_id(tool_id, task=mock_task)

kiln_ai/tools/tool_registry.py CHANGED Viewed

@@ -1,9 +1,14 @@
+from kiln_ai.datamodel.rag import RagConfig
 from kiln_ai.datamodel.task import Task
 from kiln_ai.datamodel.tool_id import (
+    KILN_TASK_TOOL_ID_PREFIX,
     MCP_LOCAL_TOOL_ID_PREFIX,
     MCP_REMOTE_TOOL_ID_PREFIX,
+    RAG_TOOL_ID_PREFIX,
     KilnBuiltInToolId,
+    kiln_task_server_id_from_tool_id,
     mcp_server_and_tool_name_from_id,
+    rag_config_id_from_id,
 )
 from kiln_ai.tools.base_tool import KilnToolInterface
 from kiln_ai.tools.built_in_tools.math_tools import (
@@ -12,6 +17,7 @@ from kiln_ai.tools.built_in_tools.math_tools import (
     MultiplyTool,
     SubtractTool,
 )
+from kiln_ai.tools.kiln_task_tool import KilnTaskTool
 from kiln_ai.tools.mcp_server_tool import MCPServerTool
 from kiln_ai.utils.exhaustive_error import raise_exhaustive_enum_error
@@ -35,30 +41,77 @@ def tool_from_id(tool_id: str, task: Task | None = None) -> KilnToolInterface:
             case _:
                 raise_exhaustive_enum_error(typed_tool_id)
-    # Check MCP Server Tools
-    if tool_id.startswith((MCP_REMOTE_TOOL_ID_PREFIX, MCP_LOCAL_TOOL_ID_PREFIX)):
+    # Check if this looks like an MCP or Kiln Task tool ID that requires a project
+    is_mcp_tool = tool_id.startswith(
+        (MCP_REMOTE_TOOL_ID_PREFIX, MCP_LOCAL_TOOL_ID_PREFIX)
+    )
+    is_kiln_task_tool = tool_id.startswith(KILN_TASK_TOOL_ID_PREFIX)
+    if is_mcp_tool or is_kiln_task_tool:
         project = task.parent_project() if task is not None else None
-        if project is None:
+        if project is None or project.id is None:
             raise ValueError(
                 f"Unable to resolve tool from id: {tool_id}. Requires a parent project/task."
             )
-        # Get the tool server ID and tool name from the ID
-        tool_server_id, tool_name = mcp_server_and_tool_name_from_id(tool_id)
+        # Check MCP Server Tools
+        if is_mcp_tool:
+            # Get the tool server ID and tool name from the ID
+            tool_server_id, tool_name = mcp_server_and_tool_name_from_id(
+                tool_id
+            )  # Fixed function name
+            server = next(
+                (
+                    server
+                    for server in project.external_tool_servers()
+                    if server.id == tool_server_id
+                ),
+                None,
+            )
+            if server is None:
+                raise ValueError(
+                    f"External tool server not found: {tool_server_id} in project ID {project.id}"
+                )
+            return MCPServerTool(server, tool_name)
+        # Check Kiln Task Tools
+        if is_kiln_task_tool:
+            server_id = kiln_task_server_id_from_tool_id(tool_id)
+            server = next(
+                (
+                    server
+                    for server in project.external_tool_servers()
+                    if server.id == server_id
+                ),
+                None,
+            )
+            if server is None:
+                raise ValueError(
+                    f"Kiln Task External tool server not found: {server_id} in project ID {project.id}"
+                )
+            return KilnTaskTool(project.id, tool_id, server)
+    elif tool_id.startswith(RAG_TOOL_ID_PREFIX):
+        project = task.parent_project() if task is not None else None
+        if project is None:
+            raise ValueError(
+                f"Unable to resolve tool from id: {tool_id}. Requires a parent project/task."
+            )
-        server = next(
-            (
-                server
-                for server in project.external_tool_servers()
-                if server.id == tool_server_id
-            ),
-            None,
-        )
-        if server is None:
+        rag_config_id = rag_config_id_from_id(tool_id)
+        rag_config = RagConfig.from_id_and_parent_path(rag_config_id, project.path)
+        if rag_config is None:
             raise ValueError(
-                f"External tool server not found: {tool_server_id} in project ID {project.id}"
+                f"RAG config not found: {rag_config_id} in project {project.id} for tool {tool_id}"
             )
-        return MCPServerTool(server, tool_name)
+        # Lazy import to avoid circular dependency
+        from kiln_ai.tools.rag_tools import RagTool
+        return RagTool(tool_id, rag_config)
     raise ValueError(f"Tool ID {tool_id} not found in tool registry")

kiln_ai/utils/__init__.py CHANGED Viewed

@@ -5,8 +5,11 @@ Misc utilities used in the kiln_ai library.
 """
 from . import config, formatting
+from .lock import AsyncLockManager, shared_async_lock_manager
 __all__ = [
+    "AsyncLockManager",
     "config",
     "formatting",
+    "shared_async_lock_manager",
 ]

kiln_ai/utils/async_job_runner.py CHANGED Viewed

@@ -1,7 +1,7 @@
 import asyncio
 import logging
 from dataclasses import dataclass
-from typing import AsyncGenerator, Awaitable, Callable, List, TypeVar
+from typing import AsyncGenerator, Awaitable, Callable, Generic, List, TypeVar
 logger = logging.getLogger(__name__)
@@ -15,29 +15,66 @@ class Progress:
     errors: int
-class AsyncJobRunner:
-    def __init__(self, concurrency: int = 1):
+class AsyncJobRunnerObserver(Generic[T]):
+    async def on_error(self, job: T, error: Exception):
+        """
+        Called when a job raises an unhandled exception.
+        """
+        pass
+    async def on_success(self, job: T):
+        """
+        Called when a job completes successfully.
+        """
+        pass
+    async def on_job_start(self, job: T):
+        """
+        Called when a job starts.
+        """
+        pass
+class AsyncJobRunner(Generic[T]):
+    def __init__(
+        self,
+        jobs: List[T],
+        run_job_fn: Callable[[T], Awaitable[bool]],
+        concurrency: int = 1,
+        observers: List[AsyncJobRunnerObserver[T]] | None = None,
+    ):
         if concurrency < 1:
             raise ValueError("concurrency must be ≥ 1")
         self.concurrency = concurrency
+        self.jobs = jobs
+        self.run_job_fn = run_job_fn
+        self.observers = observers or []
-    async def run(
-        self,
-        jobs: List[T],
-        run_job: Callable[[T], Awaitable[bool]],
-    ) -> AsyncGenerator[Progress, None]:
+    async def notify_error(self, job: T, error: Exception):
+        for observer in self.observers:
+            await observer.on_error(job, error)
+    async def notify_success(self, job: T):
+        for observer in self.observers:
+            await observer.on_success(job)
+    async def notify_job_start(self, job: T):
+        for observer in self.observers:
+            await observer.on_job_start(job)
+    async def run(self) -> AsyncGenerator[Progress, None]:
         """
         Runs the jobs with parallel workers and yields progress updates.
         """
         complete = 0
         errors = 0
-        total = len(jobs)
+        total = len(self.jobs)
         # Send initial status
         yield Progress(complete=complete, total=total, errors=errors)
         worker_queue: asyncio.Queue[T] = asyncio.Queue()
-        for job in jobs:
+        for job in self.jobs:
             worker_queue.put_nowait(job)
         # simple status queue to return progress. True=success, False=error
@@ -46,7 +83,7 @@ class AsyncJobRunner:
         workers = []
         for _ in range(self.concurrency):
             task = asyncio.create_task(
-                self._run_worker(worker_queue, status_queue, run_job),
+                self._run_worker(worker_queue, status_queue, self.run_job_fn),
             )
             workers.append(task)
@@ -64,7 +101,11 @@ class AsyncJobRunner:
                     else:
                         errors += 1
-                    yield Progress(complete=complete, total=total, errors=errors)
+                    yield Progress(
+                        complete=complete,
+                        total=total,
+                        errors=errors,
+                    )
                 except asyncio.TimeoutError:
                     # Timeout is expected, just continue to recheck worker status
                     # Don't love this but beats sentinels for reliability
@@ -82,7 +123,7 @@ class AsyncJobRunner:
         self,
         worker_queue: asyncio.Queue[T],
         status_queue: asyncio.Queue[bool],
-        run_job: Callable[[T], Awaitable[bool]],
+        run_job_fn: Callable[[T], Awaitable[bool]],
     ):
         while True:
             try:
@@ -92,13 +133,17 @@ class AsyncJobRunner:
                 break
             try:
-                success = await run_job(job)
-            except Exception:
+                await self.notify_job_start(job)
+                result = await run_job_fn(job)
+                if result:
+                    await self.notify_success(job)
+            except Exception as e:
                 logger.error("Job failed to complete", exc_info=True)
-                success = False
+                await self.notify_error(job, e)
+                result = False
             try:
-                await status_queue.put(success)
+                await status_queue.put(result)
             except Exception:
                 logger.error("Failed to enqueue status for job", exc_info=True)
             finally:

kiln_ai/utils/config.py CHANGED Viewed

@@ -221,14 +221,14 @@ class Config:
             raise AttributeError(f"Config has no attribute '{name}'")
     @classmethod
-    def settings_dir(cls, create=True):
+    def settings_dir(cls, create=True) -> str:
         settings_dir = os.path.join(Path.home(), ".kiln_ai")
         if create and not os.path.exists(settings_dir):
             os.makedirs(settings_dir)
         return settings_dir
     @classmethod
-    def settings_path(cls, create=True):
+    def settings_path(cls, create=True) -> str:
         settings_dir = cls.settings_dir(create)
         return os.path.join(settings_dir, "settings.yaml")

kiln_ai/utils/env.py ADDED Viewed

@@ -0,0 +1,15 @@
+import os
+from contextlib import contextmanager
+@contextmanager
+def temporary_env(var_name: str, value: str):
+    old_value = os.environ.get(var_name)
+    os.environ[var_name] = value
+    try:
+        yield
+    finally:
+        if old_value is None:
+            os.environ.pop(var_name, None)  # remove if it did not exist before
+        else:
+            os.environ[var_name] = old_value

kiln-ai 0.20.1__py3-none-any.whl → 0.22.0__py3-none-any.whl

Potentially problematic release.

kiln-ai 0.20.1py3-none-any.whl → 0.22.0py3-none-any.whl