PyPI - kiln-ai - Versions diffs - 0.19.0__py3-none-any.whl → 0.20.1__py3-none-any.whl - Mend

kiln-ai 0.19.0py3-none-any.whl → 0.20.1py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of kiln-ai might be problematic. Click here for more details.

Files changed (70) hide show

kiln_ai/adapters/__init__.py +2 -2
kiln_ai/adapters/adapter_registry.py +19 -1
kiln_ai/adapters/chat/chat_formatter.py +8 -12
kiln_ai/adapters/chat/test_chat_formatter.py +6 -2
kiln_ai/adapters/docker_model_runner_tools.py +119 -0
kiln_ai/adapters/eval/base_eval.py +2 -2
kiln_ai/adapters/eval/eval_runner.py +3 -1
kiln_ai/adapters/eval/g_eval.py +2 -2
kiln_ai/adapters/eval/test_base_eval.py +1 -1
kiln_ai/adapters/eval/test_g_eval.py +3 -4
kiln_ai/adapters/fine_tune/__init__.py +1 -1
kiln_ai/adapters/fine_tune/openai_finetune.py +14 -4
kiln_ai/adapters/fine_tune/test_openai_finetune.py +108 -111
kiln_ai/adapters/ml_model_list.py +380 -34
kiln_ai/adapters/model_adapters/base_adapter.py +51 -21
kiln_ai/adapters/model_adapters/litellm_adapter.py +383 -79
kiln_ai/adapters/model_adapters/test_base_adapter.py +193 -17
kiln_ai/adapters/model_adapters/test_litellm_adapter.py +406 -1
kiln_ai/adapters/model_adapters/test_litellm_adapter_tools.py +1103 -0
kiln_ai/adapters/model_adapters/test_saving_adapter_results.py +5 -5
kiln_ai/adapters/model_adapters/test_structured_output.py +110 -4
kiln_ai/adapters/parsers/__init__.py +1 -1
kiln_ai/adapters/provider_tools.py +15 -1
kiln_ai/adapters/repair/test_repair_task.py +12 -9
kiln_ai/adapters/run_output.py +3 -0
kiln_ai/adapters/test_adapter_registry.py +80 -1
kiln_ai/adapters/test_docker_model_runner_tools.py +305 -0
kiln_ai/adapters/test_ml_model_list.py +39 -1
kiln_ai/adapters/test_prompt_adaptors.py +13 -6
kiln_ai/adapters/test_provider_tools.py +55 -0
kiln_ai/adapters/test_remote_config.py +98 -0
kiln_ai/datamodel/__init__.py +23 -21
kiln_ai/datamodel/datamodel_enums.py +1 -0
kiln_ai/datamodel/eval.py +1 -1
kiln_ai/datamodel/external_tool_server.py +298 -0
kiln_ai/datamodel/json_schema.py +25 -10
kiln_ai/datamodel/project.py +8 -1
kiln_ai/datamodel/registry.py +0 -15
kiln_ai/datamodel/run_config.py +62 -0
kiln_ai/datamodel/task.py +2 -77
kiln_ai/datamodel/task_output.py +6 -1
kiln_ai/datamodel/task_run.py +41 -0
kiln_ai/datamodel/test_basemodel.py +3 -3
kiln_ai/datamodel/test_example_models.py +175 -0
kiln_ai/datamodel/test_external_tool_server.py +691 -0
kiln_ai/datamodel/test_registry.py +8 -3
kiln_ai/datamodel/test_task.py +15 -47
kiln_ai/datamodel/test_tool_id.py +239 -0
kiln_ai/datamodel/tool_id.py +83 -0
kiln_ai/tools/__init__.py +8 -0
kiln_ai/tools/base_tool.py +82 -0
kiln_ai/tools/built_in_tools/__init__.py +13 -0
kiln_ai/tools/built_in_tools/math_tools.py +124 -0
kiln_ai/tools/built_in_tools/test_math_tools.py +204 -0
kiln_ai/tools/mcp_server_tool.py +95 -0
kiln_ai/tools/mcp_session_manager.py +243 -0
kiln_ai/tools/test_base_tools.py +199 -0
kiln_ai/tools/test_mcp_server_tool.py +457 -0
kiln_ai/tools/test_mcp_session_manager.py +1585 -0
kiln_ai/tools/test_tool_registry.py +473 -0
kiln_ai/tools/tool_registry.py +64 -0
kiln_ai/utils/config.py +22 -0
kiln_ai/utils/open_ai_types.py +94 -0
kiln_ai/utils/project_utils.py +17 -0
kiln_ai/utils/test_config.py +138 -1
kiln_ai/utils/test_open_ai_types.py +131 -0
{kiln_ai-0.19.0.dist-info → kiln_ai-0.20.1.dist-info}/METADATA +6 -5
{kiln_ai-0.19.0.dist-info → kiln_ai-0.20.1.dist-info}/RECORD +70 -47
{kiln_ai-0.19.0.dist-info → kiln_ai-0.20.1.dist-info}/WHEEL +0 -0
{kiln_ai-0.19.0.dist-info → kiln_ai-0.20.1.dist-info}/licenses/LICENSE.txt +0 -0

kiln_ai/datamodel/test_example_models.py CHANGED Viewed

@@ -797,3 +797,178 @@ def test_usage_model_in_task_run(valid_task_run):
     assert task_run.usage.output_tokens == 50
     assert task_run.usage.total_tokens == 150
     assert task_run.usage.cost == 0.002
+@pytest.mark.parametrize(
+    "usage1_data,usage2_data,expected_data",
+    [
+        # None + None = None
+        (
+            {
+                "input_tokens": None,
+                "output_tokens": None,
+                "total_tokens": None,
+                "cost": None,
+            },
+            {
+                "input_tokens": None,
+                "output_tokens": None,
+                "total_tokens": None,
+                "cost": None,
+            },
+            {
+                "input_tokens": None,
+                "output_tokens": None,
+                "total_tokens": None,
+                "cost": None,
+            },
+        ),
+        # None + value = value
+        (
+            {
+                "input_tokens": None,
+                "output_tokens": None,
+                "total_tokens": None,
+                "cost": None,
+            },
+            {
+                "input_tokens": 100,
+                "output_tokens": 50,
+                "total_tokens": 150,
+                "cost": 0.005,
+            },
+            {
+                "input_tokens": 100,
+                "output_tokens": 50,
+                "total_tokens": 150,
+                "cost": 0.005,
+            },
+        ),
+        # value + None = value
+        (
+            {
+                "input_tokens": 100,
+                "output_tokens": 50,
+                "total_tokens": 150,
+                "cost": 0.005,
+            },
+            {
+                "input_tokens": None,
+                "output_tokens": None,
+                "total_tokens": None,
+                "cost": None,
+            },
+            {
+                "input_tokens": 100,
+                "output_tokens": 50,
+                "total_tokens": 150,
+                "cost": 0.005,
+            },
+        ),
+        # value1 + value2 = value1 + value2
+        (
+            {
+                "input_tokens": 100,
+                "output_tokens": 50,
+                "total_tokens": 150,
+                "cost": 0.005,
+            },
+            {
+                "input_tokens": 200,
+                "output_tokens": 75,
+                "total_tokens": 275,
+                "cost": 0.010,
+            },
+            {
+                "input_tokens": 300,
+                "output_tokens": 125,
+                "total_tokens": 425,
+                "cost": 0.015,
+            },
+        ),
+        # Mixed scenarios
+        (
+            {
+                "input_tokens": 100,
+                "output_tokens": None,
+                "total_tokens": 150,
+                "cost": None,
+            },
+            {
+                "input_tokens": None,
+                "output_tokens": 75,
+                "total_tokens": None,
+                "cost": 0.010,
+            },
+            {
+                "input_tokens": 100,
+                "output_tokens": 75,
+                "total_tokens": 150,
+                "cost": 0.010,
+            },
+        ),
+        # Edge case: zeros
+        (
+            {"input_tokens": 0, "output_tokens": 0, "total_tokens": 0, "cost": 0.0},
+            {
+                "input_tokens": 100,
+                "output_tokens": 50,
+                "total_tokens": 150,
+                "cost": 0.005,
+            },
+            {
+                "input_tokens": 100,
+                "output_tokens": 50,
+                "total_tokens": 150,
+                "cost": 0.005,
+            },
+        ),
+    ],
+)
+def test_usage_addition(usage1_data, usage2_data, expected_data):
+    """Test Usage addition with various combinations of None and numeric values."""
+    usage1 = Usage(**usage1_data)
+    usage2 = Usage(**usage2_data)
+    result = usage1 + usage2
+    assert result.input_tokens == expected_data["input_tokens"]
+    assert result.output_tokens == expected_data["output_tokens"]
+    assert result.total_tokens == expected_data["total_tokens"]
+    assert result.cost == expected_data["cost"]
+def test_usage_addition_type_error():
+    """Test that adding Usage to non-Usage raises TypeError."""
+    usage = Usage(input_tokens=100, output_tokens=50, total_tokens=150, cost=0.005)
+    with pytest.raises(TypeError, match="Cannot add Usage with"):
+        usage + "not_a_usage"  # type: ignore
+    with pytest.raises(TypeError, match="Cannot add Usage with"):
+        usage + 42  # type: ignore
+    with pytest.raises(TypeError, match="Cannot add Usage with"):
+        usage + {"input_tokens": 100}  # type: ignore
+def test_usage_addition_immutability():
+    """Test that addition creates new Usage objects and doesn't mutate originals."""
+    usage1 = Usage(input_tokens=100, output_tokens=50, total_tokens=150, cost=0.005)
+    usage2 = Usage(input_tokens=200, output_tokens=75, total_tokens=275, cost=0.010)
+    original_usage1_data = usage1.model_dump()
+    original_usage2_data = usage2.model_dump()
+    result = usage1 + usage2
+    # Original objects should be unchanged
+    assert usage1.model_dump() == original_usage1_data
+    assert usage2.model_dump() == original_usage2_data
+    # Result should be a new object
+    assert result is not usage1
+    assert result is not usage2
+    assert result.input_tokens == 300
+    assert result.output_tokens == 125
+    assert result.total_tokens == 425
+    assert result.cost == 0.015

kiln-ai 0.19.0__py3-none-any.whl → 0.20.1__py3-none-any.whl

Potentially problematic release.

kiln-ai 0.19.0py3-none-any.whl → 0.20.1py3-none-any.whl