PyPI - kiln-ai - Versions diffs - 0.8.1__py3-none-any.whl → 0.11.1__py3-none-any.whl - Mend

kiln-ai 0.8.1py3-none-any.whl → 0.11.1py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of kiln-ai might be problematic. Click here for more details.

Files changed (57) hide show

kiln_ai/adapters/__init__.py +7 -7
kiln_ai/adapters/adapter_registry.py +77 -5
kiln_ai/adapters/data_gen/data_gen_task.py +3 -3
kiln_ai/adapters/data_gen/test_data_gen_task.py +23 -3
kiln_ai/adapters/fine_tune/base_finetune.py +5 -1
kiln_ai/adapters/fine_tune/dataset_formatter.py +310 -65
kiln_ai/adapters/fine_tune/fireworks_finetune.py +47 -32
kiln_ai/adapters/fine_tune/openai_finetune.py +12 -11
kiln_ai/adapters/fine_tune/test_base_finetune.py +19 -0
kiln_ai/adapters/fine_tune/test_dataset_formatter.py +469 -129
kiln_ai/adapters/fine_tune/test_fireworks_tinetune.py +113 -21
kiln_ai/adapters/fine_tune/test_openai_finetune.py +125 -14
kiln_ai/adapters/ml_model_list.py +323 -94
kiln_ai/adapters/model_adapters/__init__.py +18 -0
kiln_ai/adapters/{base_adapter.py → model_adapters/base_adapter.py} +81 -37
kiln_ai/adapters/{langchain_adapters.py → model_adapters/langchain_adapters.py} +130 -84
kiln_ai/adapters/model_adapters/openai_compatible_config.py +11 -0
kiln_ai/adapters/model_adapters/openai_model_adapter.py +246 -0
kiln_ai/adapters/model_adapters/test_base_adapter.py +190 -0
kiln_ai/adapters/{test_langchain_adapter.py → model_adapters/test_langchain_adapter.py} +103 -88
kiln_ai/adapters/model_adapters/test_openai_model_adapter.py +225 -0
kiln_ai/adapters/{test_saving_adapter_results.py → model_adapters/test_saving_adapter_results.py} +43 -15
kiln_ai/adapters/{test_structured_output.py → model_adapters/test_structured_output.py} +93 -20
kiln_ai/adapters/parsers/__init__.py +10 -0
kiln_ai/adapters/parsers/base_parser.py +12 -0
kiln_ai/adapters/parsers/json_parser.py +37 -0
kiln_ai/adapters/parsers/parser_registry.py +19 -0
kiln_ai/adapters/parsers/r1_parser.py +69 -0
kiln_ai/adapters/parsers/test_json_parser.py +81 -0
kiln_ai/adapters/parsers/test_parser_registry.py +32 -0
kiln_ai/adapters/parsers/test_r1_parser.py +144 -0
kiln_ai/adapters/prompt_builders.py +126 -20
kiln_ai/adapters/provider_tools.py +91 -36
kiln_ai/adapters/repair/repair_task.py +17 -6
kiln_ai/adapters/repair/test_repair_task.py +4 -4
kiln_ai/adapters/run_output.py +8 -0
kiln_ai/adapters/test_adapter_registry.py +177 -0
kiln_ai/adapters/test_generate_docs.py +69 -0
kiln_ai/adapters/test_prompt_adaptors.py +8 -4
kiln_ai/adapters/test_prompt_builders.py +190 -29
kiln_ai/adapters/test_provider_tools.py +268 -46
kiln_ai/datamodel/__init__.py +193 -12
kiln_ai/datamodel/basemodel.py +31 -11
kiln_ai/datamodel/json_schema.py +8 -3
kiln_ai/datamodel/model_cache.py +8 -3
kiln_ai/datamodel/test_basemodel.py +81 -2
kiln_ai/datamodel/test_dataset_split.py +100 -3
kiln_ai/datamodel/test_example_models.py +25 -4
kiln_ai/datamodel/test_model_cache.py +24 -0
kiln_ai/datamodel/test_model_perf.py +125 -0
kiln_ai/datamodel/test_models.py +129 -0
kiln_ai/utils/exhaustive_error.py +6 -0
{kiln_ai-0.8.1.dist-info → kiln_ai-0.11.1.dist-info}/METADATA +9 -7
kiln_ai-0.11.1.dist-info/RECORD +76 -0
kiln_ai-0.8.1.dist-info/RECORD +0 -58
{kiln_ai-0.8.1.dist-info → kiln_ai-0.11.1.dist-info}/WHEEL +0 -0
{kiln_ai-0.8.1.dist-info → kiln_ai-0.11.1.dist-info}/licenses/LICENSE.txt +0 -0

kiln_ai/adapters/fine_tune/test_fireworks_tinetune.py CHANGED Viewed

@@ -13,6 +13,8 @@ from kiln_ai.adapters.fine_tune.dataset_formatter import DatasetFormat, DatasetF
 from kiln_ai.adapters.fine_tune.fireworks_finetune import FireworksFinetune
 from kiln_ai.datamodel import (
     DatasetSplit,
+    FinetuneDataStrategy,
+    StructuredOutputMode,
     Task,
     Train80Test20SplitDefinition,
 )
@@ -33,7 +35,6 @@ def fireworks_finetune(tmp_path):
             dataset_split_id="dataset-123",
             system_message="Test system message",
             path=tmp_file,
-            properties={"undeployed_model_id": "ftm-123"},
         ),
     )
     return finetune
@@ -228,8 +229,20 @@ def mock_task():
     )
+@pytest.mark.parametrize(
+    "data_strategy,thinking_instructions",
+    [
+        (FinetuneDataStrategy.final_and_intermediate, "thinking instructions"),
+        (FinetuneDataStrategy.final_only, None),
+    ],
+)
 async def test_generate_and_upload_jsonl_success(
-    fireworks_finetune, mock_dataset, mock_task, mock_api_key
+    mock_dataset,
+    mock_task,
+    mock_api_key,
+    data_strategy,
+    thinking_instructions,
+    tmp_path,
 ):
     mock_path = Path("mock_path.jsonl")
     mock_dataset_id = "dataset-123"
@@ -249,11 +262,27 @@ async def test_generate_and_upload_jsonl_success(
     status_response.status_code = 200
     status_response.json.return_value = {"state": "READY"}
+    # Set the data strategy on the finetune model
+    tmp_file = tmp_path / "test-finetune.kiln"
+    fireworks_finetune = FireworksFinetune(
+        datamodel=FinetuneModel(
+            name="test-finetune",
+            provider="fireworks",
+            provider_id="fw-123",
+            base_model_id="llama-v2-7b",
+            train_split_name="train",
+            dataset_split_id="dataset-123",
+            system_message="Test system message",
+            path=tmp_file,
+            data_strategy=data_strategy,
+            thinking_instructions=thinking_instructions,
+        ),
+    )
     with (
         patch(
             "kiln_ai.adapters.fine_tune.fireworks_finetune.DatasetFormatter",
-            return_value=mock_formatter,
-        ),
+        ) as mock_formatter_constructor,
         patch("httpx.AsyncClient") as mock_client_class,
         patch("builtins.open"),
         patch(
@@ -261,26 +290,58 @@ async def test_generate_and_upload_jsonl_success(
             return_value=mock_dataset_id,
         ),
     ):
+        mock_formatter_constructor.return_value = mock_formatter
         mock_client = AsyncMock()
         mock_client.post = AsyncMock(side_effect=[create_response, upload_response])
         mock_client.get = AsyncMock(return_value=status_response)
         mock_client_class.return_value.__aenter__.return_value = mock_client
         result = await fireworks_finetune.generate_and_upload_jsonl(
-            mock_dataset, "train", mock_task
+            mock_dataset, "train", mock_task, DatasetFormat.OPENAI_CHAT_JSONL
         )
         # Verify formatter was created with correct parameters
-        mock_formatter.dump_to_file.assert_called_once_with(
-            "train", DatasetFormat.OPENAI_CHAT_JSONL
-        )
+        assert mock_formatter_constructor.call_count == 1
+        assert mock_formatter_constructor.call_args[1] == {
+            "dataset": mock_dataset,
+            "system_message": "Test system message",
+            "thinking_instructions": thinking_instructions,
+        }
+        # Verify the thinking instructions were set on the formatter
+        mock_formatter.method_calls[0][0] == "dump_to_file"
+        mock_formatter.method_calls[0][1] == {
+            "dataset": mock_dataset,
+            "thinking_instructions": thinking_instructions,
+        }
         assert result == mock_dataset_id
         assert mock_client.post.call_count == 2
         assert mock_client.get.call_count == 1
-async def test_start_success(fireworks_finetune, mock_dataset, mock_task, mock_api_key):
+@pytest.mark.parametrize(
+    "output_schema,expected_mode,expected_format",
+    [
+        (
+            '{"type": "object", "properties": {"key": {"type": "string"}}}',
+            StructuredOutputMode.json_mode,
+            DatasetFormat.OPENAI_CHAT_JSON_SCHEMA_JSONL,
+        ),
+        (None, None, DatasetFormat.OPENAI_CHAT_JSONL),
+    ],
+)
+async def test_start_success(
+    fireworks_finetune,
+    mock_dataset,
+    mock_task,
+    mock_api_key,
+    output_schema,
+    expected_mode,
+    expected_format,
+):
+    mock_task.output_json_schema = output_schema
     fireworks_finetune.datamodel.parent = mock_task
     mock_dataset_id = "dataset-123"
     mock_model_id = "ft-model-123"
@@ -306,11 +367,16 @@ async def test_start_success(fireworks_finetune, mock_dataset, mock_task, mock_a
         # Verify dataset was uploaded
         fireworks_finetune.generate_and_upload_jsonl.assert_called_once_with(
-            mock_dataset, fireworks_finetune.datamodel.train_split_name, mock_task
+            mock_dataset,
+            fireworks_finetune.datamodel.train_split_name,
+            mock_task,
+            expected_format,
         )
         # Verify model ID was updated
         assert fireworks_finetune.datamodel.provider_id == mock_model_id
+        assert fireworks_finetune.datamodel.structured_output_mode == expected_mode
+        assert fireworks_finetune.datamodel.properties["endpoint_version"] == "v2"
 async def test_start_api_error(
@@ -369,7 +435,15 @@ async def test_deploy_success(fireworks_finetune, mock_api_key):
     success_response.status_code = 200
     assert fireworks_finetune.datamodel.fine_tune_model_id is None
-    with patch("httpx.AsyncClient") as mock_client_class:
+    status_response = (
+        FineTuneStatus(status=FineTuneStatusType.completed, message=""),
+        "ftm-123",
+    )
+    with (
+        patch("httpx.AsyncClient") as mock_client_class,
+        patch.object(fireworks_finetune, "_status", return_value=status_response),
+    ):
         mock_client = AsyncMock()
         mock_client.post.return_value = success_response
         mock_client_class.return_value.__aenter__.return_value = mock_client
@@ -388,13 +462,22 @@ async def test_deploy_already_deployed(fireworks_finetune, mock_api_key):
         "message": "Model already deployed",
     }
-    with patch("httpx.AsyncClient") as mock_client_class:
+    status_response = (
+        FineTuneStatus(status=FineTuneStatusType.completed, message=""),
+        "ftm-123",
+    )
+    with (
+        patch("httpx.AsyncClient") as mock_client_class,
+        patch.object(fireworks_finetune, "_status", return_value=status_response),
+    ):
         mock_client = AsyncMock()
         mock_client.post.return_value = already_deployed_response
         mock_client_class.return_value.__aenter__.return_value = mock_client
         result = await fireworks_finetune._deploy()
         assert result is True
+        assert fireworks_finetune.datamodel.fine_tune_model_id == "ftm-123"
 async def test_deploy_failure(fireworks_finetune, mock_api_key):
@@ -423,22 +506,31 @@ async def test_deploy_missing_credentials(fireworks_finetune):
 async def test_deploy_missing_model_id(fireworks_finetune, mock_api_key):
-    # Test missing model ID
-    fireworks_finetune.datamodel.properties["undeployed_model_id"] = None
-    response = await fireworks_finetune._deploy()
-    assert response is False
+    # Mock _status to return no model ID
+    status_response = (
+        FineTuneStatus(
+            status=FineTuneStatusType.completed, message="Fine-tuning job completed"
+        ),
+        None,
+    )
+    with (
+        patch.object(fireworks_finetune, "_status", return_value=status_response),
+    ):
+        response = await fireworks_finetune._deploy()
+        assert response is False
 async def test_status_with_deploy(fireworks_finetune, mock_api_key):
     # Mock _status to return completed
-    mock_status_response = FineTuneStatus(
-        status=FineTuneStatusType.completed, message="Fine-tuning job completed"
+    status_response = (
+        FineTuneStatus(
+            status=FineTuneStatusType.completed, message="Fine-tuning job completed"
+        ),
+        "ftm-123",
     )
     with (
         patch.object(
-            fireworks_finetune, "_status", return_value=mock_status_response
+            fireworks_finetune, "_status", return_value=status_response
         ) as mock_status,
         patch.object(fireworks_finetune, "_deploy", return_value=False) as mock_deploy,
     ):

kiln_ai/adapters/fine_tune/test_openai_finetune.py CHANGED Viewed

@@ -10,7 +10,13 @@ from openai.types.fine_tuning import FineTuningJob
 from kiln_ai.adapters.fine_tune.base_finetune import FineTuneStatusType
 from kiln_ai.adapters.fine_tune.dataset_formatter import DatasetFormat, DatasetFormatter
 from kiln_ai.adapters.fine_tune.openai_finetune import OpenAIFinetune
-from kiln_ai.datamodel import DatasetSplit, Task, Train80Test20SplitDefinition
+from kiln_ai.datamodel import (
+    DatasetSplit,
+    FinetuneDataStrategy,
+    StructuredOutputMode,
+    Task,
+    Train80Test20SplitDefinition,
+)
 from kiln_ai.datamodel import Finetune as FinetuneModel
 from kiln_ai.utils.config import Config
@@ -29,6 +35,7 @@ def openai_finetune(tmp_path):
             system_message="Test system message",
             fine_tune_model_id="ft-123",
             path=tmp_file,
+            data_strategy=FinetuneDataStrategy.final_only,
         ),
     )
     return finetune
@@ -225,17 +232,22 @@ async def test_generate_and_upload_jsonl_success(
         patch("builtins.open") as mock_open,
     ):
         result = await openai_finetune.generate_and_upload_jsonl(
-            mock_dataset, "train", mock_task
+            mock_dataset,
+            "train",
+            mock_task,
+            DatasetFormat.OPENAI_CHAT_JSONL,
         )
         # Verify formatter was created with correct parameters
         mock_formatter_class.assert_called_once_with(
-            mock_dataset, openai_finetune.datamodel.system_message
+            mock_dataset, openai_finetune.datamodel.system_message, None
         )
         # Verify correct format was used
         mock_formatter.dump_to_file.assert_called_once_with(
-            "train", DatasetFormat.OPENAI_CHAT_JSONL
+            "train",
+            DatasetFormat.OPENAI_CHAT_JSONL,
+            FinetuneDataStrategy.final_only,
         )
         # Verify file was opened and uploaded
@@ -245,7 +257,7 @@ async def test_generate_and_upload_jsonl_success(
         assert result == mock_file_id
-async def test_generate_and_upload_jsonl_toolcall_success(
+async def test_generate_and_upload_jsonl_schema_success(
     openai_finetune, mock_dataset, mock_task
 ):
     mock_path = Path("mock_path.jsonl")
@@ -272,17 +284,22 @@ async def test_generate_and_upload_jsonl_toolcall_success(
         patch("builtins.open") as mock_open,
     ):
         result = await openai_finetune.generate_and_upload_jsonl(
-            mock_dataset, "train", mock_task
+            mock_dataset,
+            "train",
+            mock_task,
+            DatasetFormat.OPENAI_CHAT_JSON_SCHEMA_JSONL,
         )
         # Verify formatter was created with correct parameters
         mock_formatter_class.assert_called_once_with(
-            mock_dataset, openai_finetune.datamodel.system_message
+            mock_dataset, openai_finetune.datamodel.system_message, None
         )
         # Verify correct format was used
         mock_formatter.dump_to_file.assert_called_once_with(
-            "train", DatasetFormat.OPENAI_CHAT_TOOLCALL_JSONL
+            "train",
+            DatasetFormat.OPENAI_CHAT_JSON_SCHEMA_JSONL,
+            FinetuneDataStrategy.final_only,
         )
         # Verify file was opened and uploaded
@@ -317,7 +334,7 @@ async def test_generate_and_upload_jsonl_upload_failure(
     ):
         with pytest.raises(ValueError, match="Failed to upload file to OpenAI"):
             await openai_finetune.generate_and_upload_jsonl(
-                mock_dataset, "train", mock_task
+                mock_dataset, "train", mock_task, DatasetFormat.OPENAI_CHAT_JSONL
             )
@@ -344,13 +361,33 @@ async def test_generate_and_upload_jsonl_api_error(
     ):
         with pytest.raises(openai.APIError):
             await openai_finetune.generate_and_upload_jsonl(
-                mock_dataset, "train", mock_task
+                mock_dataset, "train", mock_task, DatasetFormat.OPENAI_CHAT_JSONL
             )
-async def test_start_success(openai_finetune, mock_dataset, mock_task):
+@pytest.mark.parametrize(
+    "output_schema,expected_mode,expected_format",
+    [
+        (
+            '{"type": "object", "properties": {"key": {"type": "string"}}}',
+            StructuredOutputMode.json_schema,
+            DatasetFormat.OPENAI_CHAT_JSON_SCHEMA_JSONL,
+        ),
+        (None, None, DatasetFormat.OPENAI_CHAT_JSONL),
+    ],
+)
+async def test_start_success(
+    openai_finetune,
+    mock_dataset,
+    mock_task,
+    output_schema,
+    expected_mode,
+    expected_format,
+):
     openai_finetune.datamodel.parent = mock_task
+    mock_task.output_json_schema = output_schema
     # Mock parameters
     openai_finetune.datamodel.parameters = {
         "n_epochs": 3,
@@ -381,7 +418,10 @@ async def test_start_success(openai_finetune, mock_dataset, mock_task):
         # Verify file uploads
         assert mock_upload.call_count == 1  # Only training file
         mock_upload.assert_called_with(
-            mock_dataset, openai_finetune.datamodel.train_split_name, mock_task
+            mock_dataset,
+            openai_finetune.datamodel.train_split_name,
+            mock_task,
+            expected_format,
         )
         # Verify fine-tune creation
@@ -401,6 +441,7 @@ async def test_start_success(openai_finetune, mock_dataset, mock_task):
         # Verify model updates
         assert openai_finetune.datamodel.provider_id == "ft-123"
         assert openai_finetune.datamodel.base_model_id == "gpt-4o-mini-2024-07-18"
+        assert openai_finetune.datamodel.structured_output_mode == expected_mode
 async def test_start_with_validation(openai_finetune, mock_dataset, mock_task):
@@ -430,9 +471,17 @@ async def test_start_with_validation(openai_finetune, mock_dataset, mock_task):
         mock_upload.assert_has_calls(
             [
                 mock.call(
-                    mock_dataset, openai_finetune.datamodel.train_split_name, mock_task
+                    mock_dataset,
+                    openai_finetune.datamodel.train_split_name,
+                    mock_task,
+                    DatasetFormat.OPENAI_CHAT_JSONL,
+                ),
+                mock.call(
+                    mock_dataset,
+                    "validation",
+                    mock_task,
+                    DatasetFormat.OPENAI_CHAT_JSONL,
                 ),
-                mock.call(mock_dataset, "validation", mock_task),
             ]
         )
@@ -501,3 +550,65 @@ async def test_status_updates_latest_status(openai_finetune, mock_response):
         # Verify file was saved
         assert openai_finetune.datamodel.path.exists()
+@pytest.mark.parametrize(
+    "data_strategy,thinking_instructions",
+    [
+        (FinetuneDataStrategy.final_and_intermediate, "Custom thinking instructions"),
+        (FinetuneDataStrategy.final_only, None),
+    ],
+)
+async def test_generate_and_upload_jsonl_with_data_strategy(
+    mock_dataset, mock_task, data_strategy, thinking_instructions, tmp_path
+):
+    mock_path = Path("mock_path.jsonl")
+    mock_file_id = "file-123"
+    openai_finetune = OpenAIFinetune(
+        datamodel=FinetuneModel(
+            name="test-finetune",
+            provider="openai",
+            provider_id="openai-123",
+            base_model_id="gpt-4o",
+            train_split_name="train",
+            dataset_split_id="dataset-123",
+            system_message="Test system message",
+            fine_tune_model_id="ft-123",
+            path=tmp_path / "test-finetune.kiln",
+            data_strategy=data_strategy,
+            thinking_instructions=thinking_instructions,
+        ),
+    )
+    # Mock the formatter
+    mock_formatter = MagicMock(spec=DatasetFormatter)
+    mock_formatter.dump_to_file.return_value = mock_path
+    # Mock the file response
+    mock_file_response = MagicMock()
+    mock_file_response.id = mock_file_id
+    with (
+        patch(
+            "kiln_ai.adapters.fine_tune.openai_finetune.DatasetFormatter",
+            return_value=mock_formatter,
+        ),
+        patch(
+            "kiln_ai.adapters.fine_tune.openai_finetune.oai_client.files.create",
+            return_value=mock_file_response,
+        ),
+        patch("builtins.open"),
+    ):
+        result = await openai_finetune.generate_and_upload_jsonl(
+            mock_dataset, "train", mock_task, DatasetFormat.OPENAI_CHAT_JSONL
+        )
+        # Verify formatter was created with correct parameters
+        mock_formatter.dump_to_file.assert_called_once_with(
+            "train",
+            DatasetFormat.OPENAI_CHAT_JSONL,
+            data_strategy,  # Verify data_strategy is passed through
+        )
+        assert result == mock_file_id

kiln-ai 0.8.1__py3-none-any.whl → 0.11.1__py3-none-any.whl

Potentially problematic release.

kiln-ai 0.8.1py3-none-any.whl → 0.11.1py3-none-any.whl