PyPI - kiln-ai - Versions diffs - 0.8.0__py3-none-any.whl → 0.11.1__py3-none-any.whl - Mend

kiln-ai 0.8.0py3-none-any.whl → 0.11.1py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of kiln-ai might be problematic. Click here for more details.

Files changed (57) hide show

kiln_ai/adapters/__init__.py +7 -7
kiln_ai/adapters/adapter_registry.py +77 -5
kiln_ai/adapters/data_gen/data_gen_task.py +3 -3
kiln_ai/adapters/data_gen/test_data_gen_task.py +23 -3
kiln_ai/adapters/fine_tune/base_finetune.py +5 -1
kiln_ai/adapters/fine_tune/dataset_formatter.py +310 -65
kiln_ai/adapters/fine_tune/fireworks_finetune.py +47 -32
kiln_ai/adapters/fine_tune/openai_finetune.py +12 -11
kiln_ai/adapters/fine_tune/test_base_finetune.py +19 -0
kiln_ai/adapters/fine_tune/test_dataset_formatter.py +469 -129
kiln_ai/adapters/fine_tune/test_fireworks_tinetune.py +113 -21
kiln_ai/adapters/fine_tune/test_openai_finetune.py +125 -14
kiln_ai/adapters/ml_model_list.py +323 -94
kiln_ai/adapters/model_adapters/__init__.py +18 -0
kiln_ai/adapters/{base_adapter.py → model_adapters/base_adapter.py} +81 -37
kiln_ai/adapters/{langchain_adapters.py → model_adapters/langchain_adapters.py} +130 -84
kiln_ai/adapters/model_adapters/openai_compatible_config.py +11 -0
kiln_ai/adapters/model_adapters/openai_model_adapter.py +246 -0
kiln_ai/adapters/model_adapters/test_base_adapter.py +190 -0
kiln_ai/adapters/{test_langchain_adapter.py → model_adapters/test_langchain_adapter.py} +103 -88
kiln_ai/adapters/model_adapters/test_openai_model_adapter.py +225 -0
kiln_ai/adapters/{test_saving_adapter_results.py → model_adapters/test_saving_adapter_results.py} +43 -15
kiln_ai/adapters/{test_structured_output.py → model_adapters/test_structured_output.py} +93 -20
kiln_ai/adapters/parsers/__init__.py +10 -0
kiln_ai/adapters/parsers/base_parser.py +12 -0
kiln_ai/adapters/parsers/json_parser.py +37 -0
kiln_ai/adapters/parsers/parser_registry.py +19 -0
kiln_ai/adapters/parsers/r1_parser.py +69 -0
kiln_ai/adapters/parsers/test_json_parser.py +81 -0
kiln_ai/adapters/parsers/test_parser_registry.py +32 -0
kiln_ai/adapters/parsers/test_r1_parser.py +144 -0
kiln_ai/adapters/prompt_builders.py +126 -20
kiln_ai/adapters/provider_tools.py +91 -36
kiln_ai/adapters/repair/repair_task.py +17 -6
kiln_ai/adapters/repair/test_repair_task.py +4 -4
kiln_ai/adapters/run_output.py +8 -0
kiln_ai/adapters/test_adapter_registry.py +177 -0
kiln_ai/adapters/test_generate_docs.py +69 -0
kiln_ai/adapters/test_prompt_adaptors.py +8 -4
kiln_ai/adapters/test_prompt_builders.py +190 -29
kiln_ai/adapters/test_provider_tools.py +268 -46
kiln_ai/datamodel/__init__.py +199 -12
kiln_ai/datamodel/basemodel.py +31 -11
kiln_ai/datamodel/json_schema.py +8 -3
kiln_ai/datamodel/model_cache.py +8 -3
kiln_ai/datamodel/test_basemodel.py +81 -2
kiln_ai/datamodel/test_dataset_split.py +100 -3
kiln_ai/datamodel/test_example_models.py +25 -4
kiln_ai/datamodel/test_model_cache.py +24 -0
kiln_ai/datamodel/test_model_perf.py +125 -0
kiln_ai/datamodel/test_models.py +129 -0
kiln_ai/utils/exhaustive_error.py +6 -0
{kiln_ai-0.8.0.dist-info → kiln_ai-0.11.1.dist-info}/METADATA +9 -7
kiln_ai-0.11.1.dist-info/RECORD +76 -0
kiln_ai-0.8.0.dist-info/RECORD +0 -58
{kiln_ai-0.8.0.dist-info → kiln_ai-0.11.1.dist-info}/WHEEL +0 -0
{kiln_ai-0.8.0.dist-info → kiln_ai-0.11.1.dist-info}/licenses/LICENSE.txt +0 -0

kiln_ai/adapters/fine_tune/openai_finetune.py CHANGED Viewed

@@ -10,7 +10,7 @@ from kiln_ai.adapters.fine_tune.base_finetune import (
     FineTuneStatusType,
 )
 from kiln_ai.adapters.fine_tune.dataset_formatter import DatasetFormat, DatasetFormatter
-from kiln_ai.datamodel import DatasetSplit, Task
+from kiln_ai.datamodel import DatasetSplit, StructuredOutputMode, Task
 from kiln_ai.utils.config import Config
 oai_client = openai.AsyncOpenAI(
@@ -124,13 +124,18 @@ class OpenAIFinetune(BaseFinetuneAdapter):
         if not task:
             raise ValueError("Task is required to start a fine-tune")
+        # Use chat format for unstructured output, and JSON for formatted output (was previously function calls)
+        format = DatasetFormat.OPENAI_CHAT_JSONL
+        if task.output_json_schema:
+            format = DatasetFormat.OPENAI_CHAT_JSON_SCHEMA_JSONL
+            self.datamodel.structured_output_mode = StructuredOutputMode.json_schema
         train_file_id = await self.generate_and_upload_jsonl(
-            dataset, self.datamodel.train_split_name, task
+            dataset, self.datamodel.train_split_name, task, format
         )
         validation_file_id = None
         if self.datamodel.validation_split_name:
             validation_file_id = await self.generate_and_upload_jsonl(
-                dataset, self.datamodel.validation_split_name, task
+                dataset, self.datamodel.validation_split_name, task, format
             )
         # Filter to hyperparameters which are set via the hyperparameters field (some like seed are set via the API)
@@ -156,16 +161,12 @@ class OpenAIFinetune(BaseFinetuneAdapter):
         return None
     async def generate_and_upload_jsonl(
-        self, dataset: DatasetSplit, split_name: str, task: Task
+        self, dataset: DatasetSplit, split_name: str, task: Task, format: DatasetFormat
     ) -> str:
-        formatter = DatasetFormatter(dataset, self.datamodel.system_message)
-        # All OpenAI models support tool calls for structured outputs
-        format = (
-            DatasetFormat.OPENAI_CHAT_TOOLCALL_JSONL
-            if task.output_json_schema
-            else DatasetFormat.OPENAI_CHAT_JSONL
+        formatter = DatasetFormatter(
+            dataset, self.datamodel.system_message, self.datamodel.thinking_instructions
         )
-        path = formatter.dump_to_file(split_name, format)
+        path = formatter.dump_to_file(split_name, format, self.datamodel.data_strategy)
         response = await oai_client.files.create(
             file=open(path, "rb"),

kiln_ai/adapters/fine_tune/test_base_finetune.py CHANGED Viewed

@@ -4,6 +4,7 @@ import pytest
 from kiln_ai.adapters.fine_tune.base_finetune import (
     BaseFinetuneAdapter,
+    FinetuneDataStrategy,
     FineTuneParameter,
     FineTuneStatus,
     FineTuneStatusType,
@@ -154,6 +155,8 @@ async def test_create_and_start_success(mock_dataset):
         train_split_name="train",
         parameters={"epochs": 10},  # Required parameter
         system_message="Test system message",
+        data_strategy=FinetuneDataStrategy.final_only,
+        thinking_instructions=None,
     )
     assert isinstance(adapter, MockFinetune)
@@ -166,6 +169,8 @@ async def test_create_and_start_success(mock_dataset):
     assert datamodel.parameters == {"epochs": 10}
     assert datamodel.system_message == "Test system message"
     assert datamodel.path.exists()
+    assert datamodel.data_strategy == FinetuneDataStrategy.final_only
+    assert datamodel.thinking_instructions is None
 async def test_create_and_start_with_all_params(mock_dataset):
@@ -180,6 +185,8 @@ async def test_create_and_start_with_all_params(mock_dataset):
         description="Custom Description",
         validation_split_name="test",
         system_message="Test system message",
+        data_strategy=FinetuneDataStrategy.final_and_intermediate,
+        thinking_instructions="Custom thinking instructions",
     )
     assert datamodel.name == "Custom Name"
@@ -188,6 +195,8 @@ async def test_create_and_start_with_all_params(mock_dataset):
     assert datamodel.parameters == {"epochs": 10, "learning_rate": 0.001}
     assert datamodel.system_message == "Test system message"
     assert adapter.datamodel == datamodel
+    assert datamodel.data_strategy == FinetuneDataStrategy.final_and_intermediate
+    assert datamodel.thinking_instructions == "Custom thinking instructions"
     # load the datamodel from the file, confirm it's saved
     loaded_datamodel = FinetuneModel.load_from_file(datamodel.path)
@@ -204,6 +213,8 @@ async def test_create_and_start_invalid_parameters(mock_dataset):
             train_split_name="train",
             parameters={"learning_rate": 0.001},  # Missing required 'epochs'
             system_message="Test system message",
+            thinking_instructions=None,
+            data_strategy=FinetuneDataStrategy.final_only,
         )
@@ -222,6 +233,8 @@ async def test_create_and_start_no_parent_task():
             train_split_name="train",
             parameters={"epochs": 10},
             system_message="Test system message",
+            data_strategy=FinetuneDataStrategy.final_only,
+            thinking_instructions=None,
         )
@@ -243,6 +256,8 @@ async def test_create_and_start_no_parent_task_path():
             train_split_name="train",
             parameters={"epochs": 10},
             system_message="Test system message",
+            data_strategy=FinetuneDataStrategy.final_only,
+            thinking_instructions=None,
         )
@@ -269,6 +284,8 @@ async def test_create_and_start_invalid_train_split(mock_dataset):
             train_split_name="invalid_train",  # Invalid train split
             parameters={"epochs": 10},
             system_message="Test system message",
+            data_strategy=FinetuneDataStrategy.final_only,
+            thinking_instructions=None,
         )
@@ -287,4 +304,6 @@ async def test_create_and_start_invalid_validation_split(mock_dataset):
             validation_split_name="invalid_test",  # Invalid validation split
             parameters={"epochs": 10},
             system_message="Test system message",
+            data_strategy=FinetuneDataStrategy.final_only,
+            thinking_instructions=None,
         )

kiln-ai 0.8.0__py3-none-any.whl → 0.11.1__py3-none-any.whl

Potentially problematic release.

kiln-ai 0.8.0py3-none-any.whl → 0.11.1py3-none-any.whl