PyPI - kiln-ai - Versions diffs - 0.11.1__py3-none-any.whl → 0.13.0__py3-none-any.whl - Mend

kiln-ai 0.11.1py3-none-any.whl → 0.13.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of kiln-ai might be problematic. Click here for more details.

Files changed (80) hide show

kiln_ai/adapters/__init__.py +4 -0
kiln_ai/adapters/adapter_registry.py +163 -39
kiln_ai/adapters/data_gen/data_gen_task.py +18 -0
kiln_ai/adapters/eval/__init__.py +28 -0
kiln_ai/adapters/eval/base_eval.py +164 -0
kiln_ai/adapters/eval/eval_runner.py +270 -0
kiln_ai/adapters/eval/g_eval.py +368 -0
kiln_ai/adapters/eval/registry.py +16 -0
kiln_ai/adapters/eval/test_base_eval.py +325 -0
kiln_ai/adapters/eval/test_eval_runner.py +641 -0
kiln_ai/adapters/eval/test_g_eval.py +498 -0
kiln_ai/adapters/eval/test_g_eval_data.py +4 -0
kiln_ai/adapters/fine_tune/base_finetune.py +16 -2
kiln_ai/adapters/fine_tune/finetune_registry.py +2 -0
kiln_ai/adapters/fine_tune/test_dataset_formatter.py +4 -1
kiln_ai/adapters/fine_tune/test_fireworks_tinetune.py +1 -1
kiln_ai/adapters/fine_tune/test_openai_finetune.py +1 -1
kiln_ai/adapters/fine_tune/test_together_finetune.py +531 -0
kiln_ai/adapters/fine_tune/together_finetune.py +325 -0
kiln_ai/adapters/ml_model_list.py +758 -163
kiln_ai/adapters/model_adapters/__init__.py +2 -4
kiln_ai/adapters/model_adapters/base_adapter.py +61 -43
kiln_ai/adapters/model_adapters/litellm_adapter.py +391 -0
kiln_ai/adapters/model_adapters/litellm_config.py +13 -0
kiln_ai/adapters/model_adapters/test_base_adapter.py +22 -13
kiln_ai/adapters/model_adapters/test_litellm_adapter.py +407 -0
kiln_ai/adapters/model_adapters/test_saving_adapter_results.py +41 -19
kiln_ai/adapters/model_adapters/test_structured_output.py +59 -35
kiln_ai/adapters/ollama_tools.py +3 -3
kiln_ai/adapters/parsers/r1_parser.py +19 -14
kiln_ai/adapters/parsers/test_r1_parser.py +17 -5
kiln_ai/adapters/prompt_builders.py +80 -42
kiln_ai/adapters/provider_tools.py +50 -58
kiln_ai/adapters/repair/repair_task.py +9 -21
kiln_ai/adapters/repair/test_repair_task.py +6 -6
kiln_ai/adapters/run_output.py +3 -0
kiln_ai/adapters/test_adapter_registry.py +26 -29
kiln_ai/adapters/test_generate_docs.py +4 -4
kiln_ai/adapters/test_ollama_tools.py +0 -1
kiln_ai/adapters/test_prompt_adaptors.py +47 -33
kiln_ai/adapters/test_prompt_builders.py +91 -31
kiln_ai/adapters/test_provider_tools.py +26 -81
kiln_ai/datamodel/__init__.py +50 -952
kiln_ai/datamodel/basemodel.py +2 -0
kiln_ai/datamodel/datamodel_enums.py +60 -0
kiln_ai/datamodel/dataset_filters.py +114 -0
kiln_ai/datamodel/dataset_split.py +170 -0
kiln_ai/datamodel/eval.py +298 -0
kiln_ai/datamodel/finetune.py +105 -0
kiln_ai/datamodel/json_schema.py +7 -1
kiln_ai/datamodel/project.py +23 -0
kiln_ai/datamodel/prompt.py +37 -0
kiln_ai/datamodel/prompt_id.py +83 -0
kiln_ai/datamodel/strict_mode.py +24 -0
kiln_ai/datamodel/task.py +181 -0
kiln_ai/datamodel/task_output.py +328 -0
kiln_ai/datamodel/task_run.py +164 -0
kiln_ai/datamodel/test_basemodel.py +19 -11
kiln_ai/datamodel/test_dataset_filters.py +71 -0
kiln_ai/datamodel/test_dataset_split.py +32 -8
kiln_ai/datamodel/test_datasource.py +22 -2
kiln_ai/datamodel/test_eval_model.py +635 -0
kiln_ai/datamodel/test_example_models.py +9 -13
kiln_ai/datamodel/test_json_schema.py +23 -0
kiln_ai/datamodel/test_models.py +2 -2
kiln_ai/datamodel/test_prompt_id.py +129 -0
kiln_ai/datamodel/test_task.py +159 -0
kiln_ai/utils/config.py +43 -1
kiln_ai/utils/dataset_import.py +232 -0
kiln_ai/utils/test_dataset_import.py +596 -0
{kiln_ai-0.11.1.dist-info → kiln_ai-0.13.0.dist-info}/METADATA +86 -6
kiln_ai-0.13.0.dist-info/RECORD +103 -0
kiln_ai/adapters/model_adapters/langchain_adapters.py +0 -302
kiln_ai/adapters/model_adapters/openai_compatible_config.py +0 -11
kiln_ai/adapters/model_adapters/openai_model_adapter.py +0 -246
kiln_ai/adapters/model_adapters/test_langchain_adapter.py +0 -350
kiln_ai/adapters/model_adapters/test_openai_model_adapter.py +0 -225
kiln_ai-0.11.1.dist-info/RECORD +0 -76
{kiln_ai-0.11.1.dist-info → kiln_ai-0.13.0.dist-info}/WHEEL +0 -0
{kiln_ai-0.11.1.dist-info → kiln_ai-0.13.0.dist-info}/licenses/LICENSE.txt +0 -0

kiln_ai/utils/dataset_import.py ADDED Viewed

@@ -0,0 +1,232 @@
+import csv
+import logging
+import time
+from dataclasses import dataclass
+from enum import Enum
+from typing import Dict, Protocol
+from pydantic import BaseModel, Field, ValidationError, field_validator
+from kiln_ai.datamodel import DataSource, DataSourceType, Task, TaskOutput, TaskRun
+logger = logging.getLogger(__name__)
+class DatasetImportFormat(str, Enum):
+    """
+    The format of the dataset to import.
+    """
+    CSV = "csv"
+class Importer(Protocol):
+    """Protocol for dataset importers"""
+    def __call__(
+        self,
+        task: Task,
+        dataset_path: str,
+        dataset_name: str,
+    ) -> int: ...
+class CSVRowSchema(BaseModel):
+    """Schema for validating rows in a CSV file."""
+    input: str = Field(description="The input to the model")
+    output: str = Field(description="The output of the model")
+    reasoning: str | None = Field(
+        description="The reasoning of the model (optional)",
+        default=None,
+    )
+    chain_of_thought: str | None = Field(
+        description="The chain of thought of the model (optional)",
+        default=None,
+    )
+    tags: list[str] = Field(
+        default_factory=list,
+        description="The tags of the run (optional)",
+    )
+def generate_import_tags(session_id: str) -> list[str]:
+    return [
+        "imported",
+        f"imported_{session_id}",
+    ]
+class KilnInvalidImportFormat(Exception):
+    """Raised when the import format is invalid"""
+    def __init__(self, message: str, row_number: int | None = None):
+        self.row_number = row_number
+        if row_number is not None:
+            message = f"Error in row {row_number}: {message}"
+        super().__init__(message)
+def format_validation_error(e: ValidationError) -> str:
+    """Convert a Pydantic validation error into a human-readable message."""
+    error_messages = []
+    for error in e.errors():
+        location = " -> ".join(str(loc) for loc in error["loc"])
+        message = error["msg"]
+        error_messages.append(f"- {location}: {message}")
+    return "Validation failed:\n" + "\n".join(error_messages)
+def deserialize_tags(tags_serialized: str | None) -> list[str]:
+    """Deserialize tags from a comma-separated string to a list of strings."""
+    if tags_serialized:
+        return [tag.strip() for tag in tags_serialized.split(",") if tag.strip()]
+    return []
+def without_none_values(d: dict) -> dict:
+    """Return a copy of the dictionary with all None values removed."""
+    return {k: v for k, v in d.items() if v is not None}
+def create_task_run_from_csv_row(
+    task: Task,
+    row: dict[str, str],
+    dataset_name: str,
+    session_id: str,
+) -> TaskRun:
+    """Validate and create a TaskRun from a CSV row, without saving to file"""
+    # first we validate the row from the CSV file
+    validated_row = CSVRowSchema.model_validate(
+        {
+            **row,
+            "tags": deserialize_tags(row.get("tags")),
+        }
+    )
+    tags = generate_import_tags(session_id)
+    if validated_row.tags:
+        tags.extend(validated_row.tags)
+    # note that we don't persist the run yet, we just create and validate it
+    # this instantiation may raise pydantic validation errors
+    run = TaskRun(
+        parent=task,
+        input=validated_row.input,
+        input_source=DataSource(
+            type=DataSourceType.file_import,
+            properties={
+                "file_name": dataset_name,
+            },
+        ),
+        output=TaskOutput(
+            output=validated_row.output,
+            source=DataSource(
+                type=DataSourceType.file_import,
+                properties={
+                    "file_name": dataset_name,
+                },
+            ),
+        ),
+        intermediate_outputs=without_none_values(
+            {
+                "reasoning": validated_row.reasoning,
+                "chain_of_thought": validated_row.chain_of_thought,
+            }
+        )
+        or None,
+        tags=tags,
+    )
+    return run
+def import_csv(task: Task, dataset_path: str, dataset_name: str) -> int:
+    """Import a CSV dataset.
+    All rows are validated before any are persisted to files to avoid partial imports."""
+    session_id = str(int(time.time()))
+    required_headers = {"input", "output"}  # minimum required headers
+    optional_headers = {"reasoning", "tags", "chain_of_thought"}  # optional headers
+    rows: list[TaskRun] = []
+    with open(dataset_path, "r", newline="") as csvfile:
+        reader = csv.DictReader(csvfile)
+        # Check if we have headers
+        if not reader.fieldnames:
+            raise KilnInvalidImportFormat(
+                "CSV file appears to be empty or missing headers"
+            )
+        # Check for required headers
+        actual_headers = set(reader.fieldnames)
+        missing_headers = required_headers - actual_headers
+        if missing_headers:
+            raise KilnInvalidImportFormat(
+                f"Missing required headers: {', '.join(missing_headers)}. "
+                f"Required headers are: {', '.join(required_headers)}"
+            )
+        # Warn about unknown headers (not required or optional)
+        unknown_headers = actual_headers - (required_headers | optional_headers)
+        if unknown_headers:
+            logger.warning(
+                f"Unknown headers in CSV file will be ignored: {', '.join(unknown_headers)}"
+            )
+        # enumeration starts at 2 because row 1 is headers
+        for row_number, row in enumerate(reader, start=2):
+            try:
+                run = create_task_run_from_csv_row(
+                    task=task,
+                    row=row,
+                    dataset_name=dataset_name,
+                    session_id=session_id,
+                )
+            except ValidationError as e:
+                logger.warning(f"Invalid row {row_number}: {row}", exc_info=True)
+                human_readable = format_validation_error(e)
+                raise KilnInvalidImportFormat(
+                    human_readable,
+                    row_number=row_number,
+                ) from e
+            rows.append(run)
+    # now that we know all rows are valid, we can save them
+    for run in rows:
+        run.save_to_file()
+    return len(rows)
+DATASET_IMPORTERS: Dict[DatasetImportFormat, Importer] = {
+    DatasetImportFormat.CSV: import_csv,
+}
+@dataclass
+class ImportConfig:
+    """Configuration for importing a dataset"""
+    dataset_type: DatasetImportFormat
+    dataset_path: str
+    dataset_name: str
+class DatasetFileImporter:
+    """Import a dataset from a file"""
+    def __init__(self, task: Task, config: ImportConfig):
+        self.task = task
+        self.dataset_type = config.dataset_type
+        self.dataset_path = config.dataset_path
+        self.dataset_name = config.dataset_name
+    def create_runs_from_file(self) -> int:
+        fn = DATASET_IMPORTERS[self.dataset_type]
+        return fn(self.task, self.dataset_path, self.dataset_name)

kiln-ai 0.11.1__py3-none-any.whl → 0.13.0__py3-none-any.whl

Potentially problematic release.

kiln-ai 0.11.1py3-none-any.whl → 0.13.0py3-none-any.whl