PyPI - kiln-ai - Versions diffs - 0.7.1__py3-none-any.whl → 0.8.1__py3-none-any.whl - Mend

kiln-ai 0.7.1py3-none-any.whl → 0.8.1py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of kiln-ai might be problematic. Click here for more details.

Files changed (17) hide show

kiln_ai/adapters/adapter_registry.py +2 -0
kiln_ai/adapters/base_adapter.py +6 -1
kiln_ai/adapters/langchain_adapters.py +5 -1
kiln_ai/adapters/ml_model_list.py +9 -0
kiln_ai/adapters/provider_tools.py +48 -0
kiln_ai/adapters/test_provider_tools.py +95 -0
kiln_ai/datamodel/__init__.py +113 -14
kiln_ai/datamodel/basemodel.py +3 -9
kiln_ai/datamodel/test_dataset_split.py +1 -1
kiln_ai/datamodel/test_models.py +49 -0
kiln_ai/datamodel/test_output_rating.py +377 -10
kiln_ai/utils/config.py +28 -9
kiln_ai/utils/test_config.py +48 -0
{kiln_ai-0.7.1.dist-info → kiln_ai-0.8.1.dist-info}/METADATA +1 -1
{kiln_ai-0.7.1.dist-info → kiln_ai-0.8.1.dist-info}/RECORD +17 -17
{kiln_ai-0.7.1.dist-info → kiln_ai-0.8.1.dist-info}/WHEEL +0 -0
{kiln_ai-0.7.1.dist-info → kiln_ai-0.8.1.dist-info}/licenses/LICENSE.txt +0 -0

kiln_ai/adapters/adapter_registry.py CHANGED Viewed

@@ -9,6 +9,7 @@ def adapter_for_task(
     model_name: str | None = None,
     provider: str | None = None,
     prompt_builder: BasePromptBuilder | None = None,
+    tags: list[str] | None = None,
 ) -> BaseAdapter:
     # We use langchain for everything right now, but can add any others here
     return LangchainAdapter(
@@ -16,4 +17,5 @@ def adapter_for_task(
         model_name=model_name,
         provider=provider,
         prompt_builder=prompt_builder,
+        tags=tags,
     )

kiln_ai/adapters/base_adapter.py CHANGED Viewed

@@ -45,12 +45,16 @@ class BaseAdapter(metaclass=ABCMeta):
     """
     def __init__(
-        self, kiln_task: Task, prompt_builder: BasePromptBuilder | None = None
+        self,
+        kiln_task: Task,
+        prompt_builder: BasePromptBuilder | None = None,
+        tags: list[str] | None = None,
     ):
         self.prompt_builder = prompt_builder or SimplePromptBuilder(kiln_task)
         self.kiln_task = kiln_task
         self.output_schema = self.kiln_task.output_json_schema
         self.input_schema = self.kiln_task.input_json_schema
+        self.default_tags = tags
     async def invoke_returning_raw(
         self,
@@ -148,6 +152,7 @@ class BaseAdapter(metaclass=ABCMeta):
                 ),
             ),
             intermediate_outputs=run_output.intermediate_outputs,
+            tags=self.default_tags or [],
         )
         exclude_fields = {

kiln_ai/adapters/langchain_adapters.py CHANGED Viewed

@@ -39,8 +39,9 @@ class LangchainAdapter(BaseAdapter):
         model_name: str | None = None,
         provider: str | None = None,
         prompt_builder: BasePromptBuilder | None = None,
+        tags: list[str] | None = None,
     ):
-        super().__init__(kiln_task, prompt_builder=prompt_builder)
+        super().__init__(kiln_task, prompt_builder=prompt_builder, tags=tags)
         if custom_model is not None:
             self._model = custom_model
@@ -198,6 +199,9 @@ async def langchain_model_from_provider(
     if provider.name == ModelProviderName.openai:
         api_key = Config.shared().open_ai_api_key
         return ChatOpenAI(**provider.provider_options, openai_api_key=api_key)  # type: ignore[arg-type]
+    elif provider.name == ModelProviderName.openai_compatible:
+        # See provider_tools.py for how base_url, key and other parameters are set
+        return ChatOpenAI(**provider.provider_options)  # type: ignore[arg-type]
     elif provider.name == ModelProviderName.groq:
         api_key = Config.shared().groq_api_key
         if api_key is None:

kiln_ai/adapters/ml_model_list.py CHANGED Viewed

@@ -23,6 +23,7 @@ class ModelProviderName(str, Enum):
     fireworks_ai = "fireworks_ai"
     kiln_fine_tune = "kiln_fine_tune"
     kiln_custom_registry = "kiln_custom_registry"
+    openai_compatible = "openai_compatible"
 class ModelFamily(str, Enum):
@@ -522,6 +523,12 @@ built_in_models: List[KilnModel] = [
                     }
                 },
             ),
+            KilnModelProvider(
+                name=ModelProviderName.groq,
+                supports_structured_output=True,
+                supports_data_gen=True,
+                provider_options={"model": "llama-3.3-70b-versatile"},
+            ),
             KilnModelProvider(
                 name=ModelProviderName.ollama,
                 provider_options={"model": "llama3.3"},
@@ -530,6 +537,8 @@ built_in_models: List[KilnModel] = [
                 name=ModelProviderName.fireworks_ai,
                 # Finetuning not live yet
                 # provider_finetune_id="accounts/fireworks/models/llama-v3p3-70b-instruct",
+                supports_structured_output=True,
+                supports_data_gen=True,
                 provider_options={
                     "model": "accounts/fireworks/models/llama-v3p3-70b-instruct"
                 },

kiln_ai/adapters/provider_tools.py CHANGED Viewed

@@ -108,6 +108,9 @@ async def kiln_model_provider_from(
     if provider_name == ModelProviderName.kiln_fine_tune:
         return finetune_provider_model(name)
+    if provider_name == ModelProviderName.openai_compatible:
+        return openai_compatible_provider_model(name)
     built_in_model = await builtin_model_from(name, provider_name)
     if built_in_model:
         return built_in_model
@@ -136,6 +139,45 @@ async def kiln_model_provider_from(
 finetune_cache: dict[str, KilnModelProvider] = {}
+def openai_compatible_provider_model(
+    model_id: str,
+) -> KilnModelProvider:
+    try:
+        openai_provider_name, model_id = model_id.split("::")
+    except Exception:
+        raise ValueError(f"Invalid openai compatible model ID: {model_id}")
+    openai_compatible_providers = Config.shared().openai_compatible_providers or []
+    provider = next(
+        filter(
+            lambda p: p.get("name") == openai_provider_name, openai_compatible_providers
+        ),
+        None,
+    )
+    if provider is None:
+        raise ValueError(f"OpenAI compatible provider {openai_provider_name} not found")
+    # API key optional some providers don't use it
+    api_key = provider.get("api_key")
+    base_url = provider.get("base_url")
+    if base_url is None:
+        raise ValueError(
+            f"OpenAI compatible provider {openai_provider_name} has no base URL"
+        )
+    return KilnModelProvider(
+        name=ModelProviderName.openai_compatible,
+        provider_options={
+            "model": model_id,
+            "api_key": api_key,
+            "openai_api_base": base_url,
+        },
+        supports_structured_output=False,
+        supports_data_gen=False,
+        untested_model=True,
+    )
 def finetune_provider_model(
     model_id: str,
 ) -> KilnModelProvider:
@@ -228,6 +270,8 @@ def provider_name_from_id(id: str) -> str:
                 return "Fireworks AI"
             case ModelProviderName.kiln_custom_registry:
                 return "Custom Models"
+            case ModelProviderName.openai_compatible:
+                return "OpenAI Compatible"
             case _:
                 # triggers pyright warning if I miss a case
                 raise_exhaustive_error(enum_id)
@@ -266,6 +310,10 @@ def provider_options_for_custom_model(
             raise ValueError(
                 "Fine tuned models should populate provider options via another path"
             )
+        case ModelProviderName.openai_compatible:
+            raise ValueError(
+                "OpenAI compatible models should populate provider options via another path"
+            )
         case _:
             # triggers pyright warning if I miss a case
             raise_exhaustive_error(enum_id)

kiln_ai/adapters/test_provider_tools.py CHANGED Viewed

@@ -15,6 +15,7 @@ from kiln_ai.adapters.provider_tools import (
     finetune_provider_model,
     get_model_and_provider,
     kiln_model_provider_from,
+    openai_compatible_provider_model,
     provider_enabled,
     provider_name_from_id,
     provider_options_for_custom_model,
@@ -64,6 +65,25 @@ def mock_finetune():
         yield mock
+@pytest.fixture
+def mock_shared_config():
+    with patch("kiln_ai.adapters.provider_tools.Config.shared") as mock:
+        config = Mock()
+        config.openai_compatible_providers = [
+            {
+                "name": "test_provider",
+                "base_url": "https://api.test.com",
+                "api_key": "test-key",
+            },
+            {
+                "name": "no_key_provider",
+                "base_url": "https://api.nokey.com",
+            },
+        ]
+        mock.return_value = config
+        yield mock
 def test_check_provider_warnings_no_warning(mock_config):
     mock_config.return_value = "some_value"
@@ -529,3 +549,78 @@ def test_finetune_provider_model_fireworks_provider(
     assert provider.adapter_options == {
         "langchain": {"with_structured_output_options": {"method": "json_mode"}}
     }
+def test_openai_compatible_provider_model_success(mock_shared_config):
+    """Test successful creation of an OpenAI compatible provider"""
+    model_id = "test_provider::gpt-4"
+    provider = openai_compatible_provider_model(model_id)
+    assert provider.name == ModelProviderName.openai_compatible
+    assert provider.provider_options == {
+        "model": "gpt-4",
+        "api_key": "test-key",
+        "openai_api_base": "https://api.test.com",
+    }
+    assert provider.supports_structured_output is False
+    assert provider.supports_data_gen is False
+    assert provider.untested_model is True
+def test_openai_compatible_provider_model_no_api_key(mock_shared_config):
+    """Test provider creation without API key (should work as some providers don't require it)"""
+    model_id = "no_key_provider::gpt-4"
+    provider = openai_compatible_provider_model(model_id)
+    assert provider.name == ModelProviderName.openai_compatible
+    assert provider.provider_options == {
+        "model": "gpt-4",
+        "api_key": None,
+        "openai_api_base": "https://api.nokey.com",
+    }
+def test_openai_compatible_provider_model_invalid_id():
+    """Test handling of invalid model ID format"""
+    with pytest.raises(ValueError) as exc_info:
+        openai_compatible_provider_model("invalid-id-format")
+    assert (
+        str(exc_info.value) == "Invalid openai compatible model ID: invalid-id-format"
+    )
+def test_openai_compatible_provider_model_no_providers(mock_shared_config):
+    """Test handling when no providers are configured"""
+    mock_shared_config.return_value.openai_compatible_providers = None
+    with pytest.raises(ValueError) as exc_info:
+        openai_compatible_provider_model("test_provider::gpt-4")
+    assert str(exc_info.value) == "OpenAI compatible provider test_provider not found"
+def test_openai_compatible_provider_model_provider_not_found(mock_shared_config):
+    """Test handling of non-existent provider"""
+    with pytest.raises(ValueError) as exc_info:
+        openai_compatible_provider_model("unknown_provider::gpt-4")
+    assert (
+        str(exc_info.value) == "OpenAI compatible provider unknown_provider not found"
+    )
+def test_openai_compatible_provider_model_no_base_url(mock_shared_config):
+    """Test handling of provider without base URL"""
+    mock_shared_config.return_value.openai_compatible_providers = [
+        {
+            "name": "test_provider",
+            "api_key": "test-key",
+        }
+    ]
+    with pytest.raises(ValueError) as exc_info:
+        openai_compatible_provider_model("test_provider::gpt-4")
+    assert (
+        str(exc_info.value)
+        == "OpenAI compatible provider test_provider has no base URL"
+    )

kiln_ai/datamodel/__init__.py CHANGED Viewed

@@ -49,9 +49,15 @@ __all__ = [
     "DataSource",
     "DataSourceType",
     "DataSourceProperty",
+    "Finetune",
+    "FineTuneStatusType",
     "TaskOutputRatingType",
     "TaskRequirement",
     "TaskDeterminism",
+    "DatasetSplitDefinition",
+    "DatasetSplit",
+    "RequirementRating",
+    "TaskRequirement",
     "strict_mode",
     "set_strict_mode",
 ]
@@ -85,30 +91,71 @@ class TaskOutputRatingType(str, Enum):
     """Defines the types of rating systems available for task outputs."""
     five_star = "five_star"
+    pass_fail = "pass_fail"
+    pass_fail_critical = "pass_fail_critical"
     custom = "custom"
+class RequirementRating(BaseModel):
+    """Rating for a specific requirement within a task output."""
+    value: float = Field(
+        description="The rating value. Interpretation depends on rating type"
+    )
+    type: TaskOutputRatingType = Field(description="The type of rating")
 class TaskOutputRating(KilnBaseModel):
     """
     A rating for a task output, including an overall rating and ratings for each requirement.
-    Only supports five star ratings for now, but extensible for custom values.
+    Supports:
+    - five_star: 1-5 star ratings
+    - pass_fail: boolean pass/fail (1.0 = pass, 0.0 = fail)
+    - pass_fail_critical: tri-state (1.0 = pass, 0.0 = fail, -1.0 = critical fail)
     """
     type: TaskOutputRatingType = Field(default=TaskOutputRatingType.five_star)
     value: float | None = Field(
-        description="The overall rating value (typically 1-5 stars).",
+        description="The rating value. Interpretation depends on rating type:\n- five_star: 1-5 stars\n- pass_fail: 1.0 (pass) or 0.0 (fail)\n- pass_fail_critical: 1.0 (pass), 0.0 (fail), or -1.0 (critical fail)",
         default=None,
     )
-    requirement_ratings: Dict[ID_TYPE, float] = Field(
+    requirement_ratings: Dict[ID_TYPE, RequirementRating] = Field(
         default={},
-        description="The ratings of the requirements of the task. The keys are the ids of the requirements. The values are the ratings (typically 1-5 stars).",
+        description="The ratings of the requirements of the task.",
     )
+    # Previously we stored rating values as a dict of floats, but now we store them as RequirementRating objects.
+    @model_validator(mode="before")
+    def upgrade_old_format(cls, data: dict) -> dict:
+        if not isinstance(data, dict):
+            return data
+        # Check if we have the old format (dict of floats)
+        req_ratings = data.get("requirement_ratings", {})
+        if req_ratings and all(
+            isinstance(v, (int, float)) for v in req_ratings.values()
+        ):
+            # Convert each float to a RequirementRating object
+            # all ratings are five star at the point we used this format
+            data["requirement_ratings"] = {
+                k: {"value": v, "type": TaskOutputRatingType.five_star}
+                for k, v in req_ratings.items()
+            }
+        return data
     # Used to select high quality outputs for example selection (MultiShotPromptBuilder, etc)
     def is_high_quality(self) -> bool:
+        if self.value is None:
+            return False
         if self.type == TaskOutputRatingType.five_star:
-            return self.value is not None and self.value >= 4
+            return self.value >= 4
+        elif self.type == TaskOutputRatingType.pass_fail:
+            return self.value == 1.0
+        elif self.type == TaskOutputRatingType.pass_fail_critical:
+            return self.value == 1.0
         return False
     @model_validator(mode="after")
@@ -116,24 +163,61 @@ class TaskOutputRating(KilnBaseModel):
         if self.type not in TaskOutputRatingType:
             raise ValueError(f"Invalid rating type: {self.type}")
-        if self.type == TaskOutputRatingType.five_star:
-            if self.value is not None:
-                self._validate_five_star(self.value, "overall rating")
-            for req_id, req_rating in self.requirement_ratings.items():
-                self._validate_five_star(req_rating, f"requirement rating for {req_id}")
+        # Overall rating is optional
+        if self.value is not None:
+            self._validate_rating(self.type, self.value, "overall rating")
+        for req_id, req_rating in self.requirement_ratings.items():
+            self._validate_rating(
+                req_rating.type,
+                req_rating.value,
+                f"requirement rating for req ID: {req_id}",
+            )
         return self
-    def _validate_five_star(self, rating: float, rating_name: str) -> None:
-        if not isinstance(rating, float) or not rating.is_integer():
+    def _validate_rating(
+        self, type: TaskOutputRatingType, rating: float | None, rating_name: str
+    ) -> None:
+        if type == TaskOutputRatingType.five_star:
+            self._validate_five_star(rating, rating_name)
+        elif type == TaskOutputRatingType.pass_fail:
+            self._validate_pass_fail(rating, rating_name)
+        elif type == TaskOutputRatingType.pass_fail_critical:
+            self._validate_pass_fail_critical(rating, rating_name)
+    def _validate_five_star(self, rating: float | None, rating_name: str) -> None:
+        if rating is None or not isinstance(rating, float) or not rating.is_integer():
             raise ValueError(
-                f"{rating_name.capitalize()} of type five_star must be an integer value (1.0, 2.0, 3.0, 4.0, or 5.0)"
+                f"{rating_name.capitalize()} of type five_star must be an integer value (1-5)"
             )
         if rating < 1 or rating > 5:
             raise ValueError(
                 f"{rating_name.capitalize()} of type five_star must be between 1 and 5 stars"
             )
+    def _validate_pass_fail(self, rating: float | None, rating_name: str) -> None:
+        if rating is None or not isinstance(rating, float) or not rating.is_integer():
+            raise ValueError(
+                f"{rating_name.capitalize()} of type pass_fail must be an integer value (0 or 1)"
+            )
+        if rating not in [0, 1]:
+            raise ValueError(
+                f"{rating_name.capitalize()} of type pass_fail must be 0 (fail) or 1 (pass)"
+            )
+    def _validate_pass_fail_critical(
+        self, rating: float | None, rating_name: str
+    ) -> None:
+        if rating is None or not isinstance(rating, float) or not rating.is_integer():
+            raise ValueError(
+                f"{rating_name.capitalize()} of type pass_fail_critical must be an integer value (-1, 0, or 1)"
+            )
+        if rating not in [-1, 0, 1]:
+            raise ValueError(
+                f"{rating_name.capitalize()} of type pass_fail_critical must be -1 (critical fail), 0 (fail), or 1 (pass)"
+            )
 class TaskOutput(KilnBaseModel):
     """
@@ -381,6 +465,10 @@ class TaskRun(KilnParentedModel):
         default=None,
         description="Intermediate outputs from the task run. Keys are the names of the intermediate output steps (cot=chain of thought, etc), values are the output data.",
     )
+    tags: List[str] = Field(
+        default=[],
+        description="Tags for the task run. Tags are used to categorize task runs for filtering and reporting.",
+    )
     def parent_task(self) -> Task | None:
         if not isinstance(self.parent, Task):
@@ -442,6 +530,16 @@ class TaskRun(KilnParentedModel):
             raise ValueError("input_source is required when strict mode is enabled")
         return self
+    @model_validator(mode="after")
+    def validate_tags(self) -> Self:
+        for tag in self.tags:
+            if not tag:
+                raise ValueError("Tags cannot be empty strings")
+            if " " in tag:
+                raise ValueError("Tags cannot contain spaces. Try underscores.")
+        return self
 # Define the type alias for clarity
 DatasetFilter = Callable[[TaskRun], bool]
@@ -602,7 +700,7 @@ class TaskRequirement(BaseModel):
     Defines a specific requirement that should be met by task outputs.
     Includes an identifier, name, description, instruction for meeting the requirement,
-    and priority level.
+    priority level, and rating type (five_star, pass_fail, pass_fail_critical, custom).
     """
     id: ID_TYPE = ID_FIELD
@@ -610,6 +708,7 @@ class TaskRequirement(BaseModel):
     description: str | None = Field(default=None)
     instruction: str = Field(min_length=1)
     priority: Priority = Field(default=Priority.p2)
+    type: TaskOutputRatingType = Field(default=TaskOutputRatingType.five_star)
 class TaskDeterminism(str, Enum):

kiln_ai/datamodel/basemodel.py CHANGED Viewed

@@ -142,14 +142,8 @@ class KilnBaseModel(BaseModel):
             # modified time of file for cache invalidation. From file descriptor so it's atomic w read.
             mtime_ns = os.fstat(file.fileno()).st_mtime_ns
             file_data = file.read()
-            # TODO P2 perf: parsing the JSON twice here.
-            # Once for model_type, once for model. Can't call model_validate with parsed json because enum types break; they get strings instead of enums.
             parsed_json = json.loads(file_data)
-            m = cls.model_validate_json(
-                file_data,
-                strict=True,
-                context={"loading_from_file": True},
-            )
+            m = cls.model_validate(parsed_json, context={"loading_from_file": True})
             if not isinstance(m, cls):
                 raise ValueError(f"Loaded model is not of type {cls.__name__}")
             m._loaded_from_file = True
@@ -471,7 +465,7 @@ class KilnParentModel(KilnBaseModel, metaclass=ABCMeta):
         validation_errors = []
         try:
-            instance = cls.model_validate(data, strict=True)
+            instance = cls.model_validate(data)
             if path is not None:
                 instance.path = path
             if parent is not None and isinstance(instance, KilnParentedModel):
@@ -499,7 +493,7 @@ class KilnParentModel(KilnBaseModel, metaclass=ABCMeta):
                             parent_type._validate_nested(**kwargs)
                         elif issubclass(parent_type, KilnParentedModel):
                             # Root node
-                            subinstance = parent_type.model_validate(value, strict=True)
+                            subinstance = parent_type.model_validate(value)
                             if instance is not None:
                                 subinstance.parent = instance
                             if save:

kiln_ai/datamodel/test_dataset_split.py CHANGED Viewed

@@ -84,7 +84,7 @@ def task_run():
                 type=DataSourceType.human,
                 properties={"created_by": "test-user"},
             ),
-            rating=TaskOutputRating(rating=5, type=TaskOutputRatingType.five_star),
+            rating=TaskOutputRating(value=5, type=TaskOutputRatingType.five_star),
         ),
     )

kiln_ai/datamodel/test_models.py CHANGED Viewed

@@ -439,3 +439,52 @@ def test_task_output_source_validation(tmp_path):
         assert os.path.exists(task_missing_output_source)
         task_run = TaskRun.load_from_file(task_missing_output_source)
         assert task_run.output.source is None
+def test_task_run_tags_validation():
+    # Setup basic output for TaskRun creation
+    output = TaskOutput(
+        output="test output",
+        source=DataSource(
+            type=DataSourceType.synthetic,
+            properties={
+                "model_name": "test-model",
+                "model_provider": "test-provider",
+                "adapter_name": "test-adapter",
+            },
+        ),
+    )
+    # Test 1: Valid tags should work
+    task_run = TaskRun(
+        input="test input",
+        output=output,
+        tags=["test_tag", "another_tag", "tag123"],
+    )
+    assert task_run.tags == ["test_tag", "another_tag", "tag123"]
+    # Test 2: Empty list of tags should work
+    task_run = TaskRun(
+        input="test input",
+        output=output,
+        tags=[],
+    )
+    assert task_run.tags == []
+    # Test 3: Empty string tag should fail
+    with pytest.raises(ValueError) as exc_info:
+        TaskRun(
+            input="test input",
+            output=output,
+            tags=["valid_tag", ""],
+        )
+    assert "Tags cannot be empty strings" in str(exc_info.value)
+    # Test 4: Tag with spaces should fail
+    with pytest.raises(ValueError) as exc_info:
+        TaskRun(
+            input="test input",
+            output=output,
+            tags=["valid_tag", "invalid tag"],
+        )
+    assert "Tags cannot contain spaces. Try underscores." in str(exc_info.value)

kiln_ai/datamodel/test_output_rating.py CHANGED Viewed

@@ -1,14 +1,34 @@
+import json
 import pytest
 from pydantic import ValidationError
-from kiln_ai.datamodel import TaskOutputRating, TaskOutputRatingType
+from kiln_ai.datamodel import RequirementRating, TaskOutputRating, TaskOutputRatingType
 def test_valid_task_output_rating():
     rating = TaskOutputRating(value=4.0, requirement_ratings={"req1": 5.0, "req2": 3.0})
     assert rating.type == TaskOutputRatingType.five_star
     assert rating.value == 4.0
-    assert rating.requirement_ratings == {"req1": 5.0, "req2": 3.0}
+    dumped = json.loads(rating.model_dump_json())
+    assert dumped["requirement_ratings"] == {
+        "req1": {"type": TaskOutputRatingType.five_star, "value": 5.0},
+        "req2": {"type": TaskOutputRatingType.five_star, "value": 3.0},
+    }
+    # new format
+    rating = TaskOutputRating(
+        value=4.0,
+        requirement_ratings={
+            "req1": {"type": TaskOutputRatingType.five_star, "value": 5.0},
+            "req2": {"type": TaskOutputRatingType.five_star, "value": 3.0},
+        },
+    )
+    dumped = json.loads(rating.model_dump_json())
+    assert dumped["requirement_ratings"] == {
+        "req1": {"type": TaskOutputRatingType.five_star, "value": 5.0},
+        "req2": {"type": TaskOutputRatingType.five_star, "value": 3.0},
+    }
 def test_invalid_rating_type():
@@ -40,34 +60,92 @@ def test_rating_below_range():
         TaskOutputRating(value=0.0)
-def test_valid_requirement_ratings():
-    rating = TaskOutputRating(
-        value=4.0, requirement_ratings={"req1": 5.0, "req2": 3.0, "req3": 1.0}
+def test_valid_requirement_ratings_old_format():
+    rating = TaskOutputRating.model_validate(
+        {"value": 4.0, "requirement_ratings": {"req1": 5.0, "req2": 3.0, "req3": 1.0}}
+    )
+    dumped = json.loads(rating.model_dump_json())
+    assert dumped["requirement_ratings"] == {
+        "req1": {"type": TaskOutputRatingType.five_star, "value": 5.0},
+        "req2": {"type": TaskOutputRatingType.five_star, "value": 3.0},
+        "req3": {"type": TaskOutputRatingType.five_star, "value": 1.0},
+    }
+def test_valid_requirement_ratings_new_format():
+    rating = TaskOutputRating.model_validate(
+        {
+            "value": 4.0,
+            "requirement_ratings": {
+                "req1": {"type": TaskOutputRatingType.five_star, "value": 5.0},
+                "req2": {"type": TaskOutputRatingType.five_star, "value": 3.0},
+                "req3": {"type": TaskOutputRatingType.five_star, "value": 1.0},
+            },
+        }
     )
-    assert rating.requirement_ratings == {"req1": 5.0, "req2": 3.0, "req3": 1.0}
+    dumped = json.loads(rating.model_dump_json())
+    assert dumped["requirement_ratings"] == {
+        "req1": {"type": TaskOutputRatingType.five_star, "value": 5.0},
+        "req2": {"type": TaskOutputRatingType.five_star, "value": 3.0},
+        "req3": {"type": TaskOutputRatingType.five_star, "value": 1.0},
+    }
 def test_invalid_requirement_rating_value():
     with pytest.raises(
         ValidationError,
-        match="Requirement rating for req1 of type five_star must be an integer value",
+        match="Requirement rating for req id: req1 of type five_star must be an integer value",
     ):
         TaskOutputRating(value=4.0, requirement_ratings={"req1": 3.5})
+    # new format
+    with pytest.raises(
+        ValidationError,
+        match="Requirement rating for req id: req1 of type five_star must be an integer value",
+    ):
+        TaskOutputRating(
+            value=4.0,
+            requirement_ratings={
+                "req1": {"type": TaskOutputRatingType.five_star, "value": 3.5}
+            },
+        )
 def test_requirement_rating_out_of_range():
     with pytest.raises(
         ValidationError,
-        match="Requirement rating for req1 of type five_star must be between 1 and 5 stars",
+        match="Requirement rating for req id: req1 of type five_star must be between 1 and 5 stars",
     ):
         TaskOutputRating(value=4.0, requirement_ratings={"req1": 6.0})
+    # new format
+    with pytest.raises(
+        ValidationError,
+        match="Requirement rating for req id: req1 of type five_star must be between 1 and 5 stars",
+    ):
+        TaskOutputRating(
+            value=4.0,
+            requirement_ratings={
+                "req1": {"type": TaskOutputRatingType.five_star, "value": 6.0}
+            },
+        )
 def test_empty_requirement_ratings():
     rating = TaskOutputRating(value=4.0)
     assert rating.requirement_ratings == {}
+def test_empty_requirement_ratings_integer():
+    rating = TaskOutputRating(
+        value=4,
+        requirement_ratings={
+            "req1": RequirementRating(type=TaskOutputRatingType.five_star, value=5),
+        },
+    )
+    assert rating.requirement_ratings["req1"].value == 5.0
 def test_invalid_id_type():
     with pytest.raises(ValidationError):
         TaskOutputRating(
@@ -77,13 +155,302 @@ def test_invalid_id_type():
             },
         )
+    # new format
+    with pytest.raises(ValidationError):
+        TaskOutputRating(
+            value=4.0,
+            requirement_ratings={
+                123: {"type": TaskOutputRatingType.five_star, "value": 4.0}
+            },
+        )
 def test_valid_custom_rating():
     rating = TaskOutputRating(
         type=TaskOutputRatingType.custom,
         value=31.459,
-        requirement_ratings={"req1": 42.0, "req2": 3.14},
+        requirement_ratings={
+            "req1": {"type": TaskOutputRatingType.custom, "value": 42.0},
+            "req2": {"type": TaskOutputRatingType.custom, "value": 3.14},
+        },
     )
     assert rating.type == TaskOutputRatingType.custom
     assert rating.value == 31.459
-    assert rating.requirement_ratings == {"req1": 42.0, "req2": 3.14}
+    dumped = json.loads(rating.model_dump_json())
+    assert dumped["requirement_ratings"] == {
+        "req1": {"type": TaskOutputRatingType.custom, "value": 42.0},
+        "req2": {"type": TaskOutputRatingType.custom, "value": 3.14},
+    }
+# We upgraded the format of requirement_ratings to be a dict of RequirementRating objects from a dict of floats
+def test_task_output_rating_format_upgrade():
+    # Test old format (dict of floats)
+    old_format = {
+        "type": "five_star",
+        "value": 4.0,
+        "requirement_ratings": {"req1": 5.0, "req2": 3.0},
+    }
+    rating = TaskOutputRating.model_validate(old_format)
+    # Verify the upgrade worked
+    assert isinstance(rating.requirement_ratings["req1"], RequirementRating)
+    assert rating.requirement_ratings["req1"].value == 5.0
+    assert rating.requirement_ratings["req1"].type == TaskOutputRatingType.five_star
+    assert rating.requirement_ratings["req2"].value == 3.0
+    assert rating.requirement_ratings["req2"].type == TaskOutputRatingType.five_star
+    # Verify the json dump is new format
+    json_dump = json.loads(rating.model_dump_json())
+    assert json_dump["requirement_ratings"]["req1"]["type"] == "five_star"
+    assert json_dump["requirement_ratings"]["req1"]["value"] == 5.0
+    assert json_dump["requirement_ratings"]["req2"]["type"] == "five_star"
+    assert json_dump["requirement_ratings"]["req2"]["value"] == 3.0
+    # Test new format (dict of RequirementRating)
+    new_format = {
+        "type": "five_star",
+        "value": 4.0,
+        "requirement_ratings": {
+            "req1": {"value": 5.0, "type": "five_star"},
+            "req2": {"value": 3.0, "type": "five_star"},
+        },
+    }
+    rating = TaskOutputRating.model_validate(new_format)
+    # Verify new format works as expected
+    assert isinstance(rating.requirement_ratings["req1"], RequirementRating)
+    assert rating.requirement_ratings["req1"].value == 5.0
+    assert rating.requirement_ratings["req1"].type == TaskOutputRatingType.five_star
+    # Verify the json dump is new format
+    json_dump = json.loads(rating.model_dump_json())
+    assert json_dump["requirement_ratings"]["req1"]["type"] == "five_star"
+    assert json_dump["requirement_ratings"]["req1"]["value"] == 5.0
+    assert json_dump["requirement_ratings"]["req2"]["type"] == "five_star"
+    assert json_dump["requirement_ratings"]["req2"]["value"] == 3.0
+    # Test mixed format (should fail)
+    mixed_format = {
+        "type": "five_star",
+        "value": 4.0,
+        "requirement_ratings": {
+            "req1": 5.0,
+            "req2": {"value": 3.0, "type": "five_star"},
+        },
+    }
+    with pytest.raises(ValidationError):
+        TaskOutputRating.model_validate(mixed_format)
+    # Test empty requirement_ratings
+    empty_format = {"type": "five_star", "value": 4.0, "requirement_ratings": {}}
+    rating = TaskOutputRating.model_validate(empty_format)
+    assert rating.requirement_ratings == {}
+def test_valid_pass_fail_rating():
+    rating = TaskOutputRating(
+        type=TaskOutputRatingType.pass_fail,
+        value=1.0,
+        requirement_ratings={
+            "req1": {"type": TaskOutputRatingType.pass_fail, "value": 1.0},
+            "req2": {"type": TaskOutputRatingType.pass_fail, "value": 0.0},
+        },
+    )
+    assert rating.type == TaskOutputRatingType.pass_fail
+    assert rating.value == 1.0
+    dumped = json.loads(rating.model_dump_json())
+    assert dumped["requirement_ratings"] == {
+        "req1": {"type": TaskOutputRatingType.pass_fail, "value": 1.0},
+        "req2": {"type": TaskOutputRatingType.pass_fail, "value": 0.0},
+    }
+def test_invalid_pass_fail_rating_value():
+    with pytest.raises(
+        ValidationError,
+        match="Overall rating of type pass_fail must be an integer value",
+    ):
+        TaskOutputRating(type=TaskOutputRatingType.pass_fail, value=0.5)
+    with pytest.raises(
+        ValidationError,
+        match="Requirement rating for req id: req1 of type pass_fail must be an integer value",
+    ):
+        TaskOutputRating(
+            type=TaskOutputRatingType.pass_fail,
+            value=1.0,
+            requirement_ratings={
+                "req1": {"type": TaskOutputRatingType.pass_fail, "value": 0.5}
+            },
+        )
+def test_pass_fail_rating_out_of_range():
+    with pytest.raises(
+        ValidationError,
+        match="Overall rating of type pass_fail must be 0 \\(fail\\) or 1 \\(pass\\)",
+    ):
+        TaskOutputRating(type=TaskOutputRatingType.pass_fail, value=2.0)
+    with pytest.raises(
+        ValidationError,
+        match="Requirement rating for req id: req1 of type pass_fail must be 0 \\(fail\\) or 1 \\(pass\\)",
+    ):
+        TaskOutputRating(
+            type=TaskOutputRatingType.pass_fail,
+            value=1.0,
+            requirement_ratings={
+                "req1": {"type": TaskOutputRatingType.pass_fail, "value": 2.0}
+            },
+        )
+def test_valid_pass_fail_critical_rating():
+    rating = TaskOutputRating(
+        type=TaskOutputRatingType.pass_fail_critical,
+        value=1.0,
+        requirement_ratings={
+            "req1": {"type": TaskOutputRatingType.pass_fail_critical, "value": 1.0},
+            "req2": {"type": TaskOutputRatingType.pass_fail_critical, "value": 0.0},
+            "req3": {"type": TaskOutputRatingType.pass_fail_critical, "value": -1.0},
+        },
+    )
+    assert rating.type == TaskOutputRatingType.pass_fail_critical
+    assert rating.value == 1.0
+    dumped = json.loads(rating.model_dump_json())
+    assert dumped["requirement_ratings"] == {
+        "req1": {"type": TaskOutputRatingType.pass_fail_critical, "value": 1.0},
+        "req2": {"type": TaskOutputRatingType.pass_fail_critical, "value": 0.0},
+        "req3": {"type": TaskOutputRatingType.pass_fail_critical, "value": -1.0},
+    }
+def test_invalid_pass_fail_critical_rating_value():
+    with pytest.raises(
+        ValidationError,
+        match="Overall rating of type pass_fail_critical must be an integer value",
+    ):
+        TaskOutputRating(type=TaskOutputRatingType.pass_fail_critical, value=0.5)
+    with pytest.raises(
+        ValidationError,
+        match="Requirement rating for req id: req1 of type pass_fail_critical must be an integer value",
+    ):
+        TaskOutputRating(
+            type=TaskOutputRatingType.pass_fail_critical,
+            value=1.0,
+            requirement_ratings={
+                "req1": {"type": TaskOutputRatingType.pass_fail_critical, "value": 0.5}
+            },
+        )
+def test_pass_fail_critical_rating_out_of_range():
+    with pytest.raises(
+        ValidationError,
+        match="Overall rating of type pass_fail_critical must be -1 \\(critical fail\\), 0 \\(fail\\), or 1 \\(pass\\)",
+    ):
+        TaskOutputRating(type=TaskOutputRatingType.pass_fail_critical, value=2.0)
+    with pytest.raises(
+        ValidationError,
+        match="Requirement rating for req id: req1 of type pass_fail_critical must be -1 \\(critical fail\\), 0 \\(fail\\), or 1 \\(pass\\)",
+    ):
+        TaskOutputRating(
+            type=TaskOutputRatingType.pass_fail_critical,
+            value=1.0,
+            requirement_ratings={
+                "req1": {"type": TaskOutputRatingType.pass_fail_critical, "value": 2.0}
+            },
+        )
+def test_is_high_quality():
+    # Test five_star ratings
+    assert (
+        TaskOutputRating(
+            type=TaskOutputRatingType.five_star, value=5.0
+        ).is_high_quality()
+        is True
+    )
+    assert (
+        TaskOutputRating(
+            type=TaskOutputRatingType.five_star, value=4.0
+        ).is_high_quality()
+        is True
+    )
+    assert (
+        TaskOutputRating(
+            type=TaskOutputRatingType.five_star, value=3.0
+        ).is_high_quality()
+        is False
+    )
+    assert (
+        TaskOutputRating(
+            type=TaskOutputRatingType.five_star, value=2.0
+        ).is_high_quality()
+        is False
+    )
+    assert (
+        TaskOutputRating(
+            type=TaskOutputRatingType.five_star, value=1.0
+        ).is_high_quality()
+        is False
+    )
+    # Test pass_fail ratings
+    assert (
+        TaskOutputRating(
+            type=TaskOutputRatingType.pass_fail, value=1.0
+        ).is_high_quality()
+        is True
+    )
+    assert (
+        TaskOutputRating(
+            type=TaskOutputRatingType.pass_fail, value=0.0
+        ).is_high_quality()
+        is False
+    )
+    # Test pass_fail_critical ratings
+    assert (
+        TaskOutputRating(
+            type=TaskOutputRatingType.pass_fail_critical, value=1.0
+        ).is_high_quality()
+        is True
+    )
+    assert (
+        TaskOutputRating(
+            type=TaskOutputRatingType.pass_fail_critical, value=0.0
+        ).is_high_quality()
+        is False
+    )
+    assert (
+        TaskOutputRating(
+            type=TaskOutputRatingType.pass_fail_critical, value=-1.0
+        ).is_high_quality()
+        is False
+    )
+    # Test custom ratings (should always return False)
+    assert (
+        TaskOutputRating(
+            type=TaskOutputRatingType.custom, value=100.0
+        ).is_high_quality()
+        is False
+    )
+    assert (
+        TaskOutputRating(type=TaskOutputRatingType.custom, value=0.0).is_high_quality()
+        is False
+    )
+    # Test None value
+    assert (
+        TaskOutputRating(type=TaskOutputRatingType.custom, value=None).is_high_quality()
+        is False
+    )

kiln_ai/utils/config.py CHANGED Viewed

@@ -2,7 +2,7 @@ import getpass
 import os
 import threading
 from pathlib import Path
-from typing import Any, Callable, Dict, Optional
+from typing import Any, Callable, Dict, List, Optional
 import yaml
@@ -15,12 +15,14 @@ class ConfigProperty:
         env_var: Optional[str] = None,
         default_lambda: Optional[Callable[[], Any]] = None,
         sensitive: bool = False,
+        sensitive_keys: Optional[List[str]] = None,
     ):
         self.type = type_
         self.default = default
         self.env_var = env_var
         self.default_lambda = default_lambda
         self.sensitive = sensitive
+        self.sensitive_keys = sensitive_keys
 class Config:
@@ -84,6 +86,11 @@ class Config:
                 list,
                 default_lambda=lambda: [],
             ),
+            "openai_compatible_providers": ConfigProperty(
+                list,
+                default_lambda=lambda: [],
+                sensitive_keys=["api_key"],
+            ),
         }
         self._settings = self.load_settings()
@@ -150,14 +157,26 @@ class Config:
         return settings
     def settings(self, hide_sensitive=False) -> Dict[str, Any]:
-        if hide_sensitive:
-            return {
-                k: "[hidden]"
-                if k in self._properties and self._properties[k].sensitive
-                else v
-                for k, v in self._settings.items()
-            }
-        return self._settings
+        if not hide_sensitive:
+            return self._settings
+        settings = {
+            k: "[hidden]"
+            if k in self._properties and self._properties[k].sensitive
+            else v
+            for k, v in self._settings.items()
+        }
+        # Hide sensitive keys in lists. Could generalize this if we every have more types, but right not it's only needed for root elements of lists
+        for key, value in settings.items():
+            if key in self._properties and self._properties[key].sensitive_keys:
+                sensitive_keys = self._properties[key].sensitive_keys or []
+                for sensitive_key in sensitive_keys:
+                    if isinstance(value, list):
+                        for item in value:
+                            if sensitive_key in item:
+                                item[sensitive_key] = "[hidden]"
+        return settings
     def save_setting(self, name: str, value: Any):
         self.update_settings({name: value})

kiln_ai/utils/test_config.py CHANGED Viewed

@@ -27,6 +27,7 @@ def config_with_yaml(mock_yaml_file):
                 ),
                 "int_property": ConfigProperty(int, default=0),
                 "empty_property": ConfigProperty(str),
+                "list_of_objects": ConfigProperty(list, default=[]),
             }
         )
@@ -251,3 +252,50 @@ def test_stale_values_bug(config_with_yaml):
     # Simulate updating the settings file with set_settings
     config_with_yaml.update_settings({"example_property": "third_value"})
     assert config_with_yaml.example_property == "third_value"
+async def test_openai_compatible_providers():
+    config = Config.shared()
+    assert config.openai_compatible_providers == []
+    new_settings = [
+        {
+            "name": "provider1",
+            "url": "https://provider1.com",
+            "api_key": "password1",
+        },
+        {
+            "name": "provider2",
+            "url": "https://provider2.com",
+        },
+    ]
+    config.save_setting("openai_compatible_providers", new_settings)
+    assert config.openai_compatible_providers == new_settings
+    # Test that sensitive keys are hidden
+    settings = config.settings(hide_sensitive=True)
+    assert settings["openai_compatible_providers"] == [
+        {"name": "provider1", "url": "https://provider1.com", "api_key": "[hidden]"},
+        {"name": "provider2", "url": "https://provider2.com"},
+    ]
+def test_yaml_persistence_structured_data(config_with_yaml, mock_yaml_file):
+    # Set a value
+    new_settings = [
+        {
+            "name": "provider1",
+            "url": "https://provider1.com",
+            "api_key": "password1",
+        },
+        {
+            "name": "provider2",
+            "url": "https://provider2.com",
+        },
+    ]
+    config_with_yaml.list_of_objects = new_settings
+    # Check that the value was saved to the YAML file
+    with open(mock_yaml_file, "r") as f:
+        saved_settings = yaml.safe_load(f)
+    assert saved_settings["list_of_objects"] == new_settings

{kiln_ai-0.7.1.dist-info → kiln_ai-0.8.1.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: kiln-ai
-Version: 0.7.1
+Version: 0.8.1
 Summary: Kiln AI
 Project-URL: Homepage, https://getkiln.ai
 Project-URL: Repository, https://github.com/Kiln-AI/kiln

{kiln_ai-0.7.1.dist-info → kiln_ai-0.8.1.dist-info}/RECORD RENAMED Viewed

@@ -1,17 +1,17 @@
 kiln_ai/__init__.py,sha256=Sc4z8LRVFMwJUoc_DPVUriSXTZ6PO9MaJ80PhRbKyB8,34
 kiln_ai/adapters/__init__.py,sha256=8-YlnTh3gsaPeEArFVLIqGE7-tbssI42fub4OQBp_DA,970
-kiln_ai/adapters/adapter_registry.py,sha256=EnB0rUIZ0KbBd2nxkNjwUqOpldwqPDyJ9LzIQoDl2GU,634
-kiln_ai/adapters/base_adapter.py,sha256=E_RfXxzEhW-i066xOhZdPuTM7OPKQv70hDpfMsxfYEs,6145
-kiln_ai/adapters/langchain_adapters.py,sha256=NeTZ8WbQTnVu8rtFX6AwkdjFj2ihyhe_vxNxM-_v2yE,10584
-kiln_ai/adapters/ml_model_list.py,sha256=jEayUwDMYjMJTEL5fJ4jKacWR0OKkQ64q4bL10fnMsE,25062
+kiln_ai/adapters/adapter_registry.py,sha256=zO-0_CWF3ZGA-1420_0Uwq976o3-7WXxEY_aTeu0PzQ,688
+kiln_ai/adapters/base_adapter.py,sha256=POSdMrZFqd0IJnLpVoyc1w9CGhdNtePZyQPgdBBRUpQ,6276
+kiln_ai/adapters/langchain_adapters.py,sha256=S9VZ9JLBDEue-vh00iNv4wM1rdBQRNnF0ubeOFLAdZc,10861
+kiln_ai/adapters/ml_model_list.py,sha256=Fl8PUlecibRjcWkKFwfge4cFz7jusVMeK35ewaWw8ac,25446
 kiln_ai/adapters/ollama_tools.py,sha256=0Of6ySbJ2d4j--9laOL6QKgRUQSrqX8dJUIrz20n59s,3561
 kiln_ai/adapters/prompt_builders.py,sha256=Mdu-f1mC9hWIDwoF7Qwd9F99GDx6oNGvtEZN-SrOsNM,10325
-kiln_ai/adapters/provider_tools.py,sha256=Y694_oDm5wKs-WGtnI5FAh1H_wgs0EXUqEcr5rVA6SY,10768
+kiln_ai/adapters/provider_tools.py,sha256=m7X93DFbnYnw5H2HDumFJKpTKmeau-GZLv-SUmssJZ0,12381
 kiln_ai/adapters/test_langchain_adapter.py,sha256=QiVdCUJJ_uEzD0uA0jYMC3ZO4NTGJLm9iWTwvQfdFxI,12037
 kiln_ai/adapters/test_ollama_tools.py,sha256=2KwYVaj3ySV3ld-z51TCGbJEMdb3MZj2eoEicIWz3Q4,2552
 kiln_ai/adapters/test_prompt_adaptors.py,sha256=Mc0oSYgDLxfP2u3GVR_iDWaYctTQ8Ug1u6UGvWA90lM,7494
 kiln_ai/adapters/test_prompt_builders.py,sha256=sU0bSBZa9Y4Q-mmkDf3HbQ0MNSWk5o9bC9sNgtnBokk,14598
-kiln_ai/adapters/test_provider_tools.py,sha256=b9CDC-Cul2WHoVmON1IOp6BI5jiJNqJCC0rnr1Fm8P8,17468
+kiln_ai/adapters/test_provider_tools.py,sha256=S1PSXd5MJnPvBe7Hq4FijptB0lbmym2E6iztncAvuUg,20752
 kiln_ai/adapters/test_saving_adapter_results.py,sha256=SYYh2xY1zmeKhFHfWAuEY4pEiLd8SitSV5ewGOTmaOI,6447
 kiln_ai/adapters/test_structured_output.py,sha256=9Mgng-HOXiZ_WcJG5cpMWhtsdJt8Rn-7qIouBWvWVoU,9324
 kiln_ai/adapters/data_gen/__init__.py,sha256=QTZWaf7kq5BorhPvexJfwDEKmjRmIbhwW9ei8LW2SIs,276
@@ -31,28 +31,28 @@ kiln_ai/adapters/fine_tune/test_openai_finetune.py,sha256=EF-f0JbVaPiVXF0eBYbwTK
 kiln_ai/adapters/repair/__init__.py,sha256=dOO9MEpEhjiwzDVFg3MNfA2bKMPlax9iekDatpTkX8E,217
 kiln_ai/adapters/repair/repair_task.py,sha256=L7WTFEpfaGpWXHPQf7BTNL0wiDPbeBIVqn7qNV_SeZc,3354
 kiln_ai/adapters/repair/test_repair_task.py,sha256=JBcyqyQYWniiUo4FSle9kUEsnbTsl5JN1LTRN1SRnrE,7940
-kiln_ai/datamodel/__init__.py,sha256=qavy8MSzO2n9O5KMrMHXkmj2nG949_vK4Q_Y4oSiuqw,24390
-kiln_ai/datamodel/basemodel.py,sha256=H2e_wvhoqqSJLz96xj9uVG-nXp5bgiuPwxJXRI4qZuU,21301
+kiln_ai/datamodel/__init__.py,sha256=zhiyzeEgaE3IYunmv6KEjX43Biby6uxBjBMMEMAjE1g,28337
+kiln_ai/datamodel/basemodel.py,sha256=zWyoYgsA2tmP55jl9H18xQ0yl9vM98aTOFJTUnW5ulU,20984
 kiln_ai/datamodel/json_schema.py,sha256=l4BIq1ItLHgcSHqsqDOchegLLHY48U4yR0SP2aMb4i0,2449
 kiln_ai/datamodel/model_cache.py,sha256=d8VjPp0p5BhrGSkx9soKyxO6VWW-bcesNSJI21ySvmA,4369
 kiln_ai/datamodel/registry.py,sha256=XwGFXJFKZtOpR1Z9ven6SftggfADdZRm8TFxCEVtfUQ,957
 kiln_ai/datamodel/test_basemodel.py,sha256=r40jWaW1073ZdIhHe-GHFE8jJDD9ocauItInOsK8pWU,15234
-kiln_ai/datamodel/test_dataset_split.py,sha256=aBjHVyTdt4mWXEKBkvvchEEZSj8jUwhXRZ37LbBxTi4,7265
+kiln_ai/datamodel/test_dataset_split.py,sha256=Ug-vbga-opGN_LF51Mszx5NN4wXbx3MIP1LiNzIn5Nw,7264
 kiln_ai/datamodel/test_datasource.py,sha256=GAiZz31qezVVPwFqnt8wHMu15WvtlV89jw8C1Ue6YNI,3165
 kiln_ai/datamodel/test_example_models.py,sha256=9Jhc0bvbM4hCjJGiQNgWH5rwyIsGuneAD8h4o1P3zAY,20356
 kiln_ai/datamodel/test_json_schema.py,sha256=vdLnTQxxrcmuSrf6iOmkrmpfh7JnxqIw4B4dbDAAcZ4,3199
 kiln_ai/datamodel/test_model_cache.py,sha256=9HvK2etVZJyepdlRz5ja7u1CnyzhsV4_BupJF77yBxE,7285
-kiln_ai/datamodel/test_models.py,sha256=-ygQe8XeiZcZJxaffgK5KudRzHXs52ZDEDUSoz8B7eI,13665
+kiln_ai/datamodel/test_models.py,sha256=t2Uthl559QioTyFAbQUk4BD3PqAywl3u1RSh4tHiMP0,15071
 kiln_ai/datamodel/test_nested_save.py,sha256=xciCddqvPyKyoyjC5Lx_3Kh1t4LJv1xYRAPazR3SRcs,5588
-kiln_ai/datamodel/test_output_rating.py,sha256=iw7fVUAPORA-0-VFiikZV3NDycGFaFMHSX1a38t_aQA,2647
+kiln_ai/datamodel/test_output_rating.py,sha256=zvPIp2shAgCs2RQBgwYoL09fRA3krHvgAqUa91RlWR0,15125
 kiln_ai/datamodel/test_registry.py,sha256=PhS4anLi5Bf_023obuTlO5DALhtPB8WIc_bX12Yg6Po,2705
 kiln_ai/utils/__init__.py,sha256=PTD0MwBCKAMIOGsTAwsFaJOusTJJoRFTfOGqRvCaU-E,142
-kiln_ai/utils/config.py,sha256=BZpARYTcK0vNGo_h-0Fjp9aP-1xZYAGEuYS0HdBWWHA,5946
+kiln_ai/utils/config.py,sha256=u289b2AHuQoPup_vILTSpgsO29fxJyU8zy8BwADAtvs,6859
 kiln_ai/utils/formatting.py,sha256=VtB9oag0lOGv17dwT7OPX_3HzBfaU9GsLH-iLete0yM,97
 kiln_ai/utils/name_generator.py,sha256=v26TgpCwQbhQFcZvzgjZvURinjrOyyFhxpsI6NQrHKc,1914
-kiln_ai/utils/test_config.py,sha256=pTYItz5WD15rTRdxKE7vszXF_mb-dik2qrFWzkVemEY,7671
+kiln_ai/utils/test_config.py,sha256=Jw3nMFeIgZUsZDRJJY2HpB-2EkR2NoZ-rDe_o9oA7ws,9174
 kiln_ai/utils/test_name_geneator.py,sha256=9-hSTBshyakqlPbFnNcggwLrL7lcPTitauBYHg9jFWI,1513
-kiln_ai-0.7.1.dist-info/METADATA,sha256=Hl--1C_wZrj_ui9WByLBgjrSzielnezjX8CR7JCJboQ,9050
-kiln_ai-0.7.1.dist-info/WHEEL,sha256=qtCwoSJWgHk21S1Kb4ihdzI2rlJ1ZKaIurTj_ngOhyQ,87
-kiln_ai-0.7.1.dist-info/licenses/LICENSE.txt,sha256=_NA5pnTYgRRr4qH6lE3X-TuZJ8iRcMUi5ASoGr-lEx8,1209
-kiln_ai-0.7.1.dist-info/RECORD,,
+kiln_ai-0.8.1.dist-info/METADATA,sha256=hcnd6e-iYHbE9GsI0W2deM8O6UgZOXl70VI1j8kIJrg,9050
+kiln_ai-0.8.1.dist-info/WHEEL,sha256=qtCwoSJWgHk21S1Kb4ihdzI2rlJ1ZKaIurTj_ngOhyQ,87
+kiln_ai-0.8.1.dist-info/licenses/LICENSE.txt,sha256=_NA5pnTYgRRr4qH6lE3X-TuZJ8iRcMUi5ASoGr-lEx8,1209
+kiln_ai-0.8.1.dist-info/RECORD,,

{kiln_ai-0.7.1.dist-info → kiln_ai-0.8.1.dist-info}/WHEEL RENAMED Viewed

File without changes

{kiln_ai-0.7.1.dist-info → kiln_ai-0.8.1.dist-info}/licenses/LICENSE.txt RENAMED Viewed

File without changes

kiln-ai 0.7.1__py3-none-any.whl → 0.8.1__py3-none-any.whl

Potentially problematic release.

kiln-ai 0.7.1py3-none-any.whl → 0.8.1py3-none-any.whl