PyPI - kiln-ai - Versions diffs - 0.11.1__py3-none-any.whl → 0.13.0__py3-none-any.whl - Mend

kiln-ai 0.11.1py3-none-any.whl → 0.13.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of kiln-ai might be problematic. Click here for more details.

Files changed (80) hide show

kiln_ai/adapters/__init__.py +4 -0
kiln_ai/adapters/adapter_registry.py +163 -39
kiln_ai/adapters/data_gen/data_gen_task.py +18 -0
kiln_ai/adapters/eval/__init__.py +28 -0
kiln_ai/adapters/eval/base_eval.py +164 -0
kiln_ai/adapters/eval/eval_runner.py +270 -0
kiln_ai/adapters/eval/g_eval.py +368 -0
kiln_ai/adapters/eval/registry.py +16 -0
kiln_ai/adapters/eval/test_base_eval.py +325 -0
kiln_ai/adapters/eval/test_eval_runner.py +641 -0
kiln_ai/adapters/eval/test_g_eval.py +498 -0
kiln_ai/adapters/eval/test_g_eval_data.py +4 -0
kiln_ai/adapters/fine_tune/base_finetune.py +16 -2
kiln_ai/adapters/fine_tune/finetune_registry.py +2 -0
kiln_ai/adapters/fine_tune/test_dataset_formatter.py +4 -1
kiln_ai/adapters/fine_tune/test_fireworks_tinetune.py +1 -1
kiln_ai/adapters/fine_tune/test_openai_finetune.py +1 -1
kiln_ai/adapters/fine_tune/test_together_finetune.py +531 -0
kiln_ai/adapters/fine_tune/together_finetune.py +325 -0
kiln_ai/adapters/ml_model_list.py +758 -163
kiln_ai/adapters/model_adapters/__init__.py +2 -4
kiln_ai/adapters/model_adapters/base_adapter.py +61 -43
kiln_ai/adapters/model_adapters/litellm_adapter.py +391 -0
kiln_ai/adapters/model_adapters/litellm_config.py +13 -0
kiln_ai/adapters/model_adapters/test_base_adapter.py +22 -13
kiln_ai/adapters/model_adapters/test_litellm_adapter.py +407 -0
kiln_ai/adapters/model_adapters/test_saving_adapter_results.py +41 -19
kiln_ai/adapters/model_adapters/test_structured_output.py +59 -35
kiln_ai/adapters/ollama_tools.py +3 -3
kiln_ai/adapters/parsers/r1_parser.py +19 -14
kiln_ai/adapters/parsers/test_r1_parser.py +17 -5
kiln_ai/adapters/prompt_builders.py +80 -42
kiln_ai/adapters/provider_tools.py +50 -58
kiln_ai/adapters/repair/repair_task.py +9 -21
kiln_ai/adapters/repair/test_repair_task.py +6 -6
kiln_ai/adapters/run_output.py +3 -0
kiln_ai/adapters/test_adapter_registry.py +26 -29
kiln_ai/adapters/test_generate_docs.py +4 -4
kiln_ai/adapters/test_ollama_tools.py +0 -1
kiln_ai/adapters/test_prompt_adaptors.py +47 -33
kiln_ai/adapters/test_prompt_builders.py +91 -31
kiln_ai/adapters/test_provider_tools.py +26 -81
kiln_ai/datamodel/__init__.py +50 -952
kiln_ai/datamodel/basemodel.py +2 -0
kiln_ai/datamodel/datamodel_enums.py +60 -0
kiln_ai/datamodel/dataset_filters.py +114 -0
kiln_ai/datamodel/dataset_split.py +170 -0
kiln_ai/datamodel/eval.py +298 -0
kiln_ai/datamodel/finetune.py +105 -0
kiln_ai/datamodel/json_schema.py +7 -1
kiln_ai/datamodel/project.py +23 -0
kiln_ai/datamodel/prompt.py +37 -0
kiln_ai/datamodel/prompt_id.py +83 -0
kiln_ai/datamodel/strict_mode.py +24 -0
kiln_ai/datamodel/task.py +181 -0
kiln_ai/datamodel/task_output.py +328 -0
kiln_ai/datamodel/task_run.py +164 -0
kiln_ai/datamodel/test_basemodel.py +19 -11
kiln_ai/datamodel/test_dataset_filters.py +71 -0
kiln_ai/datamodel/test_dataset_split.py +32 -8
kiln_ai/datamodel/test_datasource.py +22 -2
kiln_ai/datamodel/test_eval_model.py +635 -0
kiln_ai/datamodel/test_example_models.py +9 -13
kiln_ai/datamodel/test_json_schema.py +23 -0
kiln_ai/datamodel/test_models.py +2 -2
kiln_ai/datamodel/test_prompt_id.py +129 -0
kiln_ai/datamodel/test_task.py +159 -0
kiln_ai/utils/config.py +43 -1
kiln_ai/utils/dataset_import.py +232 -0
kiln_ai/utils/test_dataset_import.py +596 -0
{kiln_ai-0.11.1.dist-info → kiln_ai-0.13.0.dist-info}/METADATA +86 -6
kiln_ai-0.13.0.dist-info/RECORD +103 -0
kiln_ai/adapters/model_adapters/langchain_adapters.py +0 -302
kiln_ai/adapters/model_adapters/openai_compatible_config.py +0 -11
kiln_ai/adapters/model_adapters/openai_model_adapter.py +0 -246
kiln_ai/adapters/model_adapters/test_langchain_adapter.py +0 -350
kiln_ai/adapters/model_adapters/test_openai_model_adapter.py +0 -225
kiln_ai-0.11.1.dist-info/RECORD +0 -76
{kiln_ai-0.11.1.dist-info → kiln_ai-0.13.0.dist-info}/WHEEL +0 -0
{kiln_ai-0.11.1.dist-info → kiln_ai-0.13.0.dist-info}/licenses/LICENSE.txt +0 -0

kiln_ai/adapters/test_provider_tools.py CHANGED Viewed

@@ -17,12 +17,11 @@ from kiln_ai.adapters.provider_tools import (
     finetune_provider_model,
     get_model_and_provider,
     kiln_model_provider_from,
-    openai_compatible_config,
-    openai_compatible_provider_model,
+    lite_llm_config,
+    lite_llm_provider_model,
     parse_custom_model_id,
     provider_enabled,
     provider_name_from_id,
-    provider_options_for_custom_model,
     provider_warnings,
 )
 from kiln_ai.datamodel import Finetune, StructuredOutputMode, Task
@@ -186,7 +185,7 @@ def test_get_model_and_provider_valid():
     assert provider is not None
     assert model.name == ModelName.phi_3_5
     assert provider.name == ModelProviderName.ollama
-    assert provider.provider_options["model"] == "phi3.5"
+    assert provider.model_id == "phi3.5"
 def test_get_model_and_provider_invalid_model():
@@ -227,7 +226,7 @@ def test_get_model_and_provider_multiple_providers():
     assert provider is not None
     assert model.name == ModelName.llama_3_3_70b
     assert provider.name == ModelProviderName.groq
-    assert provider.provider_options["model"] == "llama-3.3-70b-versatile"
+    assert provider.model_id == "llama-3.3-70b-versatile"
 @pytest.mark.asyncio
@@ -324,59 +323,7 @@ async def test_kiln_model_provider_from_custom_model_valid(mock_config):
     assert provider.supports_structured_output is False
     assert provider.supports_data_gen is False
     assert provider.untested_model is True
-    assert "model" in provider.provider_options
-    assert provider.provider_options["model"] == "custom_model"
-def test_provider_options_for_custom_model_basic():
-    """Test basic case with custom model name"""
-    options = provider_options_for_custom_model(
-        "custom_model_name", ModelProviderName.openai
-    )
-    assert options == {"model": "custom_model_name"}
-def test_provider_options_for_custom_model_bedrock():
-    """Test Amazon Bedrock provider options"""
-    options = provider_options_for_custom_model(
-        ModelName.llama_3_1_8b, ModelProviderName.amazon_bedrock
-    )
-    assert options == {"model": ModelName.llama_3_1_8b, "region_name": "us-west-2"}
-@pytest.mark.parametrize(
-    "provider",
-    [
-        ModelProviderName.openai,
-        ModelProviderName.ollama,
-        ModelProviderName.fireworks_ai,
-        ModelProviderName.openrouter,
-        ModelProviderName.groq,
-    ],
-)
-def test_provider_options_for_custom_model_simple_providers(provider):
-    """Test providers that just need model name"""
-    options = provider_options_for_custom_model(ModelName.llama_3_1_8b, provider)
-    assert options == {"model": ModelName.llama_3_1_8b}
-def test_provider_options_for_custom_model_kiln_fine_tune():
-    """Test that kiln_fine_tune raises appropriate error"""
-    with pytest.raises(ValueError) as exc_info:
-        provider_options_for_custom_model(
-            "model_name", ModelProviderName.kiln_fine_tune
-        )
-    assert (
-        str(exc_info.value)
-        == "Fine tuned models should populate provider options via another path"
-    )
-def test_provider_options_for_custom_model_invalid_enum():
-    """Test handling of invalid enum value"""
-    with pytest.raises(ValueError):
-        provider_options_for_custom_model("model_name", "invalid_enum_value")
+    assert provider.model_id == "custom_model"
 @pytest.mark.asyncio
@@ -393,7 +340,7 @@ async def test_kiln_model_provider_from_custom_registry(mock_config):
     assert provider.supports_structured_output is False
     assert provider.supports_data_gen is False
     assert provider.untested_model is True
-    assert provider.provider_options == {"model": "gpt-4-turbo"}
+    assert provider.model_id == "gpt-4-turbo"
 @pytest.mark.asyncio
@@ -412,7 +359,7 @@ async def test_builtin_model_from_valid_model_default_provider(mock_config):
     assert provider is not None
     assert provider.name == ModelProviderName.ollama
-    assert provider.provider_options["model"] == "phi3.5"
+    assert provider.model_id == "phi3.5"
 @pytest.mark.asyncio
@@ -426,7 +373,7 @@ async def test_builtin_model_from_valid_model_specific_provider(mock_config):
     assert provider is not None
     assert provider.name == ModelProviderName.groq
-    assert provider.provider_options["model"] == "llama-3.3-70b-versatile"
+    assert provider.model_id == "llama-3.3-70b-versatile"
 @pytest.mark.asyncio
@@ -477,7 +424,7 @@ def test_finetune_provider_model_success(mock_project, mock_task, mock_finetune)
     provider = finetune_provider_model(model_id)
     assert provider.name == ModelProviderName.openai
-    assert provider.provider_options == {"model": "ft:gpt-3.5-turbo:custom:model-123"}
+    assert provider.model_id == "ft:gpt-3.5-turbo:custom:model-123"
     assert provider.structured_output_mode == StructuredOutputMode.json_schema
@@ -573,7 +520,7 @@ def test_finetune_provider_model_structured_mode(
     provider = finetune_provider_model("project-123::task-456::finetune-789")
     assert provider.name == provider_name
-    assert provider.provider_options == {"model": "fireworks-model-123"}
+    assert provider.model_id == "fireworks-model-123"
     assert provider.structured_output_mode == expected_mode
@@ -581,69 +528,67 @@ def test_openai_compatible_provider_config(mock_shared_config):
     """Test successful creation of an OpenAI compatible provider"""
     model_id = "test_provider::gpt-4"
-    config = openai_compatible_config(model_id)
+    config = lite_llm_config(model_id)
     assert config.provider_name == ModelProviderName.openai_compatible
     assert config.model_name == "gpt-4"
-    assert config.api_key == "test-key"
+    assert config.additional_body_options == {"api_key": "test-key"}
     assert config.base_url == "https://api.test.com"
-def test_openai_compatible_provider_model_success(mock_shared_config):
+def test_litellm_provider_model_success(mock_shared_config):
     """Test successful creation of an OpenAI compatible provider"""
     model_id = "test_provider::gpt-4"
-    provider = openai_compatible_provider_model(model_id)
+    provider = lite_llm_provider_model(model_id)
     assert provider.name == ModelProviderName.openai_compatible
-    assert provider.provider_options == {
-        "model": model_id,
-    }
+    assert provider.model_id == model_id
     assert provider.supports_structured_output is False
     assert provider.supports_data_gen is False
     assert provider.untested_model is True
-def test_openai_compatible_config_no_api_key(mock_shared_config):
+def test_lite_llm_config_no_api_key(mock_shared_config):
     """Test provider creation without API key (should work as some providers don't require it)"""
     model_id = "no_key_provider::gpt-4"
-    config = openai_compatible_config(model_id)
+    config = lite_llm_config(model_id)
     assert config.provider_name == ModelProviderName.openai_compatible
     assert config.model_name == "gpt-4"
-    assert config.api_key is None
+    assert config.additional_body_options == {"api_key": None}
     assert config.base_url == "https://api.nokey.com"
-def test_openai_compatible_config_invalid_id():
+def test_lite_llm_config_invalid_id():
     """Test handling of invalid model ID format"""
     with pytest.raises(ValueError) as exc_info:
-        openai_compatible_config("invalid-id-format")
+        lite_llm_config("invalid-id-format")
     assert (
         str(exc_info.value) == "Invalid openai compatible model ID: invalid-id-format"
     )
-def test_openai_compatible_config_no_providers(mock_shared_config):
+def test_lite_llm_config_no_providers(mock_shared_config):
     """Test handling when no providers are configured"""
     mock_shared_config.return_value.openai_compatible_providers = None
     with pytest.raises(ValueError) as exc_info:
-        openai_compatible_config("test_provider::gpt-4")
+        lite_llm_config("test_provider::gpt-4")
     assert str(exc_info.value) == "OpenAI compatible provider test_provider not found"
-def test_openai_compatible_config_provider_not_found(mock_shared_config):
+def test_lite_llm_config_provider_not_found(mock_shared_config):
     """Test handling of non-existent provider"""
     with pytest.raises(ValueError) as exc_info:
-        openai_compatible_config("unknown_provider::gpt-4")
+        lite_llm_config("unknown_provider::gpt-4")
     assert (
         str(exc_info.value) == "OpenAI compatible provider unknown_provider not found"
     )
-def test_openai_compatible_config_no_base_url(mock_shared_config):
+def test_lite_llm_config_no_base_url(mock_shared_config):
     """Test handling of provider without base URL"""
     mock_shared_config.return_value.openai_compatible_providers = [
         {
@@ -653,7 +598,7 @@ def test_openai_compatible_config_no_base_url(mock_shared_config):
     ]
     with pytest.raises(ValueError) as exc_info:
-        openai_compatible_config("test_provider::gpt-4")
+        lite_llm_config("test_provider::gpt-4")
     assert (
         str(exc_info.value)
         == "OpenAI compatible provider test_provider has no base URL"

kiln-ai 0.11.1__py3-none-any.whl → 0.13.0__py3-none-any.whl

Potentially problematic release.

kiln-ai 0.11.1py3-none-any.whl → 0.13.0py3-none-any.whl