PyPI - kiln-ai - Versions diffs - 0.6.1__py3-none-any.whl → 0.7.0__py3-none-any.whl - Mend

kiln-ai 0.6.1py3-none-any.whl → 0.7.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of kiln-ai might be problematic. Click here for more details.

Files changed (40) hide show

kiln_ai/adapters/__init__.py +2 -0
kiln_ai/adapters/adapter_registry.py +19 -0
kiln_ai/adapters/data_gen/test_data_gen_task.py +29 -21
kiln_ai/adapters/fine_tune/__init__.py +14 -0
kiln_ai/adapters/fine_tune/base_finetune.py +186 -0
kiln_ai/adapters/fine_tune/dataset_formatter.py +187 -0
kiln_ai/adapters/fine_tune/finetune_registry.py +11 -0
kiln_ai/adapters/fine_tune/fireworks_finetune.py +308 -0
kiln_ai/adapters/fine_tune/openai_finetune.py +205 -0
kiln_ai/adapters/fine_tune/test_base_finetune.py +290 -0
kiln_ai/adapters/fine_tune/test_dataset_formatter.py +342 -0
kiln_ai/adapters/fine_tune/test_fireworks_tinetune.py +455 -0
kiln_ai/adapters/fine_tune/test_openai_finetune.py +503 -0
kiln_ai/adapters/langchain_adapters.py +103 -13
kiln_ai/adapters/ml_model_list.py +218 -304
kiln_ai/adapters/ollama_tools.py +114 -0
kiln_ai/adapters/provider_tools.py +295 -0
kiln_ai/adapters/repair/test_repair_task.py +6 -11
kiln_ai/adapters/test_langchain_adapter.py +46 -18
kiln_ai/adapters/test_ollama_tools.py +42 -0
kiln_ai/adapters/test_prompt_adaptors.py +7 -5
kiln_ai/adapters/test_provider_tools.py +312 -0
kiln_ai/adapters/test_structured_output.py +22 -43
kiln_ai/datamodel/__init__.py +235 -22
kiln_ai/datamodel/basemodel.py +30 -0
kiln_ai/datamodel/registry.py +31 -0
kiln_ai/datamodel/test_basemodel.py +29 -1
kiln_ai/datamodel/test_dataset_split.py +234 -0
kiln_ai/datamodel/test_example_models.py +12 -0
kiln_ai/datamodel/test_models.py +91 -1
kiln_ai/datamodel/test_registry.py +96 -0
kiln_ai/utils/config.py +9 -0
kiln_ai/utils/name_generator.py +125 -0
kiln_ai/utils/test_name_geneator.py +47 -0
{kiln_ai-0.6.1.dist-info → kiln_ai-0.7.0.dist-info}/METADATA +4 -2
kiln_ai-0.7.0.dist-info/RECORD +56 -0
kiln_ai/adapters/test_ml_model_list.py +0 -181
kiln_ai-0.6.1.dist-info/RECORD +0 -37
{kiln_ai-0.6.1.dist-info → kiln_ai-0.7.0.dist-info}/WHEEL +0 -0
{kiln_ai-0.6.1.dist-info → kiln_ai-0.7.0.dist-info}/licenses/LICENSE.txt +0 -0

kiln_ai/adapters/test_provider_tools.py ADDED Viewed

@@ -0,0 +1,312 @@
+from unittest.mock import AsyncMock, patch
+import pytest
+from kiln_ai.adapters.ml_model_list import (
+    ModelName,
+    ModelProviderName,
+)
+from kiln_ai.adapters.ollama_tools import OllamaConnection
+from kiln_ai.adapters.provider_tools import (
+    check_provider_warnings,
+    get_model_and_provider,
+    kiln_model_provider_from,
+    provider_enabled,
+    provider_name_from_id,
+    provider_options_for_custom_model,
+    provider_warnings,
+)
+@pytest.fixture
+def mock_config():
+    with patch("kiln_ai.adapters.provider_tools.get_config_value") as mock:
+        yield mock
+def test_check_provider_warnings_no_warning(mock_config):
+    mock_config.return_value = "some_value"
+    # This should not raise an exception
+    check_provider_warnings(ModelProviderName.amazon_bedrock)
+def test_check_provider_warnings_missing_key(mock_config):
+    mock_config.return_value = None
+    with pytest.raises(ValueError) as exc_info:
+        check_provider_warnings(ModelProviderName.amazon_bedrock)
+    assert provider_warnings[ModelProviderName.amazon_bedrock].message in str(
+        exc_info.value
+    )
+def test_check_provider_warnings_unknown_provider():
+    # This should not raise an exception, as no settings are required for unknown providers
+    check_provider_warnings("unknown_provider")
+@pytest.mark.parametrize(
+    "provider_name",
+    [
+        ModelProviderName.amazon_bedrock,
+        ModelProviderName.openrouter,
+        ModelProviderName.groq,
+        ModelProviderName.openai,
+        ModelProviderName.fireworks_ai,
+    ],
+)
+def test_check_provider_warnings_all_providers(mock_config, provider_name):
+    mock_config.return_value = None
+    with pytest.raises(ValueError) as exc_info:
+        check_provider_warnings(provider_name)
+    assert provider_warnings[provider_name].message in str(exc_info.value)
+def test_check_provider_warnings_partial_keys_set(mock_config):
+    def mock_get(key):
+        return "value" if key == "bedrock_access_key" else None
+    mock_config.side_effect = mock_get
+    with pytest.raises(ValueError) as exc_info:
+        check_provider_warnings(ModelProviderName.amazon_bedrock)
+    assert provider_warnings[ModelProviderName.amazon_bedrock].message in str(
+        exc_info.value
+    )
+def test_provider_name_from_id_unknown_provider():
+    assert (
+        provider_name_from_id("unknown_provider")
+        == "Unknown provider: unknown_provider"
+    )
+def test_provider_name_from_id_case_sensitivity():
+    assert (
+        provider_name_from_id(ModelProviderName.amazon_bedrock.upper())
+        == "Unknown provider: AMAZON_BEDROCK"
+    )
+@pytest.mark.parametrize(
+    "provider_id, expected_name",
+    [
+        (ModelProviderName.amazon_bedrock, "Amazon Bedrock"),
+        (ModelProviderName.openrouter, "OpenRouter"),
+        (ModelProviderName.groq, "Groq"),
+        (ModelProviderName.ollama, "Ollama"),
+        (ModelProviderName.openai, "OpenAI"),
+        (ModelProviderName.fireworks_ai, "Fireworks AI"),
+    ],
+)
+def test_provider_name_from_id_parametrized(provider_id, expected_name):
+    assert provider_name_from_id(provider_id) == expected_name
+def test_get_model_and_provider_valid():
+    # Test with a known valid model and provider combination
+    model, provider = get_model_and_provider(
+        ModelName.phi_3_5, ModelProviderName.ollama
+    )
+    assert model is not None
+    assert provider is not None
+    assert model.name == ModelName.phi_3_5
+    assert provider.name == ModelProviderName.ollama
+    assert provider.provider_options["model"] == "phi3.5"
+def test_get_model_and_provider_invalid_model():
+    # Test with an invalid model name
+    model, provider = get_model_and_provider(
+        "nonexistent_model", ModelProviderName.ollama
+    )
+    assert model is None
+    assert provider is None
+def test_get_model_and_provider_invalid_provider():
+    # Test with a valid model but invalid provider
+    model, provider = get_model_and_provider(ModelName.phi_3_5, "nonexistent_provider")
+    assert model is None
+    assert provider is None
+def test_get_model_and_provider_valid_model_wrong_provider():
+    # Test with a valid model but a provider that doesn't support it
+    model, provider = get_model_and_provider(
+        ModelName.phi_3_5, ModelProviderName.amazon_bedrock
+    )
+    assert model is None
+    assert provider is None
+def test_get_model_and_provider_multiple_providers():
+    # Test with a model that has multiple providers
+    model, provider = get_model_and_provider(
+        ModelName.llama_3_1_70b, ModelProviderName.groq
+    )
+    assert model is not None
+    assert provider is not None
+    assert model.name == ModelName.llama_3_1_70b
+    assert provider.name == ModelProviderName.groq
+    assert provider.provider_options["model"] == "llama-3.1-70b-versatile"
+@pytest.mark.asyncio
+async def test_provider_enabled_ollama_success():
+    with patch(
+        "kiln_ai.adapters.provider_tools.get_ollama_connection", new_callable=AsyncMock
+    ) as mock_get_ollama:
+        # Mock successful Ollama connection with models
+        mock_get_ollama.return_value = OllamaConnection(
+            message="Connected", supported_models=["phi3.5:latest"]
+        )
+        result = await provider_enabled(ModelProviderName.ollama)
+        assert result is True
+@pytest.mark.asyncio
+async def test_provider_enabled_ollama_no_models():
+    with patch(
+        "kiln_ai.adapters.provider_tools.get_ollama_connection", new_callable=AsyncMock
+    ) as mock_get_ollama:
+        # Mock Ollama connection but with no models
+        mock_get_ollama.return_value = OllamaConnection(
+            message="Connected but no models",
+            supported_models=[],
+            unsupported_models=[],
+        )
+        result = await provider_enabled(ModelProviderName.ollama)
+        assert result is False
+@pytest.mark.asyncio
+async def test_provider_enabled_ollama_connection_error():
+    with patch(
+        "kiln_ai.adapters.provider_tools.get_ollama_connection", new_callable=AsyncMock
+    ) as mock_get_ollama:
+        # Mock Ollama connection failure
+        mock_get_ollama.side_effect = Exception("Connection failed")
+        result = await provider_enabled(ModelProviderName.ollama)
+        assert result is False
+@pytest.mark.asyncio
+async def test_provider_enabled_openai_with_key(mock_config):
+    # Mock config to return API key
+    mock_config.return_value = "fake-api-key"
+    result = await provider_enabled(ModelProviderName.openai)
+    assert result is True
+    mock_config.assert_called_with("open_ai_api_key")
+@pytest.mark.asyncio
+async def test_provider_enabled_openai_without_key(mock_config):
+    # Mock config to return None for API key
+    mock_config.return_value = None
+    result = await provider_enabled(ModelProviderName.openai)
+    assert result is False
+    mock_config.assert_called_with("open_ai_api_key")
+@pytest.mark.asyncio
+async def test_provider_enabled_unknown_provider():
+    # Test with a provider that isn't in provider_warnings
+    result = await provider_enabled("unknown_provider")
+    assert result is False
+@pytest.mark.asyncio
+async def test_kiln_model_provider_from_custom_model_no_provider():
+    with pytest.raises(ValueError) as exc_info:
+        await kiln_model_provider_from("custom_model")
+    assert str(exc_info.value) == "Provider name is required for custom models"
+@pytest.mark.asyncio
+async def test_kiln_model_provider_from_invalid_provider():
+    with pytest.raises(ValueError) as exc_info:
+        await kiln_model_provider_from("custom_model", "invalid_provider")
+    assert str(exc_info.value) == "Invalid provider name: invalid_provider"
+@pytest.mark.asyncio
+async def test_kiln_model_provider_from_custom_model_valid(mock_config):
+    # Mock config to pass provider warnings check
+    mock_config.return_value = "fake-api-key"
+    provider = await kiln_model_provider_from("custom_model", ModelProviderName.openai)
+    assert provider.name == ModelProviderName.openai
+    assert provider.supports_structured_output is False
+    assert provider.supports_data_gen is False
+    assert provider.untested_model is True
+    assert "model" in provider.provider_options
+    assert provider.provider_options["model"] == "custom_model"
+def test_provider_options_for_custom_model_basic():
+    """Test basic case with custom model name"""
+    options = provider_options_for_custom_model(
+        "custom_model_name", ModelProviderName.openai
+    )
+    assert options == {"model": "custom_model_name"}
+def test_provider_options_for_custom_model_bedrock():
+    """Test Amazon Bedrock provider options"""
+    options = provider_options_for_custom_model(
+        ModelName.llama_3_1_8b, ModelProviderName.amazon_bedrock
+    )
+    assert options == {"model": ModelName.llama_3_1_8b, "region_name": "us-west-2"}
+@pytest.mark.parametrize(
+    "provider",
+    [
+        ModelProviderName.openai,
+        ModelProviderName.ollama,
+        ModelProviderName.fireworks_ai,
+        ModelProviderName.openrouter,
+        ModelProviderName.groq,
+    ],
+)
+def test_provider_options_for_custom_model_simple_providers(provider):
+    """Test providers that just need model name"""
+    options = provider_options_for_custom_model(ModelName.llama_3_1_8b, provider)
+    assert options == {"model": ModelName.llama_3_1_8b}
+def test_provider_options_for_custom_model_kiln_fine_tune():
+    """Test that kiln_fine_tune raises appropriate error"""
+    with pytest.raises(ValueError) as exc_info:
+        provider_options_for_custom_model(
+            "model_name", ModelProviderName.kiln_fine_tune
+        )
+    assert (
+        str(exc_info.value)
+        == "Fine tuned models should populate provider options via another path"
+    )
+def test_provider_options_for_custom_model_invalid_enum():
+    """Test handling of invalid enum value"""
+    with pytest.raises(ValueError):
+        provider_options_for_custom_model("model_name", "invalid_enum_value")

kiln_ai/adapters/test_structured_output.py CHANGED Viewed

@@ -6,12 +6,12 @@ import jsonschema.exceptions
 import pytest
 import kiln_ai.datamodel as datamodel
+from kiln_ai.adapters.adapter_registry import adapter_for_task
 from kiln_ai.adapters.base_adapter import AdapterInfo, BaseAdapter, RunOutput
-from kiln_ai.adapters.langchain_adapters import LangChainPromptAdapter
 from kiln_ai.adapters.ml_model_list import (
     built_in_models,
-    ollama_online,
 )
+from kiln_ai.adapters.ollama_tools import ollama_online
 from kiln_ai.adapters.prompt_builders import (
     BasePromptBuilder,
     SimpleChainOfThoughtPromptBuilder,
@@ -20,23 +20,6 @@ from kiln_ai.adapters.test_prompt_adaptors import get_all_models_and_providers
 from kiln_ai.datamodel.test_json_schema import json_joke_schema, json_triangle_schema
-@pytest.mark.parametrize(
-    "model_name,provider",
-    [
-        ("llama_3_1_8b", "groq"),
-        ("mistral_nemo", "openrouter"),
-        ("llama_3_1_70b", "amazon_bedrock"),
-        ("claude_3_5_sonnet", "openrouter"),
-        ("gemini_1_5_pro", "openrouter"),
-        ("gemini_1_5_flash", "openrouter"),
-        ("gemini_1_5_flash_8b", "openrouter"),
-    ],
-)
-@pytest.mark.paid
-async def test_structured_output(tmp_path, model_name, provider):
-    await run_structured_output_test(tmp_path, model_name, provider)
 @pytest.mark.ollama
 async def test_structured_output_ollama_phi(tmp_path):
     # https://python.langchain.com/v0.2/docs/how_to/structured_output/#advanced-specifying-the-method-for-structuring-outputs
@@ -112,28 +95,27 @@ async def test_mock_unstructred_response(tmp_path):
 @pytest.mark.paid
 @pytest.mark.ollama
-async def test_all_built_in_models_structured_output(tmp_path):
-    errors = []
+@pytest.mark.parametrize("model_name,provider_name", get_all_models_and_providers())
+async def test_all_built_in_models_structured_output(
+    tmp_path, model_name, provider_name
+):
     for model in built_in_models:
+        if model.name != model_name:
+            continue
         if not model.supports_structured_output:
-            print(
+            pytest.skip(
                 f"Skipping {model.name} because it does not support structured output"
             )
-            continue
         for provider in model.providers:
+            if provider.name != provider_name:
+                continue
             if not provider.supports_structured_output:
-                print(
+                pytest.skip(
                     f"Skipping {model.name} {provider.name} because it does not support structured output"
                 )
-                continue
-            try:
-                print(f"Running {model.name} {provider.name}")
-                await run_structured_output_test(tmp_path, model.name, provider.name)
-            except Exception as e:
-                print(f"Error running {model.name} {provider.name}")
-                errors.append(f"{model.name} {provider.name}: {e}")
-    if len(errors) > 0:
-        raise RuntimeError(f"Errors: {errors}")
+            await run_structured_output_test(tmp_path, model.name, provider.name)
+            return
+    raise RuntimeError(f"No model {model_name} {provider_name} found")
 def build_structured_output_test_task(tmp_path: Path):
@@ -157,7 +139,7 @@ def build_structured_output_test_task(tmp_path: Path):
 async def run_structured_output_test(tmp_path: Path, model_name: str, provider: str):
     task = build_structured_output_test_task(tmp_path)
-    a = LangChainPromptAdapter(task, model_name=model_name, provider=provider)
+    a = adapter_for_task(task, model_name=model_name, provider=provider)
     parsed = await a.invoke_returning_raw("Cows")  # a joke about cows
     if parsed is None or not isinstance(parsed, Dict):
         raise RuntimeError(f"structured response is not a dict: {parsed}")
@@ -204,7 +186,7 @@ async def run_structured_input_task(
     provider: str,
     pb: BasePromptBuilder | None = None,
 ):
-    a = LangChainPromptAdapter(
+    a = adapter_for_task(
         task, model_name=model_name, provider=provider, prompt_builder=pb
     )
     with pytest.raises(ValueError):
@@ -235,14 +217,11 @@ async def test_structured_input_gpt_4o_mini(tmp_path):
 @pytest.mark.paid
 @pytest.mark.ollama
-async def test_all_built_in_models_structured_input(tmp_path):
-    for model in built_in_models:
-        for provider in model.providers:
-            try:
-                print(f"Running {model.name} {provider.name}")
-                await run_structured_input_test(tmp_path, model.name, provider.name)
-            except Exception as e:
-                raise RuntimeError(f"Error running {model.name} {provider}") from e
+@pytest.mark.parametrize("model_name,provider_name", get_all_models_and_providers())
+async def test_all_built_in_models_structured_input(
+    tmp_path, model_name, provider_name
+):
+    await run_structured_input_test(tmp_path, model_name, provider_name)
 @pytest.mark.paid

kiln-ai 0.6.1__py3-none-any.whl → 0.7.0__py3-none-any.whl

Potentially problematic release.

kiln-ai 0.6.1py3-none-any.whl → 0.7.0py3-none-any.whl