PyPI - kiln-ai - Versions diffs - 0.8.1__py3-none-any.whl → 0.12.0__py3-none-any.whl - Mend

kiln-ai 0.8.1py3-none-any.whl → 0.12.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of kiln-ai might be problematic. Click here for more details.

Files changed (88) hide show

kiln_ai/adapters/__init__.py +7 -7
kiln_ai/adapters/adapter_registry.py +81 -10
kiln_ai/adapters/data_gen/data_gen_task.py +21 -3
kiln_ai/adapters/data_gen/test_data_gen_task.py +23 -3
kiln_ai/adapters/eval/base_eval.py +164 -0
kiln_ai/adapters/eval/eval_runner.py +267 -0
kiln_ai/adapters/eval/g_eval.py +367 -0
kiln_ai/adapters/eval/registry.py +16 -0
kiln_ai/adapters/eval/test_base_eval.py +324 -0
kiln_ai/adapters/eval/test_eval_runner.py +640 -0
kiln_ai/adapters/eval/test_g_eval.py +497 -0
kiln_ai/adapters/eval/test_g_eval_data.py +4 -0
kiln_ai/adapters/fine_tune/base_finetune.py +5 -1
kiln_ai/adapters/fine_tune/dataset_formatter.py +310 -65
kiln_ai/adapters/fine_tune/fireworks_finetune.py +47 -32
kiln_ai/adapters/fine_tune/openai_finetune.py +12 -11
kiln_ai/adapters/fine_tune/test_base_finetune.py +19 -0
kiln_ai/adapters/fine_tune/test_dataset_formatter.py +472 -129
kiln_ai/adapters/fine_tune/test_fireworks_tinetune.py +114 -22
kiln_ai/adapters/fine_tune/test_openai_finetune.py +125 -14
kiln_ai/adapters/ml_model_list.py +434 -93
kiln_ai/adapters/model_adapters/__init__.py +18 -0
kiln_ai/adapters/model_adapters/base_adapter.py +250 -0
kiln_ai/adapters/model_adapters/langchain_adapters.py +309 -0
kiln_ai/adapters/model_adapters/openai_compatible_config.py +10 -0
kiln_ai/adapters/model_adapters/openai_model_adapter.py +289 -0
kiln_ai/adapters/model_adapters/test_base_adapter.py +199 -0
kiln_ai/adapters/{test_langchain_adapter.py → model_adapters/test_langchain_adapter.py} +105 -97
kiln_ai/adapters/model_adapters/test_openai_model_adapter.py +216 -0
kiln_ai/adapters/{test_saving_adapter_results.py → model_adapters/test_saving_adapter_results.py} +80 -30
kiln_ai/adapters/{test_structured_output.py → model_adapters/test_structured_output.py} +125 -46
kiln_ai/adapters/ollama_tools.py +0 -1
kiln_ai/adapters/parsers/__init__.py +10 -0
kiln_ai/adapters/parsers/base_parser.py +12 -0
kiln_ai/adapters/parsers/json_parser.py +37 -0
kiln_ai/adapters/parsers/parser_registry.py +19 -0
kiln_ai/adapters/parsers/r1_parser.py +69 -0
kiln_ai/adapters/parsers/test_json_parser.py +81 -0
kiln_ai/adapters/parsers/test_parser_registry.py +32 -0
kiln_ai/adapters/parsers/test_r1_parser.py +144 -0
kiln_ai/adapters/prompt_builders.py +193 -49
kiln_ai/adapters/provider_tools.py +91 -36
kiln_ai/adapters/repair/repair_task.py +18 -19
kiln_ai/adapters/repair/test_repair_task.py +7 -7
kiln_ai/adapters/run_output.py +11 -0
kiln_ai/adapters/test_adapter_registry.py +177 -0
kiln_ai/adapters/test_generate_docs.py +69 -0
kiln_ai/adapters/test_ollama_tools.py +0 -1
kiln_ai/adapters/test_prompt_adaptors.py +25 -18
kiln_ai/adapters/test_prompt_builders.py +265 -44
kiln_ai/adapters/test_provider_tools.py +268 -46
kiln_ai/datamodel/__init__.py +51 -772
kiln_ai/datamodel/basemodel.py +31 -11
kiln_ai/datamodel/datamodel_enums.py +58 -0
kiln_ai/datamodel/dataset_filters.py +114 -0
kiln_ai/datamodel/dataset_split.py +170 -0
kiln_ai/datamodel/eval.py +298 -0
kiln_ai/datamodel/finetune.py +105 -0
kiln_ai/datamodel/json_schema.py +14 -3
kiln_ai/datamodel/model_cache.py +8 -3
kiln_ai/datamodel/project.py +23 -0
kiln_ai/datamodel/prompt.py +37 -0
kiln_ai/datamodel/prompt_id.py +83 -0
kiln_ai/datamodel/strict_mode.py +24 -0
kiln_ai/datamodel/task.py +181 -0
kiln_ai/datamodel/task_output.py +321 -0
kiln_ai/datamodel/task_run.py +164 -0
kiln_ai/datamodel/test_basemodel.py +80 -2
kiln_ai/datamodel/test_dataset_filters.py +71 -0
kiln_ai/datamodel/test_dataset_split.py +127 -6
kiln_ai/datamodel/test_datasource.py +3 -2
kiln_ai/datamodel/test_eval_model.py +635 -0
kiln_ai/datamodel/test_example_models.py +34 -17
kiln_ai/datamodel/test_json_schema.py +23 -0
kiln_ai/datamodel/test_model_cache.py +24 -0
kiln_ai/datamodel/test_model_perf.py +125 -0
kiln_ai/datamodel/test_models.py +131 -2
kiln_ai/datamodel/test_prompt_id.py +129 -0
kiln_ai/datamodel/test_task.py +159 -0
kiln_ai/utils/config.py +6 -1
kiln_ai/utils/exhaustive_error.py +6 -0
{kiln_ai-0.8.1.dist-info → kiln_ai-0.12.0.dist-info}/METADATA +45 -7
kiln_ai-0.12.0.dist-info/RECORD +100 -0
kiln_ai/adapters/base_adapter.py +0 -191
kiln_ai/adapters/langchain_adapters.py +0 -256
kiln_ai-0.8.1.dist-info/RECORD +0 -58
{kiln_ai-0.8.1.dist-info → kiln_ai-0.12.0.dist-info}/WHEEL +0 -0
{kiln_ai-0.8.1.dist-info → kiln_ai-0.12.0.dist-info}/licenses/LICENSE.txt +0 -0

kiln_ai/adapters/ml_model_list.py CHANGED Viewed

@@ -3,6 +3,8 @@ from typing import Dict, List
 from pydantic import BaseModel
+from kiln_ai.datamodel import StructuredOutputMode
 """
 Provides model configuration and management for various LLM providers and models.
 This module handles the integration with different AI model providers and their respective models,
@@ -40,6 +42,9 @@ class ModelFamily(str, Enum):
     claude = "claude"
     mixtral = "mixtral"
     qwen = "qwen"
+    deepseek = "deepseek"
+    dolphin = "dolphin"
+    grok = "grok"
 # Where models have instruct and raw versions, instruct is default and raw is specified
@@ -60,6 +65,7 @@ class ModelName(str, Enum):
     gpt_4o_mini = "gpt_4o_mini"
     gpt_4o = "gpt_4o"
     phi_3_5 = "phi_3_5"
+    phi_4 = "phi_4"
     mistral_large = "mistral_large"
     mistral_nemo = "mistral_nemo"
     gemma_2_2b = "gemma_2_2b"
@@ -67,13 +73,35 @@ class ModelName(str, Enum):
     gemma_2_27b = "gemma_2_27b"
     claude_3_5_haiku = "claude_3_5_haiku"
     claude_3_5_sonnet = "claude_3_5_sonnet"
+    claude_3_7_sonnet = "claude_3_7_sonnet"
+    claude_3_7_sonnet_thinking = "claude_3_7_sonnet_thinking"
     gemini_1_5_flash = "gemini_1_5_flash"
     gemini_1_5_flash_8b = "gemini_1_5_flash_8b"
     gemini_1_5_pro = "gemini_1_5_pro"
+    gemini_2_0_flash = "gemini_2_0_flash"
     nemotron_70b = "nemotron_70b"
     mixtral_8x7b = "mixtral_8x7b"
     qwen_2p5_7b = "qwen_2p5_7b"
     qwen_2p5_72b = "qwen_2p5_72b"
+    deepseek_3 = "deepseek_3"
+    deepseek_r1 = "deepseek_r1"
+    mistral_small_3 = "mistral_small_3"
+    deepseek_r1_distill_qwen_32b = "deepseek_r1_distill_qwen_32b"
+    deepseek_r1_distill_llama_70b = "deepseek_r1_distill_llama_70b"
+    deepseek_r1_distill_qwen_14b = "deepseek_r1_distill_qwen_14b"
+    deepseek_r1_distill_qwen_1p5b = "deepseek_r1_distill_qwen_1p5b"
+    deepseek_r1_distill_qwen_7b = "deepseek_r1_distill_qwen_7b"
+    deepseek_r1_distill_llama_8b = "deepseek_r1_distill_llama_8b"
+    dolphin_2_9_8x22b = "dolphin_2_9_8x22b"
+    grok_2 = "grok_2"
+class ModelParserID(str, Enum):
+    """
+    Enumeration of supported model parsers.
+    """
+    r1_thinking = "r1_thinking"
 class KilnModelProvider(BaseModel):
@@ -87,7 +115,9 @@ class KilnModelProvider(BaseModel):
         untested_model: Whether the model is untested (typically user added). The supports_ fields are not applicable.
         provider_finetune_id: The finetune ID for the provider, if applicable
         provider_options: Additional provider-specific configuration options
-        adapter_options: Additional options specific to the adapter. Top level key should be adapter ID.
+        structured_output_mode: The mode we should use to call the model for structured output, if it was trained with structured output.
+        parser: A parser to use for the model, if applicable
+        reasoning_capable: Whether the model is designed to output thinking in a structured format (eg <think></think>). If so we don't use COT across 2 calls, and ask for thinking and final response in the same call.
     """
     name: ModelProviderName
@@ -96,7 +126,18 @@ class KilnModelProvider(BaseModel):
     untested_model: bool = False
     provider_finetune_id: str | None = None
     provider_options: Dict = {}
-    adapter_options: Dict = {}
+    structured_output_mode: StructuredOutputMode = StructuredOutputMode.default
+    parser: ModelParserID | None = None
+    reasoning_capable: bool = False
+    supports_logprobs: bool = False
+    # TODO P1: Need a more generalized way to handle custom provider parameters.
+    # Making them quite declarative here for now, isolating provider specific logic
+    # to this file. Later I should be able to override anything in this file via config.
+    r1_openrouter_options: bool = False
+    require_openrouter_reasoning: bool = False
+    logprobs_openrouter_options: bool = False
+    openrouter_skip_required_parameters: bool = False
 class KilnModel(BaseModel):
@@ -115,7 +156,6 @@ class KilnModel(BaseModel):
     name: str
     friendly_name: str
     providers: List[KilnModelProvider]
-    supports_structured_output: bool = True
 built_in_models: List[KilnModel] = [
@@ -129,10 +169,15 @@ built_in_models: List[KilnModel] = [
                 name=ModelProviderName.openai,
                 provider_options={"model": "gpt-4o-mini"},
                 provider_finetune_id="gpt-4o-mini-2024-07-18",
+                structured_output_mode=StructuredOutputMode.json_schema,
+                supports_logprobs=True,
             ),
             KilnModelProvider(
                 name=ModelProviderName.openrouter,
                 provider_options={"model": "openai/gpt-4o-mini"},
+                structured_output_mode=StructuredOutputMode.json_schema,
+                supports_logprobs=True,
+                logprobs_openrouter_options=True,
             ),
         ],
     ),
@@ -146,10 +191,15 @@ built_in_models: List[KilnModel] = [
                 name=ModelProviderName.openai,
                 provider_options={"model": "gpt-4o"},
                 provider_finetune_id="gpt-4o-2024-08-06",
+                structured_output_mode=StructuredOutputMode.json_schema,
+                supports_logprobs=True,
             ),
             KilnModelProvider(
                 name=ModelProviderName.openrouter,
-                provider_options={"model": "openai/gpt-4o-2024-08-06"},
+                provider_options={"model": "openai/gpt-4o"},
+                structured_output_mode=StructuredOutputMode.json_schema,
+                supports_logprobs=True,
+                logprobs_openrouter_options=True,
             ),
         ],
     ),
@@ -161,6 +211,7 @@ built_in_models: List[KilnModel] = [
         providers=[
             KilnModelProvider(
                 name=ModelProviderName.openrouter,
+                structured_output_mode=StructuredOutputMode.json_instruction_and_object,
                 provider_options={"model": "anthropic/claude-3-5-haiku"},
             ),
         ],
@@ -173,10 +224,40 @@ built_in_models: List[KilnModel] = [
         providers=[
             KilnModelProvider(
                 name=ModelProviderName.openrouter,
+                structured_output_mode=StructuredOutputMode.json_instruction_and_object,
                 provider_options={"model": "anthropic/claude-3.5-sonnet"},
             ),
         ],
     ),
+    # Claude 3.7 Sonnet
+    KilnModel(
+        family=ModelFamily.claude,
+        name=ModelName.claude_3_7_sonnet,
+        friendly_name="Claude 3.7 Sonnet",
+        providers=[
+            KilnModelProvider(
+                name=ModelProviderName.openrouter,
+                structured_output_mode=StructuredOutputMode.function_calling,
+                provider_options={"model": "anthropic/claude-3.7-sonnet"},
+            ),
+        ],
+    ),
+    # Claude 3.7 Sonnet Thinking
+    KilnModel(
+        family=ModelFamily.claude,
+        name=ModelName.claude_3_7_sonnet_thinking,
+        friendly_name="Claude 3.7 Sonnet Thinking",
+        providers=[
+            KilnModelProvider(
+                name=ModelProviderName.openrouter,
+                provider_options={"model": "anthropic/claude-3.7-sonnet:thinking"},
+                reasoning_capable=True,
+                # For reasoning models, we need to use json_instructions with OpenRouter
+                structured_output_mode=StructuredOutputMode.json_instructions,
+                require_openrouter_reasoning=True,
+            ),
+        ],
+    ),
     # Gemini 1.5 Pro
     KilnModel(
         family=ModelFamily.gemini,
@@ -185,9 +266,8 @@ built_in_models: List[KilnModel] = [
         providers=[
             KilnModelProvider(
                 name=ModelProviderName.openrouter,
-                supports_structured_output=False,  # it should, but doesn't work on openrouter
-                supports_data_gen=False,  # doesn't work on openrouter
                 provider_options={"model": "google/gemini-pro-1.5"},
+                structured_output_mode=StructuredOutputMode.json_schema,
             ),
         ],
     ),
@@ -199,8 +279,8 @@ built_in_models: List[KilnModel] = [
         providers=[
             KilnModelProvider(
                 name=ModelProviderName.openrouter,
-                supports_data_gen=False,
                 provider_options={"model": "google/gemini-flash-1.5"},
+                structured_output_mode=StructuredOutputMode.json_schema,
             ),
         ],
     ),
@@ -212,9 +292,21 @@ built_in_models: List[KilnModel] = [
         providers=[
             KilnModelProvider(
                 name=ModelProviderName.openrouter,
-                supports_structured_output=False,
-                supports_data_gen=False,
                 provider_options={"model": "google/gemini-flash-1.5-8b"},
+                structured_output_mode=StructuredOutputMode.json_mode,
+            ),
+        ],
+    ),
+    # Gemini 2.0 Flash
+    KilnModel(
+        family=ModelFamily.gemini,
+        name=ModelName.gemini_2_0_flash,
+        friendly_name="Gemini 2.0 Flash",
+        providers=[
+            KilnModelProvider(
+                name=ModelProviderName.openrouter,
+                structured_output_mode=StructuredOutputMode.json_schema,
+                provider_options={"model": "google/gemini-2.0-flash-001"},
             ),
         ],
     ),
@@ -244,7 +336,7 @@ built_in_models: List[KilnModel] = [
             ),
             KilnModelProvider(
                 name=ModelProviderName.amazon_bedrock,
-                supports_structured_output=False,
+                structured_output_mode=StructuredOutputMode.json_schema,
                 supports_data_gen=False,
                 provider_options={
                     "model": "meta.llama3-1-8b-instruct-v1:0",
@@ -253,7 +345,7 @@ built_in_models: List[KilnModel] = [
             ),
             KilnModelProvider(
                 name=ModelProviderName.ollama,
-                supports_data_gen=False,
+                structured_output_mode=StructuredOutputMode.json_schema,
                 provider_options={
                     "model": "llama3.1:8b",
                     "model_aliases": ["llama3.1"],  # 8b is default
@@ -261,14 +353,14 @@ built_in_models: List[KilnModel] = [
             ),
             KilnModelProvider(
                 name=ModelProviderName.openrouter,
-                supports_structured_output=False,
                 supports_data_gen=False,
+                structured_output_mode=StructuredOutputMode.function_calling,
                 provider_options={"model": "meta-llama/llama-3.1-8b-instruct"},
             ),
             KilnModelProvider(
                 name=ModelProviderName.fireworks_ai,
-                supports_structured_output=False,
-                supports_data_gen=False,
+                # JSON mode not ideal (no schema), but tool calling doesn't work on 8b
+                structured_output_mode=StructuredOutputMode.json_mode,
                 provider_finetune_id="accounts/fireworks/models/llama-v3p1-8b-instruct",
                 provider_options={
                     "model": "accounts/fireworks/models/llama-v3p1-8b-instruct"
@@ -282,14 +374,9 @@ built_in_models: List[KilnModel] = [
         name=ModelName.llama_3_1_70b,
         friendly_name="Llama 3.1 70B",
         providers=[
-            KilnModelProvider(
-                name=ModelProviderName.groq,
-                provider_options={"model": "llama-3.1-70b-versatile"},
-            ),
             KilnModelProvider(
                 name=ModelProviderName.amazon_bedrock,
-                # AWS 70b not working as well as the others.
-                supports_structured_output=False,
+                structured_output_mode=StructuredOutputMode.json_schema,
                 supports_data_gen=False,
                 provider_options={
                     "model": "meta.llama3-1-70b-instruct-v1:0",
@@ -298,14 +385,22 @@ built_in_models: List[KilnModel] = [
             ),
             KilnModelProvider(
                 name=ModelProviderName.openrouter,
+                supports_data_gen=False,
+                # Need to not pass "strict=True" to the function call to get this to work with logprobs for some reason. Openrouter issue.
+                structured_output_mode=StructuredOutputMode.function_calling_weak,
                 provider_options={"model": "meta-llama/llama-3.1-70b-instruct"},
+                supports_logprobs=True,
+                logprobs_openrouter_options=True,
             ),
             KilnModelProvider(
                 name=ModelProviderName.ollama,
+                structured_output_mode=StructuredOutputMode.json_schema,
                 provider_options={"model": "llama3.1:70b"},
             ),
             KilnModelProvider(
                 name=ModelProviderName.fireworks_ai,
+                # Tool calling forces schema -- fireworks doesn't support json_schema, just json_mode
+                structured_output_mode=StructuredOutputMode.function_calling,
                 provider_finetune_id="accounts/fireworks/models/llama-v3p1-70b-instruct",
                 provider_options={
                     "model": "accounts/fireworks/models/llama-v3p1-70b-instruct"
@@ -321,6 +416,7 @@ built_in_models: List[KilnModel] = [
         providers=[
             KilnModelProvider(
                 name=ModelProviderName.amazon_bedrock,
+                structured_output_mode=StructuredOutputMode.json_schema,
                 supports_data_gen=False,
                 provider_options={
                     "model": "meta.llama3-1-405b-instruct-v1:0",
@@ -329,15 +425,18 @@ built_in_models: List[KilnModel] = [
             ),
             KilnModelProvider(
                 name=ModelProviderName.ollama,
+                structured_output_mode=StructuredOutputMode.json_schema,
                 provider_options={"model": "llama3.1:405b"},
             ),
             KilnModelProvider(
                 name=ModelProviderName.openrouter,
+                structured_output_mode=StructuredOutputMode.function_calling,
                 provider_options={"model": "meta-llama/llama-3.1-405b-instruct"},
             ),
             KilnModelProvider(
                 name=ModelProviderName.fireworks_ai,
                 # No finetune support. https://docs.fireworks.ai/fine-tuning/fine-tuning-models
+                structured_output_mode=StructuredOutputMode.function_calling,
                 provider_options={
                     "model": "accounts/fireworks/models/llama-v3p1-405b-instruct"
                 },
@@ -353,6 +452,7 @@ built_in_models: List[KilnModel] = [
             KilnModelProvider(
                 name=ModelProviderName.openrouter,
                 provider_options={"model": "mistralai/mistral-nemo"},
+                structured_output_mode=StructuredOutputMode.json_instruction_and_object,
             ),
         ],
     ),
@@ -364,6 +464,7 @@ built_in_models: List[KilnModel] = [
         providers=[
             KilnModelProvider(
                 name=ModelProviderName.amazon_bedrock,
+                structured_output_mode=StructuredOutputMode.json_schema,
                 provider_options={
                     "model": "mistral.mistral-large-2407-v1:0",
                     "region_name": "us-west-2",  # only in west-2
@@ -371,10 +472,12 @@ built_in_models: List[KilnModel] = [
             ),
             KilnModelProvider(
                 name=ModelProviderName.openrouter,
+                structured_output_mode=StructuredOutputMode.json_schema,
                 provider_options={"model": "mistralai/mistral-large"},
             ),
             KilnModelProvider(
                 name=ModelProviderName.ollama,
+                structured_output_mode=StructuredOutputMode.json_schema,
                 provider_options={"model": "mistral-large"},
             ),
         ],
@@ -385,10 +488,16 @@ built_in_models: List[KilnModel] = [
         name=ModelName.llama_3_2_1b,
         friendly_name="Llama 3.2 1B",
         providers=[
+            KilnModelProvider(
+                name=ModelProviderName.groq,
+                provider_options={"model": "llama-3.2-1b-preview"},
+                supports_data_gen=False,
+            ),
             KilnModelProvider(
                 name=ModelProviderName.openrouter,
                 supports_structured_output=False,
                 supports_data_gen=False,
+                structured_output_mode=StructuredOutputMode.json_instruction_and_object,
                 provider_options={"model": "meta-llama/llama-3.2-1b-instruct"},
             ),
             KilnModelProvider(
@@ -397,15 +506,6 @@ built_in_models: List[KilnModel] = [
                 supports_data_gen=False,
                 provider_options={"model": "llama3.2:1b"},
             ),
-            KilnModelProvider(
-                name=ModelProviderName.fireworks_ai,
-                provider_finetune_id="accounts/fireworks/models/llama-v3p2-1b-instruct",
-                supports_structured_output=False,
-                supports_data_gen=False,
-                provider_options={
-                    "model": "accounts/fireworks/models/llama-v3p2-1b-instruct"
-                },
-            ),
         ],
     ),
     # Llama 3.2 3B
@@ -414,23 +514,27 @@ built_in_models: List[KilnModel] = [
         name=ModelName.llama_3_2_3b,
         friendly_name="Llama 3.2 3B",
         providers=[
+            KilnModelProvider(
+                name=ModelProviderName.groq,
+                provider_options={"model": "llama-3.2-3b-preview"},
+                supports_data_gen=False,
+            ),
             KilnModelProvider(
                 name=ModelProviderName.openrouter,
                 supports_structured_output=False,
                 supports_data_gen=False,
+                structured_output_mode=StructuredOutputMode.json_schema,
                 provider_options={"model": "meta-llama/llama-3.2-3b-instruct"},
             ),
             KilnModelProvider(
                 name=ModelProviderName.ollama,
-                supports_structured_output=False,
                 supports_data_gen=False,
                 provider_options={"model": "llama3.2"},
             ),
             KilnModelProvider(
                 name=ModelProviderName.fireworks_ai,
                 provider_finetune_id="accounts/fireworks/models/llama-v3p2-3b-instruct",
-                supports_structured_output=False,
-                supports_data_gen=False,
+                structured_output_mode=StructuredOutputMode.json_mode,
                 provider_options={
                     "model": "accounts/fireworks/models/llama-v3p2-3b-instruct"
                 },
@@ -443,19 +547,18 @@ built_in_models: List[KilnModel] = [
         name=ModelName.llama_3_2_11b,
         friendly_name="Llama 3.2 11B",
         providers=[
+            KilnModelProvider(
+                name=ModelProviderName.groq,
+                provider_options={"model": "llama-3.2-11b-vision-preview"},
+            ),
             KilnModelProvider(
                 name=ModelProviderName.openrouter,
+                structured_output_mode=StructuredOutputMode.json_schema,
                 provider_options={"model": "meta-llama/llama-3.2-11b-vision-instruct"},
-                adapter_options={
-                    "langchain": {
-                        "with_structured_output_options": {"method": "json_mode"}
-                    }
-                },
             ),
             KilnModelProvider(
                 name=ModelProviderName.ollama,
-                supports_structured_output=False,
-                supports_data_gen=False,
+                structured_output_mode=StructuredOutputMode.json_schema,
                 provider_options={"model": "llama3.2-vision"},
             ),
             KilnModelProvider(
@@ -464,11 +567,7 @@ built_in_models: List[KilnModel] = [
                 provider_options={
                     "model": "accounts/fireworks/models/llama-v3p2-11b-vision-instruct"
                 },
-                adapter_options={
-                    "langchain": {
-                        "with_structured_output_options": {"method": "json_mode"}
-                    }
-                },
+                structured_output_mode=StructuredOutputMode.json_mode,
             ),
         ],
     ),
@@ -478,17 +577,18 @@ built_in_models: List[KilnModel] = [
         name=ModelName.llama_3_2_90b,
         friendly_name="Llama 3.2 90B",
         providers=[
+            KilnModelProvider(
+                name=ModelProviderName.groq,
+                provider_options={"model": "llama-3.2-90b-vision-preview"},
+            ),
             KilnModelProvider(
                 name=ModelProviderName.openrouter,
+                structured_output_mode=StructuredOutputMode.json_schema,
                 provider_options={"model": "meta-llama/llama-3.2-90b-vision-instruct"},
-                adapter_options={
-                    "langchain": {
-                        "with_structured_output_options": {"method": "json_mode"}
-                    }
-                },
             ),
             KilnModelProvider(
                 name=ModelProviderName.ollama,
+                structured_output_mode=StructuredOutputMode.json_schema,
                 provider_options={"model": "llama3.2-vision:90b"},
             ),
             KilnModelProvider(
@@ -497,11 +597,7 @@ built_in_models: List[KilnModel] = [
                 provider_options={
                     "model": "accounts/fireworks/models/llama-v3p2-90b-vision-instruct"
                 },
-                adapter_options={
-                    "langchain": {
-                        "with_structured_output_options": {"method": "json_mode"}
-                    }
-                },
+                structured_output_mode=StructuredOutputMode.json_mode,
             ),
         ],
     ),
@@ -514,14 +610,10 @@ built_in_models: List[KilnModel] = [
             KilnModelProvider(
                 name=ModelProviderName.openrouter,
                 provider_options={"model": "meta-llama/llama-3.3-70b-instruct"},
-                # Openrouter not supporing tools yet. Once they do probably can remove. JSON mode sometimes works, but not consistently.
+                structured_output_mode=StructuredOutputMode.json_schema,
+                # Openrouter not working with json_schema or tools. JSON_schema sometimes works so force that, but not consistently so still not recommended.
                 supports_structured_output=False,
                 supports_data_gen=False,
-                adapter_options={
-                    "langchain": {
-                        "with_structured_output_options": {"method": "json_mode"}
-                    }
-                },
             ),
             KilnModelProvider(
                 name=ModelProviderName.groq,
@@ -531,14 +623,15 @@ built_in_models: List[KilnModel] = [
             ),
             KilnModelProvider(
                 name=ModelProviderName.ollama,
+                structured_output_mode=StructuredOutputMode.json_schema,
                 provider_options={"model": "llama3.3"},
             ),
             KilnModelProvider(
                 name=ModelProviderName.fireworks_ai,
                 # Finetuning not live yet
                 # provider_finetune_id="accounts/fireworks/models/llama-v3p3-70b-instruct",
-                supports_structured_output=True,
-                supports_data_gen=True,
+                # Tool calling forces schema -- fireworks doesn't support json_schema, just json_mode
+                structured_output_mode=StructuredOutputMode.function_calling,
                 provider_options={
                     "model": "accounts/fireworks/models/llama-v3p3-70b-instruct"
                 },
@@ -550,10 +643,10 @@ built_in_models: List[KilnModel] = [
         family=ModelFamily.phi,
         name=ModelName.phi_3_5,
         friendly_name="Phi 3.5",
-        supports_structured_output=False,
         providers=[
             KilnModelProvider(
                 name=ModelProviderName.ollama,
+                structured_output_mode=StructuredOutputMode.json_schema,
                 supports_structured_output=False,
                 supports_data_gen=False,
                 provider_options={"model": "phi3.5"},
@@ -563,28 +656,47 @@ built_in_models: List[KilnModel] = [
                 supports_structured_output=False,
                 supports_data_gen=False,
                 provider_options={"model": "microsoft/phi-3.5-mini-128k-instruct"},
+                structured_output_mode=StructuredOutputMode.json_schema,
             ),
             KilnModelProvider(
                 name=ModelProviderName.fireworks_ai,
-                supports_structured_output=False,
-                supports_data_gen=False,
                 # No finetune support. https://docs.fireworks.ai/fine-tuning/fine-tuning-models
+                structured_output_mode=StructuredOutputMode.json_mode,
+                supports_data_gen=False,
                 provider_options={
                     "model": "accounts/fireworks/models/phi-3-vision-128k-instruct"
                 },
             ),
         ],
     ),
+    # Phi 4
+    KilnModel(
+        family=ModelFamily.phi,
+        name=ModelName.phi_4,
+        friendly_name="Phi 4",
+        providers=[
+            KilnModelProvider(
+                name=ModelProviderName.ollama,
+                structured_output_mode=StructuredOutputMode.json_schema,
+                provider_options={"model": "phi4"},
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.openrouter,
+                # JSON mode not consistent enough to enable in UI
+                structured_output_mode=StructuredOutputMode.json_instruction_and_object,
+                supports_data_gen=False,
+                provider_options={"model": "microsoft/phi-4"},
+            ),
+        ],
+    ),
     # Gemma 2 2.6b
     KilnModel(
         family=ModelFamily.gemma,
         name=ModelName.gemma_2_2b,
         friendly_name="Gemma 2 2B",
-        supports_structured_output=False,
         providers=[
             KilnModelProvider(
                 name=ModelProviderName.ollama,
-                supports_structured_output=False,
                 supports_data_gen=False,
                 provider_options={
                     "model": "gemma2:2b",
@@ -597,7 +709,6 @@ built_in_models: List[KilnModel] = [
         family=ModelFamily.gemma,
         name=ModelName.gemma_2_9b,
         friendly_name="Gemma 2 9B",
-        supports_structured_output=False,
         providers=[
             KilnModelProvider(
                 name=ModelProviderName.ollama,
@@ -608,6 +719,7 @@ built_in_models: List[KilnModel] = [
             ),
             KilnModelProvider(
                 name=ModelProviderName.openrouter,
+                structured_output_mode=StructuredOutputMode.json_instruction_and_object,
                 supports_data_gen=False,
                 provider_options={"model": "google/gemma-2-9b-it"},
             ),
@@ -619,7 +731,6 @@ built_in_models: List[KilnModel] = [
         family=ModelFamily.gemma,
         name=ModelName.gemma_2_27b,
         friendly_name="Gemma 2 27B",
-        supports_structured_output=False,
         providers=[
             KilnModelProvider(
                 name=ModelProviderName.ollama,
@@ -630,6 +741,7 @@ built_in_models: List[KilnModel] = [
             ),
             KilnModelProvider(
                 name=ModelProviderName.openrouter,
+                structured_output_mode=StructuredOutputMode.json_instruction_and_object,
                 supports_data_gen=False,
                 provider_options={"model": "google/gemma-2-27b-it"},
             ),
@@ -644,16 +756,11 @@ built_in_models: List[KilnModel] = [
             KilnModelProvider(
                 name=ModelProviderName.openrouter,
                 provider_options={"model": "mistralai/mixtral-8x7b-instruct"},
-                adapter_options={
-                    "langchain": {
-                        "with_structured_output_options": {"method": "json_mode"}
-                    }
-                },
+                supports_data_gen=False,
+                structured_output_mode=StructuredOutputMode.json_instruction_and_object,
             ),
             KilnModelProvider(
                 name=ModelProviderName.ollama,
-                supports_structured_output=False,
-                supports_data_gen=False,
                 provider_options={"model": "mixtral"},
             ),
         ],
@@ -667,14 +774,7 @@ built_in_models: List[KilnModel] = [
             KilnModelProvider(
                 name=ModelProviderName.openrouter,
                 provider_options={"model": "qwen/qwen-2.5-7b-instruct"},
-                # Tool calls not supported. JSON doesn't error, but fails.
-                supports_structured_output=False,
-                supports_data_gen=False,
-                adapter_options={
-                    "langchain": {
-                        "with_structured_output_options": {"method": "json_mode"}
-                    }
-                },
+                structured_output_mode=StructuredOutputMode.json_instruction_and_object,
             ),
             KilnModelProvider(
                 name=ModelProviderName.ollama,
@@ -694,11 +794,7 @@ built_in_models: List[KilnModel] = [
                 # Not consistent with structure data. Works sometimes but not often
                 supports_structured_output=False,
                 supports_data_gen=False,
-                adapter_options={
-                    "langchain": {
-                        "with_structured_output_options": {"method": "json_mode"}
-                    }
-                },
+                structured_output_mode=StructuredOutputMode.json_instruction_and_object,
             ),
             KilnModelProvider(
                 name=ModelProviderName.ollama,
@@ -711,11 +807,256 @@ built_in_models: List[KilnModel] = [
                 },
                 # Fireworks will start tuning, but it never finishes.
                 # provider_finetune_id="accounts/fireworks/models/qwen2p5-72b-instruct",
-                adapter_options={
-                    "langchain": {
-                        "with_structured_output_options": {"method": "json_mode"}
-                    }
+                # Tool calling forces schema -- fireworks doesn't support json_schema, just json_mode
+                structured_output_mode=StructuredOutputMode.function_calling,
+            ),
+        ],
+    ),
+    # Mistral Small 3
+    KilnModel(
+        family=ModelFamily.mistral,
+        name=ModelName.mistral_small_3,
+        friendly_name="Mistral Small 3",
+        providers=[
+            KilnModelProvider(
+                name=ModelProviderName.openrouter,
+                structured_output_mode=StructuredOutputMode.json_instruction_and_object,
+                provider_options={"model": "mistralai/mistral-small-24b-instruct-2501"},
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.ollama,
+                provider_options={"model": "mistral-small:24b"},
+            ),
+        ],
+    ),
+    # DeepSeek 3
+    KilnModel(
+        family=ModelFamily.deepseek,
+        name=ModelName.deepseek_3,
+        friendly_name="DeepSeek V3",
+        providers=[
+            KilnModelProvider(
+                name=ModelProviderName.openrouter,
+                provider_options={"model": "deepseek/deepseek-chat"},
+                structured_output_mode=StructuredOutputMode.function_calling,
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.fireworks_ai,
+                provider_options={"model": "accounts/fireworks/models/deepseek-v3"},
+                structured_output_mode=StructuredOutputMode.json_mode,
+                supports_structured_output=True,
+                supports_data_gen=False,
+            ),
+        ],
+    ),
+    # DeepSeek R1
+    KilnModel(
+        family=ModelFamily.deepseek,
+        name=ModelName.deepseek_r1,
+        friendly_name="DeepSeek R1",
+        providers=[
+            KilnModelProvider(
+                name=ModelProviderName.openrouter,
+                provider_options={"model": "deepseek/deepseek-r1"},
+                # No custom parser -- openrouter implemented it themselves
+                structured_output_mode=StructuredOutputMode.json_instructions,
+                reasoning_capable=True,
+                r1_openrouter_options=True,
+                require_openrouter_reasoning=True,
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.fireworks_ai,
+                provider_options={"model": "accounts/fireworks/models/deepseek-r1"},
+                parser=ModelParserID.r1_thinking,
+                structured_output_mode=StructuredOutputMode.json_instructions,
+                reasoning_capable=True,
+            ),
+            KilnModelProvider(
+                # I want your RAM
+                name=ModelProviderName.ollama,
+                provider_options={"model": "deepseek-r1:671b"},
+                parser=ModelParserID.r1_thinking,
+                structured_output_mode=StructuredOutputMode.json_instructions,
+                reasoning_capable=True,
+            ),
+        ],
+    ),
+    # DeepSeek R1 Distill Qwen 32B
+    KilnModel(
+        family=ModelFamily.deepseek,
+        name=ModelName.deepseek_r1_distill_qwen_32b,
+        friendly_name="DeepSeek R1 Distill Qwen 32B",
+        providers=[
+            KilnModelProvider(
+                name=ModelProviderName.openrouter,
+                reasoning_capable=True,
+                structured_output_mode=StructuredOutputMode.json_instructions,
+                provider_options={"model": "deepseek/deepseek-r1-distill-qwen-32b"},
+                r1_openrouter_options=True,
+                require_openrouter_reasoning=True,
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.ollama,
+                parser=ModelParserID.r1_thinking,
+                reasoning_capable=True,
+                structured_output_mode=StructuredOutputMode.json_instructions,
+                provider_options={"model": "deepseek-r1:32b"},
+            ),
+        ],
+    ),
+    # DeepSeek R1 Distill Llama 70B
+    KilnModel(
+        family=ModelFamily.deepseek,
+        name=ModelName.deepseek_r1_distill_llama_70b,
+        friendly_name="DeepSeek R1 Distill Llama 70B",
+        providers=[
+            KilnModelProvider(
+                name=ModelProviderName.openrouter,
+                reasoning_capable=True,
+                structured_output_mode=StructuredOutputMode.json_instructions,
+                provider_options={"model": "deepseek/deepseek-r1-distill-llama-70b"},
+                r1_openrouter_options=True,
+                require_openrouter_reasoning=True,
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.ollama,
+                supports_data_gen=False,
+                parser=ModelParserID.r1_thinking,
+                reasoning_capable=True,
+                structured_output_mode=StructuredOutputMode.json_instructions,
+                provider_options={"model": "deepseek-r1:70b"},
+            ),
+        ],
+    ),
+    # DeepSeek R1 Distill Qwen 14B
+    KilnModel(
+        family=ModelFamily.deepseek,
+        name=ModelName.deepseek_r1_distill_qwen_14b,
+        friendly_name="DeepSeek R1 Distill Qwen 14B",
+        providers=[
+            KilnModelProvider(
+                name=ModelProviderName.openrouter,
+                supports_data_gen=False,
+                reasoning_capable=True,
+                structured_output_mode=StructuredOutputMode.json_instructions,
+                provider_options={"model": "deepseek/deepseek-r1-distill-qwen-14b"},
+                r1_openrouter_options=True,
+                require_openrouter_reasoning=True,
+                openrouter_skip_required_parameters=True,
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.ollama,
+                supports_data_gen=False,
+                parser=ModelParserID.r1_thinking,
+                reasoning_capable=True,
+                structured_output_mode=StructuredOutputMode.json_instructions,
+                provider_options={"model": "deepseek-r1:14b"},
+            ),
+        ],
+    ),
+    # DeepSeek R1 Distill Llama 8B
+    KilnModel(
+        family=ModelFamily.deepseek,
+        name=ModelName.deepseek_r1_distill_llama_8b,
+        friendly_name="DeepSeek R1 Distill Llama 8B",
+        providers=[
+            KilnModelProvider(
+                name=ModelProviderName.openrouter,
+                supports_data_gen=False,
+                reasoning_capable=True,
+                structured_output_mode=StructuredOutputMode.json_instructions,
+                provider_options={"model": "deepseek/deepseek-r1-distill-llama-8b"},
+                r1_openrouter_options=True,
+                require_openrouter_reasoning=True,
+                openrouter_skip_required_parameters=True,
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.ollama,
+                supports_data_gen=False,
+                parser=ModelParserID.r1_thinking,
+                reasoning_capable=True,
+                structured_output_mode=StructuredOutputMode.json_instructions,
+                provider_options={"model": "deepseek-r1:8b"},
+            ),
+        ],
+    ),
+    # DeepSeek R1 Distill Qwen 7B
+    KilnModel(
+        family=ModelFamily.deepseek,
+        name=ModelName.deepseek_r1_distill_qwen_7b,
+        friendly_name="DeepSeek R1 Distill Qwen 7B",
+        providers=[
+            KilnModelProvider(
+                name=ModelProviderName.ollama,
+                supports_data_gen=False,
+                parser=ModelParserID.r1_thinking,
+                reasoning_capable=True,
+                structured_output_mode=StructuredOutputMode.json_instructions,
+                provider_options={"model": "deepseek-r1:7b"},
+            ),
+        ],
+    ),
+    # DeepSeek R1 Distill Qwen 1.5B
+    KilnModel(
+        family=ModelFamily.deepseek,
+        name=ModelName.deepseek_r1_distill_qwen_1p5b,
+        friendly_name="DeepSeek R1 Distill Qwen 1.5B",
+        providers=[
+            KilnModelProvider(
+                name=ModelProviderName.openrouter,
+                supports_structured_output=False,
+                supports_data_gen=False,
+                reasoning_capable=True,
+                structured_output_mode=StructuredOutputMode.json_instructions,
+                provider_options={"model": "deepseek/deepseek-r1-distill-qwen-1.5b"},
+                r1_openrouter_options=True,
+                require_openrouter_reasoning=True,
+                openrouter_skip_required_parameters=True,
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.ollama,
+                supports_data_gen=False,
+                parser=ModelParserID.r1_thinking,
+                reasoning_capable=True,
+                structured_output_mode=StructuredOutputMode.json_instructions,
+                provider_options={"model": "deepseek-r1:1.5b"},
+            ),
+        ],
+    ),
+    # Dolphin 2.9 Mixtral 8x22B
+    KilnModel(
+        family=ModelFamily.dolphin,
+        name=ModelName.dolphin_2_9_8x22b,
+        friendly_name="Dolphin 2.9 8x22B",
+        providers=[
+            KilnModelProvider(
+                name=ModelProviderName.ollama,
+                structured_output_mode=StructuredOutputMode.json_schema,
+                supports_data_gen=True,
+                provider_options={"model": "dolphin-mixtral:8x22b"},
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.openrouter,
+                provider_options={
+                    "model": "cognitivecomputations/dolphin-mixtral-8x22b"
                 },
+                supports_data_gen=True,
+                structured_output_mode=StructuredOutputMode.json_instruction_and_object,
+            ),
+        ],
+    ),
+    # Grok 2
+    KilnModel(
+        family=ModelFamily.grok,
+        name=ModelName.grok_2,
+        friendly_name="Grok 2",
+        providers=[
+            KilnModelProvider(
+                name=ModelProviderName.openrouter,
+                provider_options={"model": "x-ai/grok-2-1212"},
+                supports_structured_output=True,
+                supports_data_gen=True,
+                structured_output_mode=StructuredOutputMode.json_schema,
             ),
         ],
     ),

kiln-ai 0.8.1__py3-none-any.whl → 0.12.0__py3-none-any.whl

Potentially problematic release.

kiln-ai 0.8.1py3-none-any.whl → 0.12.0py3-none-any.whl