PyPI - kiln-ai - Versions diffs - 0.14.0__py3-none-any.whl → 0.16.0__py3-none-any.whl - Mend

kiln-ai 0.14.0py3-none-any.whl → 0.16.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (58) hide show

kiln_ai/adapters/eval/base_eval.py +7 -2
kiln_ai/adapters/eval/eval_runner.py +5 -64
kiln_ai/adapters/eval/g_eval.py +3 -3
kiln_ai/adapters/fine_tune/base_finetune.py +6 -3
kiln_ai/adapters/fine_tune/dataset_formatter.py +128 -38
kiln_ai/adapters/fine_tune/finetune_registry.py +2 -0
kiln_ai/adapters/fine_tune/fireworks_finetune.py +2 -1
kiln_ai/adapters/fine_tune/test_base_finetune.py +7 -0
kiln_ai/adapters/fine_tune/test_dataset_formatter.py +267 -10
kiln_ai/adapters/fine_tune/test_fireworks_tinetune.py +1 -1
kiln_ai/adapters/fine_tune/test_vertex_finetune.py +586 -0
kiln_ai/adapters/fine_tune/vertex_finetune.py +217 -0
kiln_ai/adapters/ml_model_list.py +817 -62
kiln_ai/adapters/model_adapters/base_adapter.py +33 -10
kiln_ai/adapters/model_adapters/litellm_adapter.py +51 -12
kiln_ai/adapters/model_adapters/test_base_adapter.py +74 -2
kiln_ai/adapters/model_adapters/test_litellm_adapter.py +65 -1
kiln_ai/adapters/model_adapters/test_saving_adapter_results.py +3 -2
kiln_ai/adapters/model_adapters/test_structured_output.py +4 -6
kiln_ai/adapters/parsers/base_parser.py +0 -3
kiln_ai/adapters/parsers/parser_registry.py +5 -3
kiln_ai/adapters/parsers/r1_parser.py +17 -2
kiln_ai/adapters/parsers/request_formatters.py +40 -0
kiln_ai/adapters/parsers/test_parser_registry.py +2 -2
kiln_ai/adapters/parsers/test_r1_parser.py +44 -1
kiln_ai/adapters/parsers/test_request_formatters.py +76 -0
kiln_ai/adapters/prompt_builders.py +14 -1
kiln_ai/adapters/provider_tools.py +25 -1
kiln_ai/adapters/repair/test_repair_task.py +3 -2
kiln_ai/adapters/test_prompt_builders.py +24 -3
kiln_ai/adapters/test_provider_tools.py +86 -1
kiln_ai/datamodel/__init__.py +2 -0
kiln_ai/datamodel/datamodel_enums.py +14 -0
kiln_ai/datamodel/dataset_filters.py +69 -1
kiln_ai/datamodel/dataset_split.py +4 -0
kiln_ai/datamodel/eval.py +8 -0
kiln_ai/datamodel/finetune.py +1 -0
kiln_ai/datamodel/json_schema.py +24 -7
kiln_ai/datamodel/prompt_id.py +1 -0
kiln_ai/datamodel/task_output.py +10 -6
kiln_ai/datamodel/task_run.py +68 -12
kiln_ai/datamodel/test_basemodel.py +3 -7
kiln_ai/datamodel/test_dataset_filters.py +82 -0
kiln_ai/datamodel/test_dataset_split.py +2 -0
kiln_ai/datamodel/test_example_models.py +158 -3
kiln_ai/datamodel/test_json_schema.py +22 -3
kiln_ai/datamodel/test_model_perf.py +3 -2
kiln_ai/datamodel/test_models.py +50 -2
kiln_ai/utils/async_job_runner.py +106 -0
kiln_ai/utils/dataset_import.py +80 -18
kiln_ai/utils/test_async_job_runner.py +199 -0
kiln_ai/utils/test_dataset_import.py +242 -10
{kiln_ai-0.14.0.dist-info → kiln_ai-0.16.0.dist-info}/METADATA +3 -2
kiln_ai-0.16.0.dist-info/RECORD +108 -0
kiln_ai/adapters/test_generate_docs.py +0 -69
kiln_ai-0.14.0.dist-info/RECORD +0 -103
{kiln_ai-0.14.0.dist-info → kiln_ai-0.16.0.dist-info}/WHEEL +0 -0
{kiln_ai-0.14.0.dist-info → kiln_ai-0.16.0.dist-info}/licenses/LICENSE.txt +0 -0

kiln_ai/adapters/ml_model_list.py CHANGED Viewed

@@ -70,9 +70,18 @@ class ModelName(str, Enum):
     llama_3_3_70b = "llama_3_3_70b"
     gpt_4o_mini = "gpt_4o_mini"
     gpt_4o = "gpt_4o"
+    gpt_4_1 = "gpt_4_1"
+    gpt_4_1_mini = "gpt_4_1_mini"
+    gpt_4_1_nano = "gpt_4_1_nano"
+    gpt_o3_low = "gpt_o3_low"
+    gpt_o3_medium = "gpt_o3_medium"
+    gpt_o3_high = "gpt_o3_high"
     gpt_o1_low = "gpt_o1_low"
     gpt_o1_medium = "gpt_o1_medium"
     gpt_o1_high = "gpt_o1_high"
+    gpt_o4_mini_low = "gpt_o4_mini_low"
+    gpt_o4_mini_medium = "gpt_o4_mini_medium"
+    gpt_o4_mini_high = "gpt_o4_mini_high"
     gpt_o3_mini_low = "gpt_o3_mini_low"
     gpt_o3_mini_medium = "gpt_o3_mini_medium"
     gpt_o3_mini_high = "gpt_o3_mini_high"
@@ -97,6 +106,9 @@ class ModelName(str, Enum):
     gemini_1_5_flash_8b = "gemini_1_5_flash_8b"
     gemini_1_5_pro = "gemini_1_5_pro"
     gemini_2_0_flash = "gemini_2_0_flash"
+    gemini_2_0_flash_lite = "gemini_2_0_flash_lite"
+    gemini_2_5_pro = "gemini_2_5_pro"
+    gemini_2_5_flash = "gemini_2_5_flash"
     nemotron_70b = "nemotron_70b"
     mixtral_8x7b = "mixtral_8x7b"
     qwen_2p5_7b = "qwen_2p5_7b"
@@ -114,6 +126,22 @@ class ModelName(str, Enum):
     deepseek_r1_distill_llama_8b = "deepseek_r1_distill_llama_8b"
     dolphin_2_9_8x22b = "dolphin_2_9_8x22b"
     grok_2 = "grok_2"
+    qwen_3_0p6b = "qwen_3_0p6b"
+    qwen_3_0p6b_no_thinking = "qwen_3_0p6b_no_thinking"
+    qwen_3_1p7b = "qwen_3_1p7b"
+    qwen_3_1p7b_no_thinking = "qwen_3_1p7b_no_thinking"
+    qwen_3_4b = "qwen_3_4b"
+    qwen_3_4b_no_thinking = "qwen_3_4b_no_thinking"
+    qwen_3_8b = "qwen_3_8b"
+    qwen_3_8b_no_thinking = "qwen_3_8b_no_thinking"
+    qwen_3_14b = "qwen_3_14b"
+    qwen_3_14b_no_thinking = "qwen_3_14b_no_thinking"
+    qwen_3_30b_a3b = "qwen_3_30b_a3b"
+    qwen_3_30b_a3b_no_thinking = "qwen_3_30b_a3b_no_thinking"
+    qwen_3_32b = "qwen_3_32b"
+    qwen_3_32b_no_thinking = "qwen_3_32b_no_thinking"
+    qwen_3_235b_a22b = "qwen_3_235b_a22b"
+    qwen_3_235b_a22b_no_thinking = "qwen_3_235b_a22b_no_thinking"
 class ModelParserID(str, Enum):
@@ -122,6 +150,15 @@ class ModelParserID(str, Enum):
     """
     r1_thinking = "r1_thinking"
+    optional_r1_thinking = "optional_r1_thinking"
+class ModelFormatterID(str, Enum):
+    """
+    Enumeration of supported model formatters.
+    """
+    qwen3_style_no_think = "qwen3_style_no_think"
 class KilnModelProvider(BaseModel):
@@ -143,12 +180,15 @@ class KilnModelProvider(BaseModel):
     model_id: str | None = None
     supports_structured_output: bool = True
     supports_data_gen: bool = True
+    suggested_for_data_gen: bool = False
     untested_model: bool = False
     provider_finetune_id: str | None = None
     structured_output_mode: StructuredOutputMode = StructuredOutputMode.default
     parser: ModelParserID | None = None
+    formatter: ModelFormatterID | None = None
     reasoning_capable: bool = False
     supports_logprobs: bool = False
+    suggested_for_evals: bool = False
     # TODO P1: Need a more generalized way to handle custom provider parameters.
     # Making them quite declarative here for now, isolating provider specific logic
@@ -181,29 +221,89 @@ class KilnModel(BaseModel):
 built_in_models: List[KilnModel] = [
-    # GPT 4o Mini
+    # GPT 4.1
     KilnModel(
         family=ModelFamily.gpt,
-        name=ModelName.gpt_4o_mini,
-        friendly_name="GPT 4o Mini",
+        name=ModelName.gpt_4_1,
+        friendly_name="GPT 4.1",
         providers=[
             KilnModelProvider(
                 name=ModelProviderName.openai,
-                model_id="gpt-4o-mini",
-                provider_finetune_id="gpt-4o-mini-2024-07-18",
+                model_id="gpt-4.1",
+                provider_finetune_id="gpt-4.1-2025-04-14",
                 structured_output_mode=StructuredOutputMode.json_schema,
                 supports_logprobs=True,
+                suggested_for_data_gen=True,
+                suggested_for_evals=True,
             ),
             KilnModelProvider(
                 name=ModelProviderName.openrouter,
-                model_id="openai/gpt-4o-mini",
+                model_id="openai/gpt-4.1",
                 structured_output_mode=StructuredOutputMode.json_schema,
                 supports_logprobs=True,
-                logprobs_openrouter_options=True,
+                suggested_for_data_gen=True,
+                suggested_for_evals=True,
             ),
             KilnModelProvider(
                 name=ModelProviderName.azure_openai,
-                model_id="gpt-4o-mini",
+                model_id="gpt-4.1",
+                suggested_for_data_gen=True,
+                suggested_for_evals=True,
+            ),
+        ],
+    ),
+    # GPT 4.1 Mini
+    KilnModel(
+        family=ModelFamily.gpt,
+        name=ModelName.gpt_4_1_mini,
+        friendly_name="GPT 4.1 Mini",
+        providers=[
+            KilnModelProvider(
+                name=ModelProviderName.openai,
+                model_id="gpt-4.1-mini",
+                provider_finetune_id="gpt-4.1-mini-2025-04-14",
+                structured_output_mode=StructuredOutputMode.json_schema,
+                supports_logprobs=True,
+                suggested_for_data_gen=True,
+                suggested_for_evals=True,
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.openrouter,
+                model_id="openai/gpt-4.1-mini",
+                structured_output_mode=StructuredOutputMode.json_schema,
+                supports_logprobs=True,
+                suggested_for_data_gen=True,
+                suggested_for_evals=True,
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.azure_openai,
+                model_id="gpt-4.1-mini",
+                suggested_for_data_gen=True,
+                suggested_for_evals=True,
+            ),
+        ],
+    ),
+    # GPT 4.1 Nano
+    KilnModel(
+        family=ModelFamily.gpt,
+        name=ModelName.gpt_4_1_nano,
+        friendly_name="GPT 4.1 Nano",
+        providers=[
+            KilnModelProvider(
+                name=ModelProviderName.openai,
+                model_id="gpt-4.1-nano",
+                structured_output_mode=StructuredOutputMode.json_schema,
+                supports_logprobs=True,
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.openrouter,
+                model_id="openai/gpt-4.1-nano",
+                structured_output_mode=StructuredOutputMode.json_schema,
+                supports_logprobs=True,
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.azure_openai,
+                model_id="gpt-4.1-nano",
             ),
         ],
     ),
@@ -233,6 +333,102 @@ built_in_models: List[KilnModel] = [
             ),
         ],
     ),
+    # GPT 4o Mini
+    KilnModel(
+        family=ModelFamily.gpt,
+        name=ModelName.gpt_4o_mini,
+        friendly_name="GPT 4o Mini",
+        providers=[
+            KilnModelProvider(
+                name=ModelProviderName.openai,
+                model_id="gpt-4o-mini",
+                provider_finetune_id="gpt-4o-mini-2024-07-18",
+                structured_output_mode=StructuredOutputMode.json_schema,
+                supports_logprobs=True,
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.openrouter,
+                model_id="openai/gpt-4o-mini",
+                structured_output_mode=StructuredOutputMode.json_schema,
+                supports_logprobs=True,
+                logprobs_openrouter_options=True,
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.azure_openai,
+                model_id="gpt-4o-mini",
+            ),
+        ],
+    ),
+    # GPT o4 Mini Low
+    KilnModel(
+        family=ModelFamily.gpt,
+        name=ModelName.gpt_o4_mini_low,
+        friendly_name="GPT o4 Mini - Low",
+        providers=[
+            KilnModelProvider(
+                name=ModelProviderName.openai,
+                model_id="o4-mini",
+                thinking_level="low",
+                structured_output_mode=StructuredOutputMode.json_schema,
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.azure_openai,
+                model_id="o4-mini",
+                structured_output_mode=StructuredOutputMode.json_schema,
+                thinking_level="low",
+            ),
+        ],
+    ),
+    # GPT o4 Mini Medium
+    KilnModel(
+        family=ModelFamily.gpt,
+        name=ModelName.gpt_o4_mini_medium,
+        friendly_name="GPT o4 Mini - Medium",
+        providers=[
+            KilnModelProvider(
+                name=ModelProviderName.openai,
+                model_id="o4-mini",
+                thinking_level="medium",
+                structured_output_mode=StructuredOutputMode.json_schema,
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.azure_openai,
+                model_id="o4-mini",
+                structured_output_mode=StructuredOutputMode.json_schema,
+                thinking_level="medium",
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.openrouter,
+                model_id="openai/o4-mini",
+                structured_output_mode=StructuredOutputMode.json_schema,
+            ),
+        ],
+    ),
+    # GPT o4 Mini High
+    KilnModel(
+        family=ModelFamily.gpt,
+        name=ModelName.gpt_o4_mini_high,
+        friendly_name="GPT o4 Mini - High",
+        providers=[
+            KilnModelProvider(
+                name=ModelProviderName.openai,
+                model_id="o4-mini",
+                thinking_level="high",
+                structured_output_mode=StructuredOutputMode.json_schema,
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.azure_openai,
+                model_id="o4-mini",
+                structured_output_mode=StructuredOutputMode.json_schema,
+                thinking_level="high",
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.openrouter,
+                model_id="openai/o4-mini-high",
+                structured_output_mode=StructuredOutputMode.json_schema,
+            ),
+        ],
+    ),
     # GPT o3 Mini Low
     KilnModel(
         family=ModelFamily.gpt,
@@ -293,6 +489,66 @@ built_in_models: List[KilnModel] = [
             ),
         ],
     ),
+    # GPT o3 Low
+    KilnModel(
+        family=ModelFamily.gpt,
+        name=ModelName.gpt_o3_low,
+        friendly_name="GPT o3 - Low",
+        providers=[
+            KilnModelProvider(
+                name=ModelProviderName.openai,
+                model_id="o3",
+                thinking_level="low",
+                structured_output_mode=StructuredOutputMode.json_schema,
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.azure_openai,
+                model_id="o3",
+                structured_output_mode=StructuredOutputMode.json_schema,
+                thinking_level="low",
+            ),
+        ],
+    ),
+    # GPT o3 Medium
+    KilnModel(
+        family=ModelFamily.gpt,
+        name=ModelName.gpt_o3_medium,
+        friendly_name="GPT o3 - Medium",
+        providers=[
+            KilnModelProvider(
+                name=ModelProviderName.openai,
+                model_id="o3",
+                thinking_level="medium",
+                structured_output_mode=StructuredOutputMode.json_schema,
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.azure_openai,
+                model_id="o3",
+                structured_output_mode=StructuredOutputMode.json_schema,
+                thinking_level="medium",
+            ),
+        ],
+    ),
+    # GPT o3 High
+    KilnModel(
+        family=ModelFamily.gpt,
+        name=ModelName.gpt_o3_high,
+        friendly_name="GPT o3 - High",
+        providers=[
+            KilnModelProvider(
+                name=ModelProviderName.openai,
+                model_id="o3",
+                thinking_level="high",
+                structured_output_mode=StructuredOutputMode.json_schema,
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.azure_openai,
+                model_id="o3",
+                structured_output_mode=StructuredOutputMode.json_schema,
+                thinking_level="high",
+            ),
+        ],
+    ),
     # GPT o1 Low
     KilnModel(
         family=ModelFamily.gpt,
@@ -409,11 +665,15 @@ built_in_models: List[KilnModel] = [
                 name=ModelProviderName.openrouter,
                 structured_output_mode=StructuredOutputMode.function_calling,
                 model_id="anthropic/claude-3.7-sonnet",
+                suggested_for_data_gen=True,
+                suggested_for_evals=True,
             ),
             KilnModelProvider(
                 name=ModelProviderName.anthropic,
                 model_id="claude-3-7-sonnet-20250219",
                 structured_output_mode=StructuredOutputMode.function_calling,
+                suggested_for_data_gen=True,
+                suggested_for_evals=True,
             ),
         ],
     ),
@@ -440,118 +700,195 @@ built_in_models: List[KilnModel] = [
             ),
         ],
     ),
-    # Gemini 1.5 Pro
+    # Gemini 2.5 Pro
     KilnModel(
         family=ModelFamily.gemini,
-        name=ModelName.gemini_1_5_pro,
-        friendly_name="Gemini 1.5 Pro",
+        name=ModelName.gemini_2_5_pro,
+        friendly_name="Gemini 2.5 Pro",
         providers=[
             KilnModelProvider(
                 name=ModelProviderName.openrouter,
-                model_id="google/gemini-pro-1.5",
-                structured_output_mode=StructuredOutputMode.json_instruction_and_object,
+                model_id="google/gemini-2.5-pro-preview-03-25",
+                structured_output_mode=StructuredOutputMode.json_schema,
+                suggested_for_data_gen=True,
+                suggested_for_evals=True,
             ),
             KilnModelProvider(
                 name=ModelProviderName.gemini_api,
-                model_id="gemini-1.5-pro",
-                structured_output_mode=StructuredOutputMode.json_instruction_and_object,
+                model_id="gemini-2.5-pro-preview-03-25",
+                structured_output_mode=StructuredOutputMode.json_schema,
+                suggested_for_data_gen=True,
+                suggested_for_evals=True,
             ),
             KilnModelProvider(
                 name=ModelProviderName.vertex,
-                model_id="gemini-1.5-pro",
-                structured_output_mode=StructuredOutputMode.json_instruction_and_object,
+                model_id="gemini-2.5-pro-preview-03-25",
+                structured_output_mode=StructuredOutputMode.json_schema,
+                suggested_for_data_gen=True,
+                suggested_for_evals=True,
             ),
         ],
     ),
-    # Gemini 1.5 Flash
+    # Gemini 2.5 Flash
     KilnModel(
         family=ModelFamily.gemini,
-        name=ModelName.gemini_1_5_flash,
-        friendly_name="Gemini 1.5 Flash",
+        name=ModelName.gemini_2_5_flash,
+        friendly_name="Gemini 2.5 Flash",
         providers=[
             KilnModelProvider(
                 name=ModelProviderName.openrouter,
-                model_id="google/gemini-flash-1.5",
-                structured_output_mode=StructuredOutputMode.json_instruction_and_object,
+                model_id="google/gemini-2.5-flash-preview",
+                structured_output_mode=StructuredOutputMode.json_schema,
             ),
             KilnModelProvider(
                 name=ModelProviderName.gemini_api,
-                model_id="gemini-1.5-flash",
-                structured_output_mode=StructuredOutputMode.json_instruction_and_object,
+                model_id="gemini-2.5-flash-preview-04-17",
+                structured_output_mode=StructuredOutputMode.json_schema,
             ),
             KilnModelProvider(
                 name=ModelProviderName.vertex,
-                model_id="gemini-1.5-flash",
-                structured_output_mode=StructuredOutputMode.json_instruction_and_object,
+                model_id="gemini-2.5-flash-preview-04-17",
+                structured_output_mode=StructuredOutputMode.json_schema,
             ),
         ],
     ),
-    # Gemini 1.5 Flash 8B
+    # Gemini 2.0 Flash
     KilnModel(
         family=ModelFamily.gemini,
-        name=ModelName.gemini_1_5_flash_8b,
-        friendly_name="Gemini 1.5 Flash 8B",
+        name=ModelName.gemini_2_0_flash,
+        friendly_name="Gemini 2.0 Flash",
         providers=[
             KilnModelProvider(
                 name=ModelProviderName.openrouter,
-                model_id="google/gemini-flash-1.5-8b",
+                model_id="google/gemini-2.0-flash-001",
                 structured_output_mode=StructuredOutputMode.json_instruction_and_object,
-                supports_data_gen=False,
             ),
             KilnModelProvider(
                 name=ModelProviderName.gemini_api,
-                model_id="gemini-1.5-flash-8b",
+                model_id="gemini-2.0-flash",
                 structured_output_mode=StructuredOutputMode.json_instruction_and_object,
-                supports_data_gen=False,
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.vertex,
+                model_id="gemini-2.0-flash",
+                structured_output_mode=StructuredOutputMode.json_instruction_and_object,
+                provider_finetune_id="gemini-2.0-flash-001",
             ),
         ],
     ),
-    # Gemini 2.0 Flash
+    # Gemini 2.0 Flash Lite
     KilnModel(
         family=ModelFamily.gemini,
-        name=ModelName.gemini_2_0_flash,
-        friendly_name="Gemini 2.0 Flash",
+        name=ModelName.gemini_2_0_flash_lite,
+        friendly_name="Gemini 2.0 Flash Lite",
         providers=[
             KilnModelProvider(
                 name=ModelProviderName.openrouter,
-                model_id="google/gemini-2.0-flash-001",
+                model_id="google/gemini-2.0-flash-lite-001",
                 structured_output_mode=StructuredOutputMode.json_instruction_and_object,
             ),
             KilnModelProvider(
                 name=ModelProviderName.gemini_api,
-                model_id="gemini-2.0-flash",
+                model_id="gemini-2.0-flash-lite",
                 structured_output_mode=StructuredOutputMode.json_instruction_and_object,
             ),
             KilnModelProvider(
                 name=ModelProviderName.vertex,
-                model_id="gemini-2.0-flash",
+                model_id="gemini-2.0-flash-lite",
                 structured_output_mode=StructuredOutputMode.json_instruction_and_object,
+                provider_finetune_id="gemini-2.0-flash-lite-001",
             ),
         ],
     ),
-    # Nemotron 70B
+    # Gemini 1.5 Pro
     KilnModel(
-        family=ModelFamily.llama,
-        name=ModelName.nemotron_70b,
-        friendly_name="Nemotron 70B",
+        family=ModelFamily.gemini,
+        name=ModelName.gemini_1_5_pro,
+        friendly_name="Gemini 1.5 Pro",
         providers=[
             KilnModelProvider(
                 name=ModelProviderName.openrouter,
-                supports_structured_output=False,
-                supports_data_gen=False,
-                model_id="nvidia/llama-3.1-nemotron-70b-instruct",
+                model_id="google/gemini-pro-1.5",
+                structured_output_mode=StructuredOutputMode.json_instruction_and_object,
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.gemini_api,
+                model_id="gemini-1.5-pro",
+                structured_output_mode=StructuredOutputMode.json_instruction_and_object,
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.vertex,
+                model_id="gemini-1.5-pro",
+                structured_output_mode=StructuredOutputMode.json_instruction_and_object,
             ),
         ],
     ),
-    # Llama 3.1-8b
+    # Gemini 1.5 Flash
     KilnModel(
-        family=ModelFamily.llama,
-        name=ModelName.llama_3_1_8b,
-        friendly_name="Llama 3.1 8B",
+        family=ModelFamily.gemini,
+        name=ModelName.gemini_1_5_flash,
+        friendly_name="Gemini 1.5 Flash",
         providers=[
             KilnModelProvider(
-                name=ModelProviderName.groq,
-                model_id="llama-3.1-8b-instant",
+                name=ModelProviderName.openrouter,
+                model_id="google/gemini-flash-1.5",
+                structured_output_mode=StructuredOutputMode.json_instruction_and_object,
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.gemini_api,
+                model_id="gemini-1.5-flash",
+                structured_output_mode=StructuredOutputMode.json_instruction_and_object,
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.vertex,
+                model_id="gemini-1.5-flash",
+                structured_output_mode=StructuredOutputMode.json_instruction_and_object,
+            ),
+        ],
+    ),
+    # Gemini 1.5 Flash 8B
+    KilnModel(
+        family=ModelFamily.gemini,
+        name=ModelName.gemini_1_5_flash_8b,
+        friendly_name="Gemini 1.5 Flash 8B",
+        providers=[
+            KilnModelProvider(
+                name=ModelProviderName.openrouter,
+                model_id="google/gemini-flash-1.5-8b",
+                structured_output_mode=StructuredOutputMode.json_instruction_and_object,
+                supports_data_gen=False,
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.gemini_api,
+                model_id="gemini-1.5-flash-8b",
+                structured_output_mode=StructuredOutputMode.json_instruction_and_object,
+                supports_data_gen=False,
+            ),
+        ],
+    ),
+    # Nemotron 70B
+    KilnModel(
+        family=ModelFamily.llama,
+        name=ModelName.nemotron_70b,
+        friendly_name="Nemotron 70B",
+        providers=[
+            KilnModelProvider(
+                name=ModelProviderName.openrouter,
+                supports_structured_output=False,
+                supports_data_gen=False,
+                model_id="nvidia/llama-3.1-nemotron-70b-instruct",
+            ),
+        ],
+    ),
+    # Llama 3.1-8b
+    KilnModel(
+        family=ModelFamily.llama,
+        name=ModelName.llama_3_1_8b,
+        friendly_name="Llama 3.1 8B",
+        providers=[
+            KilnModelProvider(
+                name=ModelProviderName.groq,
+                model_id="llama-3.1-8b-instant",
             ),
             KilnModelProvider(
                 name=ModelProviderName.amazon_bedrock,
@@ -760,12 +1097,6 @@ built_in_models: List[KilnModel] = [
                 supports_data_gen=False,
                 model_id="llama3.2",
             ),
-            KilnModelProvider(
-                name=ModelProviderName.fireworks_ai,
-                supports_structured_output=False,
-                supports_data_gen=False,
-                model_id="accounts/fireworks/models/llama-v3p2-3b-instruct",
-            ),
             KilnModelProvider(
                 name=ModelProviderName.huggingface,
                 model_id="meta-llama/Llama-3.2-3B-Instruct",
@@ -787,10 +1118,6 @@ built_in_models: List[KilnModel] = [
         name=ModelName.llama_3_2_11b,
         friendly_name="Llama 3.2 11B",
         providers=[
-            KilnModelProvider(
-                name=ModelProviderName.groq,
-                model_id="llama-3.2-11b-vision-preview",
-            ),
             KilnModelProvider(
                 name=ModelProviderName.openrouter,
                 # Best mode, but fails to often to enable without warning
@@ -1297,6 +1624,8 @@ built_in_models: List[KilnModel] = [
                 reasoning_capable=True,
                 r1_openrouter_options=True,
                 require_openrouter_reasoning=True,
+                suggested_for_data_gen=True,
+                suggested_for_evals=True,
             ),
             KilnModelProvider(
                 name=ModelProviderName.fireworks_ai,
@@ -1304,6 +1633,8 @@ built_in_models: List[KilnModel] = [
                 parser=ModelParserID.r1_thinking,
                 structured_output_mode=StructuredOutputMode.json_instructions,
                 reasoning_capable=True,
+                suggested_for_data_gen=True,
+                suggested_for_evals=True,
             ),
             KilnModelProvider(
                 # I want your RAM
@@ -1312,6 +1643,8 @@ built_in_models: List[KilnModel] = [
                 parser=ModelParserID.r1_thinking,
                 structured_output_mode=StructuredOutputMode.json_instructions,
                 reasoning_capable=True,
+                suggested_for_data_gen=True,
+                suggested_for_evals=True,
             ),
             KilnModelProvider(
                 name=ModelProviderName.together_ai,
@@ -1319,6 +1652,8 @@ built_in_models: List[KilnModel] = [
                 structured_output_mode=StructuredOutputMode.json_instructions,
                 parser=ModelParserID.r1_thinking,
                 reasoning_capable=True,
+                suggested_for_data_gen=True,
+                suggested_for_evals=True,
             ),
         ],
     ),
@@ -1538,4 +1873,424 @@ built_in_models: List[KilnModel] = [
             ),
         ],
     ),
+    # Qwen 3 0.6B
+    KilnModel(
+        family=ModelFamily.qwen,
+        name=ModelName.qwen_3_0p6b,
+        friendly_name="Qwen 3 0.6B",
+        providers=[
+            KilnModelProvider(
+                name=ModelProviderName.openrouter,
+                model_id="qwen/qwen3-0.6b-04-28:free",
+                structured_output_mode=StructuredOutputMode.json_instructions,
+                reasoning_capable=True,
+                require_openrouter_reasoning=True,
+                r1_openrouter_options=True,
+                parser=ModelParserID.r1_thinking,
+                supports_data_gen=False,
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.ollama,
+                model_id="qwen3:0.6b",
+                supports_data_gen=False,
+                reasoning_capable=True,
+                structured_output_mode=StructuredOutputMode.json_schema,
+            ),
+        ],
+    ),
+    # Qwen 3 0.6B Non-Thinking -- not respecting /no_think tag, skipping
+    # Qwen 3 1.7B
+    KilnModel(
+        family=ModelFamily.qwen,
+        name=ModelName.qwen_3_1p7b,
+        friendly_name="Qwen 3 1.7B",
+        providers=[
+            KilnModelProvider(
+                name=ModelProviderName.openrouter,
+                model_id="qwen/qwen3-1.7b:free",
+                structured_output_mode=StructuredOutputMode.json_instructions,
+                reasoning_capable=True,
+                require_openrouter_reasoning=True,
+                r1_openrouter_options=True,
+                parser=ModelParserID.r1_thinking,
+                supports_data_gen=False,
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.ollama,
+                model_id="qwen3:1.7b",
+                supports_data_gen=False,
+                reasoning_capable=True,
+                structured_output_mode=StructuredOutputMode.json_schema,
+            ),
+        ],
+    ),
+    # Qwen 3 1.7B Non-Thinking
+    KilnModel(
+        family=ModelFamily.qwen,
+        name=ModelName.qwen_3_1p7b_no_thinking,
+        friendly_name="Qwen 3 1.7B Non-Thinking",
+        providers=[
+            KilnModelProvider(
+                name=ModelProviderName.openrouter,
+                model_id="qwen/qwen3-1.7b:free",
+                structured_output_mode=StructuredOutputMode.json_instructions,
+                formatter=ModelFormatterID.qwen3_style_no_think,
+                supports_data_gen=False,
+                parser=ModelParserID.optional_r1_thinking,
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.ollama,
+                model_id="qwen3:1.7b",
+                formatter=ModelFormatterID.qwen3_style_no_think,
+                supports_data_gen=False,
+                structured_output_mode=StructuredOutputMode.json_schema,
+            ),
+        ],
+    ),
+    # Qwen 3 4B
+    KilnModel(
+        family=ModelFamily.qwen,
+        name=ModelName.qwen_3_4b,
+        friendly_name="Qwen 3 4B",
+        providers=[
+            KilnModelProvider(
+                name=ModelProviderName.openrouter,
+                model_id="qwen/qwen3-4b:free",
+                structured_output_mode=StructuredOutputMode.json_instructions,
+                reasoning_capable=True,
+                require_openrouter_reasoning=True,
+                r1_openrouter_options=True,
+                parser=ModelParserID.r1_thinking,
+                supports_data_gen=False,
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.ollama,
+                model_id="qwen3:4b",
+                supports_data_gen=False,
+                reasoning_capable=True,
+                structured_output_mode=StructuredOutputMode.json_schema,
+            ),
+        ],
+    ),
+    # Qwen 3 4B Non-Thinking
+    KilnModel(
+        family=ModelFamily.qwen,
+        name=ModelName.qwen_3_4b_no_thinking,
+        friendly_name="Qwen 3 4B Non-Thinking",
+        providers=[
+            KilnModelProvider(
+                name=ModelProviderName.openrouter,
+                model_id="qwen/qwen3-4b:free",
+                structured_output_mode=StructuredOutputMode.json_instructions,
+                formatter=ModelFormatterID.qwen3_style_no_think,
+                supports_data_gen=False,
+                parser=ModelParserID.optional_r1_thinking,
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.ollama,
+                model_id="qwen3:4b",
+                structured_output_mode=StructuredOutputMode.json_schema,
+                formatter=ModelFormatterID.qwen3_style_no_think,
+                supports_data_gen=False,
+            ),
+        ],
+    ),
+    # Qwen 3 8B
+    KilnModel(
+        family=ModelFamily.qwen,
+        name=ModelName.qwen_3_8b,
+        friendly_name="Qwen 3 8B",
+        providers=[
+            KilnModelProvider(
+                name=ModelProviderName.openrouter,
+                model_id="qwen/qwen3-8b",
+                supports_structured_output=True,
+                structured_output_mode=StructuredOutputMode.json_instructions,
+                reasoning_capable=True,
+                require_openrouter_reasoning=True,
+                r1_openrouter_options=True,
+                parser=ModelParserID.r1_thinking,
+                supports_data_gen=False,
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.ollama,
+                model_id="qwen3:8b",
+                supports_data_gen=False,
+                reasoning_capable=True,
+                structured_output_mode=StructuredOutputMode.json_schema,
+            ),
+        ],
+    ),
+    # Qwen 3 8B Non-Thinking
+    KilnModel(
+        family=ModelFamily.qwen,
+        name=ModelName.qwen_3_8b_no_thinking,
+        friendly_name="Qwen 3 8B Non-Thinking",
+        providers=[
+            KilnModelProvider(
+                name=ModelProviderName.openrouter,
+                model_id="qwen/qwen3-8b",
+                structured_output_mode=StructuredOutputMode.json_instructions,
+                formatter=ModelFormatterID.qwen3_style_no_think,
+                supports_data_gen=False,
+                parser=ModelParserID.optional_r1_thinking,
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.ollama,
+                model_id="qwen3:8b",
+                structured_output_mode=StructuredOutputMode.json_schema,
+                formatter=ModelFormatterID.qwen3_style_no_think,
+                supports_data_gen=False,
+            ),
+        ],
+    ),
+    # Qwen 3 14B
+    KilnModel(
+        family=ModelFamily.qwen,
+        name=ModelName.qwen_3_14b,
+        friendly_name="Qwen 3 14B",
+        providers=[
+            KilnModelProvider(
+                name=ModelProviderName.openrouter,
+                model_id="qwen/qwen3-14b",
+                structured_output_mode=StructuredOutputMode.json_instructions,
+                reasoning_capable=True,
+                require_openrouter_reasoning=True,
+                r1_openrouter_options=True,
+                parser=ModelParserID.r1_thinking,
+                supports_data_gen=True,
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.ollama,
+                model_id="qwen3:14b",
+                supports_data_gen=True,
+                reasoning_capable=True,
+                structured_output_mode=StructuredOutputMode.json_schema,
+            ),
+        ],
+    ),
+    # Qwen 3 14B Non-Thinking
+    KilnModel(
+        family=ModelFamily.qwen,
+        name=ModelName.qwen_3_14b_no_thinking,
+        friendly_name="Qwen 3 14B Non-Thinking",
+        providers=[
+            KilnModelProvider(
+                name=ModelProviderName.openrouter,
+                model_id="qwen/qwen3-14b",
+                structured_output_mode=StructuredOutputMode.json_instructions,
+                formatter=ModelFormatterID.qwen3_style_no_think,
+                supports_data_gen=True,
+                parser=ModelParserID.optional_r1_thinking,
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.ollama,
+                model_id="qwen3:14b",
+                formatter=ModelFormatterID.qwen3_style_no_think,
+                supports_data_gen=True,
+                structured_output_mode=StructuredOutputMode.json_schema,
+            ),
+        ],
+    ),
+    # Qwen 3 30B (3B Active)
+    KilnModel(
+        family=ModelFamily.qwen,
+        name=ModelName.qwen_3_30b_a3b,
+        friendly_name="Qwen 3 30B (3B Active)",
+        providers=[
+            KilnModelProvider(
+                name=ModelProviderName.openrouter,
+                model_id="qwen/qwen3-30b-a3b",
+                structured_output_mode=StructuredOutputMode.json_instructions,
+                reasoning_capable=True,
+                require_openrouter_reasoning=True,
+                r1_openrouter_options=True,
+                parser=ModelParserID.r1_thinking,
+                supports_data_gen=True,
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.ollama,
+                model_id="qwen3:30b-a3b",
+                supports_data_gen=True,
+                reasoning_capable=True,
+                structured_output_mode=StructuredOutputMode.json_schema,
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.fireworks_ai,
+                model_id="accounts/fireworks/models/qwen3-30b-a3b",
+                supports_data_gen=True,
+                reasoning_capable=True,
+                structured_output_mode=StructuredOutputMode.json_instructions,
+                parser=ModelParserID.r1_thinking,
+            ),
+        ],
+    ),
+    # Qwen 3 30B (3B Active) Non-Thinking
+    KilnModel(
+        family=ModelFamily.qwen,
+        name=ModelName.qwen_3_30b_a3b_no_thinking,
+        friendly_name="Qwen 3 30B (3B Active) Non-Thinking",
+        providers=[
+            KilnModelProvider(
+                name=ModelProviderName.openrouter,
+                model_id="qwen/qwen3-30b-a3b",
+                structured_output_mode=StructuredOutputMode.json_instructions,
+                formatter=ModelFormatterID.qwen3_style_no_think,
+                supports_data_gen=True,
+                parser=ModelParserID.optional_r1_thinking,
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.ollama,
+                model_id="qwen3:30b-a3b",
+                structured_output_mode=StructuredOutputMode.json_schema,
+                formatter=ModelFormatterID.qwen3_style_no_think,
+                supports_data_gen=True,
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.fireworks_ai,
+                model_id="accounts/fireworks/models/qwen3-30b-a3b",
+                supports_data_gen=True,
+                formatter=ModelFormatterID.qwen3_style_no_think,
+                structured_output_mode=StructuredOutputMode.json_instructions,
+                parser=ModelParserID.optional_r1_thinking,
+            ),
+        ],
+    ),
+    # Qwen 3 32B
+    KilnModel(
+        family=ModelFamily.qwen,
+        name=ModelName.qwen_3_32b,
+        friendly_name="Qwen 3 32B",
+        providers=[
+            KilnModelProvider(
+                name=ModelProviderName.openrouter,
+                model_id="qwen/qwen3-32b",
+                reasoning_capable=True,
+                require_openrouter_reasoning=True,
+                r1_openrouter_options=True,
+                structured_output_mode=StructuredOutputMode.json_instructions,
+                parser=ModelParserID.r1_thinking,
+                supports_data_gen=True,
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.ollama,
+                model_id="qwen3:32b",
+                supports_data_gen=True,
+                reasoning_capable=True,
+                structured_output_mode=StructuredOutputMode.json_schema,
+            ),
+        ],
+    ),
+    # Qwen 3 32B No Thinking
+    KilnModel(
+        family=ModelFamily.qwen,
+        name=ModelName.qwen_3_32b_no_thinking,
+        friendly_name="Qwen 3 32B Non-Thinking",
+        providers=[
+            KilnModelProvider(
+                name=ModelProviderName.openrouter,
+                model_id="qwen/qwen3-32b",
+                structured_output_mode=StructuredOutputMode.json_instructions,
+                formatter=ModelFormatterID.qwen3_style_no_think,
+                supports_data_gen=True,
+                parser=ModelParserID.optional_r1_thinking,
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.ollama,
+                model_id="qwen3:32b",
+                structured_output_mode=StructuredOutputMode.json_schema,
+                formatter=ModelFormatterID.qwen3_style_no_think,
+                supports_data_gen=True,
+            ),
+        ],
+    ),
+    # Qwen 3 235B (22B Active)
+    KilnModel(
+        family=ModelFamily.qwen,
+        name=ModelName.qwen_3_235b_a22b,
+        friendly_name="Qwen 3 235B (22B Active)",
+        providers=[
+            KilnModelProvider(
+                name=ModelProviderName.openrouter,
+                model_id="qwen/qwen3-235b-a22b",
+                reasoning_capable=True,
+                require_openrouter_reasoning=True,
+                supports_data_gen=True,
+                suggested_for_data_gen=True,
+                r1_openrouter_options=True,
+                structured_output_mode=StructuredOutputMode.json_instructions,
+                parser=ModelParserID.r1_thinking,
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.ollama,
+                model_id="qwen3:235b-a22b",
+                supports_data_gen=True,
+                reasoning_capable=True,
+                structured_output_mode=StructuredOutputMode.json_schema,
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.fireworks_ai,
+                model_id="accounts/fireworks/models/qwen3-235b-a22b",
+                supports_data_gen=True,
+                reasoning_capable=True,
+                structured_output_mode=StructuredOutputMode.json_instructions,
+                parser=ModelParserID.r1_thinking,
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.together_ai,
+                model_id="Qwen/Qwen3-235B-A22B-fp8-tput",
+                supports_data_gen=True,
+                reasoning_capable=True,
+                structured_output_mode=StructuredOutputMode.json_instructions,
+                parser=ModelParserID.r1_thinking,
+            ),
+        ],
+    ),
+    # Qwen 3 235B (22B Active) Non-Thinking
+    KilnModel(
+        family=ModelFamily.qwen,
+        name=ModelName.qwen_3_235b_a22b_no_thinking,
+        friendly_name="Qwen 3 235B (22B Active) Non-Thinking",
+        providers=[
+            KilnModelProvider(
+                name=ModelProviderName.openrouter,
+                model_id="qwen/qwen3-235b-a22b",
+                structured_output_mode=StructuredOutputMode.json_instructions,
+                formatter=ModelFormatterID.qwen3_style_no_think,
+                supports_data_gen=True,
+                reasoning_capable=False,
+                parser=ModelParserID.optional_r1_thinking,
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.ollama,
+                model_id="qwen3:235b-a22b",
+                structured_output_mode=StructuredOutputMode.json_schema,
+                formatter=ModelFormatterID.qwen3_style_no_think,
+                supports_data_gen=True,
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.fireworks_ai,
+                model_id="accounts/fireworks/models/qwen3-235b-a22b",
+                supports_data_gen=True,
+                formatter=ModelFormatterID.qwen3_style_no_think,
+                structured_output_mode=StructuredOutputMode.json_instructions,
+                parser=ModelParserID.optional_r1_thinking,
+            ),
+            KilnModelProvider(
+                name=ModelProviderName.together_ai,
+                model_id="Qwen/Qwen3-235B-A22B-fp8-tput",
+                supports_data_gen=True,
+                formatter=ModelFormatterID.qwen3_style_no_think,
+                structured_output_mode=StructuredOutputMode.json_instructions,
+                parser=ModelParserID.optional_r1_thinking,
+            ),
+        ],
+    ),
 ]
+def get_model_by_name(name: ModelName) -> KilnModel:
+    for model in built_in_models:
+        if model.name == name:
+            return model
+    raise ValueError(f"Model {name} not found in the list of built-in models")

kiln-ai 0.14.0__py3-none-any.whl → 0.16.0__py3-none-any.whl

kiln-ai 0.14.0py3-none-any.whl → 0.16.0py3-none-any.whl