PyPI - unique_toolkit - Versions diffs - 0.7.9__py3-none-any.whl → 1.33.3__py3-none-any.whl - Mend

unique_toolkit 0.7.9py3-none-any.whl → 1.33.3py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (190) hide show

unique_toolkit/__init__.py +36 -3
unique_toolkit/_common/api_calling/human_verification_manager.py +357 -0
unique_toolkit/_common/base_model_type_attribute.py +303 -0
unique_toolkit/_common/chunk_relevancy_sorter/config.py +49 -0
unique_toolkit/_common/chunk_relevancy_sorter/exception.py +5 -0
unique_toolkit/_common/chunk_relevancy_sorter/schemas.py +46 -0
unique_toolkit/_common/chunk_relevancy_sorter/service.py +374 -0
unique_toolkit/_common/chunk_relevancy_sorter/tests/test_service.py +275 -0
unique_toolkit/_common/default_language_model.py +12 -0
unique_toolkit/_common/docx_generator/__init__.py +7 -0
unique_toolkit/_common/docx_generator/config.py +12 -0
unique_toolkit/_common/docx_generator/schemas.py +80 -0
unique_toolkit/_common/docx_generator/service.py +225 -0
unique_toolkit/_common/docx_generator/template/Doc Template.docx +0 -0
unique_toolkit/_common/endpoint_builder.py +368 -0
unique_toolkit/_common/endpoint_requestor.py +480 -0
unique_toolkit/_common/exception.py +24 -0
unique_toolkit/_common/experimental/endpoint_builder.py +368 -0
unique_toolkit/_common/experimental/endpoint_requestor.py +488 -0
unique_toolkit/_common/feature_flags/schema.py +9 -0
unique_toolkit/_common/pydantic/rjsf_tags.py +936 -0
unique_toolkit/_common/pydantic_helpers.py +174 -0
unique_toolkit/_common/referencing.py +53 -0
unique_toolkit/_common/string_utilities.py +140 -0
unique_toolkit/_common/tests/test_referencing.py +521 -0
unique_toolkit/_common/tests/test_string_utilities.py +506 -0
unique_toolkit/_common/token/image_token_counting.py +67 -0
unique_toolkit/_common/token/token_counting.py +204 -0
unique_toolkit/_common/utils/__init__.py +1 -0
unique_toolkit/_common/utils/files.py +43 -0
unique_toolkit/_common/utils/image/encode.py +25 -0
unique_toolkit/_common/utils/jinja/helpers.py +10 -0
unique_toolkit/_common/utils/jinja/render.py +18 -0
unique_toolkit/_common/utils/jinja/schema.py +65 -0
unique_toolkit/_common/utils/jinja/utils.py +80 -0
unique_toolkit/_common/utils/structured_output/__init__.py +1 -0
unique_toolkit/_common/utils/structured_output/schema.py +5 -0
unique_toolkit/_common/utils/write_configuration.py +51 -0
unique_toolkit/_common/validators.py +101 -4
unique_toolkit/agentic/__init__.py +1 -0
unique_toolkit/agentic/debug_info_manager/debug_info_manager.py +28 -0
unique_toolkit/agentic/debug_info_manager/test/test_debug_info_manager.py +278 -0
unique_toolkit/agentic/evaluation/config.py +36 -0
unique_toolkit/{evaluators → agentic/evaluation}/context_relevancy/prompts.py +25 -0
unique_toolkit/agentic/evaluation/context_relevancy/schema.py +80 -0
unique_toolkit/agentic/evaluation/context_relevancy/service.py +273 -0
unique_toolkit/agentic/evaluation/evaluation_manager.py +218 -0
unique_toolkit/agentic/evaluation/hallucination/constants.py +61 -0
unique_toolkit/agentic/evaluation/hallucination/hallucination_evaluation.py +112 -0
unique_toolkit/{evaluators → agentic/evaluation}/hallucination/prompts.py +1 -1
unique_toolkit/{evaluators → agentic/evaluation}/hallucination/service.py +20 -16
unique_toolkit/{evaluators → agentic/evaluation}/hallucination/utils.py +32 -21
unique_toolkit/{evaluators → agentic/evaluation}/output_parser.py +20 -2
unique_toolkit/{evaluators → agentic/evaluation}/schemas.py +27 -7
unique_toolkit/agentic/evaluation/tests/test_context_relevancy_service.py +253 -0
unique_toolkit/agentic/evaluation/tests/test_output_parser.py +87 -0
unique_toolkit/agentic/history_manager/history_construction_with_contents.py +298 -0
unique_toolkit/agentic/history_manager/history_manager.py +241 -0
unique_toolkit/agentic/history_manager/loop_token_reducer.py +484 -0
unique_toolkit/agentic/history_manager/utils.py +96 -0
unique_toolkit/agentic/message_log_manager/__init__.py +5 -0
unique_toolkit/agentic/message_log_manager/service.py +93 -0
unique_toolkit/agentic/postprocessor/postprocessor_manager.py +212 -0
unique_toolkit/agentic/reference_manager/reference_manager.py +103 -0
unique_toolkit/agentic/responses_api/__init__.py +19 -0
unique_toolkit/agentic/responses_api/postprocessors/code_display.py +71 -0
unique_toolkit/agentic/responses_api/postprocessors/generated_files.py +297 -0
unique_toolkit/agentic/responses_api/stream_handler.py +15 -0
unique_toolkit/agentic/short_term_memory_manager/persistent_short_term_memory_manager.py +141 -0
unique_toolkit/agentic/thinking_manager/thinking_manager.py +103 -0
unique_toolkit/agentic/tools/__init__.py +1 -0
unique_toolkit/agentic/tools/a2a/__init__.py +36 -0
unique_toolkit/agentic/tools/a2a/config.py +17 -0
unique_toolkit/agentic/tools/a2a/evaluation/__init__.py +15 -0
unique_toolkit/agentic/tools/a2a/evaluation/_utils.py +66 -0
unique_toolkit/agentic/tools/a2a/evaluation/config.py +55 -0
unique_toolkit/agentic/tools/a2a/evaluation/evaluator.py +260 -0
unique_toolkit/agentic/tools/a2a/evaluation/summarization_user_message.j2 +9 -0
unique_toolkit/agentic/tools/a2a/manager.py +55 -0
unique_toolkit/agentic/tools/a2a/postprocessing/__init__.py +21 -0
unique_toolkit/agentic/tools/a2a/postprocessing/_display_utils.py +240 -0
unique_toolkit/agentic/tools/a2a/postprocessing/_ref_utils.py +84 -0
unique_toolkit/agentic/tools/a2a/postprocessing/config.py +78 -0
unique_toolkit/agentic/tools/a2a/postprocessing/display.py +264 -0
unique_toolkit/agentic/tools/a2a/postprocessing/references.py +101 -0
unique_toolkit/agentic/tools/a2a/postprocessing/test/test_display.py +421 -0
unique_toolkit/agentic/tools/a2a/postprocessing/test/test_display_utils.py +2103 -0
unique_toolkit/agentic/tools/a2a/postprocessing/test/test_ref_utils.py +603 -0
unique_toolkit/agentic/tools/a2a/prompts.py +46 -0
unique_toolkit/agentic/tools/a2a/response_watcher/__init__.py +6 -0
unique_toolkit/agentic/tools/a2a/response_watcher/service.py +91 -0
unique_toolkit/agentic/tools/a2a/tool/__init__.py +4 -0
unique_toolkit/agentic/tools/a2a/tool/_memory.py +26 -0
unique_toolkit/agentic/tools/a2a/tool/_schema.py +9 -0
unique_toolkit/agentic/tools/a2a/tool/config.py +158 -0
unique_toolkit/agentic/tools/a2a/tool/service.py +393 -0
unique_toolkit/agentic/tools/agent_chunks_hanlder.py +65 -0
unique_toolkit/agentic/tools/config.py +128 -0
unique_toolkit/agentic/tools/factory.py +44 -0
unique_toolkit/agentic/tools/mcp/__init__.py +4 -0
unique_toolkit/agentic/tools/mcp/manager.py +71 -0
unique_toolkit/agentic/tools/mcp/models.py +28 -0
unique_toolkit/agentic/tools/mcp/tool_wrapper.py +234 -0
unique_toolkit/agentic/tools/openai_builtin/__init__.py +11 -0
unique_toolkit/agentic/tools/openai_builtin/base.py +46 -0
unique_toolkit/agentic/tools/openai_builtin/code_interpreter/__init__.py +8 -0
unique_toolkit/agentic/tools/openai_builtin/code_interpreter/config.py +88 -0
unique_toolkit/agentic/tools/openai_builtin/code_interpreter/service.py +250 -0
unique_toolkit/agentic/tools/openai_builtin/manager.py +79 -0
unique_toolkit/agentic/tools/schemas.py +145 -0
unique_toolkit/agentic/tools/test/test_mcp_manager.py +536 -0
unique_toolkit/agentic/tools/test/test_tool_progress_reporter.py +445 -0
unique_toolkit/agentic/tools/tool.py +187 -0
unique_toolkit/agentic/tools/tool_manager.py +492 -0
unique_toolkit/agentic/tools/tool_progress_reporter.py +285 -0
unique_toolkit/agentic/tools/utils/__init__.py +19 -0
unique_toolkit/agentic/tools/utils/execution/__init__.py +1 -0
unique_toolkit/agentic/tools/utils/execution/execution.py +286 -0
unique_toolkit/agentic/tools/utils/source_handling/__init__.py +0 -0
unique_toolkit/agentic/tools/utils/source_handling/schema.py +21 -0
unique_toolkit/agentic/tools/utils/source_handling/source_formatting.py +207 -0
unique_toolkit/agentic/tools/utils/source_handling/tests/test_source_formatting.py +216 -0
unique_toolkit/app/__init__.py +9 -0
unique_toolkit/app/dev_util.py +180 -0
unique_toolkit/app/fast_api_factory.py +131 -0
unique_toolkit/app/init_sdk.py +32 -1
unique_toolkit/app/schemas.py +206 -31
unique_toolkit/app/unique_settings.py +367 -0
unique_toolkit/app/webhook.py +77 -0
unique_toolkit/chat/__init__.py +8 -1
unique_toolkit/chat/deprecated/service.py +232 -0
unique_toolkit/chat/functions.py +648 -78
unique_toolkit/chat/rendering.py +34 -0
unique_toolkit/chat/responses_api.py +461 -0
unique_toolkit/chat/schemas.py +134 -2
unique_toolkit/chat/service.py +115 -767
unique_toolkit/content/functions.py +353 -8
unique_toolkit/content/schemas.py +128 -15
unique_toolkit/content/service.py +321 -45
unique_toolkit/content/smart_rules.py +301 -0
unique_toolkit/content/utils.py +10 -3
unique_toolkit/data_extraction/README.md +96 -0
unique_toolkit/data_extraction/__init__.py +11 -0
unique_toolkit/data_extraction/augmented/__init__.py +5 -0
unique_toolkit/data_extraction/augmented/service.py +93 -0
unique_toolkit/data_extraction/base.py +25 -0
unique_toolkit/data_extraction/basic/__init__.py +11 -0
unique_toolkit/data_extraction/basic/config.py +18 -0
unique_toolkit/data_extraction/basic/prompt.py +13 -0
unique_toolkit/data_extraction/basic/service.py +55 -0
unique_toolkit/embedding/service.py +103 -12
unique_toolkit/framework_utilities/__init__.py +1 -0
unique_toolkit/framework_utilities/langchain/__init__.py +10 -0
unique_toolkit/framework_utilities/langchain/client.py +71 -0
unique_toolkit/framework_utilities/langchain/history.py +19 -0
unique_toolkit/framework_utilities/openai/__init__.py +6 -0
unique_toolkit/framework_utilities/openai/client.py +84 -0
unique_toolkit/framework_utilities/openai/message_builder.py +229 -0
unique_toolkit/framework_utilities/utils.py +23 -0
unique_toolkit/language_model/__init__.py +3 -0
unique_toolkit/language_model/_responses_api_utils.py +93 -0
unique_toolkit/language_model/builder.py +27 -11
unique_toolkit/language_model/default_language_model.py +3 -0
unique_toolkit/language_model/functions.py +345 -43
unique_toolkit/language_model/infos.py +1288 -46
unique_toolkit/language_model/reference.py +242 -0
unique_toolkit/language_model/schemas.py +481 -49
unique_toolkit/language_model/service.py +229 -28
unique_toolkit/protocols/support.py +145 -0
unique_toolkit/services/__init__.py +7 -0
unique_toolkit/services/chat_service.py +1631 -0
unique_toolkit/services/knowledge_base.py +1094 -0
unique_toolkit/short_term_memory/service.py +178 -41
unique_toolkit/smart_rules/__init__.py +0 -0
unique_toolkit/smart_rules/compile.py +56 -0
unique_toolkit/test_utilities/events.py +197 -0
unique_toolkit-1.33.3.dist-info/METADATA +1145 -0
unique_toolkit-1.33.3.dist-info/RECORD +205 -0
unique_toolkit/evaluators/__init__.py +0 -1
unique_toolkit/evaluators/config.py +0 -35
unique_toolkit/evaluators/constants.py +0 -1
unique_toolkit/evaluators/context_relevancy/constants.py +0 -32
unique_toolkit/evaluators/context_relevancy/service.py +0 -53
unique_toolkit/evaluators/context_relevancy/utils.py +0 -142
unique_toolkit/evaluators/hallucination/constants.py +0 -41
unique_toolkit-0.7.9.dist-info/METADATA +0 -413
unique_toolkit-0.7.9.dist-info/RECORD +0 -64
/unique_toolkit/{evaluators → agentic/evaluation}/exception.py +0 -0
{unique_toolkit-0.7.9.dist-info → unique_toolkit-1.33.3.dist-info}/LICENSE +0 -0
{unique_toolkit-0.7.9.dist-info → unique_toolkit-1.33.3.dist-info}/WHEEL +0 -0

unique_toolkit/language_model/infos.py CHANGED Viewed

@@ -1,11 +1,12 @@
 from datetime import date
 from enum import StrEnum
-from typing import ClassVar, Optional, Self
+from typing import Annotated, Any, ClassVar, Optional, Self
-from pydantic import BaseModel
+from pydantic import BaseModel, Field
 from pydantic.json_schema import SkipJsonSchema
 from typing_extensions import deprecated
+from unique_toolkit._common.pydantic_helpers import get_configuration_dict
 from unique_toolkit.language_model.schemas import LanguageModelTokenLimits
@@ -14,6 +15,16 @@ class LanguageModelName(StrEnum):
     AZURE_GPT_4_0613 = "AZURE_GPT_4_0613"
     AZURE_GPT_4_32K_0613 = "AZURE_GPT_4_32K_0613"
     AZURE_GPT_4_TURBO_2024_0409 = "AZURE_GPT_4_TURBO_2024_0409"
+    AZURE_GPT_5_2025_0807 = "AZURE_GPT_5_2025_0807"
+    AZURE_GPT_5_MINI_2025_0807 = "AZURE_GPT_5_MINI_2025_0807"
+    AZURE_GPT_5_NANO_2025_0807 = "AZURE_GPT_5_NANO_2025_0807"
+    AZURE_GPT_5_CHAT_2025_0807 = "AZURE_GPT_5_CHAT_2025_0807"
+    AZURE_GPT_5_PRO_2025_1006 = "AZURE_GPT_5_PRO_2025_1006"
+    AZURE_GPT_51_2025_1113 = "AZURE_GPT_51_2025_1113"
+    AZURE_GPT_51_THINKING_2025_1113 = "AZURE_GPT_51_THINKING_2025_1113"
+    AZURE_GPT_51_CHAT_2025_1113 = "AZURE_GPT_51_CHAT_2025_1113"
+    AZURE_GPT_51_CODEX_2025_1113 = "AZURE_GPT_51_CODEX_2025_1113"
+    AZURE_GPT_51_CODEX_MINI_2025_1113 = "AZURE_GPT_51_CODEX_MINI_2025_1113"
     AZURE_GPT_4o_2024_0513 = "AZURE_GPT_4o_2024_0513"
     AZURE_GPT_4o_2024_0806 = "AZURE_GPT_4o_2024_0806"
     AZURE_GPT_4o_2024_1120 = "AZURE_GPT_4o_2024_1120"
@@ -23,6 +34,48 @@ class LanguageModelName(StrEnum):
     AZURE_o3_MINI_2025_0131 = "AZURE_o3_MINI_2025_0131"
     AZURE_GPT_45_PREVIEW_2025_0227 = "AZURE_GPT_45_PREVIEW_2025_0227"
     AZURE_GPT_41_2025_0414 = "AZURE_GPT_41_2025_0414"
+    AZURE_GPT_41_MINI_2025_0414 = "AZURE_GPT_41_MINI_2025_0414"
+    AZURE_GPT_41_NANO_2025_0414 = "AZURE_GPT_41_NANO_2025_0414"
+    AZURE_o3_2025_0416 = "AZURE_o3_2025_0416"
+    AZURE_o4_MINI_2025_0416 = "AZURE_o4_MINI_2025_0416"
+    ANTHROPIC_CLAUDE_3_7_SONNET = "litellm:anthropic-claude-3-7-sonnet"
+    ANTHROPIC_CLAUDE_3_7_SONNET_THINKING = (
+        "litellm:anthropic-claude-3-7-sonnet-thinking"
+    )
+    ANTHROPIC_CLAUDE_HAIKU_4_5 = "litellm:anthropic-claude-haiku-4-5"
+    ANTHROPIC_CLAUDE_SONNET_4 = "litellm:anthropic-claude-sonnet-4"
+    ANTHROPIC_CLAUDE_SONNET_4_5 = "litellm:anthropic-claude-sonnet-4-5"
+    ANTHROPIC_CLAUDE_OPUS_4 = "litellm:anthropic-claude-opus-4"
+    ANTHROPIC_CLAUDE_OPUS_4_1 = "litellm:anthropic-claude-opus-4-1"
+    ANTHROPIC_CLAUDE_OPUS_4_5 = "litellm:anthropic-claude-opus-4-5"
+    GEMINI_2_0_FLASH = "litellm:gemini-2-0-flash"
+    GEMINI_2_5_FLASH = "litellm:gemini-2-5-flash"
+    GEMINI_2_5_FLASH_LITE = "litellm:gemini-2-5-flash-lite"
+    GEMINI_2_5_FLASH_LITE_PREVIEW_0617 = "litellm:gemini-2-5-flash-lite-preview-06-17"
+    GEMINI_2_5_FLASH_PREVIEW_0520 = "litellm:gemini-2-5-flash-preview-05-20"
+    GEMINI_2_5_PRO = "litellm:gemini-2-5-pro"
+    GEMINI_2_5_PRO_EXP_0325 = "litellm:gemini-2-5-pro-exp-03-25"
+    GEMINI_2_5_PRO_PREVIEW_0605 = "litellm:gemini-2-5-pro-preview-06-05"
+    GEMINI_3_PRO_PREVIEW = "litellm:gemini-3-pro-preview"
+    LITELLM_OPENAI_GPT_5 = "litellm:openai-gpt-5"
+    LITELLM_OPENAI_GPT_5_MINI = "litellm:openai-gpt-5-mini"
+    LITELLM_OPENAI_GPT_5_NANO = "litellm:openai-gpt-5-nano"
+    LITELLM_OPENAI_GPT_5_CHAT = "litellm:openai-gpt-5-chat"
+    LITELLM_OPENAI_GPT_5_PRO = "litellm:openai-gpt-5-pro"
+    LITELLM_OPENAI_GPT_51 = "litellm:openai-gpt-5-1"
+    LITELLM_OPENAI_GPT_51_THINKING = "litellm:openai-gpt-5-1-thinking"
+    LITELLM_OPENAI_O1 = "litellm:openai-o1"
+    LITELLM_OPENAI_O3 = "litellm:openai-o3"
+    LITELLM_OPENAI_O3_DEEP_RESEARCH = "litellm:openai-o3-deep-research"
+    LITELLM_OPENAI_O3_PRO = "litellm:openai-o3-pro"
+    LITELLM_OPENAI_O4_MINI = "litellm:openai-o4-mini"
+    LITELLM_OPENAI_O4_MINI_DEEP_RESEARCH = "litellm:openai-o4-mini-deep-research"
+    LITELLM_OPENAI_GPT_4_1_MINI = "litellm:openai-gpt-4-1-mini"
+    LITELLM_OPENAI_GPT_4_1_NANO = "litellm:openai-gpt-4-1-nano"
+    LITELLM_DEEPSEEK_R1 = "litellm:deepseek-r1"
+    LITELLM_DEEPSEEK_V3 = "litellm:deepseek-v3-1"
+    LITELLM_QWEN_3 = "litellm:qwen-3-235B-A22B"
+    LITELLM_QWEN_3_THINKING = "litellm:qwen-3-235B-A22B-thinking"
 class EncoderName(StrEnum):
@@ -45,6 +98,32 @@ def get_encoder_name(model_name: LanguageModelName) -> EncoderName:
             LMN.AZURE_GPT_4o_2024_0513
             | LMN.AZURE_GPT_4o_2024_0806
             | LMN.AZURE_GPT_4o_MINI_2024_0718
+            | LMN.AZURE_GPT_4o_2024_1120
+            | LMN.AZURE_GPT_5_2025_0807
+            | LMN.AZURE_GPT_5_MINI_2025_0807
+            | LMN.AZURE_GPT_5_NANO_2025_0807
+            | LMN.AZURE_GPT_5_CHAT_2025_0807
+            | LMN.AZURE_GPT_5_PRO_2025_1006
+            | LMN.AZURE_GPT_51_2025_1113
+            | LMN.AZURE_GPT_51_THINKING_2025_1113
+            | LMN.AZURE_GPT_51_CHAT_2025_1113
+            | LMN.AZURE_GPT_51_CODEX_2025_1113
+            | LMN.AZURE_GPT_51_CODEX_MINI_2025_1113
+            | LMN.LITELLM_OPENAI_GPT_5
+            | LMN.LITELLM_OPENAI_GPT_5_MINI
+            | LMN.LITELLM_OPENAI_GPT_5_NANO
+            | LMN.LITELLM_OPENAI_GPT_5_CHAT
+            | LMN.LITELLM_OPENAI_GPT_5_PRO
+            | LMN.LITELLM_OPENAI_GPT_51
+            | LMN.LITELLM_OPENAI_GPT_51_THINKING
+            | LMN.LITELLM_OPENAI_O1
+            | LMN.LITELLM_OPENAI_O3
+            | LMN.LITELLM_OPENAI_O3_DEEP_RESEARCH
+            | LMN.LITELLM_OPENAI_O4_MINI
+            | LMN.LITELLM_OPENAI_O4_MINI_DEEP_RESEARCH
+            | LMN.LITELLM_OPENAI_GPT_4_1_MINI
+            | LMN.LITELLM_OPENAI_GPT_4_1_NANO
+            | LMN.LITELLM_OPENAI_O3_PRO
         ):
             return EncoderName.O200K_BASE
         case _:
@@ -57,22 +136,34 @@ def get_encoder_name(model_name: LanguageModelName) -> EncoderName:
 class LanguageModelProvider(StrEnum):
     AZURE = "AZURE"
     CUSTOM = "CUSTOM"
+    LITELLM = "LITELLM"
 class ModelCapabilities(StrEnum):
+    CHAT_COMPLETIONS_API = "chat_completions_api"
     FUNCTION_CALLING = "function_calling"
     PARALLEL_FUNCTION_CALLING = "parallel_function_calling"
+    REASONING = "reasoning"
     REPRODUCIBLE_OUTPUT = "reproducible_output"
+    RESPONSES_API = "responses_api"
     STRUCTURED_OUTPUT = "structured_output"
-    VISION = "vision"
     STREAMING = "streaming"
-    REASONING = "reasoning"
+    VISION = "vision"
+class TemperatureBounds(BaseModel):
+    min_temperature: float
+    max_temperature: float
 class LanguageModelInfo(BaseModel):
-    name: LanguageModelName | str
-    version: str
-    provider: LanguageModelProvider
+    model_config = get_configuration_dict()
+    name: (
+        Annotated[str, Field(title="Custom Model Name")]
+        | SkipJsonSchema[LanguageModelName]
+    ) = Field(title="Model Name", default=LanguageModelName.AZURE_GPT_4o_2024_1120)
+    provider: LanguageModelProvider = LanguageModelProvider.AZURE
+    version: str = Field(title="Model Version", default="")
     encoder_name: EncoderName = EncoderName.CL100K_BASE
@@ -80,14 +171,36 @@ class LanguageModelInfo(BaseModel):
     token_limits: LanguageModelTokenLimits = LanguageModelTokenLimits(
         token_limit_input=7_000, token_limit_output=1_000
     )
     capabilities: list[ModelCapabilities] = [ModelCapabilities.STREAMING]
-    info_cutoff_at: date | SkipJsonSchema[None] = None
-    published_at: date | SkipJsonSchema[None] = None
-    retirement_at: date | SkipJsonSchema[None] = None
+    info_cutoff_at: (
+        Annotated[date, Field(title="Info Cutoff")]
+        | Annotated[None, Field(title="Info Cutoff Unknown")]
+    ) = None
-    deprecated_at: date | SkipJsonSchema[None] = None
-    retirement_text: str | SkipJsonSchema[None] = None
+    published_at: (
+        Annotated[date, Field(title="Publishing Date")]
+        | Annotated[None, Field(title="Publishing Date Unknown")]
+    ) = None
+    retirement_at: (
+        Annotated[date, Field(title="Retirement Date")]
+        | Annotated[None, Field(title="Retirement Date Unknown")]
+    ) = date(2225, 12, 31)
+    deprecated_at: (
+        Annotated[date, Field(title="Deprecated Date")]
+        | Annotated[None, Field(title="Deprecated Date Unknown")]
+    ) = date(2225, 12, 31)
+    retirement_text: str = "This model is no longer supported."
+    temperature_bounds: (
+        TemperatureBounds | Annotated[None, Field(title="Temperature Bounds Unknown")]
+    ) = None
+    default_options: dict[str, Any] = {}
     @classmethod
     def from_name(cls, model_name: LanguageModelName) -> Self:
@@ -97,7 +210,6 @@ class LanguageModelInfo(BaseModel):
                     name=model_name,
                     provider=LanguageModelProvider.AZURE,
                     capabilities=[
-                        ModelCapabilities.STRUCTURED_OUTPUT,
                         ModelCapabilities.FUNCTION_CALLING,
                         ModelCapabilities.PARALLEL_FUNCTION_CALLING,
                         ModelCapabilities.REPRODUCIBLE_OUTPUT,
@@ -143,16 +255,285 @@ class LanguageModelInfo(BaseModel):
                     deprecated_at=date(2024, 10, 1),
                     retirement_at=date(2025, 6, 6),
                 )
-            case LanguageModelName.AZURE_GPT_4_TURBO_2024_0409:
+            case LanguageModelName.AZURE_GPT_5_2025_0807:
                 return cls(
                     name=model_name,
-                    encoder_name=EncoderName.CL100K_BASE,
+                    provider=LanguageModelProvider.AZURE,
+                    version="2025-08-07",
+                    encoder_name=EncoderName.O200K_BASE,
+                    capabilities=[
+                        ModelCapabilities.CHAT_COMPLETIONS_API,
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.PARALLEL_FUNCTION_CALLING,
+                        ModelCapabilities.REASONING,
+                        ModelCapabilities.RESPONSES_API,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.VISION,
+                    ],
+                    token_limits=LanguageModelTokenLimits(
+                        token_limit_input=272000, token_limit_output=128000
+                    ),
+                    info_cutoff_at=date(2024, 10, 24),
+                    published_at=date(2025, 8, 7),
+                    deprecated_at=date(2026, 8, 7),
+                    retirement_at=date(2026, 8, 7),
+                    temperature_bounds=TemperatureBounds(
+                        min_temperature=1.0, max_temperature=1.0
+                    ),
+                    default_options={
+                        "reasoning_effort": "minimal",
+                    },
+                )
+            case LanguageModelName.AZURE_GPT_5_MINI_2025_0807:
+                return cls(
+                    name=model_name,
+                    provider=LanguageModelProvider.AZURE,
+                    version="2025-08-07",
+                    encoder_name=EncoderName.O200K_BASE,
+                    capabilities=[
+                        ModelCapabilities.CHAT_COMPLETIONS_API,
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.PARALLEL_FUNCTION_CALLING,
+                        ModelCapabilities.REASONING,
+                        ModelCapabilities.RESPONSES_API,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.VISION,
+                    ],
+                    token_limits=LanguageModelTokenLimits(
+                        token_limit_input=272000, token_limit_output=128000
+                    ),
+                    info_cutoff_at=date(2024, 6, 24),
+                    published_at=date(2025, 8, 7),
+                    deprecated_at=date(2026, 8, 7),
+                    retirement_at=date(2026, 8, 7),
+                    temperature_bounds=TemperatureBounds(
+                        min_temperature=1.0, max_temperature=1.0
+                    ),
+                    default_options={
+                        "reasoning_effort": "minimal",
+                    },
+                )
+            case LanguageModelName.AZURE_GPT_5_NANO_2025_0807:
+                return cls(
+                    name=model_name,
+                    provider=LanguageModelProvider.AZURE,
+                    version="2025-08-07",
+                    encoder_name=EncoderName.O200K_BASE,
+                    capabilities=[
+                        ModelCapabilities.CHAT_COMPLETIONS_API,
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.PARALLEL_FUNCTION_CALLING,
+                        ModelCapabilities.REASONING,
+                        ModelCapabilities.RESPONSES_API,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.VISION,
+                    ],
+                    token_limits=LanguageModelTokenLimits(
+                        token_limit_input=272000, token_limit_output=128000
+                    ),
+                    info_cutoff_at=date(2024, 5, 31),
+                    published_at=date(2025, 8, 7),
+                    deprecated_at=date(2026, 8, 7),
+                    retirement_at=date(2026, 8, 7),
+                    temperature_bounds=TemperatureBounds(
+                        min_temperature=1.0, max_temperature=1.0
+                    ),
+                    default_options={
+                        "reasoning_effort": "minimal",
+                    },
+                )
+            case LanguageModelName.AZURE_GPT_5_CHAT_2025_0807:
+                return cls(
+                    name=model_name,
+                    provider=LanguageModelProvider.AZURE,
+                    version="2025-08-07",
+                    encoder_name=EncoderName.O200K_BASE,
+                    capabilities=[
+                        ModelCapabilities.RESPONSES_API,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.VISION,
+                    ],
+                    token_limits=LanguageModelTokenLimits(
+                        token_limit_input=128000, token_limit_output=16384
+                    ),
+                    info_cutoff_at=date(2024, 10, 24),
+                    published_at=date(2025, 8, 7),
+                    deprecated_at=date(2026, 8, 7),
+                    retirement_at=date(2026, 8, 7),
+                )
+            case LanguageModelName.AZURE_GPT_5_PRO_2025_1006:
+                return cls(
+                    name=model_name,
+                    provider=LanguageModelProvider.AZURE,
+                    version="2025-10-06",
+                    encoder_name=EncoderName.O200K_BASE,
+                    capabilities=[
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.REASONING,
+                        ModelCapabilities.RESPONSES_API,
+                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.VISION,
+                    ],
+                    token_limits=LanguageModelTokenLimits(
+                        token_limit_input=272000, token_limit_output=128000
+                    ),
+                    info_cutoff_at=date(2024, 10, 30),
+                    published_at=date(2025, 10, 6),
+                    temperature_bounds=TemperatureBounds(
+                        min_temperature=1.0, max_temperature=1.0
+                    ),
+                )
+            case LanguageModelName.AZURE_GPT_51_2025_1113:
+                return cls(
+                    name=model_name,
+                    provider=LanguageModelProvider.AZURE,
+                    version="2025-11-13",
+                    encoder_name=EncoderName.O200K_BASE,
+                    capabilities=[
+                        ModelCapabilities.CHAT_COMPLETIONS_API,
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.PARALLEL_FUNCTION_CALLING,
+                        ModelCapabilities.REASONING,
+                        ModelCapabilities.RESPONSES_API,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.VISION,
+                    ],
+                    token_limits=LanguageModelTokenLimits(
+                        token_limit_input=272000, token_limit_output=128000
+                    ),
+                    info_cutoff_at=date(2024, 9, 30),
+                    published_at=date(2025, 11, 13),
+                    temperature_bounds=TemperatureBounds(
+                        min_temperature=1.0, max_temperature=1.0
+                    ),
+                    default_options={
+                        "reasoning_effort": None,
+                    },
+                )
+            case LanguageModelName.AZURE_GPT_51_THINKING_2025_1113:
+                return cls(
+                    name=model_name,
+                    provider=LanguageModelProvider.AZURE,
+                    version="2025-11-13",
+                    encoder_name=EncoderName.O200K_BASE,
+                    capabilities=[
+                        ModelCapabilities.CHAT_COMPLETIONS_API,
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.PARALLEL_FUNCTION_CALLING,
+                        ModelCapabilities.REASONING,
+                        ModelCapabilities.RESPONSES_API,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.VISION,
+                    ],
+                    token_limits=LanguageModelTokenLimits(
+                        token_limit_input=272000, token_limit_output=128000
+                    ),
+                    info_cutoff_at=date(2024, 9, 30),
+                    published_at=date(2025, 11, 13),
+                    temperature_bounds=TemperatureBounds(
+                        min_temperature=1.0, max_temperature=1.0
+                    ),
+                    default_options={
+                        "reasoning_effort": "medium",
+                    },
+                )
+            case LanguageModelName.AZURE_GPT_51_CHAT_2025_1113:
+                return cls(
+                    name=model_name,
+                    provider=LanguageModelProvider.AZURE,
+                    version="2025-11-13",
+                    encoder_name=EncoderName.O200K_BASE,
+                    capabilities=[
+                        ModelCapabilities.CHAT_COMPLETIONS_API,
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.PARALLEL_FUNCTION_CALLING,
+                        ModelCapabilities.REASONING,
+                        ModelCapabilities.RESPONSES_API,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.VISION,
+                    ],
+                    token_limits=LanguageModelTokenLimits(
+                        token_limit_input=128_000, token_limit_output=16_384
+                    ),
+                    info_cutoff_at=date(2024, 9, 30),
+                    published_at=date(2025, 11, 13),
+                    temperature_bounds=TemperatureBounds(
+                        min_temperature=1.0, max_temperature=1.0
+                    ),
+                    default_options={
+                        "reasoning_effort": "medium",
+                    },
+                )
+            case LanguageModelName.AZURE_GPT_51_CODEX_2025_1113:
+                return cls(
+                    name=model_name,
+                    provider=LanguageModelProvider.AZURE,
+                    version="2025-11-13",
+                    encoder_name=EncoderName.O200K_BASE,
+                    capabilities=[
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.PARALLEL_FUNCTION_CALLING,
+                        ModelCapabilities.REASONING,
+                        ModelCapabilities.RESPONSES_API,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.VISION,
+                    ],
+                    token_limits=LanguageModelTokenLimits(
+                        token_limit_input=272_000, token_limit_output=128_000
+                    ),
+                    info_cutoff_at=date(2024, 9, 30),
+                    published_at=date(2025, 11, 13),
+                    temperature_bounds=TemperatureBounds(
+                        min_temperature=1.0, max_temperature=1.0
+                    ),
+                    default_options={
+                        "reasoning_effort": "medium",
+                    },
+                )
+            case LanguageModelName.AZURE_GPT_51_CODEX_MINI_2025_1113:
+                return cls(
+                    name=model_name,
+                    provider=LanguageModelProvider.AZURE,
+                    version="2025-11-13",
+                    encoder_name=EncoderName.O200K_BASE,
                     capabilities=[
                         ModelCapabilities.FUNCTION_CALLING,
                         ModelCapabilities.PARALLEL_FUNCTION_CALLING,
+                        ModelCapabilities.REASONING,
+                        ModelCapabilities.RESPONSES_API,
+                        ModelCapabilities.STREAMING,
                         ModelCapabilities.STRUCTURED_OUTPUT,
                         ModelCapabilities.VISION,
+                    ],
+                    token_limits=LanguageModelTokenLimits(
+                        token_limit_input=272_000, token_limit_output=128_000
+                    ),
+                    info_cutoff_at=date(2024, 9, 30),
+                    published_at=date(2025, 11, 13),
+                    temperature_bounds=TemperatureBounds(
+                        min_temperature=1.0, max_temperature=1.0
+                    ),
+                    default_options={
+                        "reasoning_effort": "medium",
+                    },
+                )
+            case LanguageModelName.AZURE_GPT_4_TURBO_2024_0409:
+                return cls(
+                    name=model_name,
+                    encoder_name=EncoderName.CL100K_BASE,
+                    capabilities=[
+                        ModelCapabilities.CHAT_COMPLETIONS_API,
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.PARALLEL_FUNCTION_CALLING,
                         ModelCapabilities.STREAMING,
+                        ModelCapabilities.VISION,
                     ],
                     provider=LanguageModelProvider.AZURE,
                     version="turbo-2024-04-09",
@@ -167,7 +548,7 @@ class LanguageModelInfo(BaseModel):
                     name=model_name,
                     encoder_name=EncoderName.O200K_BASE,
                     capabilities=[
-                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.CHAT_COMPLETIONS_API,
                         ModelCapabilities.FUNCTION_CALLING,
                         ModelCapabilities.PARALLEL_FUNCTION_CALLING,
                         ModelCapabilities.STREAMING,
@@ -186,6 +567,7 @@ class LanguageModelInfo(BaseModel):
                     name=model_name,
                     encoder_name=EncoderName.O200K_BASE,
                     capabilities=[
+                        ModelCapabilities.CHAT_COMPLETIONS_API,
                         ModelCapabilities.STRUCTURED_OUTPUT,
                         ModelCapabilities.FUNCTION_CALLING,
                         ModelCapabilities.PARALLEL_FUNCTION_CALLING,
@@ -205,6 +587,7 @@ class LanguageModelInfo(BaseModel):
                     name=model_name,
                     encoder_name=EncoderName.O200K_BASE,
                     capabilities=[
+                        ModelCapabilities.CHAT_COMPLETIONS_API,
                         ModelCapabilities.STRUCTURED_OUTPUT,
                         ModelCapabilities.FUNCTION_CALLING,
                         ModelCapabilities.PARALLEL_FUNCTION_CALLING,
@@ -223,7 +606,7 @@ class LanguageModelInfo(BaseModel):
                 return cls(
                     name=model_name,
                     capabilities=[
-                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.CHAT_COMPLETIONS_API,
                         ModelCapabilities.FUNCTION_CALLING,
                         ModelCapabilities.PARALLEL_FUNCTION_CALLING,
                         ModelCapabilities.STREAMING,
@@ -242,6 +625,7 @@ class LanguageModelInfo(BaseModel):
                 return cls(
                     name=model_name,
                     capabilities=[
+                        ModelCapabilities.CHAT_COMPLETIONS_API,
                         ModelCapabilities.STRUCTURED_OUTPUT,
                         ModelCapabilities.FUNCTION_CALLING,
                         ModelCapabilities.STREAMING,
@@ -256,16 +640,21 @@ class LanguageModelInfo(BaseModel):
                     ),
                     info_cutoff_at=date(2023, 10, 1),
                     published_at=date(2024, 9, 12),
+                    temperature_bounds=TemperatureBounds(
+                        min_temperature=1.0, max_temperature=1.0
+                    ),
                 )
             case LanguageModelName.AZURE_o1_2024_1217:
                 return cls(
                     name=model_name,
                     capabilities=[
-                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.CHAT_COMPLETIONS_API,
                         ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.REASONING,
+                        ModelCapabilities.RESPONSES_API,
                         ModelCapabilities.STREAMING,
+                        ModelCapabilities.STRUCTURED_OUTPUT,
                         ModelCapabilities.VISION,
-                        ModelCapabilities.REASONING,
                     ],
                     provider=LanguageModelProvider.AZURE,
                     version="2024-12-17",
@@ -275,15 +664,20 @@ class LanguageModelInfo(BaseModel):
                     ),
                     info_cutoff_at=date(2023, 10, 1),
                     published_at=date(2024, 12, 17),
+                    temperature_bounds=TemperatureBounds(
+                        min_temperature=1.0, max_temperature=1.0
+                    ),
                 )
             case LanguageModelName.AZURE_o3_MINI_2025_0131:
                 return cls(
                     name=model_name,
                     capabilities=[
-                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.CHAT_COMPLETIONS_API,
                         ModelCapabilities.FUNCTION_CALLING,
-                        ModelCapabilities.STREAMING,
                         ModelCapabilities.REASONING,
+                        ModelCapabilities.RESPONSES_API,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.STRUCTURED_OUTPUT,
                     ],
                     provider=LanguageModelProvider.AZURE,
                     version="2025-01-31",
@@ -293,13 +687,65 @@ class LanguageModelInfo(BaseModel):
                     ),
                     info_cutoff_at=date(2023, 10, 1),
                     published_at=date(2025, 1, 31),
+                    temperature_bounds=TemperatureBounds(
+                        min_temperature=1.0, max_temperature=1.0
+                    ),
                 )
-            case LanguageModelName.AZURE_GPT_45_PREVIEW_2025_0227:
+            case LanguageModelName.AZURE_o3_2025_0416:
+                return cls(
+                    name=model_name,
+                    capabilities=[
+                        ModelCapabilities.CHAT_COMPLETIONS_API,
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.REASONING,
+                        ModelCapabilities.RESPONSES_API,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.VISION,
+                    ],
+                    provider=LanguageModelProvider.AZURE,
+                    version="2025-04-16",
+                    encoder_name=EncoderName.O200K_BASE,
+                    token_limits=LanguageModelTokenLimits(
+                        token_limit_input=200_000, token_limit_output=100_000
+                    ),
+                    info_cutoff_at=date(2024, 5, 31),
+                    published_at=date(2025, 4, 16),
+                    temperature_bounds=TemperatureBounds(
+                        min_temperature=1.0, max_temperature=1.0
+                    ),
+                )
+            case LanguageModelName.AZURE_o4_MINI_2025_0416:
                 return cls(
                     name=model_name,
                     capabilities=[
+                        ModelCapabilities.CHAT_COMPLETIONS_API,
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.REASONING,
+                        ModelCapabilities.RESPONSES_API,
+                        ModelCapabilities.STREAMING,
                         ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.VISION,
+                    ],
+                    provider=LanguageModelProvider.AZURE,
+                    version="2025-04-16",
+                    encoder_name=EncoderName.O200K_BASE,
+                    token_limits=LanguageModelTokenLimits(
+                        token_limit_input=200_000, token_limit_output=100_000
+                    ),
+                    info_cutoff_at=date(2024, 5, 31),
+                    published_at=date(2025, 4, 16),
+                    temperature_bounds=TemperatureBounds(
+                        min_temperature=1.0, max_temperature=1.0
+                    ),
+                )
+            case LanguageModelName.AZURE_GPT_45_PREVIEW_2025_0227:
+                return cls(
+                    name=model_name,
+                    capabilities=[
+                        ModelCapabilities.CHAT_COMPLETIONS_API,
                         ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.STRUCTURED_OUTPUT,
                         ModelCapabilities.STREAMING,
                         ModelCapabilities.VISION,
                     ],
@@ -316,9 +762,11 @@ class LanguageModelInfo(BaseModel):
                 return cls(
                     name=model_name,
                     capabilities=[
-                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.CHAT_COMPLETIONS_API,
                         ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.RESPONSES_API,
                         ModelCapabilities.STREAMING,
+                        ModelCapabilities.STRUCTURED_OUTPUT,
                         ModelCapabilities.VISION,
                     ],
                     provider=LanguageModelProvider.AZURE,
@@ -330,34 +778,828 @@ class LanguageModelInfo(BaseModel):
                     info_cutoff_at=date(2024, 5, 31),
                     published_at=date(2025, 4, 14),
                 )
-            case _:
-                if isinstance(model_name, LanguageModelName):
-                    raise ValueError(
-                        f"{model_name} is not supported. Please add model information in toolkit."
-                    )
+            case LanguageModelName.AZURE_GPT_41_MINI_2025_0414:
                 return cls(
                     name=model_name,
-                    version="custom",
-                    provider=LanguageModelProvider.CUSTOM,
+                    capabilities=[
+                        ModelCapabilities.CHAT_COMPLETIONS_API,
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.RESPONSES_API,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.VISION,
+                    ],
+                    provider=LanguageModelProvider.AZURE,
+                    version="2025-04-14",
+                    encoder_name=EncoderName.O200K_BASE,
+                    token_limits=LanguageModelTokenLimits(
+                        token_limit_input=1_047_576, token_limit_output=32_768
+                    ),
+                    info_cutoff_at=date(2024, 5, 31),
+                    published_at=date(2025, 4, 14),
                 )
+            case LanguageModelName.AZURE_GPT_41_NANO_2025_0414:
+                return cls(
+                    name=model_name,
+                    capabilities=[
+                        ModelCapabilities.CHAT_COMPLETIONS_API,
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.RESPONSES_API,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.VISION,
+                    ],
+                    provider=LanguageModelProvider.AZURE,
+                    version="2025-04-14",
+                    encoder_name=EncoderName.O200K_BASE,
+                    token_limits=LanguageModelTokenLimits(
+                        token_limit_input=1_047_576, token_limit_output=32_768
+                    ),
+                    info_cutoff_at=date(2024, 5, 31),
+                    published_at=date(2025, 4, 14),
+                )
+            case LanguageModelName.ANTHROPIC_CLAUDE_3_7_SONNET:
+                return cls(
+                    name=model_name,
+                    capabilities=[
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.VISION,
+                    ],
+                    provider=LanguageModelProvider.LITELLM,
+                    version="claude-3-7-sonnet",
+                    encoder_name=EncoderName.O200K_BASE,  # TODO: Update encoder with litellm
+                    token_limits=LanguageModelTokenLimits(
+                        # Input limit is 200_000, we leave 20_000 tokens as buffer due to tokenizer mismatch
+                        token_limit_input=180_000,
+                        token_limit_output=64_000,
+                    ),
+                    info_cutoff_at=date(2024, 10, 31),
+                    published_at=date(2025, 2, 24),
+                )
+            case LanguageModelName.ANTHROPIC_CLAUDE_3_7_SONNET_THINKING:
+                return cls(
+                    name=model_name,
+                    capabilities=[
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.VISION,
+                        ModelCapabilities.REASONING,
+                    ],
+                    provider=LanguageModelProvider.LITELLM,
+                    version="claude-3-7-sonnet-thinking",
+                    encoder_name=EncoderName.O200K_BASE,  # TODO: Update encoder with litellm
+                    token_limits=LanguageModelTokenLimits(
+                        # Input limit is 200_000, we leave 20_000 tokens as buffer due to tokenizer mismatch
+                        token_limit_input=180_000,
+                        token_limit_output=64_000,
+                    ),
+                    info_cutoff_at=date(2024, 10, 31),
+                    published_at=date(2025, 2, 24),
+                )
+            case LanguageModelName.ANTHROPIC_CLAUDE_HAIKU_4_5:
+                return cls(
+                    name=model_name,
+                    capabilities=[
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.VISION,
+                        ModelCapabilities.REASONING,
+                    ],
+                    provider=LanguageModelProvider.LITELLM,
+                    version="claude-haiku-4-5",
+                    encoder_name=EncoderName.O200K_BASE,  # TODO: Update encoder with litellm
+                    token_limits=LanguageModelTokenLimits(
+                        # Input limit is 200_000, we leave 20_000 tokens as buffer due to tokenizer mismatch
+                        token_limit_input=180_000,
+                        token_limit_output=64_000,
+                    ),
+                    info_cutoff_at=date(2025, 2, 1),
+                    published_at=date(2025, 10, 1),
+                )
+            case LanguageModelName.ANTHROPIC_CLAUDE_SONNET_4:
+                return cls(
+                    name=model_name,
+                    capabilities=[
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.VISION,
+                        ModelCapabilities.REASONING,
+                    ],
+                    provider=LanguageModelProvider.LITELLM,
+                    version="claude-sonnet-4",
+                    encoder_name=EncoderName.O200K_BASE,  # TODO: Update encoder with litellm
+                    token_limits=LanguageModelTokenLimits(
+                        # Input limit is 200_000, we leave 20_000 tokens as buffer due to tokenizer mismatch
+                        token_limit_input=180_000,
+                        token_limit_output=64_000,
+                    ),
+                    info_cutoff_at=date(2025, 3, 1),
+                    published_at=date(2025, 5, 1),
+                )
+            case LanguageModelName.ANTHROPIC_CLAUDE_SONNET_4_5:
+                return cls(
+                    name=model_name,
+                    capabilities=[
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.VISION,
+                        ModelCapabilities.REASONING,
+                    ],
+                    provider=LanguageModelProvider.LITELLM,
+                    version="claude-sonnet-4-5",
+                    encoder_name=EncoderName.O200K_BASE,  # TODO: Update encoder with litellm
+                    token_limits=LanguageModelTokenLimits(
+                        # Input limit is 200_000, we leave 20_000 tokens as buffer due to tokenizer mismatch
+                        token_limit_input=180_000,
+                        token_limit_output=64_000,
+                    ),
+                    info_cutoff_at=date(2025, 7, 1),
+                    published_at=date(2025, 9, 29),
+                )
+            case LanguageModelName.ANTHROPIC_CLAUDE_OPUS_4:
+                return cls(
+                    name=model_name,
+                    capabilities=[
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.VISION,
+                        ModelCapabilities.REASONING,
+                    ],
+                    provider=LanguageModelProvider.LITELLM,
+                    version="claude-opus-4",
+                    encoder_name=EncoderName.O200K_BASE,  # TODO: Update encoder with litellm
+                    token_limits=LanguageModelTokenLimits(
+                        # Input limit is 200_000, we leave 20_000 tokens as buffer due to tokenizer mismatch
+                        token_limit_input=180_000,
+                        token_limit_output=32_000,
+                    ),
+                    info_cutoff_at=date(2025, 3, 1),
+                    published_at=date(2025, 5, 1),
+                )
+            case LanguageModelName.ANTHROPIC_CLAUDE_OPUS_4_1:
+                return cls(
+                    name=model_name,
+                    capabilities=[
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.VISION,
+                        ModelCapabilities.REASONING,
+                    ],
+                    provider=LanguageModelProvider.LITELLM,
+                    version="claude-opus-4-1",
+                    encoder_name=EncoderName.O200K_BASE,  # TODO: Update encoder with litellm
+                    token_limits=LanguageModelTokenLimits(
+                        # Input limit is 200_000, we leave 20_000 tokens as buffer due to tokenizer mismatch
+                        token_limit_input=180_000,
+                        token_limit_output=32_000,
+                    ),
+                    info_cutoff_at=date(2025, 3, 1),
+                    published_at=date(2025, 5, 1),
+                )
+            case LanguageModelName.ANTHROPIC_CLAUDE_OPUS_4_5:
+                return cls(
+                    name=model_name,
+                    capabilities=[
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.VISION,
+                        ModelCapabilities.REASONING,
+                    ],
+                    provider=LanguageModelProvider.LITELLM,
+                    version="claude-opus-4-5",
+                    encoder_name=EncoderName.O200K_BASE,  # TODO: Update encoder with litellm
+                    token_limits=LanguageModelTokenLimits(
+                        # Input limit is 200_000, we leave 20_000 tokens as buffer due to tokenizer mismatch
+                        token_limit_input=180_000,
+                        token_limit_output=64_000,
+                    ),
+                    info_cutoff_at=date(2025, 8, 1),
+                    published_at=date(2025, 11, 13),
+                )
+            case LanguageModelName.GEMINI_2_0_FLASH:
+                return cls(
+                    name=model_name,
+                    capabilities=[
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.VISION,
+                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.REASONING,
+                    ],
+                    provider=LanguageModelProvider.LITELLM,
+                    version="gemini-2-0-flash",
+                    encoder_name=EncoderName.O200K_BASE,  # TODO: Update encoder with litellm
+                    token_limits=LanguageModelTokenLimits(
+                        token_limit_input=1_048_576, token_limit_output=8_192
+                    ),
+                    info_cutoff_at=date(2024, 8, 1),
+                    published_at=date(2025, 2, 1),
+                )
+            case LanguageModelName.GEMINI_2_5_FLASH:
+                return cls(
+                    name=model_name,
+                    capabilities=[
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.VISION,
+                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.REASONING,
+                    ],
+                    provider=LanguageModelProvider.LITELLM,
+                    version="gemini-2-5-flash",
+                    encoder_name=EncoderName.O200K_BASE,  # TODO:Replace with LLM tokenizer
+                    token_limits=LanguageModelTokenLimits(
+                        token_limit_input=1_048_576, token_limit_output=65_536
+                    ),
+                    info_cutoff_at=date(2025, 1, day=1),
+                    published_at=date(2025, 4, 1),
+                )
+            case LanguageModelName.GEMINI_2_5_FLASH_LITE:
+                return cls(
+                    name=model_name,
+                    capabilities=[
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.VISION,
+                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.REASONING,
+                    ],
+                    provider=LanguageModelProvider.LITELLM,
+                    version="gemini-2-5-flash-lite",
+                    encoder_name=EncoderName.O200K_BASE,  # TODO:Replace with LLM tokenizer
+                    token_limits=LanguageModelTokenLimits(
+                        token_limit_input=1_048_576, token_limit_output=65_536
+                    ),
+                    info_cutoff_at=date(2025, 1, day=1),
+                    published_at=date(2025, 7, 1),
+                )
+            case LanguageModelName.GEMINI_2_5_FLASH_LITE_PREVIEW_0617:
+                return cls(
+                    name=model_name,
+                    capabilities=[
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.VISION,
+                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.REASONING,
+                    ],
+                    provider=LanguageModelProvider.LITELLM,
+                    version="gemini-2-5-flash-lite-preview-06-17",
+                    encoder_name=EncoderName.O200K_BASE,  # TODO:Replace with LLM tokenizer
+                    token_limits=LanguageModelTokenLimits(
+                        token_limit_input=1_000_000, token_limit_output=64_000
+                    ),
+                    info_cutoff_at=date(2025, 1, day=1),
+                    published_at=date(2025, 6, 17),
+                )
+            case LanguageModelName.GEMINI_2_5_FLASH_PREVIEW_0520:
+                return cls(
+                    name=model_name,
+                    capabilities=[
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.VISION,
+                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.REASONING,
+                    ],
+                    provider=LanguageModelProvider.LITELLM,
+                    version="gemini-2-5-flash-preview-05-20",
+                    encoder_name=EncoderName.O200K_BASE,  # TODO:Replace with LLM tokenizer
+                    token_limits=LanguageModelTokenLimits(
+                        token_limit_input=1_048_576, token_limit_output=65_536
+                    ),
+                    info_cutoff_at=date(2025, 1, day=1),
+                    published_at=date(2025, 4, 1),
+                )
+            case LanguageModelName.GEMINI_2_5_PRO:
+                return cls(
+                    name=model_name,
+                    capabilities=[
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.VISION,
+                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.REASONING,
+                    ],
+                    provider=LanguageModelProvider.LITELLM,
+                    version="gemini-2-5-pro",
+                    encoder_name=EncoderName.O200K_BASE,  # TODO: Update encoder with litellm
+                    token_limits=LanguageModelTokenLimits(
+                        token_limit_input=1_048_576, token_limit_output=65_536
+                    ),
+                    info_cutoff_at=date(2025, 1, day=1),
+                    published_at=date(2025, 6, 17),
+                )
+            case LanguageModelName.GEMINI_2_5_PRO_EXP_0325:
+                return cls(
+                    name=model_name,
+                    capabilities=[
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.VISION,
+                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.REASONING,
+                    ],
+                    provider=LanguageModelProvider.LITELLM,
+                    version="gemini-2-5-pro-exp-0325",
+                    encoder_name=EncoderName.O200K_BASE,  # TODO: Update encoder with litellm
+                    token_limits=LanguageModelTokenLimits(
+                        token_limit_input=1_048_576, token_limit_output=65_536
+                    ),
+                    info_cutoff_at=date(2025, 1, day=1),
+                    published_at=date(2025, 3, 1),
+                )
+            case LanguageModelName.GEMINI_2_5_PRO_PREVIEW_0605:
+                return cls(
+                    name=model_name,
+                    capabilities=[
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.VISION,
+                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.REASONING,
+                    ],
+                    provider=LanguageModelProvider.LITELLM,
+                    version="gemini-2-5-pro-preview-06-05",
+                    encoder_name=EncoderName.O200K_BASE,  # TODO: Update encoder with litellm
+                    token_limits=LanguageModelTokenLimits(
+                        token_limit_input=1_048_576, token_limit_output=65_536
+                    ),
+                    info_cutoff_at=date(2025, 1, day=1),
+                    published_at=date(2025, 6, 5),
+                )
+            case LanguageModelName.GEMINI_3_PRO_PREVIEW:
+                return cls(
+                    name=model_name,
+                    capabilities=[
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.VISION,
+                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.REASONING,
+                    ],
+                    provider=LanguageModelProvider.LITELLM,
+                    version="gemini-3-pro-preview",
+                    encoder_name=EncoderName.O200K_BASE,  # TODO: Update encoder with litellm
+                    token_limits=LanguageModelTokenLimits(
+                        token_limit_input=1_048_576, token_limit_output=65_536
+                    ),
+                    info_cutoff_at=date(2025, 1, day=1),
+                    published_at=date(2025, 11, 13),
+                )
+            case LanguageModelName.LITELLM_OPENAI_GPT_5:
+                return cls(
+                    name=model_name,
+                    provider=LanguageModelProvider.LITELLM,
+                    version="gpt-5",
+                    encoder_name=EncoderName.O200K_BASE,
+                    capabilities=[
+                        ModelCapabilities.CHAT_COMPLETIONS_API,
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.PARALLEL_FUNCTION_CALLING,
+                        ModelCapabilities.REASONING,
+                        ModelCapabilities.RESPONSES_API,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.VISION,
+                    ],
+                    token_limits=LanguageModelTokenLimits(
+                        token_limit_input=272000, token_limit_output=128000
+                    ),
+                    info_cutoff_at=date(2024, 10, 24),
+                    published_at=date(2025, 8, 7),
+                    deprecated_at=date(2026, 8, 7),
+                    retirement_at=date(2026, 8, 7),
+                    temperature_bounds=TemperatureBounds(
+                        min_temperature=1.0, max_temperature=1.0
+                    ),
+                    default_options={
+                        "reasoning_effort": "minimal",
+                    },
+                )
+            case LanguageModelName.LITELLM_OPENAI_GPT_5_MINI:
+                return cls(
+                    name=model_name,
+                    provider=LanguageModelProvider.LITELLM,
+                    version="gpt-5-mini",
+                    encoder_name=EncoderName.O200K_BASE,
+                    capabilities=[
+                        ModelCapabilities.CHAT_COMPLETIONS_API,
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.PARALLEL_FUNCTION_CALLING,
+                        ModelCapabilities.REASONING,
+                        ModelCapabilities.RESPONSES_API,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.VISION,
+                    ],
+                    token_limits=LanguageModelTokenLimits(
+                        token_limit_input=272000, token_limit_output=128000
+                    ),
+                    info_cutoff_at=date(2024, 6, 24),
+                    published_at=date(2025, 8, 7),
+                    deprecated_at=date(2026, 8, 7),
+                    retirement_at=date(2026, 8, 7),
+                    temperature_bounds=TemperatureBounds(
+                        min_temperature=1.0, max_temperature=1.0
+                    ),
+                    default_options={
+                        "reasoning_effort": "minimal",
+                    },
+                )
+            case LanguageModelName.LITELLM_OPENAI_GPT_5_NANO:
+                return cls(
+                    name=model_name,
+                    provider=LanguageModelProvider.LITELLM,
+                    version="gpt-5-nano",
+                    encoder_name=EncoderName.O200K_BASE,
+                    capabilities=[
+                        ModelCapabilities.CHAT_COMPLETIONS_API,
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.PARALLEL_FUNCTION_CALLING,
+                        ModelCapabilities.REASONING,
+                        ModelCapabilities.RESPONSES_API,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.VISION,
+                    ],
+                    token_limits=LanguageModelTokenLimits(
+                        token_limit_input=272000, token_limit_output=128000
+                    ),
+                    info_cutoff_at=date(2024, 5, 31),
+                    published_at=date(2025, 8, 7),
+                    deprecated_at=date(2026, 8, 7),
+                    retirement_at=date(2026, 8, 7),
+                    temperature_bounds=TemperatureBounds(
+                        min_temperature=1.0, max_temperature=1.0
+                    ),
+                    default_options={
+                        "reasoning_effort": "minimal",
+                    },
+                )
+            case LanguageModelName.LITELLM_OPENAI_GPT_5_CHAT:
+                return cls(
+                    name=model_name,
+                    provider=LanguageModelProvider.LITELLM,
+                    version="gpt-5-chat",
+                    encoder_name=EncoderName.O200K_BASE,
+                    capabilities=[
+                        ModelCapabilities.RESPONSES_API,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.VISION,
+                    ],
+                    token_limits=LanguageModelTokenLimits(
+                        token_limit_input=128000, token_limit_output=16384
+                    ),
+                    info_cutoff_at=date(2024, 10, 24),
+                    published_at=date(2025, 8, 7),
+                    deprecated_at=date(2026, 8, 7),
+                    retirement_at=date(2026, 8, 7),
+                )
+            case LanguageModelName.LITELLM_OPENAI_GPT_5_PRO:
+                return cls(
+                    name=model_name,
+                    provider=LanguageModelProvider.LITELLM,
+                    version="2025-10-06",
+                    encoder_name=EncoderName.O200K_BASE,
+                    capabilities=[
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.REASONING,
+                        ModelCapabilities.RESPONSES_API,
+                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.VISION,
+                    ],
+                    token_limits=LanguageModelTokenLimits(
+                        token_limit_input=272000, token_limit_output=128000
+                    ),
+                    info_cutoff_at=date(2024, 10, 30),
+                    published_at=date(2025, 10, 6),
+                    temperature_bounds=TemperatureBounds(
+                        min_temperature=1.0, max_temperature=1.0
+                    ),
+                )
+            case LanguageModelName.LITELLM_OPENAI_GPT_51:
+                return cls(
+                    name=model_name,
+                    provider=LanguageModelProvider.LITELLM,
+                    version="2025-11-13",
+                    encoder_name=EncoderName.O200K_BASE,
+                    capabilities=[
+                        ModelCapabilities.CHAT_COMPLETIONS_API,
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.PARALLEL_FUNCTION_CALLING,
+                        ModelCapabilities.REASONING,
+                        ModelCapabilities.RESPONSES_API,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.VISION,
+                    ],
+                    token_limits=LanguageModelTokenLimits(
+                        token_limit_input=272000, token_limit_output=128000
+                    ),
+                    info_cutoff_at=date(2024, 9, 30),
+                    published_at=date(2025, 11, 13),
+                    temperature_bounds=TemperatureBounds(
+                        min_temperature=1.0, max_temperature=1.0
+                    ),
+                    default_options={
+                        "reasoning_effort": None,
+                    },
+                )
+            case LanguageModelName.LITELLM_OPENAI_GPT_51_THINKING:
+                return cls(
+                    name=model_name,
+                    provider=LanguageModelProvider.LITELLM,
+                    version="2025-11-13",
+                    encoder_name=EncoderName.O200K_BASE,
+                    capabilities=[
+                        ModelCapabilities.CHAT_COMPLETIONS_API,
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.PARALLEL_FUNCTION_CALLING,
+                        ModelCapabilities.REASONING,
+                        ModelCapabilities.RESPONSES_API,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.VISION,
+                    ],
+                    token_limits=LanguageModelTokenLimits(
+                        token_limit_input=272000, token_limit_output=128000
+                    ),
+                    info_cutoff_at=date(2024, 9, 30),
+                    published_at=date(2025, 11, 13),
+                    temperature_bounds=TemperatureBounds(
+                        min_temperature=1.0, max_temperature=1.0
+                    ),
+                    default_options={
+                        "reasoning_effort": "medium",
+                    },
+                )
+            case LanguageModelName.LITELLM_OPENAI_O1:
+                return cls(
+                    name=model_name,
+                    provider=LanguageModelProvider.LITELLM,
+                    version="2024-12-17",
+                    encoder_name=EncoderName.O200K_BASE,
+                    capabilities=[
+                        ModelCapabilities.CHAT_COMPLETIONS_API,
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.REASONING,
+                        ModelCapabilities.RESPONSES_API,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.VISION,
+                    ],
+                    token_limits=LanguageModelTokenLimits(
+                        token_limit_input=200_000, token_limit_output=100_000
+                    ),
+                    info_cutoff_at=date(2023, 10, 1),
+                    published_at=date(2024, 12, 17),
+                    temperature_bounds=TemperatureBounds(
+                        min_temperature=1.0, max_temperature=1.0
+                    ),
+                )
+            case LanguageModelName.LITELLM_OPENAI_O3:
+                return cls(
+                    name=model_name,
+                    provider=LanguageModelProvider.LITELLM,
+                    version="2025-04-16",
+                    encoder_name=EncoderName.O200K_BASE,
+                    capabilities=[
+                        ModelCapabilities.CHAT_COMPLETIONS_API,
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.REASONING,
+                        ModelCapabilities.RESPONSES_API,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.VISION,
+                    ],
+                    token_limits=LanguageModelTokenLimits(
+                        token_limit_input=200_000, token_limit_output=100_000
+                    ),
+                    temperature_bounds=TemperatureBounds(
+                        min_temperature=1.0, max_temperature=1.0
+                    ),
+                    published_at=date(2025, 4, 16),
+                    info_cutoff_at=date(2024, 6, 1),
+                )
+            case LanguageModelName.LITELLM_OPENAI_O3_DEEP_RESEARCH:
+                return cls(
+                    name=model_name,
+                    provider=LanguageModelProvider.LITELLM,
+                    version="2025-06-26",
+                    encoder_name=EncoderName.O200K_BASE,
+                    capabilities=[
+                        ModelCapabilities.CHAT_COMPLETIONS_API,
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.REASONING,
+                        ModelCapabilities.RESPONSES_API,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.VISION,
+                    ],
+                    token_limits=LanguageModelTokenLimits(
+                        token_limit_input=200_000, token_limit_output=100_000
+                    ),
+                    published_at=date(2025, 4, 16),
+                    info_cutoff_at=date(2024, 6, 1),
+                )
+            case LanguageModelName.LITELLM_OPENAI_O3_PRO:
+                return cls(
+                    name=model_name,
+                    provider=LanguageModelProvider.LITELLM,
+                    version="2025-06-10",
+                    encoder_name=EncoderName.O200K_BASE,
+                    capabilities=[
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.REASONING,
+                        ModelCapabilities.STRUCTURED_OUTPUT,
+                    ],
+                    token_limits=LanguageModelTokenLimits(
+                        token_limit_input=200_000, token_limit_output=100_000
+                    ),
+                    published_at=date(2025, 6, 10),
+                    info_cutoff_at=date(2024, 6, 1),
+                )
+            case LanguageModelName.LITELLM_OPENAI_O4_MINI:
+                return cls(
+                    name=model_name,
+                    provider=LanguageModelProvider.LITELLM,
+                    version="2025-04-16",
+                    encoder_name=EncoderName.O200K_BASE,
+                    capabilities=[
+                        ModelCapabilities.CHAT_COMPLETIONS_API,
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.REASONING,
+                        ModelCapabilities.RESPONSES_API,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.VISION,
+                    ],
+                    token_limits=LanguageModelTokenLimits(
+                        token_limit_input=200_000, token_limit_output=100_000
+                    ),
+                    published_at=date(2025, 4, 16),
+                    info_cutoff_at=date(2024, 6, 1),
+                    temperature_bounds=TemperatureBounds(
+                        min_temperature=1.0, max_temperature=1.0
+                    ),
+                )
+            case LanguageModelName.LITELLM_OPENAI_O4_MINI_DEEP_RESEARCH:
+                return cls(
+                    name=model_name,
+                    provider=LanguageModelProvider.LITELLM,
+                    version="2025-06-26",
+                    encoder_name=EncoderName.O200K_BASE,
+                    capabilities=[
+                        ModelCapabilities.CHAT_COMPLETIONS_API,
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.REASONING,
+                        ModelCapabilities.RESPONSES_API,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.VISION,
+                    ],
+                    token_limits=LanguageModelTokenLimits(
+                        token_limit_input=200_000, token_limit_output=100_000
+                    ),
+                    published_at=date(2025, 4, 16),
+                    info_cutoff_at=date(2024, 6, 1),
+                )
+            case LanguageModelName.LITELLM_OPENAI_GPT_4_1_MINI:
+                return cls(
+                    name=model_name,
+                    provider=LanguageModelProvider.LITELLM,
+                    version="2025-04-14",
+                    encoder_name=EncoderName.O200K_BASE,
+                    published_at=date(2025, 4, 14),
+                    info_cutoff_at=date(2024, 6, 1),
+                    token_limits=LanguageModelTokenLimits(
+                        token_limit_input=1_047_576, token_limit_output=32_768
+                    ),
+                    capabilities=[
+                        ModelCapabilities.CHAT_COMPLETIONS_API,
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.RESPONSES_API,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.VISION,
+                    ],
+                )
+            case LanguageModelName.LITELLM_OPENAI_GPT_4_1_NANO:
+                return cls(
+                    name=model_name,
+                    provider=LanguageModelProvider.LITELLM,
+                    version="2025-04-14",
+                    encoder_name=EncoderName.O200K_BASE,
+                    published_at=date(2025, 4, 14),
+                    info_cutoff_at=date(2024, 6, 1),
+                    token_limits=LanguageModelTokenLimits(
+                        token_limit_input=1_047_576, token_limit_output=32_768
+                    ),
+                    capabilities=[
+                        ModelCapabilities.CHAT_COMPLETIONS_API,
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.RESPONSES_API,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.VISION,
+                    ],
+                )
+            case LanguageModelName.LITELLM_DEEPSEEK_R1:
+                return cls(
+                    name=model_name,
+                    provider=LanguageModelProvider.LITELLM,
+                    version="deepseek-r1",
+                    capabilities=[
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.REASONING,
+                    ],
+                    token_limits=LanguageModelTokenLimits(
+                        token_limit_input=64_000, token_limit_output=4_000
+                    ),
+                    published_at=date(2025, 1, 25),
+                )
+            case LanguageModelName.LITELLM_DEEPSEEK_V3:
+                return cls(
+                    name=model_name,
+                    provider=LanguageModelProvider.LITELLM,
+                    version="deepseek-v3-1",
+                    capabilities=[
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.REASONING,
+                    ],
+                    token_limits=LanguageModelTokenLimits(
+                        token_limit_input=128_000, token_limit_output=4_000
+                    ),
+                    published_at=date(2025, 8, 1),
+                )
+            case LanguageModelName.LITELLM_QWEN_3:
+                return cls(
+                    name=model_name,
+                    provider=LanguageModelProvider.LITELLM,
+                    version="qwen-3",
+                    capabilities=[
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.REASONING,
+                    ],
+                    published_at=date(2025, 4, 29),
+                    token_limits=LanguageModelTokenLimits(
+                        token_limit_input=256_000, token_limit_output=32_768
+                    ),
+                )
+            case LanguageModelName.LITELLM_QWEN_3_THINKING:
+                return cls(
+                    name=model_name,
+                    provider=LanguageModelProvider.LITELLM,
+                    version="qwen-3-thinking",
+                    capabilities=[
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.REASONING,
+                    ],
+                    token_limits=LanguageModelTokenLimits(
+                        token_limit_input=256_000, token_limit_output=32_768
+                    ),
+                    published_at=date(2025, 7, 25),
+                )
+            case _:
+                if isinstance(model_name, LanguageModelName):
+                    raise ValueError(
+                        f"{model_name} is not supported. Please add model information in toolkit."
+                    )
+                return cls(
+                    name=model_name,
+                    version="custom",
+                    provider=LanguageModelProvider.CUSTOM,
+                )
+    @property
+    def display_name(self) -> str:
+        """
+        Returns the name of the model as a string.
+        """
+        if isinstance(self.name, LanguageModelName):
+            return self.name.value
+        else:
+            return self.name
-    @property
-    def display_name(self) -> str:
-        """
-        Returns the name of the model as a string.
-        """
-        if isinstance(self.name, LanguageModelName):
-            return self.name.value
-        else:
-            return self.name
 @deprecated(
     """
-Use `LanguageModelInfo` instead of `LanguageModel`
-"""
+Use `LanguageModelInfo` instead of `LanguageModel`.
+`LanguageModel` will be deprecated on 31.12.2025
+""",
 )
 class LanguageModel:
     _info: ClassVar[LanguageModelInfo]
@@ -367,8 +1609,8 @@ class LanguageModel:
     @property
     def info(self) -> LanguageModelInfo:
-        """
-        Returns all infos about the model:
+        """Return all infos about the model.
         - name
         - version
         - provider

unique_toolkit 0.7.9__py3-none-any.whl → 1.33.3__py3-none-any.whl

unique_toolkit 0.7.9py3-none-any.whl → 1.33.3py3-none-any.whl