PyPI - unique_toolkit - Versions diffs - 0.6.5__py3-none-any.whl → 0.6.6__py3-none-any.whl - Mend

unique_toolkit 0.6.5py3-none-any.whl → 0.6.6py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (5) hide show

unique_toolkit/language_model/infos.py CHANGED Viewed

@@ -1,6 +1,6 @@
 from datetime import date
 from enum import StrEnum
-from typing import ClassVar, Optional
+from typing import ClassVar, Optional, Self
 from pydantic import BaseModel
 from typing_extensions import deprecated
@@ -11,13 +11,14 @@ from unique_toolkit.language_model.schemas import LanguageModelTokenLimits
 class LanguageModelName(StrEnum):
     AZURE_GPT_35_TURBO_0125 = "AZURE_GPT_35_TURBO_0125"
     AZURE_GPT_4_0613 = "AZURE_GPT_4_0613"
-    AZURE_GPT_4_TURBO_1106 = "AZURE_GPT_4_TURBO_1106"
-    AZURE_GPT_4_VISION_PREVIEW = "AZURE_GPT_4_VISION_PREVIEW"
     AZURE_GPT_4_32K_0613 = "AZURE_GPT_4_32K_0613"
     AZURE_GPT_4_TURBO_2024_0409 = "AZURE_GPT_4_TURBO_2024_0409"
     AZURE_GPT_4o_2024_0513 = "AZURE_GPT_4o_2024_0513"
     AZURE_GPT_4o_2024_0806 = "AZURE_GPT_4o_2024_0806"
     AZURE_GPT_4o_MINI_2024_0718 = "AZURE_GPT_4o_MINI_2024_0718"
+    AZURE_GPT_o1_2024_1217 = "AZURE_GPT_o1_2024_1217"
+    AZURE_GPT_o1_MINI_2024_0912 = "AZURE_GPT_o1_MINI_2024_0912"
+    AZURE_GPT_o3_MINI_2025_0131 = "AZURE_GPT_o3_MINI_2025_0131"
 class EncoderName(StrEnum):
@@ -25,15 +26,13 @@ class EncoderName(StrEnum):
     CL100K_BASE = "cl100k_base"
-def get_encoder_name(model_name: LanguageModelName) -> Optional[EncoderName]:
+def get_encoder_name(model_name: LanguageModelName) -> EncoderName:
     LMN = LanguageModelName
     match model_name:
         case LMN.AZURE_GPT_35_TURBO_0125:
             return EncoderName.CL100K_BASE
         case (
             LMN.AZURE_GPT_4_0613
-            | LMN.AZURE_GPT_4_TURBO_1106
-            | LMN.AZURE_GPT_4_VISION_PREVIEW
             | LMN.AZURE_GPT_4_32K_0613
             | LMN.AZURE_GPT_4_TURBO_2024_0409
         ):
@@ -45,8 +44,10 @@ def get_encoder_name(model_name: LanguageModelName) -> Optional[EncoderName]:
         ):
             return EncoderName.O200K_BASE
         case _:
-            print(f"{model_name} is not supported. Please add encoder information.")
-            return None
+            print(
+                f"{model_name} is not supported. Please add encoder information. Using default"
+            )
+            return EncoderName.CL100K_BASE
 class LanguageModelProvider(StrEnum):
@@ -54,13 +55,28 @@ class LanguageModelProvider(StrEnum):
     CUSTOM = "CUSTOM"
+class ModelCapabilities(StrEnum):
+    FUNCTION_CALLING = "function_calling"
+    PARALLEL_FUNCTION_CALLING = "parallel_function_calling"
+    REPRODUCIBLE_OUTPUT = "reproducible_output"
+    STRUCTURED_OUTPUT = "structured_output"
+    VISION = "vision"
+    STREAMING = "streaming"
+    REASONING = "reasoning"
 class LanguageModelInfo(BaseModel):
     name: LanguageModelName | str
     version: str
     provider: LanguageModelProvider
-    encoder_name: Optional[EncoderName] = None
-    token_limits: Optional[LanguageModelTokenLimits] = None
+    encoder_name: EncoderName = EncoderName.CL100K_BASE
+    # TODO: Discuss if this is a sensible defaut
+    token_limits: LanguageModelTokenLimits = LanguageModelTokenLimits(
+        token_limit_input=7_000, token_limit_output=1_000
+    )
+    capabilities: list[ModelCapabilities] = [ModelCapabilities.STREAMING]
     info_cutoff_at: Optional[date] = None
     published_at: Optional[date] = None
@@ -70,14 +86,20 @@ class LanguageModelInfo(BaseModel):
     retirement_text: Optional[str] = None
     @classmethod
-    def from_name(cls, model_name: LanguageModelName):
+    def from_name(cls, model_name: LanguageModelName) -> Self:
         match model_name:
             case LanguageModelName.AZURE_GPT_35_TURBO_0125:
                 return cls(
                     name=model_name,
                     provider=LanguageModelProvider.AZURE,
+                    capabilities=[
+                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.PARALLEL_FUNCTION_CALLING,
+                        ModelCapabilities.REPRODUCIBLE_OUTPUT,
+                    ],
                     version="0125",
-                    encoder_name=get_encoder_name(model_name),
+                    encoder_name=EncoderName.CL100K_BASE,
                     token_limits=LanguageModelTokenLimits(
                         token_limit_input=16385, token_limit_output=4096
                     ),
@@ -90,43 +112,27 @@ class LanguageModelInfo(BaseModel):
                     name=model_name,
                     provider=LanguageModelProvider.AZURE,
                     version="0613",
-                    encoder_name=get_encoder_name(model_name),
+                    encoder_name=EncoderName.CL100K_BASE,
+                    capabilities=[
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.STREAMING,
+                    ],
                     token_limits=LanguageModelTokenLimits(token_limit=8192),
                     info_cutoff_at=date(2021, 9, 1),
                     published_at=date(2023, 6, 13),
                     deprecated_at=date(2024, 10, 1),
                     retirement_at=date(2025, 6, 6),
                 )
-            case LanguageModelName.AZURE_GPT_4_TURBO_1106:
-                return cls(
-                    name=model_name,
-                    provider=LanguageModelProvider.AZURE,
-                    version="1106-preview",
-                    encoder_name=get_encoder_name(model_name),
-                    token_limits=LanguageModelTokenLimits(
-                        token_limit_input=128000, token_limit_output=4096
-                    ),
-                    info_cutoff_at=date(2023, 4, 1),
-                    published_at=date(2023, 11, 6),
-                )
-            case LanguageModelName.AZURE_GPT_4_VISION_PREVIEW:
-                return cls(
-                    name=model_name,
-                    provider=LanguageModelProvider.AZURE,
-                    version="vision-preview",
-                    encoder_name=get_encoder_name(model_name),
-                    token_limits=LanguageModelTokenLimits(
-                        token_limit_input=128000, token_limit_output=4096
-                    ),
-                    info_cutoff_at=date(2023, 4, 1),
-                    published_at=date(2023, 11, 6),
-                )
             case LanguageModelName.AZURE_GPT_4_32K_0613:
                 return cls(
                     name=model_name,
                     provider=LanguageModelProvider.AZURE,
                     version="1106-preview",
-                    encoder_name=get_encoder_name(model_name),
+                    capabilities=[
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.STREAMING,
+                    ],
+                    encoder_name=EncoderName.CL100K_BASE,
                     token_limits=LanguageModelTokenLimits(token_limit=32768),
                     info_cutoff_at=date(2021, 9, 1),
                     published_at=date(2023, 6, 13),
@@ -136,7 +142,14 @@ class LanguageModelInfo(BaseModel):
             case LanguageModelName.AZURE_GPT_4_TURBO_2024_0409:
                 return cls(
                     name=model_name,
-                    encoder_name=get_encoder_name(model_name),
+                    encoder_name=EncoderName.CL100K_BASE,
+                    capabilities=[
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.PARALLEL_FUNCTION_CALLING,
+                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.VISION,
+                        ModelCapabilities.STREAMING,
+                    ],
                     provider=LanguageModelProvider.AZURE,
                     version="turbo-2024-04-09",
                     token_limits=LanguageModelTokenLimits(
@@ -148,11 +161,18 @@ class LanguageModelInfo(BaseModel):
             case LanguageModelName.AZURE_GPT_4o_2024_0513:
                 return cls(
                     name=model_name,
-                    encoder_name=get_encoder_name(model_name),
+                    encoder_name=EncoderName.O200K_BASE,
+                    capabilities=[
+                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.PARALLEL_FUNCTION_CALLING,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.VISION,
+                    ],
                     provider=LanguageModelProvider.AZURE,
                     version="2024-05-13",
                     token_limits=LanguageModelTokenLimits(
-                        token_limit_input=128000, token_limit_output=4096
+                        token_limit_input=128_000, token_limit_output=4_096
                     ),
                     info_cutoff_at=date(2023, 10, 1),
                     published_at=date(2024, 5, 13),
@@ -160,11 +180,18 @@ class LanguageModelInfo(BaseModel):
             case LanguageModelName.AZURE_GPT_4o_2024_0806:
                 return cls(
                     name=model_name,
-                    encoder_name=get_encoder_name(model_name),
+                    encoder_name=EncoderName.O200K_BASE,
+                    capabilities=[
+                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.PARALLEL_FUNCTION_CALLING,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.VISION,
+                    ],
                     provider=LanguageModelProvider.AZURE,
                     version="2024-08-06",
                     token_limits=LanguageModelTokenLimits(
-                        token_limit_input=128000, token_limit_output=16384
+                        token_limit_input=128_000, token_limit_output=16_384
                     ),
                     info_cutoff_at=date(2023, 10, 1),
                     published_at=date(2024, 8, 6),
@@ -172,15 +199,78 @@ class LanguageModelInfo(BaseModel):
             case LanguageModelName.AZURE_GPT_4o_MINI_2024_0718:
                 return cls(
                     name=model_name,
+                    capabilities=[
+                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.PARALLEL_FUNCTION_CALLING,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.VISION,
+                    ],
                     provider=LanguageModelProvider.AZURE,
                     version="2024-07-18",
-                    encoder_name=get_encoder_name(model_name),
+                    encoder_name=EncoderName.O200K_BASE,
                     token_limits=LanguageModelTokenLimits(
-                        token_limit_input=128000, token_limit_output=16384
+                        token_limit_input=128_000, token_limit_output=16_384
                     ),
                     info_cutoff_at=date(2023, 10, 1),
                     published_at=date(2024, 7, 18),
                 )
+            case LanguageModelName.AZURE_GPT_o1_2024_1217:
+                return cls(
+                    name=model_name,
+                    capabilities=[
+                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.VISION,
+                        ModelCapabilities.REASONING,
+                    ],
+                    provider=LanguageModelProvider.AZURE,
+                    version="2024-12-17",
+                    encoder_name=EncoderName.O200K_BASE,
+                    token_limits=LanguageModelTokenLimits(
+                        token_limit_input=200_000, token_limit_output=100_000
+                    ),
+                    info_cutoff_at=date(2023, 10, 1),
+                    published_at=date(2024, 12, 17),
+                )
+            case LanguageModelName.AZURE_GPT_o1_MINI_2024_0912:
+                return cls(
+                    name=model_name,
+                    capabilities=[
+                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.VISION,
+                        ModelCapabilities.REASONING,
+                    ],
+                    provider=LanguageModelProvider.AZURE,
+                    version="2024-09-12",
+                    encoder_name=EncoderName.O200K_BASE,
+                    token_limits=LanguageModelTokenLimits(
+                        token_limit_input=128_000, token_limit_output=65_536
+                    ),
+                    info_cutoff_at=date(2023, 10, 1),
+                    published_at=date(2024, 9, 12),
+                )
+            case LanguageModelName.AZURE_GPT_o3_MINI_2025_0131:
+                return cls(
+                    name=model_name,
+                    capabilities=[
+                        ModelCapabilities.STRUCTURED_OUTPUT,
+                        ModelCapabilities.FUNCTION_CALLING,
+                        ModelCapabilities.STREAMING,
+                        ModelCapabilities.REASONING,
+                    ],
+                    provider=LanguageModelProvider.AZURE,
+                    version="2025-01-31",
+                    encoder_name=EncoderName.O200K_BASE,
+                    token_limits=LanguageModelTokenLimits(
+                        token_limit_input=200_000, token_limit_output=100_000
+                    ),
+                    info_cutoff_at=date(2023, 10, 1),
+                    published_at=date(2025, 1, 31),
+                )
             case _:
                 if isinstance(model_name, LanguageModelName):
                     raise ValueError(

{unique_toolkit-0.6.5.dist-info → unique_toolkit-0.6.6.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.1
 Name: unique_toolkit
-Version: 0.6.5
+Version: 0.6.6
 Summary:
 License: Proprietary
 Author: Martin Fadler
@@ -111,6 +111,11 @@ All notable changes to this project will be documented in this file.
 The format is based on [Keep a Changelog](https://keepachangelog.com/en/1.0.0/),
 and this project adheres to [Semantic Versioning](https://semver.org/spec/v2.0.0.html).
+## [0.6.6] - 2025-03-10
+- Add o1, o1-mini and o3-mini models
+- Remove deprecated gpt4 models
+- Make token_limits and encoder a required attribute of LanguageModelInfo
 ## [0.6.5] - 2025-03-04
 - Add `upload_content_from_bytes` to `ContentService`
 - Add `download_content_to_bytes` to `ContentService`

{unique_toolkit-0.6.5.dist-info → unique_toolkit-0.6.6.dist-info}/RECORD RENAMED Viewed

@@ -48,7 +48,7 @@ unique_toolkit/language_model/__init__.py,sha256=jWko_vQj48wjnpTtlkg8iNdef0SMI3F
 unique_toolkit/language_model/builder.py,sha256=qP1SlUnYJHLqT-fpXs4lgUixnekhx8IIfuoXnMHvRKE,2408
 unique_toolkit/language_model/constants.py,sha256=B-topqW0r83dkC_25DeQfnPk3n53qzIHUCBS7YJ0-1U,119
 unique_toolkit/language_model/functions.py,sha256=I5jHhHsKoq7GwEQyTrM8LXB2n_6dvMAk7UklenjuHSY,7945
-unique_toolkit/language_model/infos.py,sha256=-axWHj55mp6tZfX_3i-FSkfh8e9fwORXWMfi9xQ_UjA,12232
+unique_toolkit/language_model/infos.py,sha256=DRkF0HzVemtSsSvdtrdsajNKaQ46Xla0ZXzFhi7xMtc,16338
 unique_toolkit/language_model/prompt.py,sha256=JSawaLjQg3VR-E2fK8engFyJnNdk21zaO8pPIodzN4Q,3991
 unique_toolkit/language_model/schemas.py,sha256=rrwzUgKANFOrdehCULW8Hh03uRW3tsE5dXpWqxmClfg,8618
 unique_toolkit/language_model/service.py,sha256=GupYD4uDZjy1TfVQW3jichmgQwiSgQCj350FtL4O0W4,5569
@@ -58,7 +58,7 @@ unique_toolkit/short_term_memory/constants.py,sha256=698CL6-wjup2MvU19RxSmQk3gX7
 unique_toolkit/short_term_memory/functions.py,sha256=3WiK-xatY5nh4Dr5zlDUye1k3E6kr41RiscwtTplw5k,4484
 unique_toolkit/short_term_memory/schemas.py,sha256=OhfcXyF6ACdwIXW45sKzjtZX_gkcJs8FEZXcgQTNenw,1406
 unique_toolkit/short_term_memory/service.py,sha256=gdsVzoNqTXmLoBR_-p_lJlZDBo8L7Cr5EKchTNVJg1Q,5233
-unique_toolkit-0.6.5.dist-info/LICENSE,sha256=GlN8wHNdh53xwOPg44URnwag6TEolCjoq3YD_KrWgss,193
-unique_toolkit-0.6.5.dist-info/METADATA,sha256=QpySQwwkqfBL9Mm9g8urq7LIhQrBy4LF7ZTWQroXED4,19835
-unique_toolkit-0.6.5.dist-info/WHEEL,sha256=sP946D7jFCHeNz5Iq4fL4Lu-PrWrFsgfLXbbkciIZwg,88
-unique_toolkit-0.6.5.dist-info/RECORD,,
+unique_toolkit-0.6.6.dist-info/LICENSE,sha256=GlN8wHNdh53xwOPg44URnwag6TEolCjoq3YD_KrWgss,193
+unique_toolkit-0.6.6.dist-info/METADATA,sha256=MAiqgLQcnD82DSwx5CmFbRLoCaAJVgbrHLYpr0AGb2Q,20003
+unique_toolkit-0.6.6.dist-info/WHEEL,sha256=sP946D7jFCHeNz5Iq4fL4Lu-PrWrFsgfLXbbkciIZwg,88
+unique_toolkit-0.6.6.dist-info/RECORD,,

{unique_toolkit-0.6.5.dist-info → unique_toolkit-0.6.6.dist-info}/LICENSE RENAMED Viewed

File without changes

{unique_toolkit-0.6.5.dist-info → unique_toolkit-0.6.6.dist-info}/WHEEL RENAMED Viewed

File without changes

unique_toolkit 0.6.5__py3-none-any.whl → 0.6.6__py3-none-any.whl

unique_toolkit 0.6.5py3-none-any.whl → 0.6.6py3-none-any.whl