PyPI - orq-ai-sdk - Versions diffs - 4.2.0rc28__py3-none-any.whl → 4.2.6__py3-none-any.whl - Mend

orq-ai-sdk 4.2.0rc28py3-none-any.whl → 4.2.6py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (167) hide show

orq_ai_sdk/_hooks/globalhook.py +0 -1
orq_ai_sdk/_version.py +3 -3
orq_ai_sdk/audio.py +30 -0
orq_ai_sdk/basesdk.py +20 -6
orq_ai_sdk/chat.py +22 -0
orq_ai_sdk/completions.py +332 -0
orq_ai_sdk/contacts.py +43 -855
orq_ai_sdk/deployments.py +61 -0
orq_ai_sdk/edits.py +258 -0
orq_ai_sdk/embeddings.py +238 -0
orq_ai_sdk/generations.py +272 -0
orq_ai_sdk/identities.py +1037 -0
orq_ai_sdk/images.py +28 -0
orq_ai_sdk/models/__init__.py +5341 -737
orq_ai_sdk/models/actionreviewedstreamingevent.py +18 -1
orq_ai_sdk/models/actionreviewrequestedstreamingevent.py +44 -1
orq_ai_sdk/models/agenterroredstreamingevent.py +18 -1
orq_ai_sdk/models/agentinactivestreamingevent.py +168 -70
orq_ai_sdk/models/agentmessagecreatedstreamingevent.py +18 -2
orq_ai_sdk/models/agentresponsemessage.py +18 -2
orq_ai_sdk/models/agentstartedstreamingevent.py +127 -2
orq_ai_sdk/models/agentthoughtstreamingevent.py +178 -211
orq_ai_sdk/models/conversationresponse.py +31 -20
orq_ai_sdk/models/conversationwithmessagesresponse.py +31 -20
orq_ai_sdk/models/createagentrequestop.py +1922 -384
orq_ai_sdk/models/createagentresponse.py +147 -91
orq_ai_sdk/models/createagentresponserequestop.py +111 -2
orq_ai_sdk/models/createchatcompletionop.py +1375 -861
orq_ai_sdk/models/createchunkop.py +46 -19
orq_ai_sdk/models/createcompletionop.py +1890 -0
orq_ai_sdk/models/createcontactop.py +45 -56
orq_ai_sdk/models/createconversationop.py +61 -39
orq_ai_sdk/models/createconversationresponseop.py +68 -4
orq_ai_sdk/models/createdatasetitemop.py +424 -80
orq_ai_sdk/models/createdatasetop.py +19 -2
orq_ai_sdk/models/createdatasourceop.py +92 -26
orq_ai_sdk/models/createembeddingop.py +384 -0
orq_ai_sdk/models/createevalop.py +552 -24
orq_ai_sdk/models/createidentityop.py +176 -0
orq_ai_sdk/models/createimageeditop.py +504 -0
orq_ai_sdk/models/createimageop.py +208 -117
orq_ai_sdk/models/createimagevariationop.py +486 -0
orq_ai_sdk/models/createknowledgeop.py +186 -121
orq_ai_sdk/models/creatememorydocumentop.py +50 -1
orq_ai_sdk/models/creatememoryop.py +34 -21
orq_ai_sdk/models/creatememorystoreop.py +34 -1
orq_ai_sdk/models/createmoderationop.py +521 -0
orq_ai_sdk/models/createpromptop.py +2748 -1252
orq_ai_sdk/models/creatererankop.py +416 -0
orq_ai_sdk/models/createresponseop.py +2567 -0
orq_ai_sdk/models/createspeechop.py +316 -0
orq_ai_sdk/models/createtoolop.py +537 -12
orq_ai_sdk/models/createtranscriptionop.py +562 -0
orq_ai_sdk/models/createtranslationop.py +540 -0
orq_ai_sdk/models/datapart.py +18 -1
orq_ai_sdk/models/deletechunksop.py +34 -1
orq_ai_sdk/models/{deletecontactop.py → deleteidentityop.py} +9 -9
orq_ai_sdk/models/deletepromptop.py +26 -0
orq_ai_sdk/models/deploymentcreatemetricop.py +362 -76
orq_ai_sdk/models/deploymentgetconfigop.py +635 -194
orq_ai_sdk/models/deploymentinvokeop.py +168 -173
orq_ai_sdk/models/deploymentsop.py +195 -58
orq_ai_sdk/models/deploymentstreamop.py +652 -304
orq_ai_sdk/models/errorpart.py +18 -1
orq_ai_sdk/models/filecontentpartschema.py +18 -1
orq_ai_sdk/models/filegetop.py +19 -2
orq_ai_sdk/models/filelistop.py +35 -2
orq_ai_sdk/models/filepart.py +50 -1
orq_ai_sdk/models/fileuploadop.py +51 -2
orq_ai_sdk/models/generateconversationnameop.py +31 -20
orq_ai_sdk/models/get_v2_evaluators_id_versionsop.py +34 -1
orq_ai_sdk/models/get_v2_tools_tool_id_versions_version_id_op.py +18 -1
orq_ai_sdk/models/get_v2_tools_tool_id_versionsop.py +34 -1
orq_ai_sdk/models/getallmemoriesop.py +34 -21
orq_ai_sdk/models/getallmemorydocumentsop.py +42 -1
orq_ai_sdk/models/getallmemorystoresop.py +34 -1
orq_ai_sdk/models/getallpromptsop.py +1690 -230
orq_ai_sdk/models/getalltoolsop.py +325 -8
orq_ai_sdk/models/getchunkscountop.py +34 -1
orq_ai_sdk/models/getevalsop.py +395 -43
orq_ai_sdk/models/getonechunkop.py +14 -19
orq_ai_sdk/models/getoneknowledgeop.py +116 -96
orq_ai_sdk/models/getonepromptop.py +1673 -230
orq_ai_sdk/models/getpromptversionop.py +1670 -216
orq_ai_sdk/models/imagecontentpartschema.py +50 -1
orq_ai_sdk/models/internal/globals.py +18 -1
orq_ai_sdk/models/invokeagentop.py +140 -2
orq_ai_sdk/models/invokedeploymentrequest.py +418 -80
orq_ai_sdk/models/invokeevalop.py +160 -131
orq_ai_sdk/models/listagentsop.py +793 -166
orq_ai_sdk/models/listchunksop.py +32 -19
orq_ai_sdk/models/listchunkspaginatedop.py +46 -19
orq_ai_sdk/models/listconversationsop.py +18 -1
orq_ai_sdk/models/listdatasetdatapointsop.py +252 -42
orq_ai_sdk/models/listdatasetsop.py +35 -2
orq_ai_sdk/models/listdatasourcesop.py +35 -26
orq_ai_sdk/models/{listcontactsop.py → listidentitiesop.py} +89 -79
orq_ai_sdk/models/listknowledgebasesop.py +132 -96
orq_ai_sdk/models/listmodelsop.py +1 -0
orq_ai_sdk/models/listpromptversionsop.py +1684 -216
orq_ai_sdk/models/parseop.py +161 -17
orq_ai_sdk/models/partdoneevent.py +19 -2
orq_ai_sdk/models/post_v2_router_ocrop.py +408 -0
orq_ai_sdk/models/publiccontact.py +27 -4
orq_ai_sdk/models/publicidentity.py +62 -0
orq_ai_sdk/models/reasoningpart.py +19 -2
orq_ai_sdk/models/refusalpartschema.py +18 -1
orq_ai_sdk/models/remoteconfigsgetconfigop.py +34 -1
orq_ai_sdk/models/responsedoneevent.py +114 -84
orq_ai_sdk/models/responsestartedevent.py +18 -1
orq_ai_sdk/models/retrieveagentrequestop.py +787 -166
orq_ai_sdk/models/retrievedatapointop.py +236 -42
orq_ai_sdk/models/retrievedatasetop.py +19 -2
orq_ai_sdk/models/retrievedatasourceop.py +17 -26
orq_ai_sdk/models/{retrievecontactop.py → retrieveidentityop.py} +38 -41
orq_ai_sdk/models/retrievememorydocumentop.py +18 -1
orq_ai_sdk/models/retrievememoryop.py +18 -21
orq_ai_sdk/models/retrievememorystoreop.py +18 -1
orq_ai_sdk/models/retrievetoolop.py +309 -8
orq_ai_sdk/models/runagentop.py +1451 -197
orq_ai_sdk/models/searchknowledgeop.py +108 -1
orq_ai_sdk/models/security.py +18 -1
orq_ai_sdk/models/streamagentop.py +93 -2
orq_ai_sdk/models/streamrunagentop.py +1428 -195
orq_ai_sdk/models/textcontentpartschema.py +34 -1
orq_ai_sdk/models/thinkingconfigenabledschema.py +18 -1
orq_ai_sdk/models/toolcallpart.py +18 -1
orq_ai_sdk/models/tooldoneevent.py +18 -1
orq_ai_sdk/models/toolexecutionfailedstreamingevent.py +50 -1
orq_ai_sdk/models/toolexecutionfinishedstreamingevent.py +34 -1
orq_ai_sdk/models/toolexecutionstartedstreamingevent.py +34 -1
orq_ai_sdk/models/toolresultpart.py +18 -1
orq_ai_sdk/models/toolreviewrequestedevent.py +18 -1
orq_ai_sdk/models/toolstartedevent.py +18 -1
orq_ai_sdk/models/updateagentop.py +1951 -404
orq_ai_sdk/models/updatechunkop.py +46 -19
orq_ai_sdk/models/updateconversationop.py +61 -39
orq_ai_sdk/models/updatedatapointop.py +424 -80
orq_ai_sdk/models/updatedatasetop.py +51 -2
orq_ai_sdk/models/updatedatasourceop.py +17 -26
orq_ai_sdk/models/updateevalop.py +577 -16
orq_ai_sdk/models/{updatecontactop.py → updateidentityop.py} +78 -68
orq_ai_sdk/models/updateknowledgeop.py +234 -190
orq_ai_sdk/models/updatememorydocumentop.py +50 -1
orq_ai_sdk/models/updatememoryop.py +50 -21
orq_ai_sdk/models/updatememorystoreop.py +66 -1
orq_ai_sdk/models/updatepromptop.py +2844 -1450
orq_ai_sdk/models/updatetoolop.py +592 -9
orq_ai_sdk/models/usermessagerequest.py +18 -2
orq_ai_sdk/moderations.py +218 -0
orq_ai_sdk/orq_completions.py +660 -0
orq_ai_sdk/orq_responses.py +398 -0
orq_ai_sdk/prompts.py +28 -36
orq_ai_sdk/rerank.py +232 -0
orq_ai_sdk/router.py +89 -641
orq_ai_sdk/sdk.py +3 -0
orq_ai_sdk/speech.py +251 -0
orq_ai_sdk/transcriptions.py +326 -0
orq_ai_sdk/translations.py +298 -0
orq_ai_sdk/utils/__init__.py +13 -1
orq_ai_sdk/variations.py +254 -0
orq_ai_sdk-4.2.6.dist-info/METADATA +888 -0
orq_ai_sdk-4.2.6.dist-info/RECORD +263 -0
{orq_ai_sdk-4.2.0rc28.dist-info → orq_ai_sdk-4.2.6.dist-info}/WHEEL +2 -1
orq_ai_sdk-4.2.6.dist-info/top_level.txt +1 -0
orq_ai_sdk-4.2.0rc28.dist-info/METADATA +0 -867
orq_ai_sdk-4.2.0rc28.dist-info/RECORD +0 -233

orq_ai_sdk/models/retrieveagentrequestop.py CHANGED Viewed

@@ -138,6 +138,32 @@ class RetrieveAgentRequestTools(BaseModel):
     timeout: Optional[float] = 120
     r"""Tool execution timeout in seconds (default: 2 minutes, max: 10 minutes)"""
+    @model_serializer(mode="wrap")
+    def serialize_model(self, handler):
+        optional_fields = set(
+            [
+                "key",
+                "display_name",
+                "description",
+                "requires_approval",
+                "tool_id",
+                "conditions",
+                "timeout",
+            ]
+        )
+        serialized = handler(self)
+        m = {}
+        for n, f in type(self).model_fields.items():
+            k = f.alias or n
+            val = serialized.get(k)
+            if val != UNSET_SENTINEL:
+                if val is not None or k not in optional_fields:
+                    m[k] = val
+        return m
 RetrieveAgentRequestExecuteOn = Literal[
     "input",
@@ -165,6 +191,22 @@ class RetrieveAgentRequestEvaluators(BaseModel):
     sample_rate: Optional[float] = 50
     r"""The percentage of executions to evaluate with this evaluator (1-100). For example, a value of 50 means the evaluator will run on approximately half of the executions."""
+    @model_serializer(mode="wrap")
+    def serialize_model(self, handler):
+        optional_fields = set(["sample_rate"])
+        serialized = handler(self)
+        m = {}
+        for n, f in type(self).model_fields.items():
+            k = f.alias or n
+            val = serialized.get(k)
+            if val != UNSET_SENTINEL:
+                if val is not None or k not in optional_fields:
+                    m[k] = val
+        return m
 RetrieveAgentRequestAgentsExecuteOn = Literal[
     "input",
@@ -192,6 +234,22 @@ class RetrieveAgentRequestGuardrails(BaseModel):
     sample_rate: Optional[float] = 50
     r"""The percentage of executions to evaluate with this evaluator (1-100). For example, a value of 50 means the evaluator will run on approximately half of the executions."""
+    @model_serializer(mode="wrap")
+    def serialize_model(self, handler):
+        optional_fields = set(["sample_rate"])
+        serialized = handler(self)
+        m = {}
+        for n, f in type(self).model_fields.items():
+            k = f.alias or n
+            val = serialized.get(k)
+            if val != UNSET_SENTINEL:
+                if val is not None or k not in optional_fields:
+                    m[k] = val
+        return m
 class RetrieveAgentRequestSettingsTypedDict(TypedDict):
     max_iterations: NotRequired[int]
@@ -227,6 +285,31 @@ class RetrieveAgentRequestSettings(BaseModel):
     guardrails: Optional[List[RetrieveAgentRequestGuardrails]] = None
     r"""Configuration for a guardrail applied to the agent"""
+    @model_serializer(mode="wrap")
+    def serialize_model(self, handler):
+        optional_fields = set(
+            [
+                "max_iterations",
+                "max_execution_time",
+                "tool_approval_required",
+                "tools",
+                "evaluators",
+                "guardrails",
+            ]
+        )
+        serialized = handler(self)
+        m = {}
+        for n, f in type(self).model_fields.items():
+            k = f.alias or n
+            val = serialized.get(k)
+            if val != UNSET_SENTINEL:
+                if val is not None or k not in optional_fields:
+                    m[k] = val
+        return m
 RetrieveAgentRequestVoice = Literal[
     "alloy",
@@ -295,6 +378,22 @@ class RetrieveAgentRequestResponseFormatJSONSchema(BaseModel):
     strict: Optional[bool] = False
     r"""Whether to enable strict schema adherence when generating the output. If set to true, the model will always follow the exact schema defined in the schema field. Only a subset of JSON Schema is supported when strict is true."""
+    @model_serializer(mode="wrap")
+    def serialize_model(self, handler):
+        optional_fields = set(["description", "schema", "strict"])
+        serialized = handler(self)
+        m = {}
+        for n, f in type(self).model_fields.items():
+            k = f.alias or n
+            val = serialized.get(k)
+            if val != UNSET_SENTINEL:
+                if val is not None or k not in optional_fields:
+                    m[k] = val
+        return m
 class RetrieveAgentRequestResponseFormatAgentsJSONSchemaTypedDict(TypedDict):
     r"""
@@ -427,6 +526,22 @@ class RetrieveAgentRequestStreamOptions(BaseModel):
     include_usage: Optional[bool] = None
     r"""If set, an additional chunk will be streamed before the data: [DONE] message. The usage field on this chunk shows the token usage statistics for the entire request, and the choices field will always be an empty array. All other chunks will also include a usage field, but with a null value."""
+    @model_serializer(mode="wrap")
+    def serialize_model(self, handler):
+        optional_fields = set(["include_usage"])
+        serialized = handler(self)
+        m = {}
+        for n, f in type(self).model_fields.items():
+            k = f.alias or n
+            val = serialized.get(k)
+            if val != UNSET_SENTINEL:
+                if val is not None or k not in optional_fields:
+                    m[k] = val
+        return m
 RetrieveAgentRequestThinkingTypedDict = TypeAliasType(
     "RetrieveAgentRequestThinkingTypedDict",
@@ -469,6 +584,22 @@ class RetrieveAgentRequestToolChoice2(BaseModel):
     type: Optional[RetrieveAgentRequestToolChoiceType] = None
     r"""The type of the tool. Currently, only function is supported."""
+    @model_serializer(mode="wrap")
+    def serialize_model(self, handler):
+        optional_fields = set(["type"])
+        serialized = handler(self)
+        m = {}
+        for n, f in type(self).model_fields.items():
+            k = f.alias or n
+            val = serialized.get(k)
+            if val != UNSET_SENTINEL:
+                if val is not None or k not in optional_fields:
+                    m[k] = val
+        return m
 RetrieveAgentRequestToolChoice1 = Literal[
     "none",
@@ -535,6 +666,154 @@ class RetrieveAgentRequestAgentsGuardrails(BaseModel):
     r"""Determines whether the guardrail runs on the input (user message) or output (model response)."""
+class RetrieveAgentRequestFallbacksTypedDict(TypedDict):
+    model: str
+    r"""Fallback model identifier"""
+class RetrieveAgentRequestFallbacks(BaseModel):
+    model: str
+    r"""Fallback model identifier"""
+class RetrieveAgentRequestAgentsRetryTypedDict(TypedDict):
+    r"""Retry configuration for the request"""
+    count: NotRequired[float]
+    r"""Number of retry attempts (1-5)"""
+    on_codes: NotRequired[List[float]]
+    r"""HTTP status codes that trigger retry logic"""
+class RetrieveAgentRequestAgentsRetry(BaseModel):
+    r"""Retry configuration for the request"""
+    count: Optional[float] = 3
+    r"""Number of retry attempts (1-5)"""
+    on_codes: Optional[List[float]] = None
+    r"""HTTP status codes that trigger retry logic"""
+    @model_serializer(mode="wrap")
+    def serialize_model(self, handler):
+        optional_fields = set(["count", "on_codes"])
+        serialized = handler(self)
+        m = {}
+        for n, f in type(self).model_fields.items():
+            k = f.alias or n
+            val = serialized.get(k)
+            if val != UNSET_SENTINEL:
+                if val is not None or k not in optional_fields:
+                    m[k] = val
+        return m
+RetrieveAgentRequestType = Literal["exact_match",]
+class RetrieveAgentRequestCacheTypedDict(TypedDict):
+    r"""Cache configuration for the request."""
+    type: RetrieveAgentRequestType
+    ttl: NotRequired[float]
+    r"""Time to live for cached responses in seconds. Maximum 259200 seconds (3 days)."""
+class RetrieveAgentRequestCache(BaseModel):
+    r"""Cache configuration for the request."""
+    type: RetrieveAgentRequestType
+    ttl: Optional[float] = 1800
+    r"""Time to live for cached responses in seconds. Maximum 259200 seconds (3 days)."""
+    @model_serializer(mode="wrap")
+    def serialize_model(self, handler):
+        optional_fields = set(["ttl"])
+        serialized = handler(self)
+        m = {}
+        for n, f in type(self).model_fields.items():
+            k = f.alias or n
+            val = serialized.get(k)
+            if val != UNSET_SENTINEL:
+                if val is not None or k not in optional_fields:
+                    m[k] = val
+        return m
+RetrieveAgentRequestLoadBalancerType = Literal["weight_based",]
+class RetrieveAgentRequestLoadBalancerModelsTypedDict(TypedDict):
+    model: str
+    r"""Model identifier for load balancing"""
+    weight: NotRequired[float]
+    r"""Weight assigned to this model for load balancing"""
+class RetrieveAgentRequestLoadBalancerModels(BaseModel):
+    model: str
+    r"""Model identifier for load balancing"""
+    weight: Optional[float] = 0.5
+    r"""Weight assigned to this model for load balancing"""
+    @model_serializer(mode="wrap")
+    def serialize_model(self, handler):
+        optional_fields = set(["weight"])
+        serialized = handler(self)
+        m = {}
+        for n, f in type(self).model_fields.items():
+            k = f.alias or n
+            val = serialized.get(k)
+            if val != UNSET_SENTINEL:
+                if val is not None or k not in optional_fields:
+                    m[k] = val
+        return m
+class RetrieveAgentRequestLoadBalancer1TypedDict(TypedDict):
+    type: RetrieveAgentRequestLoadBalancerType
+    models: List[RetrieveAgentRequestLoadBalancerModelsTypedDict]
+class RetrieveAgentRequestLoadBalancer1(BaseModel):
+    type: RetrieveAgentRequestLoadBalancerType
+    models: List[RetrieveAgentRequestLoadBalancerModels]
+RetrieveAgentRequestLoadBalancerTypedDict = RetrieveAgentRequestLoadBalancer1TypedDict
+r"""Load balancer configuration for the request."""
+RetrieveAgentRequestLoadBalancer = RetrieveAgentRequestLoadBalancer1
+r"""Load balancer configuration for the request."""
+class RetrieveAgentRequestTimeoutTypedDict(TypedDict):
+    r"""Timeout configuration to apply to the request. If the request exceeds the timeout, it will be retried or fallback to the next model if configured."""
+    call_timeout: float
+    r"""Timeout value in milliseconds"""
+class RetrieveAgentRequestTimeout(BaseModel):
+    r"""Timeout configuration to apply to the request. If the request exceeds the timeout, it will be retried or fallback to the next model if configured."""
+    call_timeout: float
+    r"""Timeout value in milliseconds"""
 class RetrieveAgentRequestParametersTypedDict(TypedDict):
     r"""Model behavior parameters (snake_case) stored as part of the agent configuration. These become the default parameters used when the agent is executed. Commonly used: temperature (0-1, controls randomness), max_completion_tokens (response length), top_p (nucleus sampling). Advanced: frequency_penalty, presence_penalty, response_format (JSON/structured output), reasoning_effort (for o1/thinking models), seed (reproducibility), stop sequences. Model-specific support varies. Runtime parameters in agent execution requests can override these defaults."""
@@ -592,6 +871,16 @@ class RetrieveAgentRequestParametersTypedDict(TypedDict):
     r"""Output types that you would like the model to generate. Most models are capable of generating text, which is the default: [\"text\"]. The gpt-4o-audio-preview model can also be used to generate audio. To request that this model generate both text and audio responses, you can use: [\"text\", \"audio\"]."""
     guardrails: NotRequired[List[RetrieveAgentRequestAgentsGuardrailsTypedDict]]
     r"""A list of guardrails to apply to the request."""
+    fallbacks: NotRequired[List[RetrieveAgentRequestFallbacksTypedDict]]
+    r"""Array of fallback models to use if primary model fails"""
+    retry: NotRequired[RetrieveAgentRequestAgentsRetryTypedDict]
+    r"""Retry configuration for the request"""
+    cache: NotRequired[RetrieveAgentRequestCacheTypedDict]
+    r"""Cache configuration for the request."""
+    load_balancer: NotRequired[RetrieveAgentRequestLoadBalancerTypedDict]
+    r"""Load balancer configuration for the request."""
+    timeout: NotRequired[RetrieveAgentRequestTimeoutTypedDict]
+    r"""Timeout configuration to apply to the request. If the request exceeds the timeout, it will be retried or fallback to the next model if configured."""
 class RetrieveAgentRequestParameters(BaseModel):
@@ -673,72 +962,91 @@ class RetrieveAgentRequestParameters(BaseModel):
     guardrails: Optional[List[RetrieveAgentRequestAgentsGuardrails]] = None
     r"""A list of guardrails to apply to the request."""
+    fallbacks: Optional[List[RetrieveAgentRequestFallbacks]] = None
+    r"""Array of fallback models to use if primary model fails"""
+    retry: Optional[RetrieveAgentRequestAgentsRetry] = None
+    r"""Retry configuration for the request"""
+    cache: Optional[RetrieveAgentRequestCache] = None
+    r"""Cache configuration for the request."""
+    load_balancer: Optional[RetrieveAgentRequestLoadBalancer] = None
+    r"""Load balancer configuration for the request."""
+    timeout: Optional[RetrieveAgentRequestTimeout] = None
+    r"""Timeout configuration to apply to the request. If the request exceeds the timeout, it will be retried or fallback to the next model if configured."""
     @model_serializer(mode="wrap")
     def serialize_model(self, handler):
-        optional_fields = [
-            "audio",
-            "frequency_penalty",
-            "max_tokens",
-            "max_completion_tokens",
-            "logprobs",
-            "top_logprobs",
-            "n",
-            "presence_penalty",
-            "response_format",
-            "reasoning_effort",
-            "verbosity",
-            "seed",
-            "stop",
-            "stream_options",
-            "thinking",
-            "temperature",
-            "top_p",
-            "top_k",
-            "tool_choice",
-            "parallel_tool_calls",
-            "modalities",
-            "guardrails",
-        ]
-        nullable_fields = [
-            "audio",
-            "frequency_penalty",
-            "max_tokens",
-            "max_completion_tokens",
-            "logprobs",
-            "top_logprobs",
-            "n",
-            "presence_penalty",
-            "seed",
-            "stop",
-            "stream_options",
-            "temperature",
-            "top_p",
-            "top_k",
-            "modalities",
-        ]
-        null_default_fields = []
+        optional_fields = set(
+            [
+                "audio",
+                "frequency_penalty",
+                "max_tokens",
+                "max_completion_tokens",
+                "logprobs",
+                "top_logprobs",
+                "n",
+                "presence_penalty",
+                "response_format",
+                "reasoning_effort",
+                "verbosity",
+                "seed",
+                "stop",
+                "stream_options",
+                "thinking",
+                "temperature",
+                "top_p",
+                "top_k",
+                "tool_choice",
+                "parallel_tool_calls",
+                "modalities",
+                "guardrails",
+                "fallbacks",
+                "retry",
+                "cache",
+                "load_balancer",
+                "timeout",
+            ]
+        )
+        nullable_fields = set(
+            [
+                "audio",
+                "frequency_penalty",
+                "max_tokens",
+                "max_completion_tokens",
+                "logprobs",
+                "top_logprobs",
+                "n",
+                "presence_penalty",
+                "seed",
+                "stop",
+                "stream_options",
+                "temperature",
+                "top_p",
+                "top_k",
+                "modalities",
+            ]
+        )
         serialized = handler(self)
         m = {}
         for n, f in type(self).model_fields.items():
             k = f.alias or n
             val = serialized.get(k)
-            serialized.pop(k, None)
-            optional_nullable = k in optional_fields and k in nullable_fields
-            is_set = (
-                self.__pydantic_fields_set__.intersection({n})
-                or k in null_default_fields
-            )  # pylint: disable=no-member
-            if val is not None and val != UNSET_SENTINEL:
-                m[k] = val
-            elif val != UNSET_SENTINEL and (
-                not k in optional_fields or (optional_nullable and is_set)
-            ):
-                m[k] = val
+            is_nullable_and_explicitly_set = (
+                k in nullable_fields
+                and (self.__pydantic_fields_set__.intersection({n}))  # pylint: disable=no-member
+            )
+            if val != UNSET_SENTINEL:
+                if (
+                    val is not None
+                    or k not in optional_fields
+                    or is_nullable_and_explicitly_set
+                ):
+                    m[k] = val
         return m
@@ -761,6 +1069,22 @@ class RetrieveAgentRequestRetry(BaseModel):
     on_codes: Optional[List[float]] = None
     r"""HTTP status codes that trigger retry logic"""
+    @model_serializer(mode="wrap")
+    def serialize_model(self, handler):
+        optional_fields = set(["count", "on_codes"])
+        serialized = handler(self)
+        m = {}
+        for n, f in type(self).model_fields.items():
+            k = f.alias or n
+            val = serialized.get(k)
+            if val != UNSET_SENTINEL:
+                if val is not None or k not in optional_fields:
+                    m[k] = val
+        return m
 RetrieveAgentRequestFallbackModelConfigurationVoice = Literal[
     "alloy",
@@ -834,6 +1158,22 @@ class RetrieveAgentRequestResponseFormatAgentsResponseJSONSchema(BaseModel):
     strict: Optional[bool] = False
     r"""Whether to enable strict schema adherence when generating the output. If set to true, the model will always follow the exact schema defined in the schema field. Only a subset of JSON Schema is supported when strict is true."""
+    @model_serializer(mode="wrap")
+    def serialize_model(self, handler):
+        optional_fields = set(["description", "schema", "strict"])
+        serialized = handler(self)
+        m = {}
+        for n, f in type(self).model_fields.items():
+            k = f.alias or n
+            val = serialized.get(k)
+            if val != UNSET_SENTINEL:
+                if val is not None or k not in optional_fields:
+                    m[k] = val
+        return m
 class RetrieveAgentRequestResponseFormatAgentsResponse200JSONSchemaTypedDict(TypedDict):
     r"""
@@ -971,6 +1311,22 @@ class RetrieveAgentRequestFallbackModelConfigurationStreamOptions(BaseModel):
     include_usage: Optional[bool] = None
     r"""If set, an additional chunk will be streamed before the data: [DONE] message. The usage field on this chunk shows the token usage statistics for the entire request, and the choices field will always be an empty array. All other chunks will also include a usage field, but with a null value."""
+    @model_serializer(mode="wrap")
+    def serialize_model(self, handler):
+        optional_fields = set(["include_usage"])
+        serialized = handler(self)
+        m = {}
+        for n, f in type(self).model_fields.items():
+            k = f.alias or n
+            val = serialized.get(k)
+            if val != UNSET_SENTINEL:
+                if val is not None or k not in optional_fields:
+                    m[k] = val
+        return m
 RetrieveAgentRequestFallbackModelConfigurationThinkingTypedDict = TypeAliasType(
     "RetrieveAgentRequestFallbackModelConfigurationThinkingTypedDict",
@@ -1013,6 +1369,22 @@ class RetrieveAgentRequestToolChoiceAgents2(BaseModel):
     type: Optional[RetrieveAgentRequestToolChoiceAgentsType] = None
     r"""The type of the tool. Currently, only function is supported."""
+    @model_serializer(mode="wrap")
+    def serialize_model(self, handler):
+        optional_fields = set(["type"])
+        serialized = handler(self)
+        m = {}
+        for n, f in type(self).model_fields.items():
+            k = f.alias or n
+            val = serialized.get(k)
+            if val != UNSET_SENTINEL:
+                if val is not None or k not in optional_fields:
+                    m[k] = val
+        return m
 RetrieveAgentRequestToolChoiceAgents1 = Literal[
     "none",
@@ -1084,6 +1456,158 @@ class RetrieveAgentRequestFallbackModelConfigurationGuardrails(BaseModel):
     r"""Determines whether the guardrail runs on the input (user message) or output (model response)."""
+class RetrieveAgentRequestFallbackModelConfigurationFallbacksTypedDict(TypedDict):
+    model: str
+    r"""Fallback model identifier"""
+class RetrieveAgentRequestFallbackModelConfigurationFallbacks(BaseModel):
+    model: str
+    r"""Fallback model identifier"""
+class RetrieveAgentRequestFallbackModelConfigurationAgentsRetryTypedDict(TypedDict):
+    r"""Retry configuration for the request"""
+    count: NotRequired[float]
+    r"""Number of retry attempts (1-5)"""
+    on_codes: NotRequired[List[float]]
+    r"""HTTP status codes that trigger retry logic"""
+class RetrieveAgentRequestFallbackModelConfigurationAgentsRetry(BaseModel):
+    r"""Retry configuration for the request"""
+    count: Optional[float] = 3
+    r"""Number of retry attempts (1-5)"""
+    on_codes: Optional[List[float]] = None
+    r"""HTTP status codes that trigger retry logic"""
+    @model_serializer(mode="wrap")
+    def serialize_model(self, handler):
+        optional_fields = set(["count", "on_codes"])
+        serialized = handler(self)
+        m = {}
+        for n, f in type(self).model_fields.items():
+            k = f.alias or n
+            val = serialized.get(k)
+            if val != UNSET_SENTINEL:
+                if val is not None or k not in optional_fields:
+                    m[k] = val
+        return m
+RetrieveAgentRequestFallbackModelConfigurationType = Literal["exact_match",]
+class RetrieveAgentRequestFallbackModelConfigurationCacheTypedDict(TypedDict):
+    r"""Cache configuration for the request."""
+    type: RetrieveAgentRequestFallbackModelConfigurationType
+    ttl: NotRequired[float]
+    r"""Time to live for cached responses in seconds. Maximum 259200 seconds (3 days)."""
+class RetrieveAgentRequestFallbackModelConfigurationCache(BaseModel):
+    r"""Cache configuration for the request."""
+    type: RetrieveAgentRequestFallbackModelConfigurationType
+    ttl: Optional[float] = 1800
+    r"""Time to live for cached responses in seconds. Maximum 259200 seconds (3 days)."""
+    @model_serializer(mode="wrap")
+    def serialize_model(self, handler):
+        optional_fields = set(["ttl"])
+        serialized = handler(self)
+        m = {}
+        for n, f in type(self).model_fields.items():
+            k = f.alias or n
+            val = serialized.get(k)
+            if val != UNSET_SENTINEL:
+                if val is not None or k not in optional_fields:
+                    m[k] = val
+        return m
+RetrieveAgentRequestLoadBalancerAgentsType = Literal["weight_based",]
+class RetrieveAgentRequestLoadBalancerAgentsModelsTypedDict(TypedDict):
+    model: str
+    r"""Model identifier for load balancing"""
+    weight: NotRequired[float]
+    r"""Weight assigned to this model for load balancing"""
+class RetrieveAgentRequestLoadBalancerAgentsModels(BaseModel):
+    model: str
+    r"""Model identifier for load balancing"""
+    weight: Optional[float] = 0.5
+    r"""Weight assigned to this model for load balancing"""
+    @model_serializer(mode="wrap")
+    def serialize_model(self, handler):
+        optional_fields = set(["weight"])
+        serialized = handler(self)
+        m = {}
+        for n, f in type(self).model_fields.items():
+            k = f.alias or n
+            val = serialized.get(k)
+            if val != UNSET_SENTINEL:
+                if val is not None or k not in optional_fields:
+                    m[k] = val
+        return m
+class RetrieveAgentRequestLoadBalancerAgents1TypedDict(TypedDict):
+    type: RetrieveAgentRequestLoadBalancerAgentsType
+    models: List[RetrieveAgentRequestLoadBalancerAgentsModelsTypedDict]
+class RetrieveAgentRequestLoadBalancerAgents1(BaseModel):
+    type: RetrieveAgentRequestLoadBalancerAgentsType
+    models: List[RetrieveAgentRequestLoadBalancerAgentsModels]
+RetrieveAgentRequestFallbackModelConfigurationLoadBalancerTypedDict = (
+    RetrieveAgentRequestLoadBalancerAgents1TypedDict
+)
+r"""Load balancer configuration for the request."""
+RetrieveAgentRequestFallbackModelConfigurationLoadBalancer = (
+    RetrieveAgentRequestLoadBalancerAgents1
+)
+r"""Load balancer configuration for the request."""
+class RetrieveAgentRequestFallbackModelConfigurationTimeoutTypedDict(TypedDict):
+    r"""Timeout configuration to apply to the request. If the request exceeds the timeout, it will be retried or fallback to the next model if configured."""
+    call_timeout: float
+    r"""Timeout value in milliseconds"""
+class RetrieveAgentRequestFallbackModelConfigurationTimeout(BaseModel):
+    r"""Timeout configuration to apply to the request. If the request exceeds the timeout, it will be retried or fallback to the next model if configured."""
+    call_timeout: float
+    r"""Timeout value in milliseconds"""
 class RetrieveAgentRequestFallbackModelConfigurationParametersTypedDict(TypedDict):
     r"""Optional model parameters specific to this fallback model. Overrides primary model parameters if this fallback is used."""
@@ -1159,6 +1683,22 @@ class RetrieveAgentRequestFallbackModelConfigurationParametersTypedDict(TypedDic
         List[RetrieveAgentRequestFallbackModelConfigurationGuardrailsTypedDict]
     ]
     r"""A list of guardrails to apply to the request."""
+    fallbacks: NotRequired[
+        List[RetrieveAgentRequestFallbackModelConfigurationFallbacksTypedDict]
+    ]
+    r"""Array of fallback models to use if primary model fails"""
+    retry: NotRequired[
+        RetrieveAgentRequestFallbackModelConfigurationAgentsRetryTypedDict
+    ]
+    r"""Retry configuration for the request"""
+    cache: NotRequired[RetrieveAgentRequestFallbackModelConfigurationCacheTypedDict]
+    r"""Cache configuration for the request."""
+    load_balancer: NotRequired[
+        RetrieveAgentRequestFallbackModelConfigurationLoadBalancerTypedDict
+    ]
+    r"""Load balancer configuration for the request."""
+    timeout: NotRequired[RetrieveAgentRequestFallbackModelConfigurationTimeoutTypedDict]
+    r"""Timeout configuration to apply to the request. If the request exceeds the timeout, it will be retried or fallback to the next model if configured."""
 class RetrieveAgentRequestFallbackModelConfigurationParameters(BaseModel):
@@ -1252,72 +1792,95 @@ class RetrieveAgentRequestFallbackModelConfigurationParameters(BaseModel):
     ] = None
     r"""A list of guardrails to apply to the request."""
+    fallbacks: Optional[
+        List[RetrieveAgentRequestFallbackModelConfigurationFallbacks]
+    ] = None
+    r"""Array of fallback models to use if primary model fails"""
+    retry: Optional[RetrieveAgentRequestFallbackModelConfigurationAgentsRetry] = None
+    r"""Retry configuration for the request"""
+    cache: Optional[RetrieveAgentRequestFallbackModelConfigurationCache] = None
+    r"""Cache configuration for the request."""
+    load_balancer: Optional[
+        RetrieveAgentRequestFallbackModelConfigurationLoadBalancer
+    ] = None
+    r"""Load balancer configuration for the request."""
+    timeout: Optional[RetrieveAgentRequestFallbackModelConfigurationTimeout] = None
+    r"""Timeout configuration to apply to the request. If the request exceeds the timeout, it will be retried or fallback to the next model if configured."""
     @model_serializer(mode="wrap")
     def serialize_model(self, handler):
-        optional_fields = [
-            "audio",
-            "frequency_penalty",
-            "max_tokens",
-            "max_completion_tokens",
-            "logprobs",
-            "top_logprobs",
-            "n",
-            "presence_penalty",
-            "response_format",
-            "reasoning_effort",
-            "verbosity",
-            "seed",
-            "stop",
-            "stream_options",
-            "thinking",
-            "temperature",
-            "top_p",
-            "top_k",
-            "tool_choice",
-            "parallel_tool_calls",
-            "modalities",
-            "guardrails",
-        ]
-        nullable_fields = [
-            "audio",
-            "frequency_penalty",
-            "max_tokens",
-            "max_completion_tokens",
-            "logprobs",
-            "top_logprobs",
-            "n",
-            "presence_penalty",
-            "seed",
-            "stop",
-            "stream_options",
-            "temperature",
-            "top_p",
-            "top_k",
-            "modalities",
-        ]
-        null_default_fields = []
+        optional_fields = set(
+            [
+                "audio",
+                "frequency_penalty",
+                "max_tokens",
+                "max_completion_tokens",
+                "logprobs",
+                "top_logprobs",
+                "n",
+                "presence_penalty",
+                "response_format",
+                "reasoning_effort",
+                "verbosity",
+                "seed",
+                "stop",
+                "stream_options",
+                "thinking",
+                "temperature",
+                "top_p",
+                "top_k",
+                "tool_choice",
+                "parallel_tool_calls",
+                "modalities",
+                "guardrails",
+                "fallbacks",
+                "retry",
+                "cache",
+                "load_balancer",
+                "timeout",
+            ]
+        )
+        nullable_fields = set(
+            [
+                "audio",
+                "frequency_penalty",
+                "max_tokens",
+                "max_completion_tokens",
+                "logprobs",
+                "top_logprobs",
+                "n",
+                "presence_penalty",
+                "seed",
+                "stop",
+                "stream_options",
+                "temperature",
+                "top_p",
+                "top_k",
+                "modalities",
+            ]
+        )
         serialized = handler(self)
         m = {}
         for n, f in type(self).model_fields.items():
             k = f.alias or n
             val = serialized.get(k)
-            serialized.pop(k, None)
-            optional_nullable = k in optional_fields and k in nullable_fields
-            is_set = (
-                self.__pydantic_fields_set__.intersection({n})
-                or k in null_default_fields
-            )  # pylint: disable=no-member
-            if val is not None and val != UNSET_SENTINEL:
-                m[k] = val
-            elif val != UNSET_SENTINEL and (
-                not k in optional_fields or (optional_nullable and is_set)
-            ):
-                m[k] = val
+            is_nullable_and_explicitly_set = (
+                k in nullable_fields
+                and (self.__pydantic_fields_set__.intersection({n}))  # pylint: disable=no-member
+            )
+            if val != UNSET_SENTINEL:
+                if (
+                    val is not None
+                    or k not in optional_fields
+                    or is_nullable_and_explicitly_set
+                ):
+                    m[k] = val
         return m
@@ -1340,6 +1903,22 @@ class RetrieveAgentRequestFallbackModelConfigurationRetry(BaseModel):
     on_codes: Optional[List[float]] = None
     r"""HTTP status codes that trigger retry logic"""
+    @model_serializer(mode="wrap")
+    def serialize_model(self, handler):
+        optional_fields = set(["count", "on_codes"])
+        serialized = handler(self)
+        m = {}
+        for n, f in type(self).model_fields.items():
+            k = f.alias or n
+            val = serialized.get(k)
+            if val != UNSET_SENTINEL:
+                if val is not None or k not in optional_fields:
+                    m[k] = val
+        return m
 class RetrieveAgentRequestFallbackModelConfiguration2TypedDict(TypedDict):
     r"""Fallback model configuration with optional parameters and retry settings."""
@@ -1368,6 +1947,22 @@ class RetrieveAgentRequestFallbackModelConfiguration2(BaseModel):
     retry: Optional[RetrieveAgentRequestFallbackModelConfigurationRetry] = None
     r"""Retry configuration for this fallback model. Allows customizing retry count (1-5) and HTTP status codes that trigger retries."""
+    @model_serializer(mode="wrap")
+    def serialize_model(self, handler):
+        optional_fields = set(["parameters", "retry"])
+        serialized = handler(self)
+        m = {}
+        for n, f in type(self).model_fields.items():
+            k = f.alias or n
+            val = serialized.get(k)
+            if val != UNSET_SENTINEL:
+                if val is not None or k not in optional_fields:
+                    m[k] = val
+        return m
 RetrieveAgentRequestFallbackModelConfigurationTypedDict = TypeAliasType(
     "RetrieveAgentRequestFallbackModelConfigurationTypedDict",
@@ -1418,31 +2013,28 @@ class RetrieveAgentRequestModel(BaseModel):
     @model_serializer(mode="wrap")
     def serialize_model(self, handler):
-        optional_fields = ["integration_id", "parameters", "retry", "fallback_models"]
-        nullable_fields = ["integration_id", "fallback_models"]
-        null_default_fields = []
+        optional_fields = set(
+            ["integration_id", "parameters", "retry", "fallback_models"]
+        )
+        nullable_fields = set(["integration_id", "fallback_models"])
         serialized = handler(self)
         m = {}
         for n, f in type(self).model_fields.items():
             k = f.alias or n
             val = serialized.get(k)
-            serialized.pop(k, None)
-            optional_nullable = k in optional_fields and k in nullable_fields
-            is_set = (
-                self.__pydantic_fields_set__.intersection({n})
-                or k in null_default_fields
-            )  # pylint: disable=no-member
-            if val is not None and val != UNSET_SENTINEL:
-                m[k] = val
-            elif val != UNSET_SENTINEL and (
-                not k in optional_fields or (optional_nullable and is_set)
-            ):
-                m[k] = val
+            is_nullable_and_explicitly_set = (
+                k in nullable_fields
+                and (self.__pydantic_fields_set__.intersection({n}))  # pylint: disable=no-member
+            )
+            if val != UNSET_SENTINEL:
+                if (
+                    val is not None
+                    or k not in optional_fields
+                    or is_nullable_and_explicitly_set
+                ):
+                    m[k] = val
         return m
@@ -1461,6 +2053,22 @@ class RetrieveAgentRequestTeamOfAgents(BaseModel):
     role: Optional[str] = None
     r"""The role of the agent in this context. This is used to give extra information to the leader to help it decide which agent to hand off to."""
+    @model_serializer(mode="wrap")
+    def serialize_model(self, handler):
+        optional_fields = set(["role"])
+        serialized = handler(self)
+        m = {}
+        for n, f in type(self).model_fields.items():
+            k = f.alias or n
+            val = serialized.get(k)
+            if val != UNSET_SENTINEL:
+                if val is not None or k not in optional_fields:
+                    m[k] = val
+        return m
 class RetrieveAgentRequestMetricsTypedDict(TypedDict):
     total_cost: NotRequired[float]
@@ -1469,6 +2077,22 @@ class RetrieveAgentRequestMetricsTypedDict(TypedDict):
 class RetrieveAgentRequestMetrics(BaseModel):
     total_cost: Optional[float] = 0
+    @model_serializer(mode="wrap")
+    def serialize_model(self, handler):
+        optional_fields = set(["total_cost"])
+        serialized = handler(self)
+        m = {}
+        for n, f in type(self).model_fields.items():
+            k = f.alias or n
+            val = serialized.get(k)
+            if val != UNSET_SENTINEL:
+                if val is not None or k not in optional_fields:
+                    m[k] = val
+        return m
 class RetrieveAgentRequestKnowledgeBasesTypedDict(TypedDict):
     knowledge_id: str
@@ -1593,42 +2217,39 @@ class RetrieveAgentRequestResponseBody(BaseModel):
     @model_serializer(mode="wrap")
     def serialize_model(self, handler):
-        optional_fields = [
-            "created_by_id",
-            "updated_by_id",
-            "created",
-            "updated",
-            "system_prompt",
-            "settings",
-            "version_hash",
-            "metrics",
-            "variables",
-            "knowledge_bases",
-            "source",
-        ]
-        nullable_fields = ["created_by_id", "updated_by_id"]
-        null_default_fields = []
+        optional_fields = set(
+            [
+                "created_by_id",
+                "updated_by_id",
+                "created",
+                "updated",
+                "system_prompt",
+                "settings",
+                "version_hash",
+                "metrics",
+                "variables",
+                "knowledge_bases",
+                "source",
+            ]
+        )
+        nullable_fields = set(["created_by_id", "updated_by_id"])
         serialized = handler(self)
         m = {}
         for n, f in type(self).model_fields.items():
             k = f.alias or n
             val = serialized.get(k)
-            serialized.pop(k, None)
-            optional_nullable = k in optional_fields and k in nullable_fields
-            is_set = (
-                self.__pydantic_fields_set__.intersection({n})
-                or k in null_default_fields
-            )  # pylint: disable=no-member
-            if val is not None and val != UNSET_SENTINEL:
-                m[k] = val
-            elif val != UNSET_SENTINEL and (
-                not k in optional_fields or (optional_nullable and is_set)
-            ):
-                m[k] = val
+            is_nullable_and_explicitly_set = (
+                k in nullable_fields
+                and (self.__pydantic_fields_set__.intersection({n}))  # pylint: disable=no-member
+            )
+            if val != UNSET_SENTINEL:
+                if (
+                    val is not None
+                    or k not in optional_fields
+                    or is_nullable_and_explicitly_set
+                ):
+                    m[k] = val
         return m

orq-ai-sdk 4.2.0rc28__py3-none-any.whl → 4.2.6__py3-none-any.whl

orq-ai-sdk 4.2.0rc28py3-none-any.whl → 4.2.6py3-none-any.whl