PyPI - orq-ai-sdk - Versions diffs - 4.2.0rc49__py3-none-any.whl → 4.2.12__py3-none-any.whl - Mend

orq-ai-sdk 4.2.0rc49py3-none-any.whl → 4.2.12py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (103) hide show

orq_ai_sdk/_hooks/globalhook.py +0 -1
orq_ai_sdk/_version.py +3 -3
orq_ai_sdk/audio.py +30 -0
orq_ai_sdk/chat.py +22 -0
orq_ai_sdk/completions.py +438 -0
orq_ai_sdk/contacts.py +43 -886
orq_ai_sdk/deployments.py +61 -0
orq_ai_sdk/edits.py +364 -0
orq_ai_sdk/embeddings.py +344 -0
orq_ai_sdk/generations.py +370 -0
orq_ai_sdk/images.py +28 -0
orq_ai_sdk/models/__init__.py +3839 -424
orq_ai_sdk/models/conversationresponse.py +1 -1
orq_ai_sdk/models/conversationwithmessagesresponse.py +1 -1
orq_ai_sdk/models/createagentrequestop.py +768 -12
orq_ai_sdk/models/createagentresponse.py +68 -2
orq_ai_sdk/models/createchatcompletionop.py +538 -313
orq_ai_sdk/models/createcompletionop.py +2078 -0
orq_ai_sdk/models/createcontactop.py +5 -10
orq_ai_sdk/models/createconversationop.py +1 -1
orq_ai_sdk/models/createconversationresponseop.py +2 -2
orq_ai_sdk/models/createdatasetitemop.py +4 -4
orq_ai_sdk/models/createdatasetop.py +1 -1
orq_ai_sdk/models/createdatasourceop.py +1 -1
orq_ai_sdk/models/createembeddingop.py +579 -0
orq_ai_sdk/models/createevalop.py +14 -14
orq_ai_sdk/models/createidentityop.py +1 -1
orq_ai_sdk/models/createimageeditop.py +715 -0
orq_ai_sdk/models/createimageop.py +228 -82
orq_ai_sdk/models/createimagevariationop.py +706 -0
orq_ai_sdk/models/creatememoryop.py +4 -2
orq_ai_sdk/models/createmoderationop.py +521 -0
orq_ai_sdk/models/createpromptop.py +375 -6
orq_ai_sdk/models/creatererankop.py +608 -0
orq_ai_sdk/models/createresponseop.py +2567 -0
orq_ai_sdk/models/createspeechop.py +466 -0
orq_ai_sdk/models/createtoolop.py +6 -6
orq_ai_sdk/models/createtranscriptionop.py +732 -0
orq_ai_sdk/models/createtranslationop.py +702 -0
orq_ai_sdk/models/deploymentgetconfigop.py +17 -7
orq_ai_sdk/models/deploymentsop.py +1 -0
orq_ai_sdk/models/deploymentstreamop.py +7 -0
orq_ai_sdk/models/filegetop.py +1 -1
orq_ai_sdk/models/filelistop.py +1 -1
orq_ai_sdk/models/fileuploadop.py +1 -1
orq_ai_sdk/models/generateconversationnameop.py +1 -1
orq_ai_sdk/models/getallmemoriesop.py +4 -2
orq_ai_sdk/models/getallpromptsop.py +188 -3
orq_ai_sdk/models/getalltoolsop.py +6 -6
orq_ai_sdk/models/getevalsop.py +17 -17
orq_ai_sdk/models/getonepromptop.py +188 -3
orq_ai_sdk/models/getpromptversionop.py +188 -3
orq_ai_sdk/models/invokedeploymentrequest.py +11 -4
orq_ai_sdk/models/listagentsop.py +372 -0
orq_ai_sdk/models/listdatasetdatapointsop.py +4 -4
orq_ai_sdk/models/listdatasetsop.py +1 -1
orq_ai_sdk/models/listdatasourcesop.py +1 -1
orq_ai_sdk/models/listidentitiesop.py +1 -1
orq_ai_sdk/models/listmodelsop.py +1 -0
orq_ai_sdk/models/listpromptversionsop.py +188 -3
orq_ai_sdk/models/partdoneevent.py +1 -1
orq_ai_sdk/models/post_v2_router_ocrop.py +408 -0
orq_ai_sdk/models/publiccontact.py +9 -3
orq_ai_sdk/models/publicidentity.py +62 -0
orq_ai_sdk/models/reasoningpart.py +1 -1
orq_ai_sdk/models/responsedoneevent.py +14 -11
orq_ai_sdk/models/retrieveagentrequestop.py +382 -0
orq_ai_sdk/models/retrievedatapointop.py +4 -4
orq_ai_sdk/models/retrievedatasetop.py +1 -1
orq_ai_sdk/models/retrievedatasourceop.py +1 -1
orq_ai_sdk/models/retrieveidentityop.py +1 -1
orq_ai_sdk/models/retrievememoryop.py +4 -2
orq_ai_sdk/models/retrievetoolop.py +6 -6
orq_ai_sdk/models/runagentop.py +379 -9
orq_ai_sdk/models/streamrunagentop.py +385 -9
orq_ai_sdk/models/updateagentop.py +770 -12
orq_ai_sdk/models/updateconversationop.py +1 -1
orq_ai_sdk/models/updatedatapointop.py +4 -4
orq_ai_sdk/models/updatedatasetop.py +1 -1
orq_ai_sdk/models/updatedatasourceop.py +1 -1
orq_ai_sdk/models/updateevalop.py +14 -14
orq_ai_sdk/models/updateidentityop.py +1 -1
orq_ai_sdk/models/updatememoryop.py +4 -2
orq_ai_sdk/models/updatepromptop.py +375 -6
orq_ai_sdk/models/updatetoolop.py +7 -7
orq_ai_sdk/moderations.py +218 -0
orq_ai_sdk/orq_completions.py +666 -0
orq_ai_sdk/orq_responses.py +398 -0
orq_ai_sdk/rerank.py +330 -0
orq_ai_sdk/router.py +89 -641
orq_ai_sdk/speech.py +333 -0
orq_ai_sdk/transcriptions.py +416 -0
orq_ai_sdk/translations.py +384 -0
orq_ai_sdk/variations.py +364 -0
orq_ai_sdk-4.2.12.dist-info/METADATA +888 -0
{orq_ai_sdk-4.2.0rc49.dist-info → orq_ai_sdk-4.2.12.dist-info}/RECORD +98 -75
{orq_ai_sdk-4.2.0rc49.dist-info → orq_ai_sdk-4.2.12.dist-info}/WHEEL +1 -1
orq_ai_sdk/models/deletecontactop.py +0 -44
orq_ai_sdk/models/listcontactsop.py +0 -265
orq_ai_sdk/models/retrievecontactop.py +0 -142
orq_ai_sdk/models/updatecontactop.py +0 -233
orq_ai_sdk-4.2.0rc49.dist-info/METADATA +0 -788
{orq_ai_sdk-4.2.0rc49.dist-info → orq_ai_sdk-4.2.12.dist-info}/top_level.txt +0 -0

orq_ai_sdk/models/publiccontact.py CHANGED Viewed

@@ -4,11 +4,14 @@ from __future__ import annotations
 from orq_ai_sdk.types import BaseModel, UNSET_SENTINEL
 from pydantic import model_serializer
 from typing import Any, Dict, List, Optional
-from typing_extensions import NotRequired, TypedDict
+from typing_extensions import NotRequired, TypedDict, deprecated
+@deprecated(
+    "warning: ** DEPRECATED ** - This will be removed in a future release, please migrate away from it as soon as possible."
+)
 class PublicContactTypedDict(TypedDict):
-    r"""Information about the identity making the request. If the identity does not exist, it will be created automatically."""
+    r"""@deprecated Use identity instead. Information about the contact making the request."""
     id: str
     r"""Unique identifier for the contact"""
@@ -24,8 +27,11 @@ class PublicContactTypedDict(TypedDict):
     r"""A list of tags associated with the contact"""
+@deprecated(
+    "warning: ** DEPRECATED ** - This will be removed in a future release, please migrate away from it as soon as possible."
+)
 class PublicContact(BaseModel):
-    r"""Information about the identity making the request. If the identity does not exist, it will be created automatically."""
+    r"""@deprecated Use identity instead. Information about the contact making the request."""
     id: str
     r"""Unique identifier for the contact"""

orq_ai_sdk/models/publicidentity.py ADDED Viewed

@@ -0,0 +1,62 @@
+"""Code generated by Speakeasy (https://speakeasy.com). DO NOT EDIT."""
+from __future__ import annotations
+from orq_ai_sdk.types import BaseModel, UNSET_SENTINEL
+from pydantic import model_serializer
+from typing import Any, Dict, List, Optional
+from typing_extensions import NotRequired, TypedDict
+class PublicIdentityTypedDict(TypedDict):
+    r"""Information about the identity making the request. If the identity does not exist, it will be created automatically."""
+    id: str
+    r"""Unique identifier for the contact"""
+    display_name: NotRequired[str]
+    r"""Display name of the contact"""
+    email: NotRequired[str]
+    r"""Email address of the contact"""
+    metadata: NotRequired[List[Dict[str, Any]]]
+    r"""A hash of key/value pairs containing any other data about the contact"""
+    logo_url: NotRequired[str]
+    r"""URL to the contact's avatar or logo"""
+    tags: NotRequired[List[str]]
+    r"""A list of tags associated with the contact"""
+class PublicIdentity(BaseModel):
+    r"""Information about the identity making the request. If the identity does not exist, it will be created automatically."""
+    id: str
+    r"""Unique identifier for the contact"""
+    display_name: Optional[str] = None
+    r"""Display name of the contact"""
+    email: Optional[str] = None
+    r"""Email address of the contact"""
+    metadata: Optional[List[Dict[str, Any]]] = None
+    r"""A hash of key/value pairs containing any other data about the contact"""
+    logo_url: Optional[str] = None
+    r"""URL to the contact's avatar or logo"""
+    tags: Optional[List[str]] = None
+    r"""A list of tags associated with the contact"""
+    @model_serializer(mode="wrap")
+    def serialize_model(self, handler):
+        optional_fields = set(["display_name", "email", "metadata", "logo_url", "tags"])
+        serialized = handler(self)
+        m = {}
+        for n, f in type(self).model_fields.items():
+            k = f.alias or n
+            val = serialized.get(k)
+            if val != UNSET_SENTINEL:
+                if val is not None or k not in optional_fields:
+                    m[k] = val
+        return m

orq_ai_sdk/models/reasoningpart.py CHANGED Viewed

@@ -37,7 +37,7 @@ class ReasoningPart(BaseModel):
     r"""The reasoning or thought process behind the response. Used for chain-of-thought or extended thinking."""
     id: Annotated[Optional[str], pydantic.Field(alias="_id")] = (
-        "reasoning_01kfds3avk2eyg3jz9fghcmt6b"
+        "reasoning_01kfzbgfgy030sq7agj1m0y240"
     )
     r"""Unique identifier for the part. Format: reasoning_{ulid} (e.g., reasoning_01hxyz...)"""

orq_ai_sdk/models/responsedoneevent.py CHANGED Viewed

@@ -17,7 +17,7 @@ from typing_extensions import Annotated, NotRequired, TypedDict
 ResponseDoneEventType = Literal["response.done",]
-FinishReason = Literal[
+ResponseDoneEventFinishReason = Literal[
     "stop",
     "length",
     "tool_calls",
@@ -206,14 +206,14 @@ class ResponseDoneEventUsage(BaseModel):
 ResponseDoneEventDataType = Literal["function",]
-class FunctionTypedDict(TypedDict):
+class ResponseDoneEventFunctionTypedDict(TypedDict):
     name: NotRequired[str]
     r"""The name of the function to call"""
     arguments: NotRequired[str]
     r"""The arguments to pass to the function as JSON string"""
-class Function(BaseModel):
+class ResponseDoneEventFunction(BaseModel):
     name: Optional[str] = None
     r"""The name of the function to call"""
@@ -237,40 +237,43 @@ class Function(BaseModel):
         return m
-class PendingToolCallsTypedDict(TypedDict):
+class ResponseDoneEventPendingToolCallsTypedDict(TypedDict):
     id: str
     r"""Unique identifier for the tool call"""
     type: ResponseDoneEventDataType
-    function: FunctionTypedDict
+    function: ResponseDoneEventFunctionTypedDict
-class PendingToolCalls(BaseModel):
+class ResponseDoneEventPendingToolCalls(BaseModel):
     id: str
     r"""Unique identifier for the tool call"""
     type: ResponseDoneEventDataType
-    function: Function
+    function: ResponseDoneEventFunction
 class ResponseDoneEventDataTypedDict(TypedDict):
-    finish_reason: FinishReason
+    finish_reason: ResponseDoneEventFinishReason
     r"""The reason why the agent stopped generating"""
     usage: NotRequired[ResponseDoneEventUsageTypedDict]
     r"""Token usage statistics for the complete response"""
-    pending_tool_calls: NotRequired[List[PendingToolCallsTypedDict]]
+    pending_tool_calls: NotRequired[List[ResponseDoneEventPendingToolCallsTypedDict]]
     r"""Tool calls awaiting user response (when finishReason is function_call)"""
 class ResponseDoneEventData(BaseModel):
-    finish_reason: Annotated[FinishReason, pydantic.Field(alias="finishReason")]
+    finish_reason: Annotated[
+        ResponseDoneEventFinishReason, pydantic.Field(alias="finishReason")
+    ]
     r"""The reason why the agent stopped generating"""
     usage: Optional[ResponseDoneEventUsage] = None
     r"""Token usage statistics for the complete response"""
     pending_tool_calls: Annotated[
-        Optional[List[PendingToolCalls]], pydantic.Field(alias="pendingToolCalls")
+        Optional[List[ResponseDoneEventPendingToolCalls]],
+        pydantic.Field(alias="pendingToolCalls"),
     ] = None
     r"""Tool calls awaiting user response (when finishReason is function_call)"""

orq_ai_sdk/models/retrieveagentrequestop.py CHANGED Viewed

@@ -666,9 +666,159 @@ class RetrieveAgentRequestAgentsGuardrails(BaseModel):
     r"""Determines whether the guardrail runs on the input (user message) or output (model response)."""
+class RetrieveAgentRequestFallbacksTypedDict(TypedDict):
+    model: str
+    r"""Fallback model identifier"""
+class RetrieveAgentRequestFallbacks(BaseModel):
+    model: str
+    r"""Fallback model identifier"""
+class RetrieveAgentRequestAgentsRetryTypedDict(TypedDict):
+    r"""Retry configuration for the request"""
+    count: NotRequired[float]
+    r"""Number of retry attempts (1-5)"""
+    on_codes: NotRequired[List[float]]
+    r"""HTTP status codes that trigger retry logic"""
+class RetrieveAgentRequestAgentsRetry(BaseModel):
+    r"""Retry configuration for the request"""
+    count: Optional[float] = 3
+    r"""Number of retry attempts (1-5)"""
+    on_codes: Optional[List[float]] = None
+    r"""HTTP status codes that trigger retry logic"""
+    @model_serializer(mode="wrap")
+    def serialize_model(self, handler):
+        optional_fields = set(["count", "on_codes"])
+        serialized = handler(self)
+        m = {}
+        for n, f in type(self).model_fields.items():
+            k = f.alias or n
+            val = serialized.get(k)
+            if val != UNSET_SENTINEL:
+                if val is not None or k not in optional_fields:
+                    m[k] = val
+        return m
+RetrieveAgentRequestType = Literal["exact_match",]
+class RetrieveAgentRequestCacheTypedDict(TypedDict):
+    r"""Cache configuration for the request."""
+    type: RetrieveAgentRequestType
+    ttl: NotRequired[float]
+    r"""Time to live for cached responses in seconds. Maximum 259200 seconds (3 days)."""
+class RetrieveAgentRequestCache(BaseModel):
+    r"""Cache configuration for the request."""
+    type: RetrieveAgentRequestType
+    ttl: Optional[float] = 1800
+    r"""Time to live for cached responses in seconds. Maximum 259200 seconds (3 days)."""
+    @model_serializer(mode="wrap")
+    def serialize_model(self, handler):
+        optional_fields = set(["ttl"])
+        serialized = handler(self)
+        m = {}
+        for n, f in type(self).model_fields.items():
+            k = f.alias or n
+            val = serialized.get(k)
+            if val != UNSET_SENTINEL:
+                if val is not None or k not in optional_fields:
+                    m[k] = val
+        return m
+RetrieveAgentRequestLoadBalancerType = Literal["weight_based",]
+class RetrieveAgentRequestLoadBalancerModelsTypedDict(TypedDict):
+    model: str
+    r"""Model identifier for load balancing"""
+    weight: NotRequired[float]
+    r"""Weight assigned to this model for load balancing"""
+class RetrieveAgentRequestLoadBalancerModels(BaseModel):
+    model: str
+    r"""Model identifier for load balancing"""
+    weight: Optional[float] = 0.5
+    r"""Weight assigned to this model for load balancing"""
+    @model_serializer(mode="wrap")
+    def serialize_model(self, handler):
+        optional_fields = set(["weight"])
+        serialized = handler(self)
+        m = {}
+        for n, f in type(self).model_fields.items():
+            k = f.alias or n
+            val = serialized.get(k)
+            if val != UNSET_SENTINEL:
+                if val is not None or k not in optional_fields:
+                    m[k] = val
+        return m
+class RetrieveAgentRequestLoadBalancer1TypedDict(TypedDict):
+    type: RetrieveAgentRequestLoadBalancerType
+    models: List[RetrieveAgentRequestLoadBalancerModelsTypedDict]
+class RetrieveAgentRequestLoadBalancer1(BaseModel):
+    type: RetrieveAgentRequestLoadBalancerType
+    models: List[RetrieveAgentRequestLoadBalancerModels]
+RetrieveAgentRequestLoadBalancerTypedDict = RetrieveAgentRequestLoadBalancer1TypedDict
+r"""Load balancer configuration for the request."""
+RetrieveAgentRequestLoadBalancer = RetrieveAgentRequestLoadBalancer1
+r"""Load balancer configuration for the request."""
+class RetrieveAgentRequestTimeoutTypedDict(TypedDict):
+    r"""Timeout configuration to apply to the request. If the request exceeds the timeout, it will be retried or fallback to the next model if configured."""
+    call_timeout: float
+    r"""Timeout value in milliseconds"""
+class RetrieveAgentRequestTimeout(BaseModel):
+    r"""Timeout configuration to apply to the request. If the request exceeds the timeout, it will be retried or fallback to the next model if configured."""
+    call_timeout: float
+    r"""Timeout value in milliseconds"""
 class RetrieveAgentRequestParametersTypedDict(TypedDict):
     r"""Model behavior parameters (snake_case) stored as part of the agent configuration. These become the default parameters used when the agent is executed. Commonly used: temperature (0-1, controls randomness), max_completion_tokens (response length), top_p (nucleus sampling). Advanced: frequency_penalty, presence_penalty, response_format (JSON/structured output), reasoning_effort (for o1/thinking models), seed (reproducibility), stop sequences. Model-specific support varies. Runtime parameters in agent execution requests can override these defaults."""
+    name: NotRequired[str]
+    r"""The name to display on the trace. If not specified, the default system name will be used."""
     audio: NotRequired[Nullable[RetrieveAgentRequestAudioTypedDict]]
     r"""Parameters for audio output. Required when audio output is requested with modalities: [\"audio\"]. Learn more."""
     frequency_penalty: NotRequired[Nullable[float]]
@@ -723,11 +873,24 @@ class RetrieveAgentRequestParametersTypedDict(TypedDict):
     r"""Output types that you would like the model to generate. Most models are capable of generating text, which is the default: [\"text\"]. The gpt-4o-audio-preview model can also be used to generate audio. To request that this model generate both text and audio responses, you can use: [\"text\", \"audio\"]."""
     guardrails: NotRequired[List[RetrieveAgentRequestAgentsGuardrailsTypedDict]]
     r"""A list of guardrails to apply to the request."""
+    fallbacks: NotRequired[List[RetrieveAgentRequestFallbacksTypedDict]]
+    r"""Array of fallback models to use if primary model fails"""
+    retry: NotRequired[RetrieveAgentRequestAgentsRetryTypedDict]
+    r"""Retry configuration for the request"""
+    cache: NotRequired[RetrieveAgentRequestCacheTypedDict]
+    r"""Cache configuration for the request."""
+    load_balancer: NotRequired[RetrieveAgentRequestLoadBalancerTypedDict]
+    r"""Load balancer configuration for the request."""
+    timeout: NotRequired[RetrieveAgentRequestTimeoutTypedDict]
+    r"""Timeout configuration to apply to the request. If the request exceeds the timeout, it will be retried or fallback to the next model if configured."""
 class RetrieveAgentRequestParameters(BaseModel):
     r"""Model behavior parameters (snake_case) stored as part of the agent configuration. These become the default parameters used when the agent is executed. Commonly used: temperature (0-1, controls randomness), max_completion_tokens (response length), top_p (nucleus sampling). Advanced: frequency_penalty, presence_penalty, response_format (JSON/structured output), reasoning_effort (for o1/thinking models), seed (reproducibility), stop sequences. Model-specific support varies. Runtime parameters in agent execution requests can override these defaults."""
+    name: Optional[str] = None
+    r"""The name to display on the trace. If not specified, the default system name will be used."""
     audio: OptionalNullable[RetrieveAgentRequestAudio] = UNSET
     r"""Parameters for audio output. Required when audio output is requested with modalities: [\"audio\"]. Learn more."""
@@ -804,10 +967,26 @@ class RetrieveAgentRequestParameters(BaseModel):
     guardrails: Optional[List[RetrieveAgentRequestAgentsGuardrails]] = None
     r"""A list of guardrails to apply to the request."""
+    fallbacks: Optional[List[RetrieveAgentRequestFallbacks]] = None
+    r"""Array of fallback models to use if primary model fails"""
+    retry: Optional[RetrieveAgentRequestAgentsRetry] = None
+    r"""Retry configuration for the request"""
+    cache: Optional[RetrieveAgentRequestCache] = None
+    r"""Cache configuration for the request."""
+    load_balancer: Optional[RetrieveAgentRequestLoadBalancer] = None
+    r"""Load balancer configuration for the request."""
+    timeout: Optional[RetrieveAgentRequestTimeout] = None
+    r"""Timeout configuration to apply to the request. If the request exceeds the timeout, it will be retried or fallback to the next model if configured."""
     @model_serializer(mode="wrap")
     def serialize_model(self, handler):
         optional_fields = set(
             [
+                "name",
                 "audio",
                 "frequency_penalty",
                 "max_tokens",
@@ -830,6 +1009,11 @@ class RetrieveAgentRequestParameters(BaseModel):
                 "parallel_tool_calls",
                 "modalities",
                 "guardrails",
+                "fallbacks",
+                "retry",
+                "cache",
+                "load_balancer",
+                "timeout",
             ]
         )
         nullable_fields = set(
@@ -1278,9 +1462,163 @@ class RetrieveAgentRequestFallbackModelConfigurationGuardrails(BaseModel):
     r"""Determines whether the guardrail runs on the input (user message) or output (model response)."""
+class RetrieveAgentRequestFallbackModelConfigurationFallbacksTypedDict(TypedDict):
+    model: str
+    r"""Fallback model identifier"""
+class RetrieveAgentRequestFallbackModelConfigurationFallbacks(BaseModel):
+    model: str
+    r"""Fallback model identifier"""
+class RetrieveAgentRequestFallbackModelConfigurationAgentsRetryTypedDict(TypedDict):
+    r"""Retry configuration for the request"""
+    count: NotRequired[float]
+    r"""Number of retry attempts (1-5)"""
+    on_codes: NotRequired[List[float]]
+    r"""HTTP status codes that trigger retry logic"""
+class RetrieveAgentRequestFallbackModelConfigurationAgentsRetry(BaseModel):
+    r"""Retry configuration for the request"""
+    count: Optional[float] = 3
+    r"""Number of retry attempts (1-5)"""
+    on_codes: Optional[List[float]] = None
+    r"""HTTP status codes that trigger retry logic"""
+    @model_serializer(mode="wrap")
+    def serialize_model(self, handler):
+        optional_fields = set(["count", "on_codes"])
+        serialized = handler(self)
+        m = {}
+        for n, f in type(self).model_fields.items():
+            k = f.alias or n
+            val = serialized.get(k)
+            if val != UNSET_SENTINEL:
+                if val is not None or k not in optional_fields:
+                    m[k] = val
+        return m
+RetrieveAgentRequestFallbackModelConfigurationType = Literal["exact_match",]
+class RetrieveAgentRequestFallbackModelConfigurationCacheTypedDict(TypedDict):
+    r"""Cache configuration for the request."""
+    type: RetrieveAgentRequestFallbackModelConfigurationType
+    ttl: NotRequired[float]
+    r"""Time to live for cached responses in seconds. Maximum 259200 seconds (3 days)."""
+class RetrieveAgentRequestFallbackModelConfigurationCache(BaseModel):
+    r"""Cache configuration for the request."""
+    type: RetrieveAgentRequestFallbackModelConfigurationType
+    ttl: Optional[float] = 1800
+    r"""Time to live for cached responses in seconds. Maximum 259200 seconds (3 days)."""
+    @model_serializer(mode="wrap")
+    def serialize_model(self, handler):
+        optional_fields = set(["ttl"])
+        serialized = handler(self)
+        m = {}
+        for n, f in type(self).model_fields.items():
+            k = f.alias or n
+            val = serialized.get(k)
+            if val != UNSET_SENTINEL:
+                if val is not None or k not in optional_fields:
+                    m[k] = val
+        return m
+RetrieveAgentRequestLoadBalancerAgentsType = Literal["weight_based",]
+class RetrieveAgentRequestLoadBalancerAgentsModelsTypedDict(TypedDict):
+    model: str
+    r"""Model identifier for load balancing"""
+    weight: NotRequired[float]
+    r"""Weight assigned to this model for load balancing"""
+class RetrieveAgentRequestLoadBalancerAgentsModels(BaseModel):
+    model: str
+    r"""Model identifier for load balancing"""
+    weight: Optional[float] = 0.5
+    r"""Weight assigned to this model for load balancing"""
+    @model_serializer(mode="wrap")
+    def serialize_model(self, handler):
+        optional_fields = set(["weight"])
+        serialized = handler(self)
+        m = {}
+        for n, f in type(self).model_fields.items():
+            k = f.alias or n
+            val = serialized.get(k)
+            if val != UNSET_SENTINEL:
+                if val is not None or k not in optional_fields:
+                    m[k] = val
+        return m
+class RetrieveAgentRequestLoadBalancerAgents1TypedDict(TypedDict):
+    type: RetrieveAgentRequestLoadBalancerAgentsType
+    models: List[RetrieveAgentRequestLoadBalancerAgentsModelsTypedDict]
+class RetrieveAgentRequestLoadBalancerAgents1(BaseModel):
+    type: RetrieveAgentRequestLoadBalancerAgentsType
+    models: List[RetrieveAgentRequestLoadBalancerAgentsModels]
+RetrieveAgentRequestFallbackModelConfigurationLoadBalancerTypedDict = (
+    RetrieveAgentRequestLoadBalancerAgents1TypedDict
+)
+r"""Load balancer configuration for the request."""
+RetrieveAgentRequestFallbackModelConfigurationLoadBalancer = (
+    RetrieveAgentRequestLoadBalancerAgents1
+)
+r"""Load balancer configuration for the request."""
+class RetrieveAgentRequestFallbackModelConfigurationTimeoutTypedDict(TypedDict):
+    r"""Timeout configuration to apply to the request. If the request exceeds the timeout, it will be retried or fallback to the next model if configured."""
+    call_timeout: float
+    r"""Timeout value in milliseconds"""
+class RetrieveAgentRequestFallbackModelConfigurationTimeout(BaseModel):
+    r"""Timeout configuration to apply to the request. If the request exceeds the timeout, it will be retried or fallback to the next model if configured."""
+    call_timeout: float
+    r"""Timeout value in milliseconds"""
 class RetrieveAgentRequestFallbackModelConfigurationParametersTypedDict(TypedDict):
     r"""Optional model parameters specific to this fallback model. Overrides primary model parameters if this fallback is used."""
+    name: NotRequired[str]
+    r"""The name to display on the trace. If not specified, the default system name will be used."""
     audio: NotRequired[
         Nullable[RetrieveAgentRequestFallbackModelConfigurationAudioTypedDict]
     ]
@@ -1353,11 +1691,30 @@ class RetrieveAgentRequestFallbackModelConfigurationParametersTypedDict(TypedDic
         List[RetrieveAgentRequestFallbackModelConfigurationGuardrailsTypedDict]
     ]
     r"""A list of guardrails to apply to the request."""
+    fallbacks: NotRequired[
+        List[RetrieveAgentRequestFallbackModelConfigurationFallbacksTypedDict]
+    ]
+    r"""Array of fallback models to use if primary model fails"""
+    retry: NotRequired[
+        RetrieveAgentRequestFallbackModelConfigurationAgentsRetryTypedDict
+    ]
+    r"""Retry configuration for the request"""
+    cache: NotRequired[RetrieveAgentRequestFallbackModelConfigurationCacheTypedDict]
+    r"""Cache configuration for the request."""
+    load_balancer: NotRequired[
+        RetrieveAgentRequestFallbackModelConfigurationLoadBalancerTypedDict
+    ]
+    r"""Load balancer configuration for the request."""
+    timeout: NotRequired[RetrieveAgentRequestFallbackModelConfigurationTimeoutTypedDict]
+    r"""Timeout configuration to apply to the request. If the request exceeds the timeout, it will be retried or fallback to the next model if configured."""
 class RetrieveAgentRequestFallbackModelConfigurationParameters(BaseModel):
     r"""Optional model parameters specific to this fallback model. Overrides primary model parameters if this fallback is used."""
+    name: Optional[str] = None
+    r"""The name to display on the trace. If not specified, the default system name will be used."""
     audio: OptionalNullable[RetrieveAgentRequestFallbackModelConfigurationAudio] = UNSET
     r"""Parameters for audio output. Required when audio output is requested with modalities: [\"audio\"]. Learn more."""
@@ -1446,10 +1803,30 @@ class RetrieveAgentRequestFallbackModelConfigurationParameters(BaseModel):
     ] = None
     r"""A list of guardrails to apply to the request."""
+    fallbacks: Optional[
+        List[RetrieveAgentRequestFallbackModelConfigurationFallbacks]
+    ] = None
+    r"""Array of fallback models to use if primary model fails"""
+    retry: Optional[RetrieveAgentRequestFallbackModelConfigurationAgentsRetry] = None
+    r"""Retry configuration for the request"""
+    cache: Optional[RetrieveAgentRequestFallbackModelConfigurationCache] = None
+    r"""Cache configuration for the request."""
+    load_balancer: Optional[
+        RetrieveAgentRequestFallbackModelConfigurationLoadBalancer
+    ] = None
+    r"""Load balancer configuration for the request."""
+    timeout: Optional[RetrieveAgentRequestFallbackModelConfigurationTimeout] = None
+    r"""Timeout configuration to apply to the request. If the request exceeds the timeout, it will be retried or fallback to the next model if configured."""
     @model_serializer(mode="wrap")
     def serialize_model(self, handler):
         optional_fields = set(
             [
+                "name",
                 "audio",
                 "frequency_penalty",
                 "max_tokens",
@@ -1472,6 +1849,11 @@ class RetrieveAgentRequestFallbackModelConfigurationParameters(BaseModel):
                 "parallel_tool_calls",
                 "modalities",
                 "guardrails",
+                "fallbacks",
+                "retry",
+                "cache",
+                "load_balancer",
+                "timeout",
             ]
         )
         nullable_fields = set(

orq_ai_sdk/models/retrievedatapointop.py CHANGED Viewed

@@ -738,7 +738,7 @@ class RetrieveDatapointEvaluations3(BaseModel):
     source: Optional[RetrieveDatapointEvaluationsDatasetsResponseSource] = "orq"
-    reviewed_at: Optional[datetime] = parse_datetime("2026-01-20T13:21:57.016Z")
+    reviewed_at: Optional[datetime] = parse_datetime("2026-01-27T09:10:46.903Z")
     r"""The date and time the item was reviewed"""
     @model_serializer(mode="wrap")
@@ -806,7 +806,7 @@ class RetrieveDatapointEvaluations2(BaseModel):
     source: Optional[RetrieveDatapointEvaluationsDatasetsSource] = "orq"
-    reviewed_at: Optional[datetime] = parse_datetime("2026-01-20T13:21:57.015Z")
+    reviewed_at: Optional[datetime] = parse_datetime("2026-01-27T09:10:46.903Z")
     r"""The date and time the item was reviewed"""
     @model_serializer(mode="wrap")
@@ -874,7 +874,7 @@ class RetrieveDatapointEvaluations1(BaseModel):
     source: Optional[RetrieveDatapointEvaluationsSource] = "orq"
-    reviewed_at: Optional[datetime] = parse_datetime("2026-01-20T13:21:57.014Z")
+    reviewed_at: Optional[datetime] = parse_datetime("2026-01-27T09:10:46.902Z")
     r"""The date and time the item was reviewed"""
     @model_serializer(mode="wrap")
@@ -977,7 +977,7 @@ class RetrieveDatapointResponseBody(BaseModel):
     created: Optional[datetime] = None
     r"""The date and time the resource was created"""
-    updated: Optional[datetime] = parse_datetime("2026-01-20T13:21:43.266Z")
+    updated: Optional[datetime] = parse_datetime("2026-01-27T09:10:34.517Z")
     r"""The date and time the resource was last updated"""
     @model_serializer(mode="wrap")

orq-ai-sdk 4.2.0rc49__py3-none-any.whl → 4.2.12__py3-none-any.whl

orq-ai-sdk 4.2.0rc49py3-none-any.whl → 4.2.12py3-none-any.whl