PyPI - retab - Versions diffs - 0.0.41__py3-none-any.whl → 0.0.43__py3-none-any.whl - Mend

retab 0.0.41py3-none-any.whl → 0.0.43py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (60) hide show

retab/__init__.py +2 -1
retab/client.py +21 -50
retab/resources/consensus/client.py +1 -1
retab/resources/consensus/completions_stream.py +2 -2
retab/resources/consensus/responses.py +1 -1
retab/resources/documents/client.py +103 -76
retab/resources/documents/extractions.py +55 -46
retab/resources/evaluations/client.py +32 -19
retab/resources/evaluations/documents.py +12 -11
retab/resources/evaluations/iterations.py +48 -30
retab/resources/jsonlUtils.py +3 -4
retab/resources/processors/automations/endpoints.py +57 -43
retab/resources/processors/automations/links.py +54 -45
retab/resources/processors/automations/logs.py +2 -2
retab/resources/processors/automations/mailboxes.py +116 -90
retab/resources/processors/automations/outlook.py +126 -86
retab/resources/processors/automations/tests.py +7 -1
retab/resources/processors/client.py +37 -32
retab/resources/usage.py +2 -0
retab/types/ai_models.py +1 -1
retab/types/automations/mailboxes.py +1 -1
retab/types/deprecated_evals.py +195 -0
retab/types/documents/extractions.py +2 -2
retab/types/documents/parse.py +3 -1
retab/types/evaluations/__init__.py +5 -2
retab/types/evaluations/iterations.py +9 -43
retab/types/evaluations/model.py +20 -22
retab/types/extractions.py +35 -9
retab/types/logs.py +5 -6
retab/types/mime.py +1 -10
retab/types/schemas/enhance.py +22 -5
retab/types/schemas/evaluate.py +1 -1
retab/types/schemas/object.py +26 -0
retab/types/standards.py +2 -2
retab/utils/__init__.py +3 -0
retab/utils/ai_models.py +127 -12
retab/utils/hashing.py +24 -0
retab/utils/json_schema.py +1 -26
retab/utils/mime.py +0 -17
retab-0.0.43.dist-info/METADATA +117 -0
{retab-0.0.41.dist-info → retab-0.0.43.dist-info}/RECORD +43 -57
retab/_utils/__init__.py +0 -0
retab/_utils/_model_cards/anthropic.yaml +0 -59
retab/_utils/_model_cards/auto.yaml +0 -43
retab/_utils/_model_cards/gemini.yaml +0 -117
retab/_utils/_model_cards/openai.yaml +0 -301
retab/_utils/_model_cards/xai.yaml +0 -28
retab/_utils/ai_models.py +0 -138
retab/_utils/benchmarking.py +0 -484
retab/_utils/chat.py +0 -327
retab/_utils/display.py +0 -440
retab/_utils/json_schema.py +0 -2156
retab/_utils/mime.py +0 -165
retab/_utils/responses.py +0 -169
retab/_utils/stream_context_managers.py +0 -52
retab/_utils/usage/__init__.py +0 -0
retab/_utils/usage/usage.py +0 -301
retab-0.0.41.dist-info/METADATA +0 -418
{retab-0.0.41.dist-info → retab-0.0.43.dist-info}/WHEEL +0 -0
{retab-0.0.41.dist-info → retab-0.0.43.dist-info}/top_level.txt +0 -0

retab/__init__.py CHANGED Viewed

@@ -1,4 +1,5 @@
 from .client import AsyncRetab, Retab
 from .types.schemas.object import Schema
+from . import utils
-__all__ = ["Retab", "AsyncRetab", "Schema"]
+__all__ = ["Retab", "AsyncRetab", "Schema", "utils"]

retab/client.py CHANGED Viewed

@@ -7,10 +7,9 @@ import backoff
 import backoff.types
 import httpx
 import truststore
-from pydantic_core import PydanticUndefined
-from .resources import consensus, documents, evals, files, finetuning, models, processors, schemas, secrets, usage, evaluations
-from .types.standards import PreparedRequest
+from .resources import consensus, documents, files, finetuning, models, processors, schemas, secrets, usage, evaluations
+from .types.standards import PreparedRequest, FieldUnset
 class MaxRetriesExceeded(Exception):
@@ -34,7 +33,7 @@ class BaseRetab:
     Args:
         api_key (str, optional): Retab API key. If not provided, will look for RETAB_API_KEY env variable.
-        base_url (str, optional): Base URL for API requests. Defaults to https://api.retab.dev
+        base_url (str, optional): Base URL for API requests. Defaults to https://api.retab.com
         timeout (float): Request timeout in seconds. Defaults to 240.0
         max_retries (int): Maximum number of retries for failed requests. Defaults to 3
         openai_api_key (str, optional): OpenAI API key. Will look for OPENAI_API_KEY env variable if not provided
@@ -43,32 +42,27 @@ class BaseRetab:
         ValueError: If no API key is provided through arguments or environment variables
     """
-    #   claude_api_key (str, optional): Claude API key. Will look for CLAUDE_API_KEY env variable if not provided
-    #   xai_api_key (str, optional): XAI API key. Will look for XAI_API_KEY env variable if not provided
-    #   gemini_api_key (str, optional): Gemini API key. Will look for GEMINI_API_KEY env variable if not provided
     def __init__(
         self,
         api_key: Optional[str] = None,
         base_url: Optional[str] = None,
         timeout: float = 240.0,
         max_retries: int = 3,
-        openai_api_key: Optional[str] = PydanticUndefined,  # type: ignore[assignment]
-        gemini_api_key: Optional[str] = PydanticUndefined,  # type: ignore[assignment]
-        # claude_api_key: Optional[str] = PydanticUndefined,   # type: ignore[assignment]
-        xai_api_key: Optional[str] = PydanticUndefined,  # type: ignore[assignment]
+        openai_api_key: Optional[str] = FieldUnset,
+        gemini_api_key: Optional[str] = FieldUnset,
+        xai_api_key: Optional[str] = FieldUnset,
     ) -> None:
         if api_key is None:
             api_key = os.environ.get("RETAB_API_KEY")
         if api_key is None:
             raise ValueError(
-                "No API key provided. You can create an API key at https://retab.dev\n"
+                "No API key provided. You can create an API key at https://retab.com\n"
                 "Then either pass it to the client (api_key='your-key') or set the RETAB_API_KEY environment variable"
             )
         if base_url is None:
-            base_url = os.environ.get("RETAB_API_BASE_URL", "https://api.retab.dev")
+            base_url = os.environ.get("RETAB_API_BASE_URL", "https://api.retab.com")
         truststore.inject_into_ssl()
         self.api_key = api_key
@@ -80,30 +74,21 @@ class BaseRetab:
             "Content-Type": "application/json",
         }
-        # Only check environment variables if the value is PydanticUndefined
-        if openai_api_key is PydanticUndefined:
+        # Only check environment variables if the value is FieldUnset
+        if openai_api_key is FieldUnset:
             openai_api_key = os.environ.get("OPENAI_API_KEY")
-        # if claude_api_key is PydanticUndefined:
-        #    claude_api_key = os.environ.get("CLAUDE_API_KEY")
-        # if xai_api_key is PydanticUndefined:
-        #    xai_api_key = os.environ.get("XAI_API_KEY")
-        if gemini_api_key is PydanticUndefined:
+        if gemini_api_key is FieldUnset:
             gemini_api_key = os.environ.get("GEMINI_API_KEY")
-        # Only add headers if the values are actual strings (not None or PydanticUndefined)
-        if openai_api_key and openai_api_key is not PydanticUndefined:
+        # Only add headers if the values are actual strings (not None or FieldUnset)
+        if openai_api_key and openai_api_key is not FieldUnset:
             self.headers["OpenAI-Api-Key"] = openai_api_key
-        # if claude_api_key and claude_api_key is not PydanticUndefined:
-        #    self.headers["Anthropic-Api-Key"] = claude_api_key
-        if xai_api_key and xai_api_key is not PydanticUndefined:
+        if xai_api_key and xai_api_key is not FieldUnset:
             self.headers["XAI-Api-Key"] = xai_api_key
-        if gemini_api_key and gemini_api_key is not PydanticUndefined:
+        if gemini_api_key and gemini_api_key is not FieldUnset:
             self.headers["Gemini-Api-Key"] = gemini_api_key
     def _prepare_url(self, endpoint: str) -> str:
@@ -154,12 +139,10 @@ class Retab(BaseRetab):
     Args:
         api_key (str, optional): Retab API key. If not provided, will look for RETAB_API_KEY env variable.
-        base_url (str, optional): Base URL for API requests. Defaults to https://api.retab.dev
+        base_url (str, optional): Base URL for API requests. Defaults to https://api.retab.com
         timeout (float): Request timeout in seconds. Defaults to 240.0
         max_retries (int): Maximum number of retries for failed requests. Defaults to 3
         openai_api_key (str, optional): OpenAI API key. Will look for OPENAI_API_KEY env variable if not provided
-        claude_api_key (str, optional): Claude API key. Will look for CLAUDE_API_KEY env variable if not provided
-        xai_api_key (str, optional): XAI API key. Will look for XAI_API_KEY env variable if not provided
         gemini_api_key (str, optional): Gemini API key. Will look for GEMINI_API_KEY env variable if not provided
     Attributes:
@@ -179,10 +162,8 @@ class Retab(BaseRetab):
         base_url: Optional[str] = None,
         timeout: float = 240.0,
         max_retries: int = 3,
-        openai_api_key: Optional[str] = PydanticUndefined,  # type: ignore[assignment]
-        gemini_api_key: Optional[str] = PydanticUndefined,  # type: ignore[assignment]
-        # claude_api_key: Optional[str] = PydanticUndefined,   # type: ignore[assignment]
-        # xai_api_key: Optional[str] = PydanticUndefined,   # type: ignore[assignment]
+        openai_api_key: Optional[str] = FieldUnset,
+        gemini_api_key: Optional[str] = FieldUnset,
     ) -> None:
         super().__init__(
             api_key=api_key,
@@ -191,16 +172,12 @@ class Retab(BaseRetab):
             max_retries=max_retries,
             openai_api_key=openai_api_key,
             gemini_api_key=gemini_api_key,
-            # claude_api_key=claude_api_key,
-            # xai_api_key=xai_api_key,
         )
         self.client = httpx.Client(timeout=self.timeout)
-        self.evals = evals.Evals(client=self)
         self.evaluations = evaluations.Evaluations(client=self)
         self.files = files.Files(client=self)
         self.fine_tuning = finetuning.FineTuning(client=self)
-        # self.prompt_optimization = prompt_optimization.PromptOptimization(client=self)
         self.documents = documents.Documents(client=self)
         self.models = models.Models(client=self)
         self.schemas = schemas.Schemas(client=self)
@@ -422,7 +399,7 @@ class AsyncRetab(BaseRetab):
     Args:
         api_key (str, optional): Retab API key. If not provided, will look for RETAB_API_KEY env variable.
-        base_url (str, optional): Base URL for API requests. Defaults to https://api.retab.dev
+        base_url (str, optional): Base URL for API requests. Defaults to https://api.retab.com
         timeout (float): Request timeout in seconds. Defaults to 240.0
         max_retries (int): Maximum number of retries for failed requests. Defaults to 3
         openai_api_key (str, optional): OpenAI API key. Will look for OPENAI_API_KEY env variable if not provided
@@ -447,10 +424,8 @@ class AsyncRetab(BaseRetab):
         base_url: Optional[str] = None,
         timeout: float = 240.0,
         max_retries: int = 3,
-        openai_api_key: Optional[str] = PydanticUndefined,  # type: ignore[assignment]
-        gemini_api_key: Optional[str] = PydanticUndefined,  # type: ignore[assignment]
-        # claude_api_key: Optional[str] = PydanticUndefined,   # type: ignore[assignment]
-        # xai_api_key: Optional[str] = PydanticUndefined,   # type: ignore[assignment]
+        openai_api_key: Optional[str] = FieldUnset,
+        gemini_api_key: Optional[str] = FieldUnset,
     ) -> None:
         super().__init__(
             api_key=api_key,
@@ -459,17 +434,13 @@ class AsyncRetab(BaseRetab):
             max_retries=max_retries,
             openai_api_key=openai_api_key,
             gemini_api_key=gemini_api_key,
-            # claude_api_key=claude_api_key,
-            # xai_api_key=xai_api_key,
         )
         self.client = httpx.AsyncClient(timeout=self.timeout)
-        self.evals = evals.AsyncEvals(client=self)
         self.evaluations = evaluations.AsyncEvaluations(client=self)
         self.files = files.AsyncFiles(client=self)
         self.fine_tuning = finetuning.AsyncFineTuning(client=self)
-        # self.prompt_optimization = prompt_optimization.AsyncPromptOptimization(client=self)
         self.documents = documents.AsyncDocuments(client=self)
         self.models = models.AsyncModels(client=self)
         self.schemas = schemas.AsyncSchemas(client=self)

retab/resources/consensus/client.py CHANGED Viewed

@@ -21,7 +21,7 @@ class BaseConsensusMixin:
             mode=mode,
         )
-        return PreparedRequest(method="POST", url="/v1/consensus/reconcile", data=request.model_dump(), idempotency_key=idempotency_key)
+        return PreparedRequest(method="POST", url="/v1/consensus/reconcile", data=request.model_dump(mode="json", exclude_unset=True), idempotency_key=idempotency_key)
 class Consensus(SyncAPIResource, BaseConsensusMixin):

retab/resources/consensus/completions_stream.py CHANGED Viewed

@@ -123,7 +123,7 @@ class Completions(SyncAPIResource, BaseCompletionsMixin):
         Usage:
         ```python
-        with retab.devpletions.stream(json_schema, messages, model, temperature, reasoning_effort) as stream:
+        with retab.completions.stream(json_schema, messages, model, temperature, reasoning_effort) as stream:
             for response in stream:
                 print(response)
         ```
@@ -210,7 +210,7 @@ class AsyncCompletions(AsyncAPIResource, BaseCompletionsMixin):
         Usage:
         ```python
-        async with retab.devpletions.stream(json_schema, messages, model, temperature, reasoning_effort, n_consensus) as stream:
+        async with retab.completions.stream(json_schema, messages, model, temperature, reasoning_effort, n_consensus) as stream:
             async for response in stream:
                 print(response)
         ```

retab/resources/consensus/responses.py CHANGED Viewed

@@ -55,7 +55,7 @@ class BaseResponsesMixin:
             instructions=instructions,
         )
-        return PreparedRequest(method="POST", url="/v1/responses", data=request.model_dump(), idempotency_key=idempotency_key)
+        return PreparedRequest(method="POST", url="/v1/responses", data=request.model_dump(mode="json", exclude_unset=True), idempotency_key=idempotency_key)
     def prepare_parse(
         self,

retab/resources/documents/client.py CHANGED Viewed

@@ -4,7 +4,6 @@ from typing import Any, Literal
 import PIL.Image
 from pydantic import HttpUrl
-from pydantic_core import PydanticUndefined
 from openai.types.chat.chat_completion_reasoning_effort import ChatCompletionReasoningEffort
 from ..._resource import AsyncAPIResource, SyncAPIResource
@@ -17,9 +16,9 @@ from ...types.documents.parse import ParseRequest, ParseResult, TableParsingForm
 from ...types.browser_canvas import BrowserCanvas
 from ...types.mime import MIMEData
 from ...types.modalities import Modality
+from ...types.ai_models import LLMModel
 from ...types.schemas.object import Schema
-from ...types.standards import PreparedRequest
-from .extractions import AsyncExtractions, Extractions
+from ...types.standards import PreparedRequest, FieldUnset
 def maybe_parse_to_pydantic(schema: Schema, response: RetabParsedChatCompletion, allow_partial: bool = False) -> RetabParsedChatCompletion:
@@ -39,40 +38,50 @@ class BaseDocumentsMixin:
         self,
         document: Path | str | IOBase | MIMEData | PIL.Image.Image | HttpUrl,
         modality: Modality = "native",
-        image_resolution_dpi: int = PydanticUndefined,  # type: ignore[assignment]
-        browser_canvas: BrowserCanvas = PydanticUndefined,  # type: ignore[assignment]
+        image_resolution_dpi: int = FieldUnset,
+        browser_canvas: BrowserCanvas = FieldUnset,
         idempotency_key: str | None = None,
     ) -> PreparedRequest:
         mime_document = prepare_mime_document(document)
-        loading_request = DocumentCreateMessageRequest(
-            document=mime_document,
-            modality=modality,
-            image_resolution_dpi=image_resolution_dpi,
-            browser_canvas=browser_canvas,
+        loading_request_dict = {
+            "document": mime_document,
+            "modality": modality,
+        }
+        if image_resolution_dpi is not FieldUnset:
+            loading_request_dict["image_resolution_dpi"] = image_resolution_dpi
+        if browser_canvas is not FieldUnset:
+            loading_request_dict["browser_canvas"] = browser_canvas
+        loading_request = DocumentCreateMessageRequest(**loading_request_dict)
+        return PreparedRequest(
+            method="POST", url="/v1/documents/create_messages", data=loading_request.model_dump(mode="json", exclude_unset=True), idempotency_key=idempotency_key
         )
-        return PreparedRequest(method="POST", url="/v1/documents/create_messages", data=loading_request.model_dump(), idempotency_key=idempotency_key)
     def _prepare_create_inputs(
         self,
         document: Path | str | IOBase | MIMEData | PIL.Image.Image | HttpUrl,
         json_schema: dict[str, Any] | Path | str,
         modality: Modality = "native",
-        image_resolution_dpi: int = PydanticUndefined,  # type: ignore[assignment],
-        browser_canvas: BrowserCanvas = PydanticUndefined,  # type: ignore[assignment],
+        image_resolution_dpi: int = FieldUnset,
+        browser_canvas: BrowserCanvas = FieldUnset,
         idempotency_key: str | None = None,
     ) -> PreparedRequest:
         mime_document = prepare_mime_document(document)
         loaded_schema = load_json_schema(json_schema)
-        loading_request = DocumentCreateInputRequest(
-            document=mime_document,
-            modality=modality,
-            json_schema=loaded_schema,
-            image_resolution_dpi=image_resolution_dpi,
-            browser_canvas=browser_canvas,
-        )
-        return PreparedRequest(method="POST", url="/v1/documents/create_inputs", data=loading_request.model_dump(), idempotency_key=idempotency_key)
+        loading_request_dict = {
+            "document": mime_document,
+            "modality": modality,
+            "json_schema": loaded_schema,
+        }
+        if image_resolution_dpi is not FieldUnset:
+            loading_request_dict["image_resolution_dpi"] = image_resolution_dpi
+        if browser_canvas is not FieldUnset:
+            loading_request_dict["browser_canvas"] = browser_canvas
+        loading_request = DocumentCreateInputRequest(**loading_request_dict)
+        return PreparedRequest(method="POST", url="/v1/documents/create_inputs", data=loading_request.model_dump(mode="json", exclude_unset=True), idempotency_key=idempotency_key)
     def _prepare_correct_image_orientation(self, document: Path | str | IOBase | MIMEData | PIL.Image.Image) -> PreparedRequest:
         mime_document = prepare_mime_document(document)
@@ -89,7 +98,7 @@ class BaseDocumentsMixin:
     def _prepare_parse(
         self,
         document: Path | str | IOBase | MIMEData | PIL.Image.Image | HttpUrl,
-        fast_mode: bool = False,
+        model: LLMModel,
         table_parsing_format: TableParsingFormat = "html",
         image_resolution_dpi: int = 72,
         browser_canvas: BrowserCanvas = "A4",
@@ -99,12 +108,12 @@ class BaseDocumentsMixin:
         parse_request = ParseRequest(
             document=mime_document,
-            fast_mode=fast_mode,
+            model=model,
             table_parsing_format=table_parsing_format,
             image_resolution_dpi=image_resolution_dpi,
             browser_canvas=browser_canvas,
         )
-        return PreparedRequest(method="POST", url="/v1/documents/parse", data=parse_request.model_dump(), idempotency_key=idempotency_key)
+        return PreparedRequest(method="POST", url="/v1/documents/parse", data=parse_request.model_dump(mode="json", exclude_unset=True), idempotency_key=idempotency_key)
 class Documents(SyncAPIResource, BaseDocumentsMixin):
@@ -144,8 +153,8 @@ class Documents(SyncAPIResource, BaseDocumentsMixin):
         self,
         document: Path | str | IOBase | MIMEData | PIL.Image.Image | HttpUrl,
         modality: Modality = "native",
-        image_resolution_dpi: int = PydanticUndefined,  # type: ignore[assignment]
-        browser_canvas: BrowserCanvas = PydanticUndefined,  # type: ignore[assignment]
+        image_resolution_dpi: int = FieldUnset,
+        browser_canvas: BrowserCanvas = FieldUnset,
         idempotency_key: str | None = None,
     ) -> DocumentMessage:
         """
@@ -174,8 +183,8 @@ class Documents(SyncAPIResource, BaseDocumentsMixin):
         document: Path | str | IOBase | MIMEData | PIL.Image.Image | HttpUrl,
         json_schema: dict[str, Any] | Path | str,
         modality: Modality = "native",
-        image_resolution_dpi: int = PydanticUndefined,  # type: ignore[assignment]
-        browser_canvas: BrowserCanvas = PydanticUndefined,  # type: ignore[assignment]
+        image_resolution_dpi: int = FieldUnset,
+        browser_canvas: BrowserCanvas = FieldUnset,
         idempotency_key: str | None = None,
     ) -> DocumentMessage:
         """
@@ -211,12 +220,12 @@ class Documents(SyncAPIResource, BaseDocumentsMixin):
         model: str,
         document: Path | str | IOBase | HttpUrl | None = None,
         documents: list[Path | str | IOBase | HttpUrl] | None = None,
-        image_resolution_dpi: int = PydanticUndefined,  # type: ignore[assignment]
-        browser_canvas: BrowserCanvas = PydanticUndefined,  # type: ignore[assignment]
-        temperature: float = PydanticUndefined,  # type: ignore[assignment]
-        modality: Modality = PydanticUndefined,  # type: ignore[assignment]
-        reasoning_effort: ChatCompletionReasoningEffort = PydanticUndefined,  # type: ignore[assignment]
-        n_consensus: int = PydanticUndefined,  # type: ignore[assignment]
+        image_resolution_dpi: int = FieldUnset,
+        browser_canvas: BrowserCanvas = FieldUnset,
+        temperature: float = FieldUnset,
+        modality: Modality = FieldUnset,
+        reasoning_effort: ChatCompletionReasoningEffort = FieldUnset,
+        n_consensus: int = FieldUnset,
         idempotency_key: str | None = None,
         store: bool = False,
     ) -> RetabParsedChatCompletion:
@@ -263,20 +272,29 @@ class Documents(SyncAPIResource, BaseDocumentsMixin):
         else:
             raise ValueError("Must provide either 'document' or 'documents' parameter.")
+        # Build request dictionary with only provided fields
+        request_dict = {
+            "json_schema": json_schema,
+            "documents": processed_documents,
+            "model": model,
+            "stream": False,
+            "store": store,
+        }
+        if temperature is not FieldUnset:
+            request_dict["temperature"] = temperature
+        if modality is not FieldUnset:
+            request_dict["modality"] = modality
+        if reasoning_effort is not FieldUnset:
+            request_dict["reasoning_effort"] = reasoning_effort
+        if n_consensus is not FieldUnset:
+            request_dict["n_consensus"] = n_consensus
+        if image_resolution_dpi is not FieldUnset:
+            request_dict["image_resolution_dpi"] = image_resolution_dpi
+        if browser_canvas is not FieldUnset:
+            request_dict["browser_canvas"] = browser_canvas
         # Validate DocumentAPIRequest data (raises exception if invalid)
-        request = DocumentExtractRequest(
-            json_schema=json_schema,
-            documents=processed_documents,
-            model=model,
-            temperature=temperature,
-            stream=False,
-            modality=modality,
-            store=store,
-            reasoning_effort=reasoning_effort,
-            n_consensus=n_consensus,
-            image_resolution_dpi=image_resolution_dpi,
-            browser_canvas=browser_canvas,
-        )
+        request = DocumentExtractRequest(**request_dict)
         prepared_request = PreparedRequest(
             method="POST", url="/v1/documents/extract", data=request.model_dump(mode="json", exclude_unset=True, exclude_defaults=True), idempotency_key=idempotency_key
@@ -290,7 +308,7 @@ class Documents(SyncAPIResource, BaseDocumentsMixin):
     def parse(
         self,
         document: Path | str | IOBase | MIMEData | PIL.Image.Image | HttpUrl,
-        fast_mode: bool = False,
+        model: LLMModel,
         table_parsing_format: TableParsingFormat = "html",
         image_resolution_dpi: int = 72,
         browser_canvas: BrowserCanvas = "A4",
@@ -304,7 +322,7 @@ class Documents(SyncAPIResource, BaseDocumentsMixin):
         Args:
             document: The document to parse. Can be a file path (Path or str), file-like object, MIMEData, PIL Image, or URL.
-            fast_mode: Use fast mode for parsing (may reduce quality). Defaults to False.
+            model: The AI model to use for document parsing.
             table_parsing_format: Format for parsing tables. Options: "html", "json", "yaml", "markdown". Defaults to "html".
             image_resolution_dpi: DPI for image processing. Defaults to 72.
             browser_canvas: Canvas size for document rendering. Defaults to "A4".
@@ -318,7 +336,7 @@ class Documents(SyncAPIResource, BaseDocumentsMixin):
         """
         request = self._prepare_parse(
             document=document,
-            fast_mode=fast_mode,
+            model=model,
             table_parsing_format=table_parsing_format,
             image_resolution_dpi=image_resolution_dpi,
             browser_canvas=browser_canvas,
@@ -339,8 +357,8 @@ class AsyncDocuments(AsyncAPIResource, BaseDocumentsMixin):
         self,
         document: Path | str | IOBase | MIMEData | PIL.Image.Image,
         modality: Modality = "native",
-        image_resolution_dpi: int = PydanticUndefined,  # type: ignore[assignment]
-        browser_canvas: BrowserCanvas = PydanticUndefined,  # type: ignore[assignment]
+        image_resolution_dpi: int = FieldUnset,
+        browser_canvas: BrowserCanvas = FieldUnset,
         idempotency_key: str | None = None,
     ) -> DocumentMessage:
         """
@@ -371,8 +389,8 @@ class AsyncDocuments(AsyncAPIResource, BaseDocumentsMixin):
         document: Path | str | IOBase | MIMEData | PIL.Image.Image | HttpUrl,
         json_schema: dict[str, Any] | Path | str,
         modality: Modality = "native",
-        image_resolution_dpi: int = PydanticUndefined,  # type: ignore[assignment]
-        browser_canvas: BrowserCanvas = PydanticUndefined,  # type: ignore[assignment]
+        image_resolution_dpi: int = FieldUnset,
+        browser_canvas: BrowserCanvas = FieldUnset,
         idempotency_key: str | None = None,
     ) -> DocumentMessage:
         """
@@ -433,12 +451,12 @@ class AsyncDocuments(AsyncAPIResource, BaseDocumentsMixin):
         model: str,
         document: Path | str | IOBase | HttpUrl | None = None,
         documents: list[Path | str | IOBase | HttpUrl] | None = None,
-        image_resolution_dpi: int = PydanticUndefined,  # type: ignore[assignment]
-        browser_canvas: BrowserCanvas = PydanticUndefined,  # type: ignore[assignment]
-        temperature: float = PydanticUndefined,  # type: ignore[assignment]
-        modality: Modality = PydanticUndefined,  # type: ignore[assignment]
-        reasoning_effort: ChatCompletionReasoningEffort = PydanticUndefined,  # type: ignore[assignment]
-        n_consensus: int = PydanticUndefined,  # type: ignore[assignment]
+        image_resolution_dpi: int = FieldUnset,
+        browser_canvas: BrowserCanvas = FieldUnset,
+        temperature: float = FieldUnset,
+        modality: Modality = FieldUnset,
+        reasoning_effort: ChatCompletionReasoningEffort = FieldUnset,
+        n_consensus: int = FieldUnset,
         idempotency_key: str | None = None,
         store: bool = False,
     ) -> RetabParsedChatCompletion:
@@ -485,20 +503,29 @@ class AsyncDocuments(AsyncAPIResource, BaseDocumentsMixin):
         else:
             raise ValueError("Must provide either 'document' or 'documents' parameter.")
+        # Build request dictionary with only provided fields
+        request_dict = {
+            "json_schema": json_schema,
+            "documents": processed_documents,
+            "model": model,
+            "stream": False,
+            "store": store,
+        }
+        if temperature is not FieldUnset:
+            request_dict["temperature"] = temperature
+        if modality is not FieldUnset:
+            request_dict["modality"] = modality
+        if reasoning_effort is not FieldUnset:
+            request_dict["reasoning_effort"] = reasoning_effort
+        if n_consensus is not FieldUnset:
+            request_dict["n_consensus"] = n_consensus
+        if image_resolution_dpi is not FieldUnset:
+            request_dict["image_resolution_dpi"] = image_resolution_dpi
+        if browser_canvas is not FieldUnset:
+            request_dict["browser_canvas"] = browser_canvas
         # Validate DocumentAPIRequest data (raises exception if invalid)
-        request = DocumentExtractRequest(
-            json_schema=json_schema,
-            documents=processed_documents,
-            model=model,
-            temperature=temperature,
-            stream=False,
-            modality=modality,
-            store=store,
-            reasoning_effort=reasoning_effort,
-            n_consensus=n_consensus,
-            image_resolution_dpi=image_resolution_dpi,
-            browser_canvas=browser_canvas,
-        )
+        request = DocumentExtractRequest(**request_dict)
         prepared_request = PreparedRequest(
             method="POST", url="/v1/documents/extract", data=request.model_dump(mode="json", exclude_unset=True, exclude_defaults=True), idempotency_key=idempotency_key
@@ -512,7 +539,7 @@ class AsyncDocuments(AsyncAPIResource, BaseDocumentsMixin):
     async def parse(
         self,
         document: Path | str | IOBase | MIMEData | PIL.Image.Image | HttpUrl,
-        fast_mode: bool = False,
+        model: LLMModel,
         table_parsing_format: TableParsingFormat = "html",
         image_resolution_dpi: int = 72,
         browser_canvas: BrowserCanvas = "A4",
@@ -526,7 +553,7 @@ class AsyncDocuments(AsyncAPIResource, BaseDocumentsMixin):
         Args:
             document: The document to parse. Can be a file path (Path or str), file-like object, MIMEData, PIL Image, or URL.
-            fast_mode: Use fast mode for parsing (may reduce quality). Defaults to False.
+            model: The AI model to use for document parsing.
             table_parsing_format: Format for parsing tables. Options: "html", "json", "yaml", "markdown". Defaults to "html".
             image_resolution_dpi: DPI for image processing. Defaults to 72.
             browser_canvas: Canvas size for document rendering. Defaults to "A4".
@@ -540,7 +567,7 @@ class AsyncDocuments(AsyncAPIResource, BaseDocumentsMixin):
         """
         request = self._prepare_parse(
             document=document,
-            fast_mode=fast_mode,
+            model=model,
             table_parsing_format=table_parsing_format,
             image_resolution_dpi=image_resolution_dpi,
             browser_canvas=browser_canvas,

retab 0.0.41__py3-none-any.whl → 0.0.43__py3-none-any.whl

retab 0.0.41py3-none-any.whl → 0.0.43py3-none-any.whl