PyPI - python-codex - Versions diffs - 0.1.2__py3-none-any.whl → 0.1.4__py3-none-any.whl - Mend

python-codex 0.1.2py3-none-any.whl → 0.1.4py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (60) hide show

pycodex/__init__.py +5 -1
pycodex/agent.py +89 -51
pycodex/cli.py +152 -45
pycodex/collaboration.py +6 -7
pycodex/compat.py +99 -0
pycodex/context.py +110 -87
pycodex/doctor.py +40 -40
pycodex/model.py +429 -90
pycodex/portable.py +33 -33
pycodex/portable_server.py +22 -21
pycodex/prompts/models.json +30 -0
pycodex/protocol.py +84 -86
pycodex/runtime.py +36 -35
pycodex/runtime_services.py +69 -69
pycodex/tools/agent_tool_schemas.py +0 -2
pycodex/tools/apply_patch_tool.py +45 -46
pycodex/tools/base_tool.py +35 -36
pycodex/tools/close_agent_tool.py +2 -4
pycodex/tools/code_mode_manager.py +61 -61
pycodex/tools/exec_command_tool.py +5 -6
pycodex/tools/exec_runtime.js +3 -3
pycodex/tools/exec_tool.py +2 -4
pycodex/tools/grep_files_tool.py +10 -11
pycodex/tools/list_dir_tool.py +8 -9
pycodex/tools/read_file_tool.py +13 -14
pycodex/tools/request_permissions_tool.py +2 -4
pycodex/tools/request_user_input_tool.py +13 -14
pycodex/tools/resume_agent_tool.py +2 -4
pycodex/tools/send_input_tool.py +8 -9
pycodex/tools/shell_command_tool.py +5 -6
pycodex/tools/shell_tool.py +5 -6
pycodex/tools/spawn_agent_tool.py +4 -5
pycodex/tools/unified_exec_manager.py +62 -61
pycodex/tools/update_plan_tool.py +4 -5
pycodex/tools/view_image_tool.py +4 -5
pycodex/tools/wait_agent_tool.py +2 -4
pycodex/tools/wait_tool.py +4 -5
pycodex/tools/web_search_tool.py +1 -3
pycodex/tools/write_stdin_tool.py +4 -5
pycodex/utils/__init__.py +4 -0
pycodex/utils/compactor.py +189 -0
pycodex/utils/dotenv.py +6 -6
pycodex/utils/get_env.py +37 -33
pycodex/utils/random_ids.py +1 -2
pycodex/utils/session_persist.py +483 -0
pycodex/utils/visualize.py +197 -83
{python_codex-0.1.2.dist-info → python_codex-0.1.4.dist-info}/METADATA +32 -11
python_codex-0.1.4.dist-info/RECORD +76 -0
{python_codex-0.1.2.dist-info → python_codex-0.1.4.dist-info}/WHEEL +1 -1
responses_server/app.py +32 -20
responses_server/config.py +17 -17
responses_server/payload_processors.py +26 -17
responses_server/server.py +11 -11
responses_server/session_store.py +10 -10
responses_server/stream_router.py +83 -64
responses_server/tools/custom_adapter.py +12 -12
responses_server/tools/web_search.py +33 -33
python_codex-0.1.2.dist-info/RECORD +0 -73
{python_codex-0.1.2.dist-info → python_codex-0.1.4.dist-info}/entry_points.txt +0 -0
{python_codex-0.1.2.dist-info → python_codex-0.1.4.dist-info}/licenses/LICENSE +0 -0

pycodex/model.py CHANGED Viewed

@@ -1,15 +1,16 @@
-from __future__ import annotations
 import asyncio
 import json
 import os
+import re
 import urllib.parse
-from collections.abc import Callable
 from dataclasses import dataclass, field, replace
 from pathlib import Path
-from typing import Protocol
+from typing import Callable
+from .compat import Protocol
 import requests
+import typing
 try:
     import tomllib
@@ -29,38 +30,47 @@ from .utils import build_user_agent, uuid7_string
 DEFAULT_CODEX_CONFIG_PATH = Path.home() / ".codex" / "config.toml"
 DEFAULT_ORIGINATOR = "pycodex"
 ModelStreamEventHandler = Callable[[ModelStreamEvent], None]
-NOOP_MODEL_STREAM_EVENT_HANDLER: ModelStreamEventHandler = lambda _event: None
+NOOP_MODEL_STREAM_EVENT_HANDLER: 'ModelStreamEventHandler' = lambda _event: None
+DEFAULT_STREAM_MAX_RETRIES = 5
+DEFAULT_STREAM_IDLE_TIMEOUT_MS = 300_000
+INITIAL_RETRY_DELAY_SECONDS = 0.2
+RETRY_BACKOFF_FACTOR = 2.0
+RATE_LIMIT_RETRY_AFTER_RE = re.compile(
+    r"(?i)try again in\s*(\d+(?:\.\d+)?)\s*(s|ms|seconds?)"
+)
 class ModelClient(Protocol):
     async def complete(
         self,
-        prompt: Prompt,
-        event_handler: ModelStreamEventHandler = NOOP_MODEL_STREAM_EVENT_HANDLER,
-    ) -> ModelResponse:
+        prompt: 'Prompt',
+        event_handler: 'ModelStreamEventHandler' = NOOP_MODEL_STREAM_EVENT_HANDLER,
+    ) -> 'ModelResponse':
         """Return the next batch of model output items for the current prompt."""
-@dataclass(frozen=True, slots=True)
+@dataclass(frozen=True, )
 class ResponsesProviderConfig:
-    model: str
-    provider_name: str
-    base_url: str
-    api_key_env: str
-    wire_api: str = "responses"
-    query_params: dict[str, str] = field(default_factory=dict)
-    reasoning_effort: str | None = None
-    reasoning_summary: str | None = None
-    verbosity: str | None = None
-    sandbox_mode: str | None = None
-    beta_features_header: str | None = None
+    model: 'str'
+    provider_name: 'str'
+    base_url: 'str'
+    api_key_env: 'typing.Union[str, None]'
+    wire_api: 'str' = "responses"
+    query_params: 'typing.Dict[str, str]' = field(default_factory=dict)
+    reasoning_effort: 'typing.Union[str, None]' = None
+    reasoning_summary: 'typing.Union[str, None]' = None
+    verbosity: 'typing.Union[str, None]' = None
+    sandbox_mode: 'typing.Union[str, None]' = None
+    beta_features_header: 'typing.Union[str, None]' = None
+    stream_max_retries: 'typing.Union[int, None]' = None
+    stream_idle_timeout_ms: 'typing.Union[int, None]' = None
     @classmethod
     def from_codex_config(
         cls,
-        config_path: str | Path = DEFAULT_CODEX_CONFIG_PATH,
-        profile: str | None = None,
-    ) -> ResponsesProviderConfig:
+        config_path: 'typing.Union[str, Path]' = DEFAULT_CODEX_CONFIG_PATH,
+        profile: 'typing.Union[str, None]' = None,
+    ) -> 'ResponsesProviderConfig':
         data = tomllib.loads(Path(config_path).read_text())
         selected = dict(data)
         if profile is not None:
@@ -76,17 +86,13 @@ class ResponsesProviderConfig:
             raise ValueError(f"unsupported wire_api for Python client: {wire_api}")
         api_key_env = provider.get("env_key")
-        if not api_key_env:
-            raise ValueError(
-                f"provider {provider_name} does not define env_key in Codex config"
-            )
         query_params = {
             str(key): str(value)
             for key, value in provider.get("query_params", {}).items()
         }
         features = selected.get("features", {})
-        beta_features: list[str] = []
+        beta_features: 'typing.List[str]' = []
         if isinstance(features, dict) and features.get("guardian_approval") is True:
             beta_features.append("guardian_approval")
         return cls(
@@ -101,9 +107,13 @@ class ResponsesProviderConfig:
             verbosity=selected.get("model_verbosity"),
             sandbox_mode=selected.get("sandbox_mode"),
             beta_features_header=",".join(beta_features) or None,
+            stream_max_retries=_optional_int(provider.get("stream_max_retries")),
+            stream_idle_timeout_ms=_optional_int(provider.get("stream_idle_timeout_ms")),
         )
-    def api_key(self) -> str:
+    def api_key(self) -> 'typing.Union[str, None]':
+        if not self.api_key_env:
+            return None
         value = os.environ.get(self.api_key_env, "")
         if not value:
             raise RuntimeError(
@@ -113,9 +123,9 @@ class ResponsesProviderConfig:
     def with_overrides(
         self,
-        model: str | None = None,
-        reasoning_effort: str | None = None,
-    ) -> ResponsesProviderConfig:
+        model: 'typing.Union[str, None]' = None,
+        reasoning_effort: 'typing.Union[str, None]' = None,
+    ) -> 'ResponsesProviderConfig':
         return replace(
             self,
             model=self.model if model is None else model,
@@ -126,11 +136,41 @@ class ResponsesProviderConfig:
             ),
         )
+    def effective_stream_max_retries(self) -> 'int':
+        if self.stream_max_retries is None:
+            return DEFAULT_STREAM_MAX_RETRIES
+        return max(int(self.stream_max_retries), 0)
+    def effective_stream_idle_timeout_seconds(self) -> 'float':
+        if self.stream_idle_timeout_ms is None:
+            return DEFAULT_STREAM_IDLE_TIMEOUT_MS / 1000.0
+        return max(int(self.stream_idle_timeout_ms), 1) / 1000.0
 class ResponsesApiError(RuntimeError):
     pass
+class ResponsesRetryableError(ResponsesApiError):
+    def __init__(
+        self,
+        message: 'str',
+        retry_delay_seconds: 'typing.Union[float, None]' = None,
+    ) -> 'None':
+        super().__init__(message)
+        self.retry_delay_seconds = retry_delay_seconds
+@dataclass
+class _StreamDiagnostics:
+    raw_lines_received: 'int' = 0
+    sse_events_received: 'int' = 0
+    output_items_received: 'int' = 0
+    last_sse_event_name: 'str' = ""
+    last_event_type: 'str' = ""
+    last_payload_excerpt: 'str' = ""
 class ResponsesModelClient:
     """Minimal OpenAI-compatible Responses API client.
@@ -141,13 +181,13 @@ class ResponsesModelClient:
     def __init__(
         self,
-        config: ResponsesProviderConfig,
-        timeout_seconds: float = 120.0,
-        session_id: str | None = None,
-        originator: str = DEFAULT_ORIGINATOR,
-        user_agent: str | None = None,
-        openai_subagent: str | None = None,
-    ) -> None:
+        config: 'ResponsesProviderConfig',
+        timeout_seconds: 'float' = 120.0,
+        session_id: 'typing.Union[str, None]' = None,
+        originator: 'str' = DEFAULT_ORIGINATOR,
+        user_agent: 'typing.Union[str, None]' = None,
+        openai_subagent: 'typing.Union[str, None]' = None,
+    ) -> 'None':
         self._config = config
         self.model = config.model
         self._timeout_seconds = timeout_seconds
@@ -159,22 +199,22 @@ class ResponsesModelClient:
     @classmethod
     def from_codex_config(
         cls,
-        config_path: str | Path = DEFAULT_CODEX_CONFIG_PATH,
-        profile: str | None = None,
-        timeout_seconds: float = 120.0,
-        originator: str = DEFAULT_ORIGINATOR,
-        user_agent: str | None = None,
-    ) -> ResponsesModelClient:
+        config_path: 'typing.Union[str, Path]' = DEFAULT_CODEX_CONFIG_PATH,
+        profile: 'typing.Union[str, None]' = None,
+        timeout_seconds: 'float' = 120.0,
+        originator: 'str' = DEFAULT_ORIGINATOR,
+        user_agent: 'typing.Union[str, None]' = None,
+    ) -> 'ResponsesModelClient':
         config = ResponsesProviderConfig.from_codex_config(config_path, profile)
         return cls(config, timeout_seconds, originator=originator, user_agent=user_agent)
     def with_overrides(
         self,
-        model: str | None = None,
-        reasoning_effort: str | None = None,
-        session_id: str | None = None,
-        openai_subagent: str | None = None,
-    ) -> ResponsesModelClient:
+        model: 'typing.Union[str, None]' = None,
+        reasoning_effort: 'typing.Union[str, None]' = None,
+        session_id: 'typing.Union[str, None]' = None,
+        openai_subagent: 'typing.Union[str, None]' = None,
+    ) -> 'ResponsesModelClient':
         return ResponsesModelClient(
             self._config.with_overrides(
                 model or self.model,
@@ -191,35 +231,64 @@ class ResponsesModelClient:
             ),
         )
-    def responses_url(self) -> str:
+    def responses_url(self) -> 'str':
         base_url = self._config.base_url.rstrip("/")
         url = f"{base_url}/responses"
         if self._config.query_params:
             return f"{url}?{urllib.parse.urlencode(self._config.query_params)}"
         return url
-    def models_url(self) -> str:
+    def models_url(self) -> 'str':
         base_url = self._config.base_url.rstrip("/")
         url = f"{base_url}/models"
         if self._config.query_params:
             return f"{url}?{urllib.parse.urlencode(self._config.query_params)}"
         return url
-    async def list_models(self) -> list[str]:
+    async def list_models(self) -> 'typing.List[str]':
         return await asyncio.to_thread(self._list_models_sync)
     async def complete(
         self,
-        prompt: Prompt,
-        event_handler: ModelStreamEventHandler = NOOP_MODEL_STREAM_EVENT_HANDLER,
-    ) -> ModelResponse:
-        return await asyncio.to_thread(self._complete_sync, prompt, event_handler)
+        prompt: 'Prompt',
+        event_handler: 'ModelStreamEventHandler' = NOOP_MODEL_STREAM_EVENT_HANDLER,
+    ) -> 'ModelResponse':
+        retries = 0
+        max_retries = self._config.effective_stream_max_retries()
+        while True:
+            try:
+                return await asyncio.to_thread(
+                    self._complete_sync,
+                    prompt,
+                    event_handler,
+                )
+            except ResponsesRetryableError as exc:
+                if retries >= max_retries:
+                    raise
+                retries += 1
+                delay_seconds = exc.retry_delay_seconds
+                if delay_seconds is None:
+                    delay_seconds = self._retry_delay_seconds(retries)
+                event_handler(
+                    ModelStreamEvent(
+                        kind="stream_error",
+                        payload={
+                            "message": f"Reconnecting... {retries}/{max_retries}",
+                            "attempt": retries,
+                            "max_retries": max_retries,
+                            "delay_seconds": delay_seconds,
+                            "error": str(exc),
+                        },
+                    )
+                )
+                if delay_seconds > 0:
+                    await asyncio.sleep(delay_seconds)
     def _complete_sync(
         self,
-        prompt: Prompt,
-        event_handler: ModelStreamEventHandler,
-    ) -> ModelResponse:
+        prompt: 'Prompt',
+        event_handler: 'ModelStreamEventHandler',
+    ) -> 'ModelResponse':
         payload = self._build_payload(prompt)
         body = json.dumps(payload).encode("utf-8")
         url = self.responses_url()
@@ -230,6 +299,7 @@ class ResponsesModelClient:
             headers=self._build_headers(prompt),
             data=body,
         )
+        diagnostics = _StreamDiagnostics()
         try:
             with requests.Session() as session:
                 settings = session.merge_environment_settings(
@@ -242,41 +312,56 @@ class ResponsesModelClient:
                 verify = _requests_verify_setting()
                 if verify is not None:
                     settings["verify"] = verify
+                timeout = (
+                    max(self._timeout_seconds, 1.0),
+                    self._config.effective_stream_idle_timeout_seconds(),
+                )
                 response = session.send(
                     prepared,
-                    timeout=self._timeout_seconds,
+                    timeout=timeout,
                     allow_redirects=False,
                     **settings,
                 )
                 with response:
                     if response.status_code >= 400:
                         error_body = response.text
-                        raise ResponsesApiError(
+                        message = (
                             f"responses request failed with status {response.status_code}: "
                             f"{error_body[:500]}"
                         )
-                    return self._parse_stream(
+                        if response.status_code >= 500:
+                            raise ResponsesRetryableError(message)
+                        raise ResponsesApiError(message)
+                    tracked_lines = self._track_stream_lines(
                         response.iter_lines(chunk_size=1, decode_unicode=False),
+                        diagnostics,
+                    )
+                    return self._parse_stream(
+                        tracked_lines,
                         event_handler,
+                        diagnostics=diagnostics,
                     )
         except requests.RequestException as exc:
-            raise ResponsesApiError(f"responses request failed: {exc}") from exc
+            raise ResponsesRetryableError(
+                self._format_transport_error(url, exc, diagnostics)
+            ) from exc
-    def _build_payload(self, prompt: Prompt) -> dict[str, object]:
-        payload: dict[str, object] = {
+    def _build_payload(self, prompt: 'Prompt') -> 'typing.Dict[str, object]':
+        payload: 'typing.Dict[str, object]' = {
             "model": self.model,
             "instructions": prompt.base_instructions or "",
             "input": [item.serialize() for item in prompt.input],
             "tools": [tool.serialize() for tool in prompt.tools],
-            "tool_choice": "auto",
             "parallel_tool_calls": prompt.parallel_tool_calls,
             "store": False,
             "stream": True,
             "include": ["reasoning.encrypted_content"],
             "prompt_cache_key": self._session_id,
         }
+        if prompt.tools:
+            payload["tool_choice"] = "auto"
-        reasoning: dict[str, str] = {}
+        reasoning: 'typing.Dict[str, str]' = {}
         if self._config.reasoning_effort is not None:
             reasoning["effort"] = self._config.reasoning_effort
         if self._config.reasoning_summary is not None:
@@ -292,7 +377,7 @@ class ResponsesModelClient:
         return payload
-    def _list_models_sync(self) -> list[str]:
+    def _list_models_sync(self) -> 'typing.List[str]':
         prepared = requests.PreparedRequest()
         prepared.prepare(
             method="GET",
@@ -330,7 +415,7 @@ class ResponsesModelClient:
         data = payload.get("data")
         if not isinstance(data, list):
             raise ResponsesApiError("models response is missing `data` list")
-        models: list[str] = []
+        models: 'typing.List[str]' = []
         for item in data:
             if not isinstance(item, dict):
                 continue
@@ -339,16 +424,18 @@ class ResponsesModelClient:
                 models.append(model_id)
         return models
-    def _build_headers(self, prompt: Prompt) -> dict[str, str]:
+    def _build_headers(self, prompt: 'Prompt') -> 'typing.Dict[str, str]':
         headers = {
             "content-type": "application/json",
             "accept": "text/event-stream",
-            "authorization": f"Bearer {self._config.api_key()}",
             "x-client-request-id": self._session_id,
             "session_id": self._session_id,
             "originator": self._originator,
             "user-agent": self._user_agent,
         }
+        api_key = self._config.api_key()
+        if api_key is not None:
+            headers["authorization"] = f"Bearer {api_key}"
         if self._config.beta_features_header is not None:
             headers["x-codex-beta-features"] = self._config.beta_features_header
         if self._openai_subagent is not None:
@@ -360,13 +447,15 @@ class ResponsesModelClient:
             )
         return headers
-    def _build_model_list_headers(self) -> dict[str, str]:
+    def _build_model_list_headers(self) -> 'typing.Dict[str, str]':
         headers = {
             "accept": "application/json",
-            "authorization": f"Bearer {self._config.api_key()}",
             "originator": self._originator,
             "user-agent": self._user_agent,
         }
+        api_key = self._config.api_key()
+        if api_key is not None:
+            headers["authorization"] = f"Bearer {api_key}"
         if self._config.beta_features_header is not None:
             headers["x-codex-beta-features"] = self._config.beta_features_header
         if self._openai_subagent is not None:
@@ -376,16 +465,26 @@ class ResponsesModelClient:
     def _parse_stream(
         self,
         response,
-        event_handler: ModelStreamEventHandler,
-    ) -> ModelResponse:
-        items: list[AssistantMessage | ToolCall | ReasoningItem] = []
+        event_handler: 'ModelStreamEventHandler',
+        diagnostics: 'typing.Union[_StreamDiagnostics, None]' = None,
+    ) -> 'ModelResponse':
+        items: 'typing.List[typing.Union[typing.Union[AssistantMessage, ToolCall], ReasoningItem]]' = []
         saw_completed = False
+        last_event_type = ""
-        for event_name, data in self._iter_sse_events(response):
+        for event_name, data in self._iter_sse_events(response, diagnostics):
             if not data:
                 continue
-            payload = json.loads(data)
+            try:
+                payload = json.loads(data)
+            except json.JSONDecodeError as exc:
+                raise ResponsesRetryableError(
+                    self._format_invalid_event_error(event_name, data, exc)
+                ) from exc
             event_type = payload.get("type", event_name)
+            last_event_type = str(event_type)
+            if diagnostics is not None:
+                diagnostics.last_event_type = last_event_type
             if event_type == "response.output_text.delta":
                 event_handler(
@@ -445,26 +544,42 @@ class ResponsesModelClient:
                             )
                         )
                     items.append(parsed)
+                    if diagnostics is not None:
+                        diagnostics.output_items_received += 1
                 continue
             if event_type == "response.completed":
+                response_payload = payload.get("response")
+                usage = None
+                if isinstance(response_payload, dict):
+                    response_usage = response_payload.get("usage")
+                    if isinstance(response_usage, dict):
+                        usage = dict(response_usage)
+                elif isinstance(payload.get("usage"), dict):
+                    usage = dict(payload["usage"])
+                event_handler(
+                    ModelStreamEvent(
+                        kind="token_count",
+                        payload={"usage": usage},
+                    )
+                )
                 saw_completed = True
                 break
             if event_type == "response.failed":
-                error = payload.get("response", {}).get("error") or {}
-                message = error.get("message") or "responses stream failed"
-                raise ResponsesApiError(message)
+                self._raise_response_failed_error(payload)
         if not saw_completed:
-            raise ResponsesApiError("responses stream ended before response.completed")
+            raise ResponsesRetryableError(
+                self._format_incomplete_stream_error(last_event_type, len(items))
+            )
         return ModelResponse(items=items)
     def _parse_output_item(
         self,
-        item: dict[str, object],
-    ) -> AssistantMessage | ToolCall | ReasoningItem | None:
+        item: 'typing.Dict[str, object]',
+    ) -> 'typing.Union[typing.Union[typing.Union[AssistantMessage, ToolCall], ReasoningItem], None]':
         item_type = item.get("type")
         if item_type == "reasoning":
             return ReasoningItem(payload=dict(item))
@@ -500,15 +615,28 @@ class ResponsesModelClient:
         return None
-    def _iter_sse_events(self, response):
-        event_name: str | None = None
-        data_lines: list[str] = []
+    def _iter_sse_events(
+        self,
+        response,
+        diagnostics: 'typing.Union[_StreamDiagnostics, None]' = None,
+    ):
+        event_name: 'typing.Union[str, None]' = None
+        data_lines: 'typing.List[str]' = []
         for raw_line in response:
             line = raw_line.decode("utf-8", errors="replace").rstrip("\r\n")
             if line == "":
                 if data_lines:
-                    yield event_name or "message", "\n".join(data_lines)
+                    resolved_event_name = event_name or "message"
+                    payload = "\n".join(data_lines)
+                    if diagnostics is not None:
+                        diagnostics.sse_events_received += 1
+                        diagnostics.last_sse_event_name = resolved_event_name
+                        diagnostics.last_payload_excerpt = self._truncate_excerpt(
+                            payload,
+                            240,
+                        )
+                    yield resolved_event_name, payload
                 event_name = None
                 data_lines = []
                 continue
@@ -522,10 +650,221 @@ class ResponsesModelClient:
                 data_lines.append(line.split(":", 1)[1].lstrip())
         if data_lines:
-            yield event_name or "message", "\n".join(data_lines)
+            resolved_event_name = event_name or "message"
+            payload = "\n".join(data_lines)
+            if diagnostics is not None:
+                diagnostics.sse_events_received += 1
+                diagnostics.last_sse_event_name = resolved_event_name
+                diagnostics.last_payload_excerpt = self._truncate_excerpt(
+                    payload,
+                    240,
+                )
+            yield resolved_event_name, payload
+    def _track_stream_lines(
+        self,
+        response,
+        diagnostics: '_StreamDiagnostics',
+    ):
+        for raw_line in response:
+            diagnostics.raw_lines_received += 1
+            yield raw_line
+    def _base_error_details(
+        self,
+        url: 'str',
+    ) -> 'typing.List[typing.Tuple[str, str]]':
+        return [
+            ("provider", self._config.provider_name),
+            ("model", self.model),
+            ("request", f"POST {url}"),
+            ("session_id", self._session_id),
+        ]
+    def _format_error_message(
+        self,
+        summary: 'str',
+        details: 'typing.Iterable[typing.Tuple[str, str]]',
+    ) -> 'str':
+        lines = [summary]
+        for label, value in details:
+            text = str(value).strip()
+            if not text:
+                continue
+            lines.append(f"- {label}: {text}")
+        return "\n".join(lines)
+    def _format_transport_error(
+        self,
+        url: 'str',
+        exc: 'BaseException',
+        diagnostics: 'typing.Union[_StreamDiagnostics, None]' = None,
+    ) -> 'str':
+        details = self._base_error_details(url)
+        if diagnostics is not None:
+            details.extend(self._transport_diagnostics_details(diagnostics))
+        details.append(("exception", type(exc).__name__))
+        details.append(("detail", str(exc) or repr(exc)))
+        details.append(
+            (
+                "meaning",
+                "the HTTP response body ended before the SSE stream finished",
+            )
+        )
+        details.append(
+            (
+                "hint",
+                "the server or a proxy likely closed the connection before sending "
+                "`response.completed` or `response.failed`",
+            )
+        )
+        hostname = urllib.parse.urlparse(url).hostname or ""
+        if hostname in {"127.0.0.1", "localhost"}:
+            details.append(
+                (
+                    "hint",
+                    "if this goes through local `responses_server`, inspect that "
+                    "server's stderr/logs for the downstream backend failure",
+                )
+            )
+        return self._format_error_message(
+            "responses request failed while reading the HTTP stream",
+            details,
+        )
+    def _format_response_failed_error(self, message: 'str') -> 'str':
+        details = self._base_error_details(self.responses_url())
+        details.append(("detail", message))
+        details.append(
+            (
+                "meaning",
+                "the server accepted the request but emitted a terminal "
+                "`response.failed` event",
+            )
+        )
+        return self._format_error_message(
+            "responses stream failed on the server side",
+            details,
+        )
+    def _raise_response_failed_error(self, payload: 'typing.Dict[str, object]') -> 'None':
+        response = payload.get("response")
+        error = response.get("error") if isinstance(response, dict) else None
+        if not isinstance(error, dict):
+            raise ResponsesRetryableError(
+                self._format_response_failed_error("responses stream failed")
+            )
+        message = str(error.get("message") or "responses stream failed")
+        code = str(error.get("code") or "").strip()
+        if code in {
+            "context_length_exceeded",
+            "insufficient_quota",
+            "invalid_prompt",
+            "usage_not_included",
+        }:
+            raise ResponsesApiError(self._format_response_failed_error(message))
+        raise ResponsesRetryableError(
+            self._format_response_failed_error(message),
+            retry_delay_seconds=self._try_parse_retry_after_seconds(code, message),
+        )
+    def _format_incomplete_stream_error(
+        self,
+        last_event_type: 'str',
+        output_item_count: 'int',
+    ) -> 'str':
+        details = self._base_error_details(self.responses_url())
+        if last_event_type:
+            details.append(("last_event", last_event_type))
+        details.append(("output_items_received", str(output_item_count)))
+        details.append(
+            (
+                "meaning",
+                "the stream ended without a terminal `response.completed` event",
+            )
+        )
+        details.append(
+            (
+                "hint",
+                "the server should emit `response.failed` on mid-stream errors; "
+                "an abrupt end usually points to a backend, proxy, or server bug",
+            )
+        )
+        return self._format_error_message(
+            "responses stream ended before `response.completed`",
+            details,
+        )
+    def _format_invalid_event_error(
+        self,
+        event_name: 'str',
+        raw_data: 'str',
+        exc: 'json.JSONDecodeError',
+    ) -> 'str':
+        details = self._base_error_details(self.responses_url())
+        details.append(("event", event_name or "message"))
+        details.append(("exception", type(exc).__name__))
+        details.append(("detail", str(exc)))
+        excerpt = raw_data if len(raw_data) <= 240 else f"{raw_data[:240]}..."
+        details.append(("data_excerpt", excerpt))
+        return self._format_error_message(
+            "responses stream contained an invalid JSON event",
+            details,
+        )
+    def _transport_diagnostics_details(
+        self,
+        diagnostics: '_StreamDiagnostics',
+    ) -> 'typing.List[typing.Tuple[str, str]]':
+        details: 'typing.List[typing.Tuple[str, str]]' = [
+            ("raw_lines_received", str(diagnostics.raw_lines_received)),
+            ("sse_events_received", str(diagnostics.sse_events_received)),
+            ("output_items_received", str(diagnostics.output_items_received)),
+        ]
+        if diagnostics.last_sse_event_name:
+            details.append(("last_sse_event", diagnostics.last_sse_event_name))
+        if diagnostics.last_event_type:
+            details.append(("last_event_type", diagnostics.last_event_type))
+        if diagnostics.last_payload_excerpt:
+            details.append(("last_payload_excerpt", diagnostics.last_payload_excerpt))
+        return details
+    def _truncate_excerpt(self, text: 'str', limit: 'int') -> 'str':
+        if len(text) <= limit:
+            return text
+        return f"{text[:limit]}..."
+    def _retry_delay_seconds(self, attempt: 'int') -> 'float':
+        return INITIAL_RETRY_DELAY_SECONDS * (
+            RETRY_BACKOFF_FACTOR ** max(attempt - 1, 0)
+        )
+    def _try_parse_retry_after_seconds(
+        self,
+        code: 'str',
+        message: 'str',
+    ) -> 'typing.Union[float, None]':
+        if code != "rate_limit_exceeded":
+            return None
+        match = RATE_LIMIT_RETRY_AFTER_RE.search(message)
+        if match is None:
+            return None
+        value = float(match.group(1))
+        unit = match.group(2).lower()
+        if unit == "ms":
+            return value / 1000.0
+        return value
+def _optional_int(value: 'object') -> 'typing.Union[int, None]':
+    if value is None:
+        return None
+    return int(value)
-def _requests_verify_setting() -> str | bool | None:
+def _requests_verify_setting() -> 'typing.Union[typing.Union[str, bool], None]':
     for env_name in ("REQUESTS_CA_BUNDLE", "CURL_CA_BUNDLE", "SSL_CERT_FILE"):
         value = os.environ.get(env_name, "").strip()
         if value:

python-codex 0.1.2__py3-none-any.whl → 0.1.4__py3-none-any.whl

python-codex 0.1.2py3-none-any.whl → 0.1.4py3-none-any.whl