PyPI - python-codex - Versions diffs - 0.1.5__py3-none-any.whl → 0.1.7__py3-none-any.whl - Mend

python-codex 0.1.5py3-none-any.whl → 0.1.7py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (15) hide show

pycodex/cli.py +59 -6
pycodex/tools/base_tool.py +16 -0
pycodex/utils/__init__.py +2 -0
pycodex/utils/debug.py +12 -0
pycodex/utils/visualize.py +34 -7
{python_codex-0.1.5.dist-info → python_codex-0.1.7.dist-info}/METADATA +5 -1
{python_codex-0.1.5.dist-info → python_codex-0.1.7.dist-info}/RECORD +15 -13
responses_server/app.py +10 -1
responses_server/config.py +12 -0
responses_server/messages_api.py +479 -0
responses_server/payload_processors.py +1 -0
responses_server/stream_router.py +94 -0
{python_codex-0.1.5.dist-info → python_codex-0.1.7.dist-info}/WHEEL +0 -0
{python_codex-0.1.5.dist-info → python_codex-0.1.7.dist-info}/entry_points.txt +0 -0
{python_codex-0.1.5.dist-info → python_codex-0.1.7.dist-info}/licenses/LICENSE +0 -0

pycodex/cli.py CHANGED Viewed

@@ -7,6 +7,7 @@ import os
 import shlex
 import sys
 import tempfile
+import traceback
 from dataclasses import asdict, replace
 from pathlib import Path
 from typing import Sequence
@@ -20,7 +21,7 @@ from .portable import bootstrap_called_home, upload_codex_home
 from .protocol import AgentEvent
 from .runtime import AgentRuntime
 from .runtime_services import RuntimeEnvironment, create_runtime_environment
-from .utils import CliSessionView, load_codex_dotenv, uuid7_string
+from .utils import CliSessionView, get_debug_dir, load_codex_dotenv, uuid7_string
 from .utils.compactor import compact_agent_loop
 from .utils.session_persist import (
     SessionRolloutRecorder,
@@ -42,7 +43,6 @@ CliSessionMode = Literal["exec", "tui"]
 LOCAL_RESPONSES_SERVER_API_KEY_ENV = "PYCODEX_LOCAL_RESPONSES_SERVER_KEY"
 CLI_ORIGINATOR = "codex-tui"
 def launch_chat_completion_compat_server(*args, **kwargs):
     from responses_server import (
         launch_chat_completion_compat_server as launch_compat_server,
@@ -58,9 +58,9 @@ def configure_loguru() -> 'None':
         return
     logger.remove()
-    log_path = os.environ.get("PYCODEX_DEBUG_LOG", "").strip()
-    if log_path:
-        logger.add(log_path, level="DEBUG")
+    debug_dir = get_debug_dir()
+    if debug_dir is not None:
+        logger.add(str(debug_dir / "loguru.log"), level="DEBUG")
         return
     if os.environ.get("PYCODEX_DEBUG_STDERR", "").strip().lower() in {
@@ -123,6 +123,15 @@ def build_parser() -> 'argparse.ArgumentParser':
             "When set, pycodex starts a local responses compat server for this session."
         ),
     )
+    parser.add_argument(
+        "--use-messages",
+        default=False,
+        action="store_true",
+        help=(
+            "When set, pycodex starts a local responses compat server and routes "
+            "to a downstream /v1/messages backend for this session."
+        ),
+    )
     parser.add_argument(
         "--system-prompt",
         default=None,
@@ -373,12 +382,17 @@ def _build_model_client(
     managed_responses_base_url: 'typing.Union[str, None]' = None,
     vllm_endpoint: 'typing.Union[str, None]' = None,
     use_chat_completion: 'bool' = False,
+    use_messages: 'bool' = False,
 ):
     load_codex_dotenv(config_path)
     provider_config = ResponsesProviderConfig.from_codex_config(
         config_path,
         profile,
     )
+    if use_chat_completion and use_messages:
+        raise ValueError("--use-chat-completion and --use-messages cannot be combined")
+    if vllm_endpoint and use_messages:
+        raise ValueError("--vllm-endpoint and --use-messages cannot be combined")
     url, key_env = provider_config.base_url, provider_config.api_key_env
     if managed_responses_base_url is not None:
         url, key_env = (
@@ -386,7 +400,7 @@ def _build_model_client(
             LOCAL_RESPONSES_SERVER_API_KEY_ENV,
         )
         os.environ.setdefault(LOCAL_RESPONSES_SERVER_API_KEY_ENV, "dummy")
-    elif vllm_endpoint or use_chat_completion:
+    elif vllm_endpoint or use_chat_completion or use_messages:
         if vllm_endpoint:
             managed_server = launch_chat_completion_compat_server(
                 vllm_endpoint,
@@ -397,6 +411,9 @@ def _build_model_client(
                 provider_config.base_url,
                 provider_config.api_key_env,
                 model_provider=provider_config.provider_name,
+                outcomming_api=(
+                    "messages" if use_messages else "chat_completions"
+                ),
             )
         atexit.register(managed_server.stop)
         url, key_env = (
@@ -727,6 +744,8 @@ async def run_interactive_session(
 async def run_cli(args: 'argparse.Namespace') -> 'int':
     runtime = None
     worker = None
+    debug_dir = get_debug_dir()
+    phase_handle = None if debug_dir is None else (debug_dir / "phase.log").open("a", encoding="utf-8")
     try:
         if args.put is not None and args.call:
             raise ValueError("--put and --call cannot be combined")
@@ -746,17 +765,33 @@ async def run_cli(args: 'argparse.Namespace') -> 'int':
             print(f"pycodex --call {shlex.quote(call_spec)}", flush=True)
             return 0
         if args.call:
+            if phase_handle is not None:
+                phase_handle.write("bootstrap_called_home:start\n")
+                phase_handle.flush()
             config_path = bootstrap_called_home(args.call)
+            if phase_handle is not None:
+                phase_handle.write("bootstrap_called_home:done\n")
+                phase_handle.flush()
             args.config = str(config_path)
             os.environ["CODEX_HOME"] = str(config_path.parent)
+        if phase_handle is not None:
+            phase_handle.write("build_model_client:start\n")
+            phase_handle.flush()
         client = _build_model_client(
             args.config,
             args.profile,
             args.timeout_seconds,
             vllm_endpoint=args.vllm_endpoint,
             use_chat_completion=args.use_chat_completion,
+            use_messages=args.use_messages,
         )
+        if phase_handle is not None:
+            phase_handle.write("build_model_client:done\n")
+            phase_handle.flush()
+        if phase_handle is not None:
+            phase_handle.write("build_runtime:start\n")
+            phase_handle.flush()
         runtime = build_runtime(
             args.config,
             args.profile,
@@ -764,6 +799,9 @@ async def run_cli(args: 'argparse.Namespace') -> 'int':
             client,
             session_mode="tui",
         )
+        if phase_handle is not None:
+            phase_handle.write("build_runtime:done\n")
+            phase_handle.flush()
         if should_run_interactive(args.prompt, sys.stdin.isatty()):
             return await run_interactive_session(
                 runtime,
@@ -773,13 +811,28 @@ async def run_cli(args: 'argparse.Namespace') -> 'int':
         else:
             prompt_text = resolve_prompt_text(args.prompt)
             worker = asyncio.create_task(runtime.run_forever())
+            if phase_handle is not None:
+                phase_handle.write("submit_user_turn:start\n")
+                phase_handle.flush()
             result = await runtime.submit_user_turn(prompt_text)
+            if phase_handle is not None:
+                phase_handle.write("submit_user_turn:done\n")
+                phase_handle.flush()
             print(format_turn_output(result, args.json))
             return 0
     except Exception as exc:
+        if phase_handle is not None:
+            phase_handle.write("fatal_exception\n")
+            phase_handle.flush()
+        if debug_dir is not None:
+            (debug_dir / "fatal_error.txt").write_text(
+                traceback.format_exc(), encoding="utf-8"
+            )
         print(f"Error: {exc}", file=sys.stderr)
         return 1
     finally:
+        if phase_handle is not None:
+            phase_handle.close()
         if runtime is not None and worker is not None:
             await runtime.shutdown()
             await worker

pycodex/tools/base_tool.py CHANGED Viewed

@@ -16,8 +16,10 @@ from dataclasses import dataclass
 from functools import lru_cache
 import json
 from pathlib import Path
+import traceback
 from ..protocol import ConversationItem, JSONDict, JSONValue, ToolCall, ToolResult, ToolSpec
+from ..utils import get_debug_dir
 import typing
 EXEC_TOOLS_SNAPSHOT_PATH = (
@@ -140,6 +142,20 @@ class ToolRegistry:
                 tool_type=call.tool_type,
             )
         except Exception as exc:  # pragma: no cover - defensive wrapper
+            if (debug_dir := get_debug_dir()) is not None:
+                with (debug_dir / "tool_errors.jsonl").open("a", encoding="utf-8") as handle:
+                    handle.write(
+                        json.dumps(
+                            {
+                                "tool": call.name,
+                                "call_id": call.call_id,
+                                "error": f"{type(exc).__name__}: {exc}",
+                                "traceback": traceback.format_exc(),
+                            },
+                            ensure_ascii=False,
+                        )
+                    )
+                    handle.write("\n")
             return ToolResult(
                 call_id=call.call_id,
                 name=call.name,

pycodex/utils/__init__.py CHANGED Viewed

@@ -1,4 +1,5 @@
 from .dotenv import DOTENV_FILENAME, load_codex_dotenv, parse_dotenv, parse_dotenv_value
+from .debug import get_debug_dir
 from .get_env import build_user_agent, get_shell_name, get_timezone_name
 from .random_ids import uuid7_string
 from .compactor import DEFAULT_COMPACT_PROMPT, SUMMARY_PREFIX, compact
@@ -31,6 +32,7 @@ __all__ = [
     "format_cli_plan_messages",
     "format_cli_tool_call_message",
     "format_cli_tool_message",
+    "get_debug_dir",
     "get_shell_name",
     "get_timezone_name",
     "load_codex_dotenv",

pycodex/utils/debug.py ADDED Viewed

@@ -0,0 +1,12 @@
+import os
+from pathlib import Path
+import typing
+def get_debug_dir() -> 'typing.Union[Path, None]':
+    value = os.environ.get("PYCODEX_DEBUG_LOG", "").strip()
+    if not value:
+        return None
+    path = Path(value).expanduser()
+    path.mkdir(parents=True, exist_ok=True)
+    return path

pycodex/utils/visualize.py CHANGED Viewed

@@ -158,13 +158,29 @@ class Spinner:
             self._paused = False
     def clear(self) -> 'None':
-        if not self._enabled or not self._visible:
-            return
         with self._terminal_lock:
+            if not self._visible:
+                return
             self._raw_write("\r\x1b[2K")
             self._raw_flush()
             self._visible = False
+    def render_now(self) -> 'None':
+        if not self._turn_active or self._paused:
+            return
+        frame = colorize_cli_message(
+            build_cli_spinner_frame(self._index, self._label),
+            "status",
+            self._color_enabled,
+        )
+        self._index += 1
+        with self._terminal_lock:
+            if not self._turn_active or self._paused:
+                return
+            self._raw_write(f"\r\x1b[2K{frame}")
+            self._raw_flush()
+            self._visible = True
     def close(self) -> 'None':
         self.finish_turn()
         if self._thread is not None:
@@ -726,6 +742,7 @@ class CliSessionView:
                 else:
                     self._spinner.resume()
                     self._spinner.set_label("running provider tools")
+                    self._spinner.render_now()
             return
         if event.kind == "tool_started":
@@ -745,15 +762,11 @@ class CliSessionView:
                     self._spinner.set_label(f"running {tool_name}")
                 else:
                     self._spinner.set_label("running provider tools")
+                self._spinner.render_now()
             return
         if event.kind == "tool_completed":
             self._finish_stream()
-            if self._input_active:
-                self._spinner.pause()
-            else:
-                self._spinner.resume()
-                self._spinner.set_label("thinking")
             tool_name, summary, is_error = extract_tool_event_display(event.payload)
             summary = self._rewrite_agent_summary(tool_name, summary)
             if tool_name == "update_plan" and not is_error:
@@ -762,6 +775,12 @@ class CliSessionView:
                     self._print_line(
                         colorize_cli_message(line, "plan", self._color_enabled)
                     )
+                if self._input_active:
+                    self._spinner.pause()
+                else:
+                    self._spinner.resume()
+                    self._spinner.set_label("thinking")
+                    self._spinner.render_now()
                 return
             message = format_cli_tool_message(
                 tool_name,
@@ -770,6 +789,12 @@ class CliSessionView:
             )
             self._remember_agent_name(tool_name, summary)
             self._print_line(self._colorize_formatted_tool_message(message))
+            if self._input_active:
+                self._spinner.pause()
+            else:
+                self._spinner.resume()
+                self._spinner.set_label("thinking")
+                self._spinner.render_now()
             return
         if event.kind == "turn_completed":
@@ -830,6 +855,8 @@ class CliSessionView:
     def resume_spinner(self) -> 'None':
         self._spinner.resume()
+        if not self._input_active:
+            self._spinner.render_now()
     def set_input_active(self, active: 'bool', resume_spinner: 'bool' = True) -> 'None':
         self._input_active = active

{python_codex-0.1.5.dist-info → python_codex-0.1.7.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.1
 Name: python-codex
-Version: 0.1.5
+Version: 0.1.7
 Summary: A minimal Python extraction of Codex's main agent loop
 License-File: LICENSE
 Requires-Python: >=3.6.2
@@ -159,6 +159,7 @@ pycodex "Summarize this repo in one sentence."
 printf 'Reply with exactly OK.' | pycodex
 pycodex --json "Reply with exactly OK."
 pycodex --profile model_proxy "Reply with exactly OK."
+pycodex --profile opus --use-messages "Reply with exactly OK."
 pycodex --vllm-endpoint http://127.0.0.1:18000 "Reply with exactly OK."
 pycodex --put @127.0.0.1:5577
 pycodex --put /data/.codex/@127.0.0.1:5577
@@ -211,6 +212,9 @@ Current behavior:
   historical `reasoning` items are replayed into downstream assistant messages
   via the `reasoning` field. Streaming token usage is also requested from vLLM
   and forwarded to the final `response.completed.response.usage`
+- standalone `responses_server` now also supports downstream `/v1/messages`
+  backends via `--outcomming-api messages`, while keeping the internal
+  canonical request/route logic in chat-completions shape
 - `pycodex doctor` checks config, `.env`, API keys, DNS, TCP/TLS, and an
   optional live Responses API request

{python_codex-0.1.5.dist-info → python_codex-0.1.7.dist-info}/RECORD RENAMED Viewed

@@ -1,6 +1,6 @@
 pycodex/__init__.py,sha256=jCnC_Bgotlxa4GwO3Re2sChKGY49TRM-uVZEQ9uBpfw,3106
 pycodex/agent.py,sha256=s0FrF_XG2pHKryooS461Jr_acmQ_TKTp2JLGQNiny6w,11888
-pycodex/cli.py,sha256=ntgC0LWlSOhuYAUOBgSEeVIjBTKS91klyvkTO9QtFoE,29559
+pycodex/cli.py,sha256=MDd6aK9L3FkNSmwIiYQs322HPqL4L8kQl9laRn4brLM,31924
 pycodex/collaboration.py,sha256=yQ6pBD-R3ZWR4_FAYQFoS7KF0m4LLD42otXIbPqw2ys,641
 pycodex/compat.py,sha256=IO0X7AgcYhlHnYnpvBZ6leCh_UjoQzg5HLT5wYBNNIw,3155
 pycodex/context.py,sha256=R5tuMcNrX1F-Lh9ymsSbnfRbKLJ19TWrtQoZ3tWlHvM,24982
@@ -28,7 +28,7 @@ pycodex/prompts/permissions/sandbox_mode/workspace_write.md,sha256=lVN-LwrBbHqlv
 pycodex/tools/__init__.py,sha256=aSLXrr_31KGQgDfRow5zVIc-2-KdXlHaCE6qUnE4HWI,1772
 pycodex/tools/agent_tool_schemas.py,sha256=r7pBICcx8fb0Rg6IzIg8-u3um2z11TogQ4yCzuiO-4o,2033
 pycodex/tools/apply_patch_tool.py,sha256=aFob-gzaCXlzPdCIvRXVKm1NrQqqhqe8CVkFVAhqiTc,13955
-pycodex/tools/base_tool.py,sha256=FLtbb6KPUKyhHRMrR6_anYi_GmpJFCaX1ch5aRnjQjo,5527
+pycodex/tools/base_tool.py,sha256=UP1ptOTMmFbnWODJCAhDook3e-IBjqgJ3aW6pZw7rsE,6247
 pycodex/tools/close_agent_tool.py,sha256=nY3l_UOX6NyTgUqdXag3yRpdyQScV0g0Vv4HE3ElLwg,1597
 pycodex/tools/code_mode_manager.py,sha256=Wow42H_9IomUKUjjjU8rrAFAklhE-UlgxgrbgHRU_4M,19031
 pycodex/tools/exec_command_tool.py,sha256=l8GWlZKTvlWWAd_OPKsnnt3m0woMWXK8NkilmspnaQQ,3485
@@ -51,26 +51,28 @@ pycodex/tools/wait_agent_tool.py,sha256=0xjr5M2S0SNZaSr1o4U0RXI6dTJfMVpBB8Uclm_4
 pycodex/tools/wait_tool.py,sha256=EJcW2Ev9jUD9eZ7cFDNOLDzlywS2BD3ll6pArXyxfrI,2331
 pycodex/tools/web_search_tool.py,sha256=_7r2ltWhnBM0ZCgweA5a0GbEi0qSFAHOyi1RHrl6tfQ,957
 pycodex/tools/write_stdin_tool.py,sha256=nCuProkbeewfQ_yS8CgBajo--K3EmkXzJYh1D2QtAM4,2549
-pycodex/utils/__init__.py,sha256=XawMC7CRm9bt3wPWyithj5x7YQvYrggn2_DcGGSTnCY,1162
+pycodex/utils/__init__.py,sha256=jE63cZR1IBzs4ED86lwdYRLqV5FmPhNNDzIgC90mr6A,1216
 pycodex/utils/compactor.py,sha256=ZCzGc02xHmXq1rIjnG2gATKcFtt6r-OGsCIK0ypjnyI,6467
+pycodex/utils/debug.py,sha256=JeEB5JfzYfbdG0fXlrWFmXyR1ts86fKsI_97IqgF6R0,296
 pycodex/utils/dotenv.py,sha256=EDBXdn93ewmq9zhJki5_LsJJXe0wMIQJ6VfCE1r7voQ,1818
 pycodex/utils/get_env.py,sha256=jR8G0Xco57jX-71E1oHIcl3-Kz9Ltc0kzxj04DKzt80,7316
 pycodex/utils/random_ids.py,sha256=zBphjVGc7OXk9ZNExAbxRi_bk7ipyLG491qTv7hi8jM,380
 pycodex/utils/session_persist.py,sha256=dUvo3Z1QBB4HJT1tLerDlLD3ZB25umB6FP6JORg9V40,16414
-pycodex/utils/visualize.py,sha256=wjuW7l8uE7sckRtUJNAQ_irHKIfDWdfnFINHYtvQ5bw,40043
+pycodex/utils/visualize.py,sha256=JURzq2AbV046bblE5fojcAe885Juda0LDxt_gqT2PUc,41006
 responses_server/__init__.py,sha256=3yPv_zeGT7P11tTnmj5kXktISLNsNW-02MUnnbiZcb0,394
 responses_server/__main__.py,sha256=9SRp-Yw7ShGxc6DhSIXcDLKgGEdAVm3oBZ59rBOPjT0,62
-responses_server/app.py,sha256=9gKgzD8LsOdkg2Te2KOwodH-Z0BD_RuNEVh9MBclx7Q,7429
-responses_server/config.py,sha256=wEcZbXZclTYz4fI_oy_sSMglWPeEITWlFeglQrrr6HE,2236
-responses_server/payload_processors.py,sha256=AcOipqVQyo4wKw_pb3ABlarwIK1VjcnQTlgPehRVGO8,3412
+responses_server/app.py,sha256=4SUG8xqKqmVKVY9i1f5WF9QrnmxGbD4mwiI6s13zQDE,7742
+responses_server/config.py,sha256=leb3_uPrCyYdUIkyRyVPX4luGF88dQ62OkhRLPe7uxw,2718
+responses_server/messages_api.py,sha256=3GPMfs3ksQkhezLyWBjeW5zJ1e_MeHXVaq1lALIA7Mk,16815
+responses_server/payload_processors.py,sha256=gfOXqvVwlhCk-yjaDdGU4RKcpDdxIq2y6CmqUCggIjY,3444
 responses_server/server.py,sha256=isyzN-p-Ir8LLycN_dQfcanvie2ZqqSu52mOPz_wYD4,2095
 responses_server/session_store.py,sha256=ZD3cH2aEOkWaQsu5qTzcal2mThTSFQPAhAhPUN9srgI,1115
-responses_server/stream_router.py,sha256=zWC4yyZ3I8E-Zgco844tIhRMWOwIkjOV0s-G-a9-B8k,30861
+responses_server/stream_router.py,sha256=OVwaDEsUaKVDNGF2vnqNZTo3WA9h3D3uzHeYY-QN9IU,34754
 responses_server/tools/__init__.py,sha256=ivsBSEy0SBUhY-Uea5v1XMLXShkwHdCVl0id-1FwdZg,150
 responses_server/tools/custom_adapter.py,sha256=LxO7ldydvR-GWachDz8GKC0Q8KGGFoFPbZxM0QvxuZ0,8350
 responses_server/tools/web_search.py,sha256=pm4ZUiHUfxc0bGY1kEvt-BCzDrZIyP24xzPUcga2ul0,8908
-python_codex-0.1.5.dist-info/METADATA,sha256=rTfHXfLqg86xKhx6VNFcrHs_qBdBJuVSn5Mfe_wXODQ,15451
-python_codex-0.1.5.dist-info/WHEEL,sha256=KGYbc1zXlYddvwxnNty23BeaKzh7YuoSIvIMO4jEhvw,87
-python_codex-0.1.5.dist-info/entry_points.txt,sha256=sNUVakoVuTrzJH505ZgRTQxmtRRPUHV_EH0i6EbYTyM,45
-python_codex-0.1.5.dist-info/licenses/LICENSE,sha256=0X8ifk312hYAORM4hlzg8wVSEXYKNmiPgWlB1YIy2Nw,10926
-python_codex-0.1.5.dist-info/RECORD,,
+python_codex-0.1.7.dist-info/METADATA,sha256=PYpANV2Xz7uP3e666V3LuU2fTHJNo5mSSOUyypdrAe0,15719
+python_codex-0.1.7.dist-info/WHEEL,sha256=KGYbc1zXlYddvwxnNty23BeaKzh7YuoSIvIMO4jEhvw,87
+python_codex-0.1.7.dist-info/entry_points.txt,sha256=sNUVakoVuTrzJH505ZgRTQxmtRRPUHV_EH0i6EbYTyM,45
+python_codex-0.1.7.dist-info/licenses/LICENSE,sha256=0X8ifk312hYAORM4hlzg8wVSEXYKNmiPgWlB1YIy2Nw,10926
+python_codex-0.1.7.dist-info/RECORD,,

responses_server/app.py CHANGED Viewed

@@ -55,12 +55,18 @@ def build_parser() -> 'argparse.ArgumentParser':
         prog="python -m responses_server",
         description=(
             "Standalone localhost `/v1/responses` server that translates the "
-            "Codex/Responses subset onto an outcomming `/v1/chat/completions` backend."
+            "Codex/Responses subset onto an outcomming `/v1/chat/completions` "
+            "or `/v1/messages` backend."
         ),
     )
     parser.add_argument("--host", default="127.0.0.1")
     parser.add_argument("--port", type=int, default=8001)
     parser.add_argument("--outcomming-base-url", required=True)
+    parser.add_argument(
+        "--outcomming-api",
+        default="chat_completions",
+        choices=["chat_completions", "messages"],
+    )
     parser.add_argument("--outcomming-api-key-env", default=None)
     parser.add_argument("--model-provider", default=None)
     parser.add_argument("--timeout-seconds", type=float, default=120.0)
@@ -80,10 +86,12 @@ def launch_chat_completion_compat_server(
     base_url: 'str',
     api_key_env: 'typing.Union[str, None]' = None,
     model_provider: 'typing.Union[str, None]' = None,
+    outcomming_api: 'str' = "chat_completions",
 ):
     config = CompatServerConfig.from_base_url(
         base_url,
         api_key_env,
+        outcomming_api=outcomming_api,
         model_provider=model_provider,
     )
     server = ManagedResponseServer(config)
@@ -209,6 +217,7 @@ def main() -> 'None':
             host=args.host,
             port=args.port,
             outcomming_base_url=args.outcomming_base_url,
+            outcomming_api=args.outcomming_api,
             outcomming_api_key_env=args.outcomming_api_key_env,
             model_provider=args.model_provider,
             timeout_seconds=args.timeout_seconds,

responses_server/config.py CHANGED Viewed

@@ -10,6 +10,7 @@ class CompatServerConfig:
     host: 'str' = "127.0.0.1"
     port: 'int' = 0
     outcomming_base_url: 'str' = "http://127.0.0.1:8000/v1"
+    outcomming_api: 'str' = "chat_completions"
     outcomming_api_key_env: 'typing.Union[str, None]' = None
     model_provider: 'typing.Union[str, None]' = None
     timeout_seconds: 'float' = 120.0
@@ -24,15 +25,24 @@ class CompatServerConfig:
         base = self.outcomming_base_url.rstrip("/")
         return f"{base}/chat/completions"
+    def outcomming_messages_url(self) -> 'str':
+        base = self.outcomming_base_url.rstrip("/")
+        return f"{base}/messages"
     def outcomming_models_url(self) -> 'str':
         base = self.outcomming_base_url.rstrip("/")
         return f"{base}/models"
+    def normalized_outcomming_api(self) -> 'str':
+        value = str(self.outcomming_api or "").strip().lower()
+        return value or "chat_completions"
     def with_ephemeral_port(self) -> 'CompatServerConfig':
         return CompatServerConfig(
             host=self.host,
             port=0,
             outcomming_base_url=self.outcomming_base_url,
+            outcomming_api=self.outcomming_api,
             outcomming_api_key_env=self.outcomming_api_key_env,
             model_provider=self.model_provider,
             timeout_seconds=self.timeout_seconds,
@@ -44,6 +54,7 @@ class CompatServerConfig:
         outcomming_base_url: 'str',
         api_key_env: 'typing.Union[str, None]' = None,
         model_provider: 'typing.Union[str, None]' = None,
+        outcomming_api: 'str' = "chat_completions",
     ) -> 'CompatServerConfig':
         parsed = urllib.parse.urlparse(outcomming_base_url)
         if not parsed.scheme or not parsed.netloc:
@@ -58,6 +69,7 @@ class CompatServerConfig:
             )
         return cls(
             outcomming_base_url=outcomming_base_url,
+            outcomming_api=outcomming_api,
             outcomming_api_key_env=api_key_env,
             model_provider=model_provider,
         )

responses_server/messages_api.py ADDED Viewed

@@ -0,0 +1,479 @@
+import json
+import typing
+DEFAULT_MESSAGES_MAX_TOKENS = 32000
+class MessagesAPIAdapterError(ValueError):
+    pass
+def build_messages_request(
+    outcomming_request: 'typing.Dict[str, object]',
+) -> 'typing.Dict[str, object]':
+    model = str(outcomming_request.get("model", "")).strip()
+    if not model:
+        raise MessagesAPIAdapterError("outcomming request is missing `model`")
+    raw_messages = outcomming_request.get("messages") or []
+    if not isinstance(raw_messages, list):
+        raise MessagesAPIAdapterError("outcomming request `messages` must be a list")
+    system_blocks: 'typing.List[typing.Dict[str, object]]' = []
+    messages: 'typing.List[typing.Dict[str, object]]' = []
+    for raw_message in raw_messages:
+        if not isinstance(raw_message, dict):
+            raise MessagesAPIAdapterError(
+                "outcomming request messages must be objects"
+            )
+        role = str(raw_message.get("role", "")).strip()
+        if role in {"developer", "system"}:
+            text = str(raw_message.get("content", "") or "")
+            if text:
+                system_blocks.append({"type": "text", "text": text})
+            continue
+        if role == "user":
+            messages.append(
+                {
+                    "role": "user",
+                    "content": _build_text_blocks(raw_message.get("content")),
+                }
+            )
+            continue
+        if role == "assistant":
+            messages.append(
+                {
+                    "role": "assistant",
+                    "content": _build_assistant_blocks(raw_message),
+                }
+            )
+            continue
+        if role == "tool":
+            messages.append(
+                {
+                    "role": "user",
+                    "content": [_build_tool_result_block(raw_message)],
+                }
+            )
+            continue
+        raise MessagesAPIAdapterError(
+            f"unsupported outcomming message role for messages API: {role!r}"
+        )
+    payload: 'typing.Dict[str, object]' = {
+        "model": model,
+        "messages": messages,
+        "max_tokens": _resolve_max_tokens(outcomming_request),
+        "stream": bool(outcomming_request.get("stream", True)),
+    }
+    if system_blocks:
+        payload["system"] = system_blocks
+    tools = _translate_tools(outcomming_request.get("tools"))
+    if tools:
+        payload["tools"] = tools
+        tool_choice = _translate_tool_choice(
+            outcomming_request.get("tool_choice"),
+            outcomming_request.get("parallel_tool_calls"),
+        )
+        if tool_choice is not None:
+            payload["tool_choice"] = tool_choice
+    return payload
+def iter_chat_chunks(
+    event_name: 'typing.Union[str, None]',
+    payload: 'typing.Dict[str, object]',
+    state: 'typing.Dict[str, object]',
+) -> 'typing.List[typing.Dict[str, object]]':
+    event_type = str(payload.get("type") or event_name or "").strip()
+    chunks: 'typing.List[typing.Dict[str, object]]' = []
+    if event_type == "message_start":
+        message = payload.get("message") or {}
+        if isinstance(message, dict):
+            usage_chunk = _usage_chunk(message.get("usage"))
+            if usage_chunk is not None:
+                chunks.append(usage_chunk)
+        return chunks
+    if event_type == "content_block_start":
+        block_index = _normalize_index(payload.get("index"))
+        content_block = payload.get("content_block") or {}
+        if not isinstance(content_block, dict):
+            return chunks
+        content_blocks = state.setdefault("content_blocks", {})
+        if not isinstance(content_blocks, dict):
+            raise MessagesAPIAdapterError("messages stream state is corrupted")
+        content_blocks[block_index] = str(content_block.get("type", "")).strip()
+        block_type = str(content_block.get("type", "")).strip()
+        if block_type == "text":
+            text = str(content_block.get("text", "") or "")
+            if text:
+                chunks.append(_chat_text_chunk(text))
+            return chunks
+        if block_type == "thinking":
+            thinking = str(content_block.get("thinking", "") or "")
+            if thinking:
+                chunks.append(_chat_reasoning_chunk(thinking))
+            return chunks
+        if block_type == "tool_use":
+            arguments = _dump_json(content_block.get("input") or {})
+            chunks.append(
+                _chat_tool_chunk(
+                    block_index,
+                    call_id=str(content_block.get("id", "")).strip(),
+                    name=str(content_block.get("name", "")).strip(),
+                    arguments=arguments if arguments != "{}" else "",
+                )
+            )
+            return chunks
+        return chunks
+    if event_type == "content_block_delta":
+        block_index = _normalize_index(payload.get("index"))
+        delta = payload.get("delta") or {}
+        if not isinstance(delta, dict):
+            return chunks
+        delta_type = str(delta.get("type", "")).strip()
+        if delta_type == "text_delta":
+            text = str(delta.get("text", "") or "")
+            if text:
+                chunks.append(_chat_text_chunk(text))
+            return chunks
+        if delta_type == "thinking_delta":
+            thinking = str(delta.get("thinking", "") or "")
+            if thinking:
+                chunks.append(_chat_reasoning_chunk(thinking))
+            return chunks
+        if delta_type == "input_json_delta":
+            partial_json = str(delta.get("partial_json", "") or "")
+            chunks.append(_chat_tool_chunk(block_index, arguments=partial_json))
+            return chunks
+        return chunks
+    if event_type == "message_delta":
+        usage_chunk = _usage_chunk(payload.get("usage"))
+        if usage_chunk is not None:
+            chunks.append(usage_chunk)
+        delta = payload.get("delta") or {}
+        if not isinstance(delta, dict):
+            return chunks
+        finish_reason = _translate_stop_reason(delta.get("stop_reason"))
+        if finish_reason and not bool(state.get("finish_emitted")):
+            state["finish_reason"] = finish_reason
+            state["finish_emitted"] = True
+            chunks.append(_chat_finish_chunk(finish_reason))
+        return chunks
+    if event_type == "message_stop":
+        if not bool(state.get("finish_emitted")):
+            finish_reason = str(state.get("finish_reason") or "stop")
+            state["finish_emitted"] = True
+            chunks.append(_chat_finish_chunk(finish_reason))
+        state["saw_message_stop"] = True
+        return chunks
+    if event_type == "error":
+        error = payload.get("error")
+        if isinstance(error, dict):
+            message = str(error.get("message", "") or "").strip()
+            if message:
+                raise MessagesAPIAdapterError(message)
+        raise MessagesAPIAdapterError(_dump_json(payload))
+    return chunks
+def saw_message_stop(state: 'typing.Dict[str, object]') -> 'bool':
+    return bool(state.get("saw_message_stop"))
+def _build_text_blocks(raw_content: 'object') -> 'typing.List[typing.Dict[str, object]]':
+    text = str(raw_content or "")
+    if not text:
+        return []
+    return [{"type": "text", "text": text}]
+def _build_assistant_blocks(
+    raw_message: 'typing.Dict[str, object]',
+) -> 'typing.List[typing.Dict[str, object]]':
+    blocks: 'typing.List[typing.Dict[str, object]]' = []
+    reasoning = str(raw_message.get("reasoning", "") or "")
+    if reasoning:
+        blocks.append({"type": "thinking", "thinking": reasoning})
+    text = str(raw_message.get("content", "") or "")
+    if text:
+        blocks.append({"type": "text", "text": text})
+    raw_tool_calls = raw_message.get("tool_calls") or []
+    if raw_tool_calls:
+        if not isinstance(raw_tool_calls, list):
+            raise MessagesAPIAdapterError("assistant `tool_calls` must be a list")
+        for raw_tool_call in raw_tool_calls:
+            if not isinstance(raw_tool_call, dict):
+                raise MessagesAPIAdapterError("assistant tool calls must be objects")
+            function = raw_tool_call.get("function") or {}
+            if not isinstance(function, dict):
+                raise MessagesAPIAdapterError(
+                    "assistant tool call is missing function payload"
+                )
+            blocks.append(
+                {
+                    "type": "tool_use",
+                    "id": str(raw_tool_call.get("id", "")).strip(),
+                    "name": str(function.get("name", "")).strip(),
+                    "input": _parse_json_object(function.get("arguments")),
+                }
+            )
+    return blocks
+def _build_tool_result_block(
+    raw_message: 'typing.Dict[str, object]',
+) -> 'typing.Dict[str, object]':
+    return {
+        "type": "tool_result",
+        "tool_use_id": str(raw_message.get("tool_call_id", "")).strip(),
+        "content": str(raw_message.get("content", "") or ""),
+    }
+def _translate_tools(
+    raw_tools: 'object',
+) -> 'typing.List[typing.Dict[str, object]]':
+    translated: 'typing.List[typing.Dict[str, object]]' = []
+    if not isinstance(raw_tools, list):
+        return translated
+    for raw_tool in raw_tools:
+        if not isinstance(raw_tool, dict) or raw_tool.get("type") != "function":
+            raise MessagesAPIAdapterError(
+                "messages API backend only supports function-style tools"
+            )
+        function = raw_tool.get("function") or {}
+        if not isinstance(function, dict):
+            raise MessagesAPIAdapterError("tool definition is missing function payload")
+        name = str(function.get("name", raw_tool.get("name", ""))).strip()
+        if not name:
+            raise MessagesAPIAdapterError("tool definition is missing `name`")
+        translated.append(
+            {
+                "name": name,
+                "description": str(function.get("description", "") or ""),
+                "input_schema": function.get("parameters") or {"type": "object"},
+            }
+        )
+    return translated
+def _translate_tool_choice(
+    raw_tool_choice: 'object',
+    parallel_tool_calls: 'object',
+) -> 'typing.Union[typing.Dict[str, object], None]':
+    if raw_tool_choice is None:
+        if parallel_tool_calls is False:
+            return {
+                "type": "auto",
+                "disable_parallel_tool_use": True,
+            }
+        return None
+    translated: 'typing.Dict[str, object]'
+    if isinstance(raw_tool_choice, str):
+        choice = raw_tool_choice.strip()
+        if choice == "auto":
+            translated = {"type": "auto"}
+        elif choice == "required":
+            translated = {"type": "any"}
+        elif choice == "none":
+            return None
+        else:
+            raise MessagesAPIAdapterError(
+                f"unsupported tool_choice for messages API: {raw_tool_choice!r}"
+            )
+    elif isinstance(raw_tool_choice, dict):
+        choice_type = str(raw_tool_choice.get("type", "")).strip()
+        if choice_type == "function":
+            function = raw_tool_choice.get("function") or {}
+            name = ""
+            if isinstance(function, dict):
+                name = str(function.get("name", "")).strip()
+            if not name:
+                name = str(raw_tool_choice.get("name", "")).strip()
+            if not name:
+                raise MessagesAPIAdapterError(
+                    "function tool_choice is missing `name`"
+                )
+            translated = {
+                "type": "tool",
+                "name": name,
+            }
+        else:
+            raise MessagesAPIAdapterError(
+                f"unsupported tool_choice for messages API: {raw_tool_choice!r}"
+            )
+    else:
+        raise MessagesAPIAdapterError(
+            f"unsupported tool_choice for messages API: {raw_tool_choice!r}"
+        )
+    if parallel_tool_calls is False:
+        translated["disable_parallel_tool_use"] = True
+    return translated
+def _parse_json_object(raw_value: 'object') -> 'typing.Dict[str, object]':
+    if isinstance(raw_value, dict):
+        return dict(raw_value)
+    if isinstance(raw_value, str):
+        text = raw_value.strip()
+        if not text:
+            return {}
+        try:
+            parsed = json.loads(text)
+        except json.JSONDecodeError as exc:
+            raise MessagesAPIAdapterError(
+                f"tool arguments must be valid JSON objects for messages API: {exc}"
+            ) from exc
+        if isinstance(parsed, dict):
+            return dict(parsed)
+        raise MessagesAPIAdapterError(
+            "tool arguments must decode to JSON objects for messages API"
+        )
+    raise MessagesAPIAdapterError(
+        "tool arguments must be strings or objects for messages API"
+    )
+def _resolve_max_tokens(outcomming_request: 'typing.Dict[str, object]') -> 'int':
+    raw_value = outcomming_request.get("max_tokens")
+    if isinstance(raw_value, bool):
+        return DEFAULT_MESSAGES_MAX_TOKENS
+    if isinstance(raw_value, int) and raw_value > 0:
+        return raw_value
+    return DEFAULT_MESSAGES_MAX_TOKENS
+def _usage_chunk(raw_usage: 'object') -> 'typing.Union[typing.Dict[str, object], None]':
+    usage = _translate_usage(raw_usage)
+    if not usage:
+        return None
+    return {
+        "choices": [],
+        "usage": usage,
+    }
+def _translate_usage(raw_usage: 'object') -> 'typing.Dict[str, object]':
+    if not isinstance(raw_usage, dict):
+        return {}
+    usage: 'typing.Dict[str, object]' = {}
+    input_tokens = raw_usage.get("input_tokens")
+    output_tokens = raw_usage.get("output_tokens")
+    if isinstance(input_tokens, int):
+        usage["input_tokens"] = input_tokens
+    if isinstance(output_tokens, int):
+        usage["output_tokens"] = output_tokens
+    total_tokens = raw_usage.get("total_tokens")
+    if isinstance(total_tokens, int):
+        usage["total_tokens"] = total_tokens
+    elif isinstance(input_tokens, int) and isinstance(output_tokens, int):
+        usage["total_tokens"] = input_tokens + output_tokens
+    input_details: 'typing.Dict[str, int]' = {}
+    cache_creation = raw_usage.get("cache_creation_input_tokens")
+    if isinstance(cache_creation, int):
+        input_details["cache_creation_input_tokens"] = cache_creation
+    cache_read = raw_usage.get("cache_read_input_tokens")
+    if isinstance(cache_read, int):
+        input_details["cache_read_input_tokens"] = cache_read
+    if input_details:
+        usage["input_tokens_details"] = input_details
+    return usage
+def _normalize_index(raw_index: 'object') -> 'int':
+    if isinstance(raw_index, int):
+        return raw_index
+    try:
+        return int(raw_index)
+    except (TypeError, ValueError):
+        return 0
+def _translate_stop_reason(raw_stop_reason: 'object') -> 'typing.Union[str, None]':
+    if not isinstance(raw_stop_reason, str):
+        return None
+    stop_reason = raw_stop_reason.strip()
+    if not stop_reason:
+        return None
+    if stop_reason == "tool_use":
+        return "tool_calls"
+    if stop_reason == "max_tokens":
+        return "length"
+    if stop_reason in {"end_turn", "stop_sequence"}:
+        return "stop"
+    return stop_reason
+def _chat_text_chunk(text: 'str') -> 'typing.Dict[str, object]':
+    return _chat_delta_chunk({"content": text})
+def _chat_reasoning_chunk(reasoning: 'str') -> 'typing.Dict[str, object]':
+    return _chat_delta_chunk({"reasoning_content": reasoning})
+def _chat_tool_chunk(
+    index: 'int',
+    call_id: 'str' = "",
+    name: 'str' = "",
+    arguments: 'str' = "",
+) -> 'typing.Dict[str, object]':
+    tool_call: 'typing.Dict[str, object]' = {
+        "index": index,
+        "function": {},
+    }
+    if call_id:
+        tool_call["id"] = call_id
+    if name:
+        tool_call["type"] = "function"
+        tool_call["function"] = {"name": name}
+    function = tool_call.get("function")
+    if not isinstance(function, dict):
+        function = {}
+        tool_call["function"] = function
+    if arguments:
+        function["arguments"] = arguments
+    return _chat_delta_chunk({"tool_calls": [tool_call]})
+def _chat_delta_chunk(delta: 'typing.Dict[str, object]') -> 'typing.Dict[str, object]':
+    return {
+        "choices": [
+            {
+                "index": 0,
+                "delta": delta,
+                "finish_reason": None,
+            }
+        ]
+    }
+def _chat_finish_chunk(finish_reason: 'str') -> 'typing.Dict[str, object]':
+    return {
+        "choices": [
+            {
+                "index": 0,
+                "delta": {},
+                "finish_reason": finish_reason,
+            }
+        ]
+    }
+def _dump_json(raw_value: 'object') -> 'str':
+    return json.dumps(raw_value, ensure_ascii=False, separators=(",", ":"))

responses_server/payload_processors.py CHANGED Viewed

@@ -28,6 +28,7 @@ class OutgoingRequest(TypedDict):
     model: 'str'
     messages: 'typing.List[ChatMessage]'
     stream: 'bool'
+    max_tokens: 'Optional[int]'
     tools: 'Optional[typing.List[typing.Dict[str, object]]]'
     tool_choice: 'Optional[object]'
     parallel_tool_calls: 'Optional[bool]'

responses_server/stream_router.py CHANGED Viewed

@@ -6,6 +6,12 @@ import urllib.error
 import urllib.request
 from .config import CompatServerConfig
+from .messages_api import (
+    MessagesAPIAdapterError,
+    build_messages_request,
+    iter_chat_chunks as iter_chat_chunks_from_messages,
+    saw_message_stop as messages_saw_message_stop,
+)
 from .session_store import StoredResponse
 from .tools import WebSearchTool, collect_custom_tool_names
 from .tools.custom_adapter import (
@@ -130,6 +136,13 @@ class StreamRouter:
             ),
             "stream": True,
         }
+        max_tokens = self._coerce_positive_int(
+            incomming_request.get("max_output_tokens")
+        )
+        if max_tokens is None:
+            max_tokens = self._coerce_positive_int(incomming_request.get("max_tokens"))
+        if max_tokens is not None:
+            payload["max_tokens"] = max_tokens
         if self._supports_stream_usage():
             payload["stream_options"] = {"include_usage": True}
@@ -150,6 +163,19 @@ class StreamRouter:
         return payload
     def open_outcomming_stream(self, outcomming_request: 'typing.Dict[str, object]'):
+        outcomming_api = self._config.normalized_outcomming_api()
+        if outcomming_api == "messages":
+            return self._open_outcomming_messages_stream(outcomming_request)
+        if outcomming_api != "chat_completions":
+            raise OutcommingChatError(
+                f"unsupported outcomming API: {self._config.outcomming_api!r}"
+            )
+        return self._open_outcomming_chat_stream(outcomming_request)
+    def _open_outcomming_chat_stream(
+        self,
+        outcomming_request: 'typing.Dict[str, object]',
+    ):
         request = urllib.request.Request(
             self._config.outcomming_chat_completions_url(),
             data=json.dumps(outcomming_request).encode("utf-8"),
@@ -196,6 +222,67 @@ class StreamRouter:
                 f"outcomming chat request failed: {exc.reason}"
             ) from exc
+    def _open_outcomming_messages_stream(
+        self,
+        outcomming_request: 'typing.Dict[str, object]',
+    ):
+        try:
+            messages_request = build_messages_request(outcomming_request)
+        except MessagesAPIAdapterError as exc:
+            raise OutcommingChatError(str(exc)) from exc
+        request = urllib.request.Request(
+            self._config.outcomming_messages_url(),
+            data=json.dumps(messages_request).encode("utf-8"),
+            headers=self._build_headers(accept="text/event-stream"),
+            method="POST",
+        )
+        try:
+            with urllib.request.urlopen(
+                request,
+                context=ssl.create_default_context(),
+                timeout=self._config.timeout_seconds,
+            ) as response:
+                try:
+                    stream_state: 'typing.Dict[str, object]' = {}
+                    for event_name, data in self._iter_sse_events(response):
+                        if not data:
+                            continue
+                        payload = json.loads(data)
+                        if not isinstance(payload, dict):
+                            continue
+                        for chunk in iter_chat_chunks_from_messages(
+                            event_name,
+                            payload,
+                            stream_state,
+                        ):
+                            yield chunk
+                    if not messages_saw_message_stop(stream_state):
+                        raise OutcommingChatError(
+                            "outcomming messages stream ended before `message_stop`"
+                        )
+                except (
+                    ConnectionError,
+                    EOFError,
+                    OSError,
+                    http.client.HTTPException,
+                    json.JSONDecodeError,
+                    MessagesAPIAdapterError,
+                ) as exc:
+                    raise OutcommingChatError(
+                        "outcomming messages stream failed while reading response body: "
+                        f"{exc}"
+                    ) from exc
+        except urllib.error.HTTPError as exc:
+            body = exc.read().decode("utf-8", errors="replace")
+            raise OutcommingChatError(
+                f"outcomming messages request failed with status {exc.code}: {body[:500]}"
+            ) from exc
+        except urllib.error.URLError as exc:
+            raise OutcommingChatError(
+                f"outcomming messages request failed: {exc.reason}"
+            ) from exc
     def route_stream(
         self,
         incomming_stream,
@@ -439,6 +526,13 @@ class StreamRouter:
         flush_pending_assistant()
         return messages
+    def _coerce_positive_int(self, raw_value: 'object') -> 'typing.Union[int, None]':
+        if isinstance(raw_value, bool):
+            return None
+        if isinstance(raw_value, int) and raw_value > 0:
+            return raw_value
+        return None
     def _coalesce_content_text(self, raw_content: 'object') -> 'str':
         if raw_content is None:
             return ""

{python_codex-0.1.5.dist-info → python_codex-0.1.7.dist-info}/WHEEL RENAMED Viewed

File without changes

{python_codex-0.1.5.dist-info → python_codex-0.1.7.dist-info}/entry_points.txt RENAMED Viewed

File without changes

{python_codex-0.1.5.dist-info → python_codex-0.1.7.dist-info}/licenses/LICENSE RENAMED Viewed

File without changes

python-codex 0.1.5__py3-none-any.whl → 0.1.7__py3-none-any.whl

python-codex 0.1.5py3-none-any.whl → 0.1.7py3-none-any.whl