PyPI - ccproxy-api - Versions diffs - 0.1.7__py3-none-any.whl → 0.2.0a4__py3-none-any.whl - Mend

ccproxy-api 0.1.7py3-none-any.whl → 0.2.0a4py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (481) hide show

ccproxy/api/__init__.py +1 -15
ccproxy/api/app.py +434 -219
ccproxy/api/bootstrap.py +30 -0
ccproxy/api/decorators.py +85 -0
ccproxy/api/dependencies.py +144 -168
ccproxy/api/format_validation.py +54 -0
ccproxy/api/middleware/cors.py +6 -3
ccproxy/api/middleware/errors.py +388 -524
ccproxy/api/middleware/hooks.py +563 -0
ccproxy/api/middleware/normalize_headers.py +59 -0
ccproxy/api/middleware/request_id.py +35 -16
ccproxy/api/middleware/streaming_hooks.py +292 -0
ccproxy/api/routes/__init__.py +5 -14
ccproxy/api/routes/health.py +39 -672
ccproxy/api/routes/plugins.py +277 -0
ccproxy/auth/__init__.py +2 -19
ccproxy/auth/bearer.py +25 -15
ccproxy/auth/dependencies.py +123 -157
ccproxy/auth/exceptions.py +0 -12
ccproxy/auth/manager.py +35 -49
ccproxy/auth/managers/__init__.py +10 -0
ccproxy/auth/managers/base.py +523 -0
ccproxy/auth/managers/base_enhanced.py +63 -0
ccproxy/auth/managers/token_snapshot.py +77 -0
ccproxy/auth/models/base.py +65 -0
ccproxy/auth/models/credentials.py +40 -0
ccproxy/auth/oauth/__init__.py +4 -18
ccproxy/auth/oauth/base.py +533 -0
ccproxy/auth/oauth/cli_errors.py +37 -0
ccproxy/auth/oauth/flows.py +430 -0
ccproxy/auth/oauth/protocol.py +366 -0
ccproxy/auth/oauth/registry.py +408 -0
ccproxy/auth/oauth/router.py +396 -0
ccproxy/auth/oauth/routes.py +186 -113
ccproxy/auth/oauth/session.py +151 -0
ccproxy/auth/oauth/templates.py +342 -0
ccproxy/auth/storage/__init__.py +2 -5
ccproxy/auth/storage/base.py +279 -5
ccproxy/auth/storage/generic.py +134 -0
ccproxy/cli/__init__.py +1 -2
ccproxy/cli/_settings_help.py +351 -0
ccproxy/cli/commands/auth.py +1519 -793
ccproxy/cli/commands/config/commands.py +209 -276
ccproxy/cli/commands/plugins.py +669 -0
ccproxy/cli/commands/serve.py +75 -810
ccproxy/cli/commands/status.py +254 -0
ccproxy/cli/decorators.py +83 -0
ccproxy/cli/helpers.py +22 -60
ccproxy/cli/main.py +359 -10
ccproxy/cli/options/claude_options.py +0 -25
ccproxy/config/__init__.py +7 -11
ccproxy/config/core.py +227 -0
ccproxy/config/env_generator.py +232 -0
ccproxy/config/runtime.py +67 -0
ccproxy/config/security.py +36 -3
ccproxy/config/settings.py +382 -441
ccproxy/config/toml_generator.py +299 -0
ccproxy/config/utils.py +452 -0
ccproxy/core/__init__.py +7 -271
ccproxy/{_version.py → core/_version.py} +16 -3
ccproxy/core/async_task_manager.py +516 -0
ccproxy/core/async_utils.py +47 -14
ccproxy/core/auth/__init__.py +6 -0
ccproxy/core/constants.py +16 -50
ccproxy/core/errors.py +53 -0
ccproxy/core/id_utils.py +20 -0
ccproxy/core/interfaces.py +16 -123
ccproxy/core/logging.py +473 -18
ccproxy/core/plugins/__init__.py +77 -0
ccproxy/core/plugins/cli_discovery.py +211 -0
ccproxy/core/plugins/declaration.py +455 -0
ccproxy/core/plugins/discovery.py +604 -0
ccproxy/core/plugins/factories.py +967 -0
ccproxy/core/plugins/hooks/__init__.py +30 -0
ccproxy/core/plugins/hooks/base.py +58 -0
ccproxy/core/plugins/hooks/events.py +46 -0
ccproxy/core/plugins/hooks/implementations/__init__.py +16 -0
ccproxy/core/plugins/hooks/implementations/formatters/__init__.py +11 -0
ccproxy/core/plugins/hooks/implementations/formatters/json.py +552 -0
ccproxy/core/plugins/hooks/implementations/formatters/raw.py +370 -0
ccproxy/core/plugins/hooks/implementations/http_tracer.py +431 -0
ccproxy/core/plugins/hooks/layers.py +44 -0
ccproxy/core/plugins/hooks/manager.py +186 -0
ccproxy/core/plugins/hooks/registry.py +139 -0
ccproxy/core/plugins/hooks/thread_manager.py +203 -0
ccproxy/core/plugins/hooks/types.py +22 -0
ccproxy/core/plugins/interfaces.py +416 -0
ccproxy/core/plugins/loader.py +166 -0
ccproxy/core/plugins/middleware.py +233 -0
ccproxy/core/plugins/models.py +59 -0
ccproxy/core/plugins/protocol.py +180 -0
ccproxy/core/plugins/runtime.py +519 -0
ccproxy/{observability/context.py → core/request_context.py} +137 -94
ccproxy/core/status_report.py +211 -0
ccproxy/core/transformers.py +13 -8
ccproxy/data/claude_headers_fallback.json +540 -19
ccproxy/data/codex_headers_fallback.json +114 -7
ccproxy/http/__init__.py +30 -0
ccproxy/http/base.py +95 -0
ccproxy/http/client.py +323 -0
ccproxy/http/hooks.py +642 -0
ccproxy/http/pool.py +279 -0
ccproxy/llms/formatters/__init__.py +7 -0
ccproxy/llms/formatters/anthropic_to_openai/__init__.py +55 -0
ccproxy/llms/formatters/anthropic_to_openai/errors.py +65 -0
ccproxy/llms/formatters/anthropic_to_openai/requests.py +356 -0
ccproxy/llms/formatters/anthropic_to_openai/responses.py +153 -0
ccproxy/llms/formatters/anthropic_to_openai/streams.py +1546 -0
ccproxy/llms/formatters/base.py +140 -0
ccproxy/llms/formatters/base_model.py +33 -0
ccproxy/llms/formatters/common/__init__.py +51 -0
ccproxy/llms/formatters/common/identifiers.py +48 -0
ccproxy/llms/formatters/common/streams.py +254 -0
ccproxy/llms/formatters/common/thinking.py +74 -0
ccproxy/llms/formatters/common/usage.py +135 -0
ccproxy/llms/formatters/constants.py +55 -0
ccproxy/llms/formatters/context.py +116 -0
ccproxy/llms/formatters/mapping.py +33 -0
ccproxy/llms/formatters/openai_to_anthropic/__init__.py +55 -0
ccproxy/llms/formatters/openai_to_anthropic/_helpers.py +141 -0
ccproxy/llms/formatters/openai_to_anthropic/errors.py +53 -0
ccproxy/llms/formatters/openai_to_anthropic/requests.py +674 -0
ccproxy/llms/formatters/openai_to_anthropic/responses.py +285 -0
ccproxy/llms/formatters/openai_to_anthropic/streams.py +530 -0
ccproxy/llms/formatters/openai_to_openai/__init__.py +53 -0
ccproxy/llms/formatters/openai_to_openai/_helpers.py +325 -0
ccproxy/llms/formatters/openai_to_openai/errors.py +6 -0
ccproxy/llms/formatters/openai_to_openai/requests.py +388 -0
ccproxy/llms/formatters/openai_to_openai/responses.py +594 -0
ccproxy/llms/formatters/openai_to_openai/streams.py +1832 -0
ccproxy/llms/formatters/utils.py +306 -0
ccproxy/llms/models/__init__.py +9 -0
ccproxy/llms/models/anthropic.py +619 -0
ccproxy/llms/models/openai.py +844 -0
ccproxy/llms/streaming/__init__.py +26 -0
ccproxy/llms/streaming/accumulators.py +1074 -0
ccproxy/llms/streaming/formatters.py +251 -0
ccproxy/{adapters/openai/streaming.py → llms/streaming/processors.py} +193 -240
ccproxy/models/__init__.py +8 -159
ccproxy/models/detection.py +92 -193
ccproxy/models/provider.py +75 -0
ccproxy/plugins/access_log/README.md +32 -0
ccproxy/plugins/access_log/__init__.py +20 -0
ccproxy/plugins/access_log/config.py +33 -0
ccproxy/plugins/access_log/formatter.py +126 -0
ccproxy/plugins/access_log/hook.py +763 -0
ccproxy/plugins/access_log/logger.py +254 -0
ccproxy/plugins/access_log/plugin.py +137 -0
ccproxy/plugins/access_log/writer.py +109 -0
ccproxy/plugins/analytics/README.md +24 -0
ccproxy/plugins/analytics/__init__.py +1 -0
ccproxy/plugins/analytics/config.py +5 -0
ccproxy/plugins/analytics/ingest.py +85 -0
ccproxy/plugins/analytics/models.py +97 -0
ccproxy/plugins/analytics/plugin.py +121 -0
ccproxy/plugins/analytics/routes.py +163 -0
ccproxy/plugins/analytics/service.py +284 -0
ccproxy/plugins/claude_api/README.md +29 -0
ccproxy/plugins/claude_api/__init__.py +10 -0
ccproxy/plugins/claude_api/adapter.py +829 -0
ccproxy/plugins/claude_api/config.py +52 -0
ccproxy/plugins/claude_api/detection_service.py +461 -0
ccproxy/plugins/claude_api/health.py +175 -0
ccproxy/plugins/claude_api/hooks.py +284 -0
ccproxy/plugins/claude_api/models.py +256 -0
ccproxy/plugins/claude_api/plugin.py +298 -0
ccproxy/plugins/claude_api/routes.py +118 -0
ccproxy/plugins/claude_api/streaming_metrics.py +68 -0
ccproxy/plugins/claude_api/tasks.py +84 -0
ccproxy/plugins/claude_sdk/README.md +35 -0
ccproxy/plugins/claude_sdk/__init__.py +80 -0
ccproxy/plugins/claude_sdk/adapter.py +749 -0
ccproxy/plugins/claude_sdk/auth.py +57 -0
ccproxy/{claude_sdk → plugins/claude_sdk}/client.py +63 -39
ccproxy/plugins/claude_sdk/config.py +210 -0
ccproxy/{claude_sdk → plugins/claude_sdk}/converter.py +6 -6
ccproxy/plugins/claude_sdk/detection_service.py +163 -0
ccproxy/{services/claude_sdk_service.py → plugins/claude_sdk/handler.py} +123 -304
ccproxy/plugins/claude_sdk/health.py +113 -0
ccproxy/plugins/claude_sdk/hooks.py +115 -0
ccproxy/{claude_sdk → plugins/claude_sdk}/manager.py +42 -32
ccproxy/{claude_sdk → plugins/claude_sdk}/message_queue.py +8 -8
ccproxy/{models/claude_sdk.py → plugins/claude_sdk/models.py} +64 -16
ccproxy/plugins/claude_sdk/options.py +154 -0
ccproxy/{claude_sdk → plugins/claude_sdk}/parser.py +23 -5
ccproxy/plugins/claude_sdk/plugin.py +269 -0
ccproxy/plugins/claude_sdk/routes.py +104 -0
ccproxy/{claude_sdk → plugins/claude_sdk}/session_client.py +124 -12
ccproxy/plugins/claude_sdk/session_pool.py +700 -0
ccproxy/{claude_sdk → plugins/claude_sdk}/stream_handle.py +48 -43
ccproxy/{claude_sdk → plugins/claude_sdk}/stream_worker.py +22 -18
ccproxy/{claude_sdk → plugins/claude_sdk}/streaming.py +50 -16
ccproxy/plugins/claude_sdk/tasks.py +97 -0
ccproxy/plugins/claude_shared/README.md +18 -0
ccproxy/plugins/claude_shared/__init__.py +12 -0
ccproxy/plugins/claude_shared/model_defaults.py +171 -0
ccproxy/plugins/codex/README.md +35 -0
ccproxy/plugins/codex/__init__.py +6 -0
ccproxy/plugins/codex/adapter.py +635 -0
ccproxy/{config/codex.py → plugins/codex/config.py} +78 -12
ccproxy/plugins/codex/detection_service.py +544 -0
ccproxy/plugins/codex/health.py +162 -0
ccproxy/plugins/codex/hooks.py +263 -0
ccproxy/plugins/codex/model_defaults.py +39 -0
ccproxy/plugins/codex/models.py +263 -0
ccproxy/plugins/codex/plugin.py +275 -0
ccproxy/plugins/codex/routes.py +129 -0
ccproxy/plugins/codex/streaming_metrics.py +324 -0
ccproxy/plugins/codex/tasks.py +106 -0
ccproxy/plugins/codex/utils/__init__.py +1 -0
ccproxy/plugins/codex/utils/sse_parser.py +106 -0
ccproxy/plugins/command_replay/README.md +34 -0
ccproxy/plugins/command_replay/__init__.py +17 -0
ccproxy/plugins/command_replay/config.py +133 -0
ccproxy/plugins/command_replay/formatter.py +432 -0
ccproxy/plugins/command_replay/hook.py +294 -0
ccproxy/plugins/command_replay/plugin.py +161 -0
ccproxy/plugins/copilot/README.md +39 -0
ccproxy/plugins/copilot/__init__.py +11 -0
ccproxy/plugins/copilot/adapter.py +465 -0
ccproxy/plugins/copilot/config.py +155 -0
ccproxy/plugins/copilot/data/copilot_fallback.json +41 -0
ccproxy/plugins/copilot/detection_service.py +255 -0
ccproxy/plugins/copilot/manager.py +275 -0
ccproxy/plugins/copilot/model_defaults.py +284 -0
ccproxy/plugins/copilot/models.py +148 -0
ccproxy/plugins/copilot/oauth/__init__.py +16 -0
ccproxy/plugins/copilot/oauth/client.py +494 -0
ccproxy/plugins/copilot/oauth/models.py +385 -0
ccproxy/plugins/copilot/oauth/provider.py +602 -0
ccproxy/plugins/copilot/oauth/storage.py +170 -0
ccproxy/plugins/copilot/plugin.py +360 -0
ccproxy/plugins/copilot/routes.py +294 -0
ccproxy/plugins/credential_balancer/README.md +124 -0
ccproxy/plugins/credential_balancer/__init__.py +6 -0
ccproxy/plugins/credential_balancer/config.py +270 -0
ccproxy/plugins/credential_balancer/factory.py +415 -0
ccproxy/plugins/credential_balancer/hook.py +51 -0
ccproxy/plugins/credential_balancer/manager.py +587 -0
ccproxy/plugins/credential_balancer/plugin.py +146 -0
ccproxy/plugins/dashboard/README.md +25 -0
ccproxy/plugins/dashboard/__init__.py +1 -0
ccproxy/plugins/dashboard/config.py +8 -0
ccproxy/plugins/dashboard/plugin.py +71 -0
ccproxy/plugins/dashboard/routes.py +67 -0
ccproxy/plugins/docker/README.md +32 -0
ccproxy/{docker → plugins/docker}/__init__.py +3 -0
ccproxy/{docker → plugins/docker}/adapter.py +108 -10
ccproxy/plugins/docker/config.py +82 -0
ccproxy/{docker → plugins/docker}/docker_path.py +4 -3
ccproxy/{docker → plugins/docker}/middleware.py +2 -2
ccproxy/plugins/docker/plugin.py +198 -0
ccproxy/{docker → plugins/docker}/stream_process.py +3 -3
ccproxy/plugins/duckdb_storage/README.md +26 -0
ccproxy/plugins/duckdb_storage/__init__.py +1 -0
ccproxy/plugins/duckdb_storage/config.py +22 -0
ccproxy/plugins/duckdb_storage/plugin.py +128 -0
ccproxy/plugins/duckdb_storage/routes.py +51 -0
ccproxy/plugins/duckdb_storage/storage.py +633 -0
ccproxy/plugins/max_tokens/README.md +38 -0
ccproxy/plugins/max_tokens/__init__.py +12 -0
ccproxy/plugins/max_tokens/adapter.py +235 -0
ccproxy/plugins/max_tokens/config.py +86 -0
ccproxy/plugins/max_tokens/models.py +53 -0
ccproxy/plugins/max_tokens/plugin.py +200 -0
ccproxy/plugins/max_tokens/service.py +271 -0
ccproxy/plugins/max_tokens/token_limits.json +54 -0
ccproxy/plugins/metrics/README.md +35 -0
ccproxy/plugins/metrics/__init__.py +10 -0
ccproxy/{observability/metrics.py → plugins/metrics/collector.py} +20 -153
ccproxy/plugins/metrics/config.py +85 -0
ccproxy/plugins/metrics/grafana/dashboards/ccproxy-dashboard.json +1720 -0
ccproxy/plugins/metrics/hook.py +403 -0
ccproxy/plugins/metrics/plugin.py +268 -0
ccproxy/{observability → plugins/metrics}/pushgateway.py +57 -59
ccproxy/plugins/metrics/routes.py +107 -0
ccproxy/plugins/metrics/tasks.py +117 -0
ccproxy/plugins/oauth_claude/README.md +35 -0
ccproxy/plugins/oauth_claude/__init__.py +14 -0
ccproxy/plugins/oauth_claude/client.py +270 -0
ccproxy/plugins/oauth_claude/config.py +84 -0
ccproxy/plugins/oauth_claude/manager.py +482 -0
ccproxy/plugins/oauth_claude/models.py +266 -0
ccproxy/plugins/oauth_claude/plugin.py +149 -0
ccproxy/plugins/oauth_claude/provider.py +571 -0
ccproxy/plugins/oauth_claude/storage.py +212 -0
ccproxy/plugins/oauth_codex/README.md +38 -0
ccproxy/plugins/oauth_codex/__init__.py +14 -0
ccproxy/plugins/oauth_codex/client.py +224 -0
ccproxy/plugins/oauth_codex/config.py +95 -0
ccproxy/plugins/oauth_codex/manager.py +256 -0
ccproxy/plugins/oauth_codex/models.py +239 -0
ccproxy/plugins/oauth_codex/plugin.py +146 -0
ccproxy/plugins/oauth_codex/provider.py +574 -0
ccproxy/plugins/oauth_codex/storage.py +92 -0
ccproxy/plugins/permissions/README.md +28 -0
ccproxy/plugins/permissions/__init__.py +22 -0
ccproxy/plugins/permissions/config.py +28 -0
ccproxy/{cli/commands/permission_handler.py → plugins/permissions/handlers/cli.py} +49 -25
ccproxy/plugins/permissions/handlers/protocol.py +33 -0
ccproxy/plugins/permissions/handlers/terminal.py +675 -0
ccproxy/{api/routes → plugins/permissions}/mcp.py +34 -7
ccproxy/{models/permissions.py → plugins/permissions/models.py} +65 -1
ccproxy/plugins/permissions/plugin.py +153 -0
ccproxy/{api/routes/permissions.py → plugins/permissions/routes.py} +20 -16
ccproxy/{api/services/permission_service.py → plugins/permissions/service.py} +65 -11
ccproxy/{api → plugins/permissions}/ui/permission_handler_protocol.py +1 -1
ccproxy/{api → plugins/permissions}/ui/terminal_permission_handler.py +66 -10
ccproxy/plugins/pricing/README.md +34 -0
ccproxy/plugins/pricing/__init__.py +6 -0
ccproxy/{pricing → plugins/pricing}/cache.py +7 -6
ccproxy/{config/pricing.py → plugins/pricing/config.py} +32 -6
ccproxy/plugins/pricing/exceptions.py +35 -0
ccproxy/plugins/pricing/loader.py +440 -0
ccproxy/{pricing → plugins/pricing}/models.py +13 -23
ccproxy/plugins/pricing/plugin.py +169 -0
ccproxy/plugins/pricing/service.py +191 -0
ccproxy/plugins/pricing/tasks.py +300 -0
ccproxy/{pricing → plugins/pricing}/updater.py +86 -72
ccproxy/plugins/pricing/utils.py +99 -0
ccproxy/plugins/request_tracer/README.md +40 -0
ccproxy/plugins/request_tracer/__init__.py +7 -0
ccproxy/plugins/request_tracer/config.py +120 -0
ccproxy/plugins/request_tracer/hook.py +415 -0
ccproxy/plugins/request_tracer/plugin.py +255 -0
ccproxy/scheduler/__init__.py +2 -14
ccproxy/scheduler/core.py +26 -41
ccproxy/scheduler/manager.py +61 -105
ccproxy/scheduler/registry.py +6 -32
ccproxy/scheduler/tasks.py +268 -276
ccproxy/services/__init__.py +0 -1
ccproxy/services/adapters/__init__.py +11 -0
ccproxy/services/adapters/base.py +123 -0
ccproxy/services/adapters/chain_composer.py +88 -0
ccproxy/services/adapters/chain_validation.py +44 -0
ccproxy/services/adapters/chat_accumulator.py +200 -0
ccproxy/services/adapters/delta_utils.py +142 -0
ccproxy/services/adapters/format_adapter.py +136 -0
ccproxy/services/adapters/format_context.py +11 -0
ccproxy/services/adapters/format_registry.py +158 -0
ccproxy/services/adapters/http_adapter.py +1045 -0
ccproxy/services/adapters/mock_adapter.py +118 -0
ccproxy/services/adapters/protocols.py +35 -0
ccproxy/services/adapters/simple_converters.py +571 -0
ccproxy/services/auth_registry.py +180 -0
ccproxy/services/cache/__init__.py +6 -0
ccproxy/services/cache/response_cache.py +261 -0
ccproxy/services/cli_detection.py +437 -0
ccproxy/services/config/__init__.py +6 -0
ccproxy/services/config/proxy_configuration.py +111 -0
ccproxy/services/container.py +256 -0
ccproxy/services/factories.py +380 -0
ccproxy/services/handler_config.py +76 -0
ccproxy/services/interfaces.py +298 -0
ccproxy/services/mocking/__init__.py +6 -0
ccproxy/services/mocking/mock_handler.py +291 -0
ccproxy/services/tracing/__init__.py +7 -0
ccproxy/services/tracing/interfaces.py +61 -0
ccproxy/services/tracing/null_tracer.py +57 -0
ccproxy/streaming/__init__.py +23 -0
ccproxy/streaming/buffer.py +1056 -0
ccproxy/streaming/deferred.py +897 -0
ccproxy/streaming/handler.py +117 -0
ccproxy/streaming/interfaces.py +77 -0
ccproxy/streaming/simple_adapter.py +39 -0
ccproxy/streaming/sse.py +109 -0
ccproxy/streaming/sse_parser.py +127 -0
ccproxy/templates/__init__.py +6 -0
ccproxy/templates/plugin_scaffold.py +695 -0
ccproxy/testing/endpoints/__init__.py +33 -0
ccproxy/testing/endpoints/cli.py +215 -0
ccproxy/testing/endpoints/config.py +874 -0
ccproxy/testing/endpoints/console.py +57 -0
ccproxy/testing/endpoints/models.py +100 -0
ccproxy/testing/endpoints/runner.py +1903 -0
ccproxy/testing/endpoints/tools.py +308 -0
ccproxy/testing/mock_responses.py +70 -1
ccproxy/testing/response_handlers.py +20 -0
ccproxy/utils/__init__.py +0 -6
ccproxy/utils/binary_resolver.py +476 -0
ccproxy/utils/caching.py +327 -0
ccproxy/utils/cli_logging.py +101 -0
ccproxy/utils/command_line.py +251 -0
ccproxy/utils/headers.py +228 -0
ccproxy/utils/model_mapper.py +120 -0
ccproxy/utils/startup_helpers.py +68 -446
ccproxy/utils/version_checker.py +273 -6
ccproxy_api-0.2.0a4.dist-info/METADATA +212 -0
ccproxy_api-0.2.0a4.dist-info/RECORD +417 -0
{ccproxy_api-0.1.7.dist-info → ccproxy_api-0.2.0a4.dist-info}/WHEEL +1 -1
ccproxy_api-0.2.0a4.dist-info/entry_points.txt +24 -0
ccproxy/__init__.py +0 -4
ccproxy/adapters/__init__.py +0 -11
ccproxy/adapters/base.py +0 -80
ccproxy/adapters/codex/__init__.py +0 -11
ccproxy/adapters/openai/__init__.py +0 -42
ccproxy/adapters/openai/adapter.py +0 -953
ccproxy/adapters/openai/models.py +0 -412
ccproxy/adapters/openai/response_adapter.py +0 -355
ccproxy/adapters/openai/response_models.py +0 -178
ccproxy/api/middleware/headers.py +0 -49
ccproxy/api/middleware/logging.py +0 -180
ccproxy/api/middleware/request_content_logging.py +0 -297
ccproxy/api/middleware/server_header.py +0 -58
ccproxy/api/responses.py +0 -89
ccproxy/api/routes/claude.py +0 -371
ccproxy/api/routes/codex.py +0 -1251
ccproxy/api/routes/metrics.py +0 -1029
ccproxy/api/routes/proxy.py +0 -211
ccproxy/api/services/__init__.py +0 -6
ccproxy/auth/conditional.py +0 -84
ccproxy/auth/credentials_adapter.py +0 -93
ccproxy/auth/models.py +0 -118
ccproxy/auth/oauth/models.py +0 -48
ccproxy/auth/openai/__init__.py +0 -13
ccproxy/auth/openai/credentials.py +0 -166
ccproxy/auth/openai/oauth_client.py +0 -334
ccproxy/auth/openai/storage.py +0 -184
ccproxy/auth/storage/json_file.py +0 -158
ccproxy/auth/storage/keyring.py +0 -189
ccproxy/claude_sdk/__init__.py +0 -18
ccproxy/claude_sdk/options.py +0 -194
ccproxy/claude_sdk/session_pool.py +0 -550
ccproxy/cli/docker/__init__.py +0 -34
ccproxy/cli/docker/adapter_factory.py +0 -157
ccproxy/cli/docker/params.py +0 -274
ccproxy/config/auth.py +0 -153
ccproxy/config/claude.py +0 -348
ccproxy/config/cors.py +0 -79
ccproxy/config/discovery.py +0 -95
ccproxy/config/docker_settings.py +0 -264
ccproxy/config/observability.py +0 -158
ccproxy/config/reverse_proxy.py +0 -31
ccproxy/config/scheduler.py +0 -108
ccproxy/config/server.py +0 -86
ccproxy/config/validators.py +0 -231
ccproxy/core/codex_transformers.py +0 -389
ccproxy/core/http.py +0 -328
ccproxy/core/http_transformers.py +0 -812
ccproxy/core/proxy.py +0 -143
ccproxy/core/validators.py +0 -288
ccproxy/models/errors.py +0 -42
ccproxy/models/messages.py +0 -269
ccproxy/models/requests.py +0 -107
ccproxy/models/responses.py +0 -270
ccproxy/models/types.py +0 -102
ccproxy/observability/__init__.py +0 -51
ccproxy/observability/access_logger.py +0 -457
ccproxy/observability/sse_events.py +0 -303
ccproxy/observability/stats_printer.py +0 -753
ccproxy/observability/storage/__init__.py +0 -1
ccproxy/observability/storage/duckdb_simple.py +0 -677
ccproxy/observability/storage/models.py +0 -70
ccproxy/observability/streaming_response.py +0 -107
ccproxy/pricing/__init__.py +0 -19
ccproxy/pricing/loader.py +0 -251
ccproxy/services/claude_detection_service.py +0 -243
ccproxy/services/codex_detection_service.py +0 -252
ccproxy/services/credentials/__init__.py +0 -55
ccproxy/services/credentials/config.py +0 -105
ccproxy/services/credentials/manager.py +0 -561
ccproxy/services/credentials/oauth_client.py +0 -481
ccproxy/services/proxy_service.py +0 -1827
ccproxy/static/.keep +0 -0
ccproxy/utils/cost_calculator.py +0 -210
ccproxy/utils/disconnection_monitor.py +0 -83
ccproxy/utils/model_mapping.py +0 -199
ccproxy/utils/models_provider.py +0 -150
ccproxy/utils/simple_request_logger.py +0 -284
ccproxy/utils/streaming_metrics.py +0 -199
ccproxy_api-0.1.7.dist-info/METADATA +0 -615
ccproxy_api-0.1.7.dist-info/RECORD +0 -191
ccproxy_api-0.1.7.dist-info/entry_points.txt +0 -4
/ccproxy/{api/middleware/auth.py → auth/models/__init__.py} +0 -0
/ccproxy/{claude_sdk → plugins/claude_sdk}/exceptions.py +0 -0
/ccproxy/{docker → plugins/docker}/models.py +0 -0
/ccproxy/{docker → plugins/docker}/protocol.py +0 -0
/ccproxy/{docker → plugins/docker}/validators.py +0 -0
/ccproxy/{auth/oauth/storage.py → plugins/permissions/handlers/__init__.py} +0 -0
/ccproxy/{api → plugins/permissions}/ui/__init__.py +0 -0
{ccproxy_api-0.1.7.dist-info → ccproxy_api-0.2.0a4.dist-info}/licenses/LICENSE +0 -0

ccproxy/llms/formatters/openai_to_openai/streams.py ADDED Viewed

@@ -0,0 +1,1832 @@
+"""Streaming conversion entry points for OpenAI↔OpenAI adapters."""
+from __future__ import annotations
+import contextlib
+import json
+import time
+import uuid
+from collections.abc import AsyncGenerator, AsyncIterator
+from typing import Any, Literal
+from pydantic import ValidationError
+import ccproxy.core.logging
+from ccproxy.llms.formatters.common import (
+    THINKING_CLOSE_PATTERN,
+    THINKING_OPEN_PATTERN,
+    IndexedToolCallTracker,
+    ObfuscationTokenFactory,
+    ReasoningBuffer,
+    ThinkingSegment,
+    ToolCallState,
+    ToolCallTracker,
+    ensure_identifier,
+)
+from ccproxy.llms.formatters.context import (
+    get_last_instructions,
+    get_last_request,
+    get_last_request_tools,
+    register_request,
+    register_request_tools,
+)
+from ccproxy.llms.models import openai as openai_models
+from ccproxy.llms.streaming.accumulators import OpenAIAccumulator
+from ._helpers import (
+    _convert_tools_chat_to_responses,
+    _get_attr,
+)
+from .requests import _build_responses_payload_from_chat_request
+from .responses import (
+    _collect_reasoning_segments,
+    _wrap_thinking,
+    convert__openai_completion_usage_to_openai_responses__usage,
+    convert__openai_responses_usage_to_openai_completion__usage,
+)
+logger = ccproxy.core.logging.get_logger(__name__)
+class OpenAIResponsesToChatStreamAdapter:
+    """Stateful adapter for Responses -> Chat streaming conversions."""
+    def run(
+        self,
+        stream: AsyncIterator[openai_models.AnyStreamEvent],
+    ) -> AsyncGenerator[openai_models.ChatCompletionChunk, None]:
+        """Convert Response API stream events to ChatCompletionChunk events."""
+        async def generator() -> AsyncGenerator[
+            openai_models.ChatCompletionChunk, None
+        ]:
+            model_id = ""
+            role_sent = False
+            # Track tool call state keyed by response item id
+            tool_tracker = ToolCallTracker()
+            tool_delta_emitted = False
+            saw_tool_event = False
+            tool_candidates: list[tuple[str | None, set[str]]] = []
+            reasoning_buffer = ReasoningBuffer()
+            def _extract_tool_signature(tool_entry: Any) -> tuple[str | None, set[str]]:
+                name: str | None = None
+                param_keys: set[str] = set()
+                if hasattr(tool_entry, "function"):
+                    fn = getattr(tool_entry, "function", None)
+                    if fn is not None:
+                        name = getattr(fn, "name", None)
+                        parameters = getattr(fn, "parameters", None)
+                        if isinstance(parameters, dict):
+                            props = parameters.get("properties")
+                            if isinstance(props, dict):
+                                param_keys = {str(key) for key in props}
+                if name is None and isinstance(tool_entry, dict):
+                    fn_dict = tool_entry.get("function")
+                    if isinstance(fn_dict, dict):
+                        name = fn_dict.get("name", name)
+                        parameters = fn_dict.get("parameters")
+                        if isinstance(parameters, dict):
+                            props = parameters.get("properties")
+                            if isinstance(props, dict):
+                                param_keys = {str(key) for key in props}
+                    if name is None:
+                        name = tool_entry.get("name")
+                return name, param_keys
+            def _guess_tool_name(arguments: str | None) -> str | None:
+                if not arguments:
+                    return None
+                try:
+                    parsed = json.loads(arguments)
+                except Exception:
+                    return None
+                if not isinstance(parsed, dict):
+                    return None
+                keys = {str(k) for k in parsed}
+                if not keys:
+                    return None
+                candidates = [
+                    tool_name
+                    for tool_name, param_keys in tool_candidates
+                    if tool_name
+                    and ((param_keys and keys.issubset(param_keys)) or not param_keys)
+                ]
+                if len(candidates) == 1:
+                    return candidates[0]
+                exact = [
+                    tool_name
+                    for tool_name, param_keys in tool_candidates
+                    if tool_name and param_keys == keys
+                ]
+                if len(exact) == 1:
+                    return exact[0]
+                return None
+            def _ensure_tool_state(item_id: str) -> ToolCallState:
+                return tool_tracker.ensure(item_id)
+            item_id = "msg_stream"
+            output_index = 0
+            content_index = 0
+            sequence_counter = 0
+            first_logged = False
+            inline_reasoning_id = "__inline_reasoning__"
+            inline_summary_index = "__inline__"
+            async for event_wrapper in stream:
+                evt = getattr(event_wrapper, "root", event_wrapper)
+                if not hasattr(evt, "type"):
+                    continue
+                logger.debug("stream_event", event_type=getattr(evt, "type", None))
+                evt_type = getattr(evt, "type", "")
+                if evt_type == "response.reasoning_summary_part.added":
+                    item_id = _get_attr(evt, "item_id")
+                    part = _get_attr(evt, "part")
+                    if isinstance(item_id, str) and item_id and part is not None:
+                        summary_index = _get_attr(evt, "summary_index")
+                        part_signature = _get_attr(part, "signature")
+                        if isinstance(part_signature, str) and part_signature:
+                            reasoning_buffer.set_signature(
+                                item_id, summary_index, part_signature
+                            )
+                        else:
+                            part_type = _get_attr(part, "type")
+                            part_text = _get_attr(part, "text")
+                            if (
+                                part_type == "signature"
+                                and isinstance(part_text, str)
+                                and part_text
+                            ):
+                                reasoning_buffer.set_signature(
+                                    item_id, summary_index, part_text
+                                )
+                        reasoning_buffer.reset_buffer(item_id, summary_index)
+                    continue
+                if evt_type in {
+                    "response.reasoning_summary_text.delta",
+                    "response.reasoning_text.delta",
+                }:
+                    item_id = _get_attr(evt, "item_id")
+                    delta_text = _get_attr(evt, "delta")
+                    if isinstance(item_id, str):
+                        summary_index = _get_attr(evt, "summary_index")
+                        reasoning_buffer.append_text(item_id, summary_index, delta_text)
+                    continue
+                if evt_type in {
+                    "response.reasoning_summary_text.done",
+                    "response.reasoning_text.done",
+                }:
+                    item_id = _get_attr(evt, "item_id")
+                    text_value = _get_attr(evt, "text")
+                    if isinstance(item_id, str):
+                        summary_index = _get_attr(evt, "summary_index")
+                        for chunk_text in reasoning_buffer.emit(
+                            item_id, summary_index, text_value
+                        ):
+                            sequence_counter += 1
+                            yield openai_models.ChatCompletionChunk(
+                                id="chatcmpl-stream",
+                                created=0,
+                                model=model_id,
+                                choices=[
+                                    openai_models.StreamingChoice(
+                                        index=0,
+                                        delta=openai_models.DeltaMessage(
+                                            role="assistant" if not role_sent else None,
+                                            content=chunk_text,
+                                        ),
+                                        finish_reason=None,
+                                    )
+                                ],
+                            )
+                            role_sent = True
+                    continue
+                if evt_type == "response.created":
+                    response_obj = getattr(evt, "response", None)
+                    model_id = getattr(response_obj, "model", model_id) or model_id
+                    tools_metadata = getattr(response_obj, "tools", None)
+                    if not tools_metadata:
+                        tools_metadata = get_last_request_tools() or []
+                    if tools_metadata:
+                        tool_candidates = [
+                            _extract_tool_signature(entry) for entry in tools_metadata
+                        ]
+                    continue
+                if evt_type == "response.output_text.delta":
+                    delta_text = getattr(evt, "delta", None) or ""
+                    if not delta_text:
+                        continue
+                    remaining = delta_text
+                    # Directly create chunks and yield them instead of using a nested function
+                    # which has closure binding issues
+                    chunks_to_yield: list[openai_models.ChatCompletionChunk] = []
+                    def create_text_chunk(
+                        current_model_id: str, text_segment: str, is_role_sent: bool
+                    ) -> tuple[openai_models.ChatCompletionChunk | None, bool]:
+                        if not text_segment:
+                            return None, is_role_sent
+                        delta_msg = openai_models.DeltaMessage(
+                            role="assistant" if not is_role_sent else None,
+                            content=text_segment,
+                        )
+                        new_role_sent = True
+                        chunk = openai_models.ChatCompletionChunk(
+                            id="chatcmpl-stream",
+                            created=0,
+                            model=current_model_id,
+                            choices=[
+                                openai_models.StreamingChoice(
+                                    index=0,
+                                    delta=delta_msg,
+                                    finish_reason=None,
+                                )
+                            ],
+                        )
+                        return chunk, new_role_sent
+                    while remaining:
+                        if reasoning_buffer.is_open(
+                            inline_reasoning_id, inline_summary_index
+                        ):
+                            close_match = THINKING_CLOSE_PATTERN.search(remaining)
+                            if close_match:
+                                inside_text = remaining[: close_match.start()]
+                                if inside_text:
+                                    reasoning_buffer.append_text(
+                                        inline_reasoning_id,
+                                        inline_summary_index,
+                                        inside_text,
+                                    )
+                                for chunk_text in reasoning_buffer.emit(
+                                    inline_reasoning_id, inline_summary_index
+                                ):
+                                    chunk, role_sent = create_text_chunk(
+                                        model_id, chunk_text, role_sent
+                                    )
+                                    if chunk:
+                                        sequence_counter += 1
+                                        chunks_to_yield.append(chunk)
+                                reasoning_buffer.close_part(
+                                    inline_reasoning_id, inline_summary_index
+                                )
+                                remaining = remaining[close_match.end() :]
+                                continue
+                            reasoning_buffer.append_text(
+                                inline_reasoning_id,
+                                inline_summary_index,
+                                remaining,
+                            )
+                            remaining = ""
+                            break
+                        open_match = THINKING_OPEN_PATTERN.search(remaining)
+                        if open_match:
+                            prefix_text = remaining[: open_match.start()]
+                            if prefix_text:
+                                chunk, role_sent = create_text_chunk(
+                                    model_id, prefix_text, role_sent
+                                )
+                                if chunk:
+                                    sequence_counter += 1
+                                    chunks_to_yield.append(chunk)
+                            signature = open_match.group(1) or None
+                            part_state = reasoning_buffer.ensure_part(
+                                inline_reasoning_id, inline_summary_index
+                            )
+                            if signature:
+                                part_state.signature = signature
+                            remaining = remaining[open_match.end() :]
+                            if part_state.open:
+                                # Already inside a reasoning block; ignore duplicate tag
+                                continue
+                            reasoning_buffer.open_part(
+                                inline_reasoning_id, inline_summary_index
+                            )
+                            continue
+                        # No reasoning markers in the rest of the chunk
+                        if reasoning_buffer.is_open(
+                            inline_reasoning_id, inline_summary_index
+                        ):
+                            reasoning_buffer.append_text(
+                                inline_reasoning_id, inline_summary_index, remaining
+                            )
+                        else:
+                            chunk, role_sent = create_text_chunk(
+                                model_id, remaining, role_sent
+                            )
+                            if chunk:
+                                sequence_counter += 1
+                                chunks_to_yield.append(chunk)
+                        remaining = ""
+                    for chunk in chunks_to_yield:
+                        yield chunk
+                    continue
+                if evt_type == "response.output_item.added":
+                    item = getattr(evt, "item", None)
+                    if not item:
+                        continue
+                    item_type = getattr(item, "type", None)
+                    if item_type != "function_call":
+                        continue
+                    saw_tool_event = True
+                    item_id_value = getattr(item, "id", None) or getattr(
+                        item, "call_id", None
+                    )
+                    if not item_id_value:
+                        item_id_value = f"call_{uuid.uuid4().hex}"
+                    item_id = item_id_value
+                    state = _ensure_tool_state(item_id)
+                    state.id = getattr(item, "id", state.id) or state.id
+                    state.call_id = getattr(item, "call_id", None) or state.call_id
+                    if not state.name and state.index < len(tool_candidates):
+                        candidate_name = tool_candidates[state.index][0]
+                        if candidate_name:
+                            state.name = candidate_name
+                    name = getattr(item, "name", None)
+                    if name:
+                        state.name = name
+                    arguments = getattr(item, "arguments", None)
+                    if isinstance(arguments, str) and arguments:
+                        state.arguments += arguments
+                        if not state.name:
+                            guessed = _guess_tool_name(state.arguments)
+                            if guessed:
+                                state.name = guessed
+                    # Emit initial tool call chunk to surface id/name information
+                    if not state.initial_emitted:
+                        tool_call = openai_models.ToolCall(
+                            id=state.id,
+                            type="function",
+                            function=openai_models.FunctionCall(
+                                name=state.name or "",
+                                arguments=arguments or "",
+                            ),
+                        )
+                        state.emitted = True
+                        state.initial_emitted = True
+                        if state.name:
+                            state.name_emitted = True
+                        if arguments:
+                            state.arguments_emitted = True
+                        tool_delta_emitted = True
+                        yield openai_models.ChatCompletionChunk(
+                            id="chatcmpl-stream",
+                            created=0,
+                            model=model_id,
+                            choices=[
+                                openai_models.StreamingChoice(
+                                    index=0,
+                                    delta=openai_models.DeltaMessage(
+                                        role="assistant" if not role_sent else None,
+                                        tool_calls=[tool_call],
+                                    ),
+                                    finish_reason=None,
+                                )
+                            ],
+                        )
+                        role_sent = True
+                    continue
+                if evt_type == "response.function_call_arguments.delta":
+                    saw_tool_event = True
+                    item_id_val = getattr(evt, "item_id", None)
+                    if not isinstance(item_id_val, str):
+                        continue
+                    item_id = item_id_val
+                    delta_segment = getattr(evt, "delta", None)
+                    if not isinstance(delta_segment, str):
+                        continue
+                    state = _ensure_tool_state(item_id)
+                    state.arguments += delta_segment
+                    if not state.name:
+                        guessed = _guess_tool_name(state.arguments)
+                        if guessed:
+                            state.name = guessed
+                    if state.initial_emitted:
+                        tool_call = openai_models.ToolCall(
+                            id=state.id,
+                            type="function",
+                            function=openai_models.FunctionCall(
+                                name=state.name or "",
+                                arguments=delta_segment,
+                            ),
+                        )
+                        state.emitted = True
+                        if delta_segment:
+                            state.arguments_emitted = True
+                        tool_delta_emitted = True
+                        yield openai_models.ChatCompletionChunk(
+                            id="chatcmpl-stream",
+                            created=0,
+                            model=model_id,
+                            choices=[
+                                openai_models.StreamingChoice(
+                                    index=0,
+                                    delta=openai_models.DeltaMessage(
+                                        role="assistant" if not role_sent else None,
+                                        tool_calls=[tool_call],
+                                    ),
+                                    finish_reason=None,
+                                )
+                            ],
+                        )
+                        role_sent = True
+                    continue
+                if evt_type == "response.function_call_arguments.done":
+                    saw_tool_event = True
+                    item_id_val = getattr(evt, "item_id", None)
+                    if not isinstance(item_id_val, str):
+                        continue
+                    item_id = item_id_val
+                    arguments = getattr(evt, "arguments", None)
+                    if not isinstance(arguments, str) or not arguments:
+                        continue
+                    state = _ensure_tool_state(item_id)
+                    # Only emit a chunk if we never emitted arguments earlier
+                    if not state.arguments_emitted:
+                        state.arguments = arguments
+                        if not state.name:
+                            guessed = _guess_tool_name(arguments)
+                            if guessed:
+                                state.name = guessed
+                        tool_call = openai_models.ToolCall(
+                            id=state.id,
+                            type="function",
+                            function=openai_models.FunctionCall(
+                                name=state.name or "",
+                                arguments=arguments,
+                            ),
+                        )
+                        state.emitted = True
+                        state.arguments_emitted = True
+                        tool_delta_emitted = True
+                        yield openai_models.ChatCompletionChunk(
+                            id="chatcmpl-stream",
+                            created=0,
+                            model=model_id,
+                            choices=[
+                                openai_models.StreamingChoice(
+                                    index=0,
+                                    delta=openai_models.DeltaMessage(
+                                        role="assistant" if not role_sent else None,
+                                        tool_calls=[tool_call],
+                                    ),
+                                    finish_reason=None,
+                                )
+                            ],
+                        )
+                        role_sent = True
+                    continue
+                if evt_type == "response.output_item.done":
+                    item = getattr(evt, "item", None)
+                    if not item:
+                        continue
+                    item_type = getattr(item, "type", None)
+                    if item_type == "reasoning":
+                        summary_list = getattr(item, "summary", None)
+                        if isinstance(summary_list, list):
+                            for entry in summary_list:
+                                text = _get_attr(entry, "text")
+                                signature = _get_attr(entry, "signature")
+                                if isinstance(text, str) and text:
+                                    chunk_text = _wrap_thinking(signature, text)
+                                    sequence_counter += 1
+                                    yield openai_models.ChatCompletionChunk(
+                                        id="chatcmpl-stream",
+                                        created=0,
+                                        model=model_id,
+                                        choices=[
+                                            openai_models.StreamingChoice(
+                                                index=0,
+                                                delta=openai_models.DeltaMessage(
+                                                    role="assistant"
+                                                    if not role_sent
+                                                    else None,
+                                                    content=chunk_text,
+                                                ),
+                                                finish_reason=None,
+                                            )
+                                        ],
+                                    )
+                                    role_sent = True
+                        continue
+                    if item_type != "function_call":
+                        continue
+                    saw_tool_event = True
+                    item_id_value = getattr(item, "id", None) or getattr(
+                        item, "call_id", None
+                    )
+                    if not isinstance(item_id_value, str) or not item_id_value:
+                        continue
+                    item_id = item_id_value
+                    state = _ensure_tool_state(item_id)
+                    name = getattr(item, "name", None)
+                    if name:
+                        state.name = name
+                    arguments = getattr(item, "arguments", None)
+                    if isinstance(arguments, str) and arguments:
+                        state.arguments = arguments
+                        if not state.name:
+                            guessed = _guess_tool_name(arguments)
+                            if guessed:
+                                state.name = guessed
+                        if not state.arguments_emitted:
+                            tool_call = openai_models.ToolCall(
+                                id=state.id,
+                                type="function",
+                                function=openai_models.FunctionCall(
+                                    name=state.name or "",
+                                    arguments=arguments,
+                                ),
+                            )
+                            state.emitted = True
+                            state.arguments_emitted = True
+                            yield openai_models.ChatCompletionChunk(
+                                id="chatcmpl-stream",
+                                created=0,
+                                model=model_id,
+                                choices=[
+                                    openai_models.StreamingChoice(
+                                        index=0,
+                                        delta=openai_models.DeltaMessage(
+                                            role="assistant" if not role_sent else None,
+                                            tool_calls=[tool_call],
+                                        ),
+                                        finish_reason=None,
+                                    )
+                                ],
+                            )
+                            role_sent = True
+                    # Emit a patch chunk if the name was never surfaced earlier
+                    if state.name and not state.name_emitted:
+                        tool_call = openai_models.ToolCall(
+                            id=state.id,
+                            type="function",
+                            function=openai_models.FunctionCall(
+                                name=state.name or "",
+                                arguments="",
+                            ),
+                        )
+                        state.name_emitted = True
+                        tool_delta_emitted = True
+                        yield openai_models.ChatCompletionChunk(
+                            id="chatcmpl-stream",
+                            created=0,
+                            model=model_id,
+                            choices=[
+                                openai_models.StreamingChoice(
+                                    index=0,
+                                    delta=openai_models.DeltaMessage(
+                                        role="assistant" if not role_sent else None,
+                                        tool_calls=[tool_call],
+                                    ),
+                                    finish_reason=None,
+                                )
+                            ],
+                        )
+                        role_sent = True
+                    state.completed = True
+                    continue
+                if evt_type in {
+                    "response.completed",
+                    "response.incomplete",
+                    "response.failed",
+                }:
+                    usage = None
+                    response_obj = getattr(evt, "response", None)
+                    if response_obj and getattr(response_obj, "usage", None):
+                        usage = (
+                            convert__openai_responses_usage_to_openai_completion__usage(
+                                response_obj.usage
+                            )
+                        )
+                    finish_reason: Literal["stop", "length", "tool_calls"] = "stop"
+                    if (
+                        tool_delta_emitted
+                        or saw_tool_event
+                        or len(tool_tracker)
+                        or tool_tracker.any_completed()
+                    ):
+                        finish_reason = "tool_calls"
+                    yield openai_models.ChatCompletionChunk(
+                        id="chatcmpl-stream",
+                        created=0,
+                        model=model_id,
+                        choices=[
+                            openai_models.StreamingChoice(
+                                index=0,
+                                delta=openai_models.DeltaMessage(),
+                                finish_reason=finish_reason,
+                            )
+                        ],
+                        usage=usage,
+                    )
+                    # Cleanup request tool cache context when stream completes
+                    register_request_tools(None)
+        return generator()
+def convert__openai_responses_to_openai_chat__stream(
+    stream: AsyncIterator[openai_models.AnyStreamEvent],
+) -> AsyncGenerator[openai_models.ChatCompletionChunk, None]:
+    """Convert Response API stream events to ChatCompletionChunk events."""
+    adapter = OpenAIResponsesToChatStreamAdapter()
+    return adapter.run(stream)
+class OpenAIChatToResponsesStreamAdapter:
+    """Stateful adapter for Chat -> Responses streaming conversions."""
+    def run(
+        self,
+        stream: AsyncIterator[openai_models.ChatCompletionChunk | dict[str, Any]],
+    ) -> AsyncGenerator[openai_models.StreamEventType, None]:
+        """Convert OpenAI ChatCompletionChunk stream to Responses API events.
+        Replays chat deltas as Responses events, including function-call output items
+        and argument deltas so partial tool calls stream correctly.
+        """
+        async def generator() -> AsyncGenerator[openai_models.StreamEventType, None]:
+            log = logger.bind(
+                category="formatter", converter="chat_to_responses_stream"
+            )
+            created_sent = False
+            response_id = ""
+            id_suffix: str | None = None
+            last_model = ""
+            sequence_counter = -1
+            first_logged = False
+            openai_accumulator = OpenAIAccumulator()
+            latest_usage_model: openai_models.ResponseUsage | None = None
+            convert_usage = convert__openai_completion_usage_to_openai_responses__usage
+            delta_event_cls = openai_models.ResponseFunctionCallArgumentsDeltaEvent
+            instructions_text = get_last_instructions()
+            if not instructions_text:
+                try:
+                    from ccproxy.core.request_context import RequestContext
+                    ctx = RequestContext.get_current()
+                    if ctx is not None:
+                        raw_instr = ctx.metadata.get("instructions")
+                        if isinstance(raw_instr, str) and raw_instr.strip():
+                            instructions_text = raw_instr.strip()
+                except Exception:
+                    pass
+            instructions_value = instructions_text or None
+            envelope_base_kwargs: dict[str, Any] = {
+                "id": response_id,
+                "object": "response",
+                "created_at": 0,
+                "instructions": instructions_value,
+            }
+            reasoning_summary_payload: list[dict[str, Any]] | None = None
+            last_request = get_last_request()
+            chat_request: openai_models.ChatCompletionRequest | None = None
+            if isinstance(last_request, openai_models.ChatCompletionRequest):
+                chat_request = last_request
+            elif isinstance(last_request, dict):
+                try:
+                    chat_request = openai_models.ChatCompletionRequest.model_validate(
+                        last_request
+                    )
+                except ValidationError:
+                    chat_request = None
+            base_parallel_tool_calls = True
+            text_payload: dict[str, Any] | None = None
+            if chat_request is not None:
+                request_payload, _ = _build_responses_payload_from_chat_request(
+                    chat_request
+                )
+                base_parallel_tool_calls = bool(
+                    request_payload.get("parallel_tool_calls", True)
+                )
+                background_value = request_payload.get("background", None)
+                envelope_base_kwargs["background"] = (
+                    bool(background_value) if background_value is not None else None
+                )
+                for key in (
+                    "max_output_tokens",
+                    "tool_choice",
+                    "tools",
+                    "store",
+                    "service_tier",
+                    "temperature",
+                    "prompt_cache_key",
+                    "top_p",
+                    "top_logprobs",
+                    "truncation",
+                    "metadata",
+                    "user",
+                ):
+                    if key in request_payload:
+                        envelope_base_kwargs[key] = request_payload[key]
+                text_payload = request_payload.get("text")
+                reasoning_source = request_payload.get("reasoning")
+                reasoning_effort = None
+                if isinstance(reasoning_source, dict):
+                    reasoning_effort = reasoning_source.get("effort")
+                if reasoning_effort is None:
+                    reasoning_effort = getattr(chat_request, "reasoning_effort", None)
+                envelope_base_kwargs["reasoning"] = openai_models.Reasoning(
+                    effort=reasoning_effort,
+                    summary=None,
+                )
+                if envelope_base_kwargs.get("tool_choice") is None:
+                    envelope_base_kwargs["tool_choice"] = (
+                        chat_request.tool_choice or "auto"
+                    )
+                if envelope_base_kwargs.get("tools") is None and chat_request.tools:
+                    envelope_base_kwargs["tools"] = _convert_tools_chat_to_responses(
+                        chat_request.tools
+                    )
+                if envelope_base_kwargs.get("store") is None:
+                    store_value = getattr(chat_request, "store", None)
+                    if store_value is not None:
+                        envelope_base_kwargs["store"] = store_value
+                if envelope_base_kwargs.get("temperature") is None:
+                    temperature_value = getattr(chat_request, "temperature", None)
+                    if temperature_value is not None:
+                        envelope_base_kwargs["temperature"] = temperature_value
+                if envelope_base_kwargs.get("service_tier") is None:
+                    service_tier_value = getattr(chat_request, "service_tier", None)
+                    envelope_base_kwargs["service_tier"] = service_tier_value or "auto"
+                if "metadata" not in envelope_base_kwargs:
+                    envelope_base_kwargs["metadata"] = {}
+                register_request_tools(chat_request.tools)
+            else:
+                envelope_base_kwargs["background"] = envelope_base_kwargs.get(
+                    "background"
+                )
+                envelope_base_kwargs["reasoning"] = openai_models.Reasoning(
+                    effort=None, summary=None
+                )
+                envelope_base_kwargs.setdefault("metadata", {})
+            if text_payload is None:
+                text_payload = {"format": {"type": "text"}}
+            else:
+                text_payload = dict(text_payload)
+            verbosity_value = None
+            if chat_request is not None:
+                verbosity_value = getattr(chat_request, "verbosity", None)
+            if verbosity_value is not None:
+                text_payload["verbosity"] = verbosity_value
+            else:
+                text_payload.setdefault("verbosity", "low")
+            envelope_base_kwargs["text"] = text_payload
+            if "store" not in envelope_base_kwargs:
+                envelope_base_kwargs["store"] = True
+            if "temperature" not in envelope_base_kwargs:
+                envelope_base_kwargs["temperature"] = 1.0
+            if "service_tier" not in envelope_base_kwargs:
+                envelope_base_kwargs["service_tier"] = "auto"
+            if "tool_choice" not in envelope_base_kwargs:
+                envelope_base_kwargs["tool_choice"] = "auto"
+            if "prompt_cache_key" not in envelope_base_kwargs:
+                envelope_base_kwargs["prompt_cache_key"] = None
+            if "top_p" not in envelope_base_kwargs:
+                envelope_base_kwargs["top_p"] = 1.0
+            if "top_logprobs" not in envelope_base_kwargs:
+                envelope_base_kwargs["top_logprobs"] = None
+            if "truncation" not in envelope_base_kwargs:
+                envelope_base_kwargs["truncation"] = None
+            if "user" not in envelope_base_kwargs:
+                envelope_base_kwargs["user"] = None
+            parallel_setting_initial = bool(base_parallel_tool_calls)
+            envelope_base_kwargs["parallel_tool_calls"] = parallel_setting_initial
+            message_item_id = ""
+            message_output_index: int | None = None
+            content_index = 0
+            message_item_added = False
+            message_content_part_added = False
+            message_text_buffer: list[str] = []
+            message_last_logprobs: Any | None = None
+            message_text_done_emitted = False
+            message_part_done_emitted = False
+            message_item_done_emitted = False
+            message_completed_entry: tuple[int, openai_models.MessageOutput] | None = (
+                None
+            )
+            reasoning_item_id = ""
+            reasoning_output_index: int | None = None
+            reasoning_item_added = False
+            reasoning_output_done = False
+            reasoning_summary_indices: dict[str, int] = {}
+            reasoning_summary_added: set[int] = set()
+            reasoning_summary_text_fragments: dict[int, list[str]] = {}
+            reasoning_summary_text_done: set[int] = set()
+            reasoning_summary_part_done: set[int] = set()
+            reasoning_completed_entry: (
+                tuple[int, openai_models.ReasoningOutput] | None
+            ) = None
+            next_summary_index = 0
+            reasoning_summary_signatures: dict[int, str | None] = {}
+            created_at_value: int | None = None
+            next_output_index = 0
+            tool_call_states = IndexedToolCallTracker()
+            obfuscation_factory = ObfuscationTokenFactory(
+                lambda: id_suffix or response_id or "stream"
+            )
+            def ensure_message_output_item() -> (
+                openai_models.ResponseOutputItemAddedEvent | None
+            ):
+                nonlocal message_item_added, message_output_index, next_output_index
+                nonlocal sequence_counter
+                if message_output_index is None:
+                    message_output_index = next_output_index
+                    next_output_index += 1
+                if not message_item_added:
+                    message_item_added = True
+                    sequence_counter += 1
+                    return openai_models.ResponseOutputItemAddedEvent(
+                        type="response.output_item.added",
+                        sequence_number=sequence_counter,
+                        output_index=message_output_index,
+                        item=openai_models.OutputItem(
+                            id=message_item_id,
+                            type="message",
+                            role="assistant",
+                            status="in_progress",
+                            content=[],
+                        ),
+                    )
+                return None
+            def ensure_message_content_part() -> (
+                openai_models.ResponseContentPartAddedEvent | None
+            ):
+                nonlocal message_content_part_added, sequence_counter
+                if message_output_index is None:
+                    return None
+                if not message_content_part_added:
+                    message_content_part_added = True
+                    sequence_counter += 1
+                    return openai_models.ResponseContentPartAddedEvent(
+                        type="response.content_part.added",
+                        sequence_number=sequence_counter,
+                        item_id=message_item_id,
+                        output_index=message_output_index,
+                        content_index=content_index,
+                        part=openai_models.ContentPart(
+                            type="output_text",
+                            text="",
+                            annotations=[],
+                        ),
+                    )
+                return None
+            def emit_message_text_delta(
+                delta_text: str,
+                *,
+                logprobs: Any | None = None,
+                obfuscation: str | None = None,
+            ) -> list[openai_models.StreamEventType]:
+                if not isinstance(delta_text, str) or not delta_text:
+                    return []
+                nonlocal \
+                    message_last_logprobs, \
+                    sequence_counter, \
+                    message_item_done_emitted
+                if message_item_done_emitted:
+                    return []
+                events: list[openai_models.StreamEventType] = []
+                message_event = ensure_message_output_item()
+                if message_event is not None:
+                    events.append(message_event)
+                content_event = ensure_message_content_part()
+                if content_event is not None:
+                    events.append(content_event)
+                sequence_counter += 1
+                event_sequence = sequence_counter
+                logprobs_value: Any
+                if logprobs is None:
+                    logprobs_value = []
+                else:
+                    logprobs_value = logprobs
+                obfuscation_value = obfuscation or obfuscation_factory.make(
+                    "message.delta",
+                    sequence=event_sequence,
+                    item_id=message_item_id,
+                    payload=delta_text,
+                )
+                events.append(
+                    openai_models.ResponseOutputTextDeltaEvent(
+                        type="response.output_text.delta",
+                        sequence_number=event_sequence,
+                        item_id=message_item_id,
+                        output_index=message_output_index or 0,
+                        content_index=content_index,
+                        delta=delta_text,
+                        logprobs=logprobs_value,
+                    )
+                )
+                message_text_buffer.append(delta_text)
+                message_last_logprobs = logprobs_value
+                return events
+            def _reasoning_key(signature: str | None) -> str:
+                if isinstance(signature, str) and signature.strip():
+                    return signature.strip()
+                return "__default__"
+            def get_summary_index(signature: str | None) -> int:
+                nonlocal next_summary_index
+                key = _reasoning_key(signature)
+                maybe_index = reasoning_summary_indices.get(key)
+                if maybe_index is not None:
+                    return maybe_index
+                reasoning_summary_indices[key] = next_summary_index
+                next_summary_index += 1
+                return reasoning_summary_indices[key]
+            def ensure_reasoning_output_item() -> (
+                openai_models.ResponseOutputItemAddedEvent | None
+            ):
+                nonlocal reasoning_item_added, reasoning_output_index
+                nonlocal next_output_index, sequence_counter
+                if reasoning_output_index is None:
+                    reasoning_output_index = next_output_index
+                    next_output_index += 1
+                if not reasoning_item_added:
+                    reasoning_item_added = True
+                    sequence_counter += 1
+                    return openai_models.ResponseOutputItemAddedEvent(
+                        type="response.output_item.added",
+                        sequence_number=sequence_counter,
+                        output_index=reasoning_output_index,
+                        item=openai_models.OutputItem(
+                            id=reasoning_item_id,
+                            type="reasoning",
+                            status="in_progress",
+                            summary=[],
+                        ),
+                    )
+                return None
+            def ensure_reasoning_summary_part(
+                summary_index: int,
+            ) -> openai_models.ReasoningSummaryPartAddedEvent | None:
+                nonlocal sequence_counter
+                if reasoning_output_index is None:
+                    return None
+                if summary_index in reasoning_summary_added:
+                    return None
+                reasoning_summary_added.add(summary_index)
+                sequence_counter += 1
+                return openai_models.ReasoningSummaryPartAddedEvent(
+                    type="response.reasoning_summary_part.added",
+                    sequence_number=sequence_counter,
+                    item_id=reasoning_item_id,
+                    output_index=reasoning_output_index,
+                    summary_index=summary_index,
+                    part=openai_models.ReasoningSummaryPart(
+                        type="summary_text",
+                        text="",
+                    ),
+                )
+            def emit_reasoning_segments(
+                segments: list[ThinkingSegment],
+            ) -> list[openai_models.StreamEventType]:
+                events: list[openai_models.StreamEventType] = []
+                if not segments:
+                    return events
+                output_event = ensure_reasoning_output_item()
+                if output_event is not None:
+                    events.append(output_event)
+                nonlocal sequence_counter
+                for segment in segments:
+                    text_value = getattr(segment, "thinking", "")
+                    if not isinstance(text_value, str) or not text_value:
+                        continue
+                    summary_index = get_summary_index(
+                        getattr(segment, "signature", None)
+                    )
+                    signature_value = getattr(segment, "signature", None)
+                    if summary_index not in reasoning_summary_signatures:
+                        reasoning_summary_signatures[summary_index] = signature_value
+                    part_event = ensure_reasoning_summary_part(summary_index)
+                    if part_event is not None:
+                        events.append(part_event)
+                    fragments = reasoning_summary_text_fragments.setdefault(
+                        summary_index, []
+                    )
+                    fragments.append(text_value)
+                    sequence_counter += 1
+                    event_sequence = sequence_counter
+                    events.append(
+                        openai_models.ReasoningSummaryTextDeltaEvent(
+                            type="response.reasoning_summary_text.delta",
+                            sequence_number=event_sequence,
+                            item_id=reasoning_item_id,
+                            output_index=reasoning_output_index or 0,
+                            summary_index=summary_index,
+                            delta=text_value,
+                        )
+                    )
+                return events
+            def finalize_reasoning() -> list[openai_models.StreamEventType]:
+                nonlocal reasoning_output_done, reasoning_completed_entry
+                nonlocal reasoning_summary_payload, sequence_counter
+                if not reasoning_item_added or reasoning_output_index is None:
+                    return []
+                events: list[openai_models.StreamEventType] = []
+                summary_entries: list[dict[str, Any]] = []
+                for summary_index in sorted(reasoning_summary_text_fragments):
+                    text_value = "".join(
+                        reasoning_summary_text_fragments.get(summary_index, [])
+                    )
+                    if summary_index not in reasoning_summary_text_done:
+                        sequence_counter += 1
+                        events.append(
+                            openai_models.ReasoningSummaryTextDoneEvent(
+                                type="response.reasoning_summary_text.done",
+                                sequence_number=sequence_counter,
+                                item_id=reasoning_item_id,
+                                output_index=reasoning_output_index,
+                                summary_index=summary_index,
+                                text=text_value,
+                            )
+                        )
+                        reasoning_summary_text_done.add(summary_index)
+                    if summary_index not in reasoning_summary_part_done:
+                        sequence_counter += 1
+                        events.append(
+                            openai_models.ReasoningSummaryPartDoneEvent(
+                                type="response.reasoning_summary_part.done",
+                                sequence_number=sequence_counter,
+                                item_id=reasoning_item_id,
+                                output_index=reasoning_output_index,
+                                summary_index=summary_index,
+                                part=openai_models.ReasoningSummaryPart(
+                                    type="summary_text",
+                                    text=text_value,
+                                ),
+                            )
+                        )
+                        reasoning_summary_part_done.add(summary_index)
+                    summary_entry: dict[str, Any] = {
+                        "type": "summary_text",
+                        "text": text_value,
+                    }
+                    signature_value = reasoning_summary_signatures.get(summary_index)
+                    if signature_value:
+                        summary_entry["signature"] = signature_value
+                    summary_entries.append(summary_entry)
+                reasoning_summary_payload = summary_entries
+                if not reasoning_output_done:
+                    sequence_counter += 1
+                    events.append(
+                        openai_models.ResponseOutputItemDoneEvent(
+                            type="response.output_item.done",
+                            sequence_number=sequence_counter,
+                            output_index=reasoning_output_index,
+                            item=openai_models.OutputItem(
+                                id=reasoning_item_id,
+                                type="reasoning",
+                                status="completed",
+                                summary=summary_entries,
+                            ),
+                        )
+                    )
+                    reasoning_output_done = True
+                    reasoning_completed_entry = (
+                        reasoning_output_index,
+                        openai_models.ReasoningOutput(
+                            type="reasoning",
+                            id=reasoning_item_id,
+                            status="completed",
+                            summary=summary_entries,
+                        ),
+                    )
+                return events
+            def finalize_message() -> list[openai_models.StreamEventType]:
+                nonlocal sequence_counter
+                nonlocal message_text_done_emitted, message_part_done_emitted
+                nonlocal message_item_done_emitted, message_completed_entry
+                nonlocal message_last_logprobs
+                if not message_item_added:
+                    return []
+                events: list[openai_models.StreamEventType] = []
+                final_text = "".join(message_text_buffer)
+                logprobs_value: Any
+                if message_last_logprobs is None:
+                    logprobs_value = []
+                else:
+                    logprobs_value = message_last_logprobs
+                if message_content_part_added and not message_text_done_emitted:
+                    sequence_counter += 1
+                    event_sequence = sequence_counter
+                    events.append(
+                        openai_models.ResponseOutputTextDoneEvent(
+                            type="response.output_text.done",
+                            sequence_number=event_sequence,
+                            item_id=message_item_id,
+                            output_index=message_output_index or 0,
+                            content_index=content_index,
+                            text=final_text,
+                            logprobs=logprobs_value,
+                        )
+                    )
+                    message_text_done_emitted = True
+                if message_content_part_added and not message_part_done_emitted:
+                    sequence_counter += 1
+                    event_sequence = sequence_counter
+                    events.append(
+                        openai_models.ResponseContentPartDoneEvent(
+                            type="response.content_part.done",
+                            sequence_number=event_sequence,
+                            item_id=message_item_id,
+                            output_index=message_output_index or 0,
+                            content_index=content_index,
+                            part=openai_models.ContentPart(
+                                type="output_text",
+                                text=final_text,
+                                annotations=[],
+                            ),
+                        )
+                    )
+                    message_part_done_emitted = True
+                if not message_item_done_emitted:
+                    sequence_counter += 1
+                    event_sequence = sequence_counter
+                    output_text_part = openai_models.OutputTextContent(
+                        type="output_text",
+                        text=final_text,
+                        annotations=[],
+                        logprobs=logprobs_value if logprobs_value != [] else [],
+                    )
+                    message_output = openai_models.MessageOutput(
+                        type="message",
+                        id=message_item_id,
+                        status="completed",
+                        role="assistant",
+                        content=[output_text_part] if final_text else [],
+                    )
+                    message_completed_entry = (
+                        message_output_index or 0,
+                        message_output,
+                    )
+                    events.append(
+                        openai_models.ResponseOutputItemDoneEvent(
+                            type="response.output_item.done",
+                            sequence_number=event_sequence,
+                            output_index=message_output_index or 0,
+                            item=openai_models.OutputItem(
+                                id=message_item_id,
+                                type="message",
+                                role="assistant",
+                                status="completed",
+                                content=[output_text_part.model_dump()]
+                                if final_text
+                                else [],
+                                text=final_text or None,
+                            ),
+                        )
+                    )
+                    message_item_done_emitted = True
+                elif message_completed_entry is None:
+                    output_text_part = openai_models.OutputTextContent(
+                        type="output_text",
+                        text=final_text,
+                        annotations=[],
+                        logprobs=logprobs_value if logprobs_value != [] else [],
+                    )
+                    message_completed_entry = (
+                        message_output_index or 0,
+                        openai_models.MessageOutput(
+                            type="message",
+                            id=message_item_id,
+                            status="completed",
+                            role="assistant",
+                            content=[output_text_part] if final_text else [],
+                        ),
+                    )
+                return events
+            def get_tool_state(index: int) -> ToolCallState:
+                nonlocal next_output_index
+                state = tool_call_states.ensure(index)
+                if state.output_index < 0:
+                    state.output_index = next_output_index
+                    next_output_index += 1
+                return state
+            def get_accumulator_entry(idx: int) -> dict[str, Any] | None:
+                for entry in openai_accumulator.tools.values():
+                    if entry.get("index") == idx:
+                        return entry
+                return None
+            def emit_tool_item_added(
+                state: ToolCallState,
+            ) -> list[openai_models.StreamEventType]:
+                nonlocal sequence_counter
+                if state.added_emitted:
+                    return []
+                if state.name is None:
+                    return []
+                if not state.item_id:
+                    item_identifier = state.call_id
+                    if not item_identifier:
+                        item_identifier = f"call_{state.index}"
+                    state.item_id = item_identifier
+                sequence_counter += 1
+                state.added_emitted = True
+                return [
+                    openai_models.ResponseOutputItemAddedEvent(
+                        type="response.output_item.added",
+                        sequence_number=sequence_counter,
+                        output_index=state.output_index,
+                        item=openai_models.OutputItem(
+                            id=state.item_id,
+                            type="function_call",
+                            status="in_progress",
+                            name=state.name,
+                            arguments="",
+                            call_id=state.call_id,
+                        ),
+                    )
+                ]
+            def finalize_tool_calls() -> list[openai_models.StreamEventType]:
+                nonlocal sequence_counter
+                events: list[openai_models.StreamEventType] = []
+                for idx, state in tool_call_states.items():
+                    accumulator_entry = get_accumulator_entry(idx)
+                    if state.name is None and accumulator_entry is not None:
+                        fn_name = accumulator_entry.get("function", {}).get("name")
+                        if isinstance(fn_name, str) and fn_name:
+                            state.name = fn_name
+                    if state.call_id is None and accumulator_entry is not None:
+                        call_identifier = accumulator_entry.get("id")
+                        if isinstance(call_identifier, str) and call_identifier:
+                            state.call_id = call_identifier
+                    if not state.item_id:
+                        candidate_id = None
+                        if accumulator_entry is not None:
+                            candidate_id = accumulator_entry.get("id")
+                        state.item_id = (
+                            candidate_id or state.call_id or f"call_{state.index}"
+                        )
+                    if not state.added_emitted:
+                        events.extend(emit_tool_item_added(state))
+                    final_args = state.final_arguments
+                    if final_args is None:
+                        combined = "".join(state.arguments_parts or [])
+                        if not combined and accumulator_entry is not None:
+                            combined = (
+                                accumulator_entry.get("function", {}).get("arguments")
+                                or ""
+                            )
+                        final_args = combined or ""
+                    state.final_arguments = final_args
+                    if not state.arguments_done_emitted:
+                        sequence_counter += 1
+                        events.append(
+                            openai_models.ResponseFunctionCallArgumentsDoneEvent(
+                                type="response.function_call_arguments.done",
+                                sequence_number=sequence_counter,
+                                item_id=state.item_id,
+                                output_index=state.output_index,
+                                arguments=final_args,
+                            )
+                        )
+                        state.arguments_done_emitted = True
+                    if not state.item_done_emitted:
+                        sequence_counter += 1
+                        events.append(
+                            openai_models.ResponseOutputItemDoneEvent(
+                                type="response.output_item.done",
+                                sequence_number=sequence_counter,
+                                output_index=state.output_index,
+                                item=openai_models.OutputItem(
+                                    id=state.item_id,
+                                    type="function_call",
+                                    status="completed",
+                                    name=state.name,
+                                    arguments=final_args,
+                                    call_id=state.call_id,
+                                ),
+                            )
+                        )
+                        state.item_done_emitted = True
+                return events
+            def make_response_object(
+                *,
+                status: str,
+                model: str | None,
+                usage: openai_models.ResponseUsage | None = None,
+                output: list[Any] | None = None,
+                parallel_override: bool | None = None,
+                reasoning_summary: list[dict[str, Any]] | None = None,
+                extra: dict[str, Any] | None = None,
+            ) -> openai_models.ResponseObject:
+                payload = dict(envelope_base_kwargs)
+                payload["status"] = status
+                payload["model"] = model or payload.get("model") or ""
+                payload["output"] = output or []
+                payload["usage"] = usage
+                payload.setdefault("object", "response")
+                payload.setdefault("created_at", int(time.time()))
+                if parallel_override is not None:
+                    payload["parallel_tool_calls"] = parallel_override
+                if reasoning_summary is not None:
+                    reasoning_entry = payload.get("reasoning")
+                    if isinstance(reasoning_entry, openai_models.Reasoning):
+                        payload["reasoning"] = reasoning_entry.model_copy(
+                            update={"summary": reasoning_summary}
+                        )
+                    elif isinstance(reasoning_entry, dict):
+                        payload["reasoning"] = openai_models.Reasoning(
+                            effort=reasoning_entry.get("effort"),
+                            summary=reasoning_summary,
+                        )
+                    else:
+                        payload["reasoning"] = openai_models.Reasoning(
+                            effort=None,
+                            summary=reasoning_summary,
+                        )
+                if extra:
+                    payload.update(extra)
+                return openai_models.ResponseObject(**payload)
+            try:
+                async for chunk in stream:
+                    if isinstance(chunk, dict):
+                        chunk_payload = chunk
+                    else:
+                        chunk_payload = chunk.model_dump(exclude_none=True)
+                    openai_accumulator.accumulate("", chunk_payload)
+                    model = chunk_payload.get("model") or last_model
+                    choices = chunk_payload.get("choices") or []
+                    usage_obj = chunk_payload.get("usage")
+                    finish_reasons: list[str | None] = []
+                    deltas: list[dict[str, Any]] = []
+                    for choice in choices:
+                        if not isinstance(choice, dict):
+                            continue
+                        finish_reasons.append(choice.get("finish_reason"))
+                        delta_obj = choice.get("delta") or {}
+                        if isinstance(delta_obj, dict):
+                            deltas.append(delta_obj)
+                    last_model = model
+                    if model:
+                        envelope_base_kwargs["model"] = model
+                    first_delta_text = deltas[0].get("content") if deltas else None
+                    if not first_logged:
+                        first_logged = True
+                        with contextlib.suppress(Exception):
+                            log.debug(
+                                "chat_stream_first_chunk",
+                                typed=isinstance(chunk, dict) is False,
+                                keys=(
+                                    list(chunk.keys())
+                                    if isinstance(chunk, dict)
+                                    else None
+                                ),
+                                has_delta=bool(first_delta_text),
+                                model=model,
+                            )
+                            if len(choices) == 0 and not model:
+                                log.debug("chat_stream_ignoring_first_chunk")
+                                continue
+                    if not created_sent:
+                        created_sent = True
+                        response_id, id_suffix = ensure_identifier(
+                            "resp", chunk_payload.get("id")
+                        )
+                        envelope_base_kwargs["id"] = response_id
+                        envelope_base_kwargs.setdefault("object", "response")
+                        if not message_item_id:
+                            message_item_id = f"msg_{id_suffix}"
+                        if not reasoning_item_id:
+                            reasoning_item_id = f"rs_{id_suffix}"
+                        created_at_value = chunk_payload.get(
+                            "created"
+                        ) or chunk_payload.get("created_at")
+                        if created_at_value is None:
+                            created_at_value = int(time.time())
+                        envelope_base_kwargs["created_at"] = int(created_at_value)
+                        if model:
+                            envelope_base_kwargs["model"] = model
+                        elif last_model:
+                            envelope_base_kwargs.setdefault("model", last_model)
+                        sequence_counter += 1
+                        response_created = make_response_object(
+                            status="in_progress",
+                            model=model or last_model,
+                            usage=None,
+                            output=[],
+                            parallel_override=parallel_setting_initial,
+                        )
+                        yield openai_models.ResponseCreatedEvent(
+                            type="response.created",
+                            sequence_number=sequence_counter,
+                            response=response_created,
+                        )
+                        sequence_counter += 1
+                        yield openai_models.ResponseInProgressEvent(
+                            type="response.in_progress",
+                            sequence_number=sequence_counter,
+                            response=make_response_object(
+                                status="in_progress",
+                                model=model or last_model,
+                                usage=latest_usage_model,
+                                output=[],
+                                parallel_override=parallel_setting_initial,
+                            ),
+                        )
+                    for delta in deltas:
+                        reasoning_payload = delta.get("reasoning")
+                        if reasoning_payload is not None:
+                            segments = _collect_reasoning_segments(reasoning_payload)
+                            for event in emit_reasoning_segments(segments):
+                                yield event
+                        content_value = delta.get("content")
+                        if isinstance(content_value, str) and content_value:
+                            for event in emit_message_text_delta(content_value):
+                                yield event
+                        elif isinstance(content_value, dict):
+                            part_type = content_value.get("type")
+                            if part_type in {"reasoning", "thinking"}:
+                                segments = _collect_reasoning_segments(content_value)
+                                for event in emit_reasoning_segments(segments):
+                                    yield event
+                            else:
+                                text_value = content_value.get("text")
+                                if not isinstance(text_value, str) or not text_value:
+                                    delta_text = content_value.get("delta")
+                                    if isinstance(delta_text, str) and delta_text:
+                                        text_value = delta_text
+                                if isinstance(text_value, str) and text_value:
+                                    for event in emit_message_text_delta(
+                                        text_value,
+                                        logprobs=content_value.get("logprobs"),
+                                        obfuscation=content_value.get("obfuscation")
+                                        or content_value.get("obfuscated"),
+                                    ):
+                                        yield event
+                        elif isinstance(content_value, list):
+                            for part in content_value:
+                                if not isinstance(part, dict):
+                                    continue
+                                part_type = part.get("type")
+                                if part_type in {"reasoning", "thinking"}:
+                                    segments = _collect_reasoning_segments(part)
+                                    for event in emit_reasoning_segments(segments):
+                                        yield event
+                                    continue
+                                text_value = part.get("text")
+                                if not isinstance(text_value, str) or not text_value:
+                                    delta_text = part.get("delta")
+                                    if isinstance(delta_text, str) and delta_text:
+                                        text_value = delta_text
+                                if (
+                                    part_type
+                                    in {"text", "output_text", "output_text_delta"}
+                                    and isinstance(text_value, str)
+                                    and text_value
+                                ):
+                                    for event in emit_message_text_delta(
+                                        text_value,
+                                        logprobs=part.get("logprobs"),
+                                        obfuscation=part.get("obfuscation")
+                                        or part.get("obfuscated"),
+                                    ):
+                                        yield event
+                        tool_calls = delta.get("tool_calls") or []
+                        if isinstance(tool_calls, list):
+                            if tool_calls:
+                                for event in finalize_message():
+                                    yield event
+                            for tool_call in tool_calls:
+                                if not isinstance(tool_call, dict):
+                                    continue
+                                index_value = int(tool_call.get("index", 0))
+                                state = get_tool_state(index_value)
+                                tool_id = tool_call.get("id")
+                                if isinstance(tool_id, str) and tool_id:
+                                    state.call_id = tool_id
+                                    if not state.added_emitted or state.item_id is None:
+                                        state.item_id = tool_id
+                                function_obj = tool_call.get("function") or {}
+                                if isinstance(function_obj, dict):
+                                    name_value = function_obj.get("name")
+                                    if isinstance(name_value, str) and name_value:
+                                        state.name = name_value
+                                    for event in emit_tool_item_added(state):
+                                        yield event
+                                    arguments_payload = function_obj.get("arguments")
+                                    obfuscation_hint = None
+                                    arguments_delta = ""
+                                    if isinstance(arguments_payload, str):
+                                        arguments_delta = arguments_payload
+                                    elif isinstance(arguments_payload, dict):
+                                        maybe_delta = arguments_payload.get("delta")
+                                        if isinstance(maybe_delta, str):
+                                            arguments_delta = maybe_delta
+                                        obfuscation_hint = arguments_payload.get(
+                                            "obfuscation"
+                                        ) or arguments_payload.get("obfuscated")
+                                    if arguments_delta:
+                                        state.add_arguments_part(arguments_delta)
+                                        sequence_counter += 1
+                                        event_sequence = sequence_counter
+                                        yield (
+                                            delta_event_cls(
+                                                type="response.function_call_arguments.delta",
+                                                sequence_number=event_sequence,
+                                                item_id=state.item_id
+                                                or f"call_{state.index}",
+                                                output_index=state.output_index,
+                                                delta=arguments_delta,
+                                            )
+                                        )
+                            for tool_call in tool_calls:
+                                if not isinstance(tool_call, dict):
+                                    continue
+                                index_value = int(tool_call.get("index", 0))
+                                state = get_tool_state(index_value)
+                                if state.name:
+                                    for event in emit_tool_item_added(state):
+                                        yield event
+                    usage_model: openai_models.ResponseUsage | None = None
+                    if usage_obj is not None:
+                        try:
+                            if isinstance(usage_obj, openai_models.ResponseUsage):
+                                usage_model = usage_obj
+                            elif isinstance(usage_obj, dict):
+                                usage_model = convert_usage(
+                                    openai_models.CompletionUsage.model_validate(
+                                        usage_obj
+                                    )
+                                )
+                            else:
+                                usage_model = convert_usage(usage_obj)
+                        except Exception:
+                            usage_model = None
+                    if usage_model is not None:
+                        latest_usage_model = usage_model
+                        if all(reason is None for reason in finish_reasons):
+                            sequence_counter += 1
+                            yield openai_models.ResponseInProgressEvent(
+                                type="response.in_progress",
+                                sequence_number=sequence_counter,
+                                response=make_response_object(
+                                    status="in_progress",
+                                    model=model or last_model,
+                                    usage=usage_model,
+                                    output=[],
+                                    parallel_override=parallel_setting_initial,
+                                ),
+                            )
+                    if any(reason == "tool_calls" for reason in finish_reasons):
+                        for event in finalize_message():
+                            yield event
+                        for event in finalize_tool_calls():
+                            yield event
+            finally:
+                register_request(None)
+                register_request_tools(None)
+            for event in finalize_reasoning():
+                yield event
+            for event in finalize_message():
+                yield event
+            for event in finalize_tool_calls():
+                yield event
+            if message_completed_entry is None and message_item_added:
+                final_text = "".join(message_text_buffer)
+                logprobs_value: Any
+                if message_last_logprobs is None:
+                    logprobs_value = []
+                else:
+                    logprobs_value = message_last_logprobs
+                output_text_part = openai_models.OutputTextContent(
+                    type="output_text",
+                    text=final_text,
+                    annotations=[],
+                    logprobs=logprobs_value if logprobs_value != [] else [],
+                )
+                message_completed_entry = (
+                    message_output_index or 0,
+                    openai_models.MessageOutput(
+                        type="message",
+                        id=message_item_id,
+                        status="completed",
+                        role="assistant",
+                        content=[output_text_part] if final_text else [],
+                    ),
+                )
+            completed_entries: list[tuple[int, Any]] = []
+            if reasoning_completed_entry is not None:
+                completed_entries.append(reasoning_completed_entry)
+            if message_completed_entry is not None:
+                completed_entries.append(message_completed_entry)
+            for idx, state in tool_call_states.items():
+                accumulator_entry = get_accumulator_entry(idx)
+                if state.final_arguments is None:
+                    aggregated = ""
+                    if accumulator_entry is not None:
+                        aggregated = (
+                            accumulator_entry.get("function", {}).get("arguments") or ""
+                        )
+                    if not aggregated:
+                        aggregated = "".join(state.arguments_parts or [])
+                    state.final_arguments = aggregated or ""
+                if state.name is None and accumulator_entry is not None:
+                    fn_name = accumulator_entry.get("function", {}).get("name")
+                    if isinstance(fn_name, str) and fn_name:
+                        state.name = fn_name
+                if not state.item_id:
+                    candidate_id = None
+                    if accumulator_entry is not None:
+                        candidate_id = accumulator_entry.get("id")
+                    state.item_id = candidate_id or f"call_{state.index}"
+                completed_entries.append(
+                    (
+                        state.output_index,
+                        openai_models.FunctionCallOutput(
+                            type="function_call",
+                            id=state.item_id,
+                            status="completed",
+                            name=state.name,
+                            call_id=state.call_id,
+                            arguments=state.final_arguments or "",
+                        ),
+                    )
+                )
+            completed_entries.sort(key=lambda item: item[0])
+            completed_outputs = [entry for _, entry in completed_entries]
+            complete_tool_calls_payload = openai_accumulator.get_complete_tool_calls()
+            parallel_tool_calls = len(tool_call_states) > 1
+            parallel_final = parallel_tool_calls or parallel_setting_initial
+            extra_fields: dict[str, Any] | None = None
+            if complete_tool_calls_payload:
+                extra_fields = {"tool_calls": complete_tool_calls_payload}
+            response_completed = make_response_object(
+                status="completed",
+                model=last_model,
+                usage=latest_usage_model,
+                output=completed_outputs,
+                parallel_override=parallel_final,
+                reasoning_summary=reasoning_summary_payload,
+                extra=extra_fields,
+            )
+            sequence_counter += 1
+            yield openai_models.ResponseCompletedEvent(
+                type="response.completed",
+                sequence_number=sequence_counter,
+                response=response_completed,
+            )
+        return generator()
+def convert__openai_chat_to_openai_responses__stream(
+    stream: AsyncIterator[openai_models.ChatCompletionChunk | dict[str, Any]],
+) -> AsyncGenerator[openai_models.StreamEventType, None]:
+    """Convert OpenAI ChatCompletionChunk stream to Responses API events.
+    Replays chat deltas as Responses events, including function-call output items
+    and argument deltas so partial tool calls stream correctly.
+    """
+    adapter = OpenAIChatToResponsesStreamAdapter()
+    return adapter.run(stream)
+__all__ = [
+    "OpenAIChatToResponsesStreamAdapter",
+    "OpenAIResponsesToChatStreamAdapter",
+    "convert__openai_chat_to_openai_responses__stream",
+    "convert__openai_responses_to_openai_chat__stream",
+]

ccproxy-api 0.1.7__py3-none-any.whl → 0.2.0a4__py3-none-any.whl

ccproxy-api 0.1.7py3-none-any.whl → 0.2.0a4py3-none-any.whl