PyPI - ccproxy-api - Versions diffs - 0.1.4__py3-none-any.whl → 0.1.6__py3-none-any.whl - Mend

ccproxy-api 0.1.4py3-none-any.whl → 0.1.6py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (72) hide show

ccproxy/_version.py +2 -2
ccproxy/adapters/codex/__init__.py +11 -0
ccproxy/adapters/openai/adapter.py +1 -1
ccproxy/adapters/openai/models.py +1 -1
ccproxy/adapters/openai/response_adapter.py +355 -0
ccproxy/adapters/openai/response_models.py +178 -0
ccproxy/adapters/openai/streaming.py +1 -0
ccproxy/api/app.py +150 -224
ccproxy/api/dependencies.py +22 -2
ccproxy/api/middleware/errors.py +27 -3
ccproxy/api/middleware/logging.py +4 -0
ccproxy/api/responses.py +6 -1
ccproxy/api/routes/claude.py +222 -17
ccproxy/api/routes/codex.py +1231 -0
ccproxy/api/routes/health.py +228 -3
ccproxy/api/routes/proxy.py +25 -6
ccproxy/api/services/permission_service.py +2 -2
ccproxy/auth/openai/__init__.py +13 -0
ccproxy/auth/openai/credentials.py +166 -0
ccproxy/auth/openai/oauth_client.py +334 -0
ccproxy/auth/openai/storage.py +184 -0
ccproxy/claude_sdk/__init__.py +4 -8
ccproxy/claude_sdk/client.py +661 -131
ccproxy/claude_sdk/exceptions.py +16 -0
ccproxy/claude_sdk/manager.py +219 -0
ccproxy/claude_sdk/message_queue.py +342 -0
ccproxy/claude_sdk/options.py +6 -1
ccproxy/claude_sdk/session_client.py +546 -0
ccproxy/claude_sdk/session_pool.py +550 -0
ccproxy/claude_sdk/stream_handle.py +538 -0
ccproxy/claude_sdk/stream_worker.py +392 -0
ccproxy/claude_sdk/streaming.py +53 -11
ccproxy/cli/commands/auth.py +398 -1
ccproxy/cli/commands/serve.py +99 -1
ccproxy/cli/options/claude_options.py +47 -0
ccproxy/config/__init__.py +0 -3
ccproxy/config/claude.py +171 -23
ccproxy/config/codex.py +100 -0
ccproxy/config/discovery.py +10 -1
ccproxy/config/scheduler.py +2 -2
ccproxy/config/settings.py +38 -1
ccproxy/core/codex_transformers.py +389 -0
ccproxy/core/http_transformers.py +458 -75
ccproxy/core/logging.py +108 -12
ccproxy/core/transformers.py +5 -0
ccproxy/models/claude_sdk.py +57 -0
ccproxy/models/detection.py +208 -0
ccproxy/models/requests.py +22 -0
ccproxy/models/responses.py +16 -0
ccproxy/observability/access_logger.py +72 -14
ccproxy/observability/metrics.py +151 -0
ccproxy/observability/storage/duckdb_simple.py +12 -0
ccproxy/observability/storage/models.py +16 -0
ccproxy/observability/streaming_response.py +107 -0
ccproxy/scheduler/manager.py +31 -6
ccproxy/scheduler/tasks.py +122 -0
ccproxy/services/claude_detection_service.py +269 -0
ccproxy/services/claude_sdk_service.py +333 -130
ccproxy/services/codex_detection_service.py +263 -0
ccproxy/services/proxy_service.py +618 -197
ccproxy/utils/__init__.py +9 -1
ccproxy/utils/disconnection_monitor.py +83 -0
ccproxy/utils/id_generator.py +12 -0
ccproxy/utils/model_mapping.py +7 -5
ccproxy/utils/startup_helpers.py +470 -0
ccproxy_api-0.1.6.dist-info/METADATA +615 -0
{ccproxy_api-0.1.4.dist-info → ccproxy_api-0.1.6.dist-info}/RECORD +70 -47
ccproxy/config/loader.py +0 -105
ccproxy_api-0.1.4.dist-info/METADATA +0 -369
{ccproxy_api-0.1.4.dist-info → ccproxy_api-0.1.6.dist-info}/WHEEL +0 -0
{ccproxy_api-0.1.4.dist-info → ccproxy_api-0.1.6.dist-info}/entry_points.txt +0 -0
{ccproxy_api-0.1.4.dist-info → ccproxy_api-0.1.6.dist-info}/licenses/LICENSE +0 -0

ccproxy/api/routes/claude.py CHANGED Viewed

@@ -14,6 +14,7 @@ from ccproxy.adapters.openai.adapter import (
 )
 from ccproxy.api.dependencies import ClaudeServiceDep
 from ccproxy.models.messages import MessageCreateParams, MessageResponse
+from ccproxy.observability.streaming_response import StreamingResponseWithLogging
 # Create the router for Claude SDK endpoints
@@ -24,9 +25,9 @@ logger = structlog.get_logger(__name__)
 @router.post("/v1/chat/completions", response_model=None)
 async def create_openai_chat_completion(
-    request: Request,
     openai_request: OpenAIChatCompletionRequest,
     claude_service: ClaudeServiceDep,
+    request: Request,
 ) -> StreamingResponse | OpenAIChatCompletionResponse:
     """Create a chat completion using Claude SDK with OpenAI-compatible format.
@@ -43,13 +44,102 @@ async def create_openai_chat_completion(
         # Extract stream parameter
         stream = openai_request.stream or False
+        # Get request context from middleware
+        request_context = getattr(request.state, "context", None)
+        if request_context is None:
+            raise HTTPException(
+                status_code=500, detail="Internal server error: no request context"
+            )
         # Call Claude SDK service with adapted request
-        if request and hasattr(request, "state") and hasattr(request.state, "context"):
-            # Use existing context from middleware
-            ctx = request.state.context
-            # Add service-specific metadata
-            ctx.add_metadata(streaming=stream)
+        response = await claude_service.create_completion(
+            messages=anthropic_request["messages"],
+            model=anthropic_request["model"],
+            temperature=anthropic_request.get("temperature"),
+            max_tokens=anthropic_request.get("max_tokens"),
+            stream=stream,
+            user_id=getattr(openai_request, "user", None),
+            request_context=request_context,
+        )
+        if stream:
+            # Handle streaming response
+            async def openai_stream_generator() -> AsyncIterator[bytes]:
+                # Use adapt_stream for streaming responses
+                async for openai_chunk in adapter.adapt_stream(response):  # type: ignore[arg-type]
+                    yield f"data: {json.dumps(openai_chunk)}\n\n".encode()
+                # Send final chunk
+                yield b"data: [DONE]\n\n"
+            # Use unified streaming wrapper with logging
+            return StreamingResponseWithLogging(
+                content=openai_stream_generator(),
+                request_context=request_context,
+                metrics=getattr(claude_service, "metrics", None),
+                status_code=200,
+                media_type="text/event-stream",
+                headers={
+                    "Cache-Control": "no-cache",
+                    "Connection": "keep-alive",
+                },
+            )
+        else:
+            # Convert non-streaming response to OpenAI format using adapter
+            # Convert MessageResponse model to dict for adapter
+            # In non-streaming mode, response should always be MessageResponse
+            assert isinstance(response, MessageResponse), (
+                "Non-streaming response must be MessageResponse"
+            )
+            response_dict = response.model_dump()
+            openai_response = adapter.adapt_response(response_dict)
+            return OpenAIChatCompletionResponse.model_validate(openai_response)
+    except Exception as e:
+        # Re-raise specific proxy errors to be handled by the error handler
+        from ccproxy.core.errors import ClaudeProxyError
+        if isinstance(e, ClaudeProxyError):
+            raise
+        raise HTTPException(
+            status_code=500, detail=f"Internal server error: {str(e)}"
+        ) from e
+@router.post(
+    "/{session_id}/v1/chat/completions",
+    response_model=None,
+)
+async def create_openai_chat_completion_with_session(
+    session_id: str,
+    openai_request: OpenAIChatCompletionRequest,
+    claude_service: ClaudeServiceDep,
+    request: Request,
+) -> StreamingResponse | OpenAIChatCompletionResponse:
+    """Create a chat completion using Claude SDK with OpenAI-compatible format and session ID.
+    This endpoint handles OpenAI API format requests with session ID and converts them
+    to Anthropic format before using the Claude SDK directly.
+    """
+    try:
+        # Create adapter instance
+        adapter = OpenAIAdapter()
+        # Convert entire OpenAI request to Anthropic format using adapter
+        anthropic_request = adapter.adapt_request(openai_request.model_dump())
+        # Extract stream parameter
+        stream = openai_request.stream or False
+        # Get request context from middleware
+        request_context = getattr(request.state, "context", None)
+        if request_context is None:
+            raise HTTPException(
+                status_code=500, detail="Internal server error: no request context"
+            )
+        # Call Claude SDK service with adapted request and session_id
         response = await claude_service.create_completion(
             messages=anthropic_request["messages"],
             model=anthropic_request["model"],
@@ -57,6 +147,8 @@ async def create_openai_chat_completion(
             max_tokens=anthropic_request.get("max_tokens"),
             stream=stream,
             user_id=getattr(openai_request, "user", None),
+            session_id=session_id,
+            request_context=request_context,
         )
         if stream:
@@ -68,8 +160,13 @@ async def create_openai_chat_completion(
                 # Send final chunk
                 yield b"data: [DONE]\n\n"
-            return StreamingResponse(
-                openai_stream_generator(),
+            # Use unified streaming wrapper with logging
+            # Session interrupts are now handled directly by the StreamHandle
+            return StreamingResponseWithLogging(
+                content=openai_stream_generator(),
+                request_context=request_context,
+                metrics=getattr(claude_service, "metrics", None),
+                status_code=200,
                 media_type="text/event-stream",
                 headers={
                     "Cache-Control": "no-cache",
@@ -98,10 +195,98 @@ async def create_openai_chat_completion(
         ) from e
+@router.post(
+    "/{session_id}/v1/messages",
+    response_model=None,
+)
+async def create_anthropic_message_with_session(
+    session_id: str,
+    message_request: MessageCreateParams,
+    claude_service: ClaudeServiceDep,
+    request: Request,
+) -> StreamingResponse | MessageResponse:
+    """Create a message using Claude SDK with Anthropic format and session ID.
+    This endpoint handles Anthropic API format requests with session ID directly
+    using the Claude SDK without any format conversion.
+    """
+    try:
+        # Extract parameters from Anthropic request
+        messages = [msg.model_dump() for msg in message_request.messages]
+        model = message_request.model
+        temperature = message_request.temperature
+        max_tokens = message_request.max_tokens
+        stream = message_request.stream or False
+        # Get request context from middleware
+        request_context = getattr(request.state, "context", None)
+        if request_context is None:
+            raise HTTPException(
+                status_code=500, detail="Internal server error: no request context"
+            )
+        # Call Claude SDK service directly with Anthropic format and session_id
+        response = await claude_service.create_completion(
+            messages=messages,
+            model=model,
+            temperature=temperature,
+            max_tokens=max_tokens,
+            stream=stream,
+            user_id=getattr(message_request, "user_id", None),
+            session_id=session_id,
+            request_context=request_context,
+        )
+        if stream:
+            # Handle streaming response
+            async def anthropic_stream_generator() -> AsyncIterator[bytes]:
+                async for chunk in response:  # type: ignore[union-attr]
+                    if chunk:
+                        # All chunks from Claude SDK streaming should be dict format
+                        # and need proper SSE event formatting
+                        if isinstance(chunk, dict):
+                            # Determine event type from chunk type
+                            event_type = chunk.get("type", "message_delta")
+                            yield f"event: {event_type}\n".encode()
+                            yield f"data: {json.dumps(chunk)}\n\n".encode()
+                        else:
+                            # Fallback for unexpected format
+                            yield f"data: {json.dumps(chunk)}\n\n".encode()
+                # No final [DONE] chunk for Anthropic format
+            # Use unified streaming wrapper with logging
+            # Session interrupts are now handled directly by the StreamHandle
+            return StreamingResponseWithLogging(
+                content=anthropic_stream_generator(),
+                request_context=request_context,
+                metrics=getattr(claude_service, "metrics", None),
+                status_code=200,
+                media_type="text/event-stream",
+                headers={
+                    "Cache-Control": "no-cache",
+                    "Connection": "keep-alive",
+                },
+            )
+        else:
+            # Return Anthropic format response directly
+            return MessageResponse.model_validate(response)
+    except Exception as e:
+        # Re-raise specific proxy errors to be handled by the error handler
+        from ccproxy.core.errors import ClaudeProxyError
+        if isinstance(e, ClaudeProxyError):
+            raise e
+        raise HTTPException(
+            status_code=500, detail=f"Internal server error: {str(e)}"
+        ) from e
 @router.post("/v1/messages", response_model=None)
 async def create_anthropic_message(
-    request: MessageCreateParams,
+    message_request: MessageCreateParams,
     claude_service: ClaudeServiceDep,
+    request: Request,
 ) -> StreamingResponse | MessageResponse:
     """Create a message using Claude SDK with Anthropic format.
@@ -110,11 +295,24 @@ async def create_anthropic_message(
     """
     try:
         # Extract parameters from Anthropic request
-        messages = [msg.model_dump() for msg in request.messages]
-        model = request.model
-        temperature = request.temperature
-        max_tokens = request.max_tokens
-        stream = request.stream or False
+        messages = [msg.model_dump() for msg in message_request.messages]
+        model = message_request.model
+        temperature = message_request.temperature
+        max_tokens = message_request.max_tokens
+        stream = message_request.stream or False
+        # Get request context from middleware
+        request_context = getattr(request.state, "context", None)
+        if request_context is None:
+            raise HTTPException(
+                status_code=500, detail="Internal server error: no request context"
+            )
+        # Extract session_id from metadata if present
+        session_id = None
+        if message_request.metadata:
+            metadata_dict = message_request.metadata.model_dump()
+            session_id = metadata_dict.get("session_id")
         # Call Claude SDK service directly with Anthropic format
         response = await claude_service.create_completion(
@@ -123,7 +321,9 @@ async def create_anthropic_message(
             temperature=temperature,
             max_tokens=max_tokens,
             stream=stream,
-            user_id=getattr(request, "user_id", None),
+            user_id=getattr(message_request, "user_id", None),
+            session_id=session_id,
+            request_context=request_context,
         )
         if stream:
@@ -143,8 +343,13 @@ async def create_anthropic_message(
                             yield f"data: {json.dumps(chunk)}\n\n".encode()
                 # No final [DONE] chunk for Anthropic format
-            return StreamingResponse(
-                anthropic_stream_generator(),
+            # Use unified streaming wrapper with logging for all requests
+            # Session interrupts are now handled directly by the StreamHandle
+            return StreamingResponseWithLogging(
+                content=anthropic_stream_generator(),
+                request_context=request_context,
+                metrics=getattr(claude_service, "metrics", None),
+                status_code=200,
                 media_type="text/event-stream",
                 headers={
                     "Cache-Control": "no-cache",

ccproxy-api 0.1.4__py3-none-any.whl → 0.1.6__py3-none-any.whl

ccproxy-api 0.1.4py3-none-any.whl → 0.1.6py3-none-any.whl