PyPI - jaf-py - Versions diffs - 2.4.1__py3-none-any.whl → 2.4.3__py3-none-any.whl - Mend

jaf-py 2.4.1py3-none-any.whl → 2.4.3py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (24) hide show

jaf/__init__.py +15 -0
jaf/core/agent_tool.py +6 -4
jaf/core/analytics.py +4 -3
jaf/core/engine.py +401 -37
jaf/core/state.py +156 -0
jaf/core/tracing.py +114 -23
jaf/core/types.py +113 -3
jaf/memory/approval_storage.py +306 -0
jaf/memory/providers/postgres.py +10 -4
jaf/memory/types.py +1 -0
jaf/memory/utils.py +1 -1
jaf/providers/model.py +277 -17
jaf/server/__init__.py +2 -0
jaf/server/server.py +665 -22
jaf/server/types.py +149 -4
jaf/utils/__init__.py +50 -0
jaf/utils/attachments.py +401 -0
jaf/utils/document_processor.py +561 -0
{jaf_py-2.4.1.dist-info → jaf_py-2.4.3.dist-info}/METADATA +10 -2
{jaf_py-2.4.1.dist-info → jaf_py-2.4.3.dist-info}/RECORD +24 -19
{jaf_py-2.4.1.dist-info → jaf_py-2.4.3.dist-info}/WHEEL +0 -0
{jaf_py-2.4.1.dist-info → jaf_py-2.4.3.dist-info}/entry_points.txt +0 -0
{jaf_py-2.4.1.dist-info → jaf_py-2.4.3.dist-info}/licenses/LICENSE +0 -0
{jaf_py-2.4.1.dist-info → jaf_py-2.4.3.dist-info}/top_level.txt +0 -0

jaf/server/server.py CHANGED Viewed

@@ -7,17 +7,25 @@ via REST API endpoints with proper error handling and validation.
 import time
 import uuid
+import asyncio
+import json
 from dataclasses import asdict, replace
-from typing import TypeVar
+from typing import TypeVar, Dict, Set
-from fastapi import FastAPI, HTTPException
+from fastapi import FastAPI, HTTPException, Request
 from fastapi.middleware.cors import CORSMiddleware
+from fastapi.responses import StreamingResponse
 from ..core.engine import run
+from ..core.streaming import run_streaming
 from ..core.types import (
+    ApprovalValue,
     CompletedOutcome,
     ErrorOutcome,
+    InterruptedOutcome,
     Message,
+    MessageContentPart,
+    Attachment,
     RunState,
     create_run_id,
     create_trace_id,
@@ -27,6 +35,8 @@ from .types import (
     AgentInfo,
     AgentListData,
     AgentListResponse,
+    ApprovalMessage,
+    BaseOutcomeData,
     ChatRequest,
     ChatResponse,
     CompletedChatData,
@@ -36,20 +46,215 @@ from .types import (
     DeleteConversationResponse,
     HealthResponse,
     HttpMessage,
+    InterruptedOutcomeData,
+    InterruptionData,
     MemoryHealthResponse,
+    PendingApprovalData,
+    PendingApprovalsData,
+    PendingApprovalsResponse,
     ServerConfig,
+    ToolCallInterruption,
 )
 Ctx = TypeVar('Ctx')
+# Helper functions for HITL (moved outside like TypeScript)
+def stable_stringify(value) -> str:
+    """Create deterministic JSON string for tool call signatures."""
+    try:
+        if isinstance(value, dict):
+            return json.dumps(value, sort_keys=True, separators=(',', ':'))
+        return json.dumps(value, separators=(',', ':'))
+    except (TypeError, ValueError):
+        return str(value)
+def try_parse_json(s: str):
+    """Try to parse JSON, return original string if it fails."""
+    try:
+        return json.loads(s)
+    except (json.JSONDecodeError, TypeError):
+        return s
+def compute_tool_call_signature(tool_call) -> str:
+    """Compute deterministic signature for tool call matching."""
+    try:
+        args = try_parse_json(tool_call.function.arguments)
+        return f"{tool_call.function.name}:{stable_stringify(args)}"
+    except Exception:
+        return f"{tool_call.function.name}:unknown"
+def _convert_http_message_to_core(http_msg: HttpMessage) -> Message:
+    """Convert HTTP message format to core Message format."""
+    # Convert content
+    if isinstance(http_msg.content, str):
+        content = http_msg.content
+    else:
+        # Convert list of content parts
+        content_parts = []
+        for i, part in enumerate(http_msg.content):
+            if part.type == 'text':
+                content_parts.append(MessageContentPart(
+                    type='text',
+                    text=part.text,
+                    image_url=None,
+                    file=None
+                ))
+            elif part.type == 'image_url':
+                content_parts.append(MessageContentPart(
+                    type='image_url',
+                    text=None,
+                    image_url=part.image_url,
+                    file=None
+                ))
+            elif part.type == 'file':
+                content_parts.append(MessageContentPart(
+                    type='file',
+                    text=None,
+                    image_url=None,
+                    file=part.file
+                ))
+            else:
+                # Raise explicit error for unrecognized part types
+                raise ValueError(f"Unrecognized message content part type: '{part.type}' at index {i}. "
+                                 f"Supported types are: 'text', 'image_url', 'file'")
+        content = content_parts
+    # Convert attachments
+    attachments = None
+    if http_msg.attachments:
+        attachments = [
+            Attachment(
+                kind=att.kind,
+                mime_type=att.mime_type,
+                name=att.name,
+                url=att.url,
+                data=att.data,
+                format=att.format,
+                use_litellm_format=att.use_litellm_format
+            )
+            for att in http_msg.attachments
+        ]
+    return Message(
+        role=http_msg.role,
+        content=content,
+        attachments=attachments,
+        tool_call_id=http_msg.tool_call_id,
+        tool_calls=http_msg.tool_calls
+    )
+def _convert_core_message_to_http(core_msg: Message) -> HttpMessage:
+    """Convert core Message format to HTTP message format."""
+    from .types import HttpAttachment, HttpMessageContentPart
+    from ..core.types import get_text_content
+    # Convert content
+    if isinstance(core_msg.content, str):
+        content = core_msg.content
+    elif isinstance(core_msg.content, list):
+        # Convert content parts to HTTP format
+        http_parts = []
+        for i, part in enumerate(core_msg.content):
+            if part.type == 'text':
+                http_parts.append(HttpMessageContentPart(
+                    type='text',
+                    text=part.text,
+                    image_url=None,
+                    file=None
+                ))
+            elif part.type == 'image_url':
+                http_parts.append(HttpMessageContentPart(
+                    type='image_url',
+                    text=None,
+                    image_url=part.image_url,
+                    file=None
+                ))
+            elif part.type == 'file':
+                http_parts.append(HttpMessageContentPart(
+                    type='file',
+                    text=None,
+                    image_url=None,
+                    file=part.file
+                ))
+            else:
+                # Raise explicit error for unrecognized part types
+                message_info = f"role={core_msg.role}"
+                raise ValueError(f"Unrecognized core message content part type: '{part.type}' at index {i}. "
+                                f"Message info: {message_info}. "
+                                f"Supported types are: 'text', 'image_url', 'file'")
+        content = http_parts
+    else:
+        content = get_text_content(core_msg.content)
+    # Convert attachments
+    attachments = None
+    if core_msg.attachments:
+        attachments = [
+            HttpAttachment(
+                kind=att.kind,
+                mime_type=att.mime_type,
+                name=att.name,
+                url=att.url,
+                data=att.data,
+                format=att.format,
+                use_litellm_format=att.use_litellm_format
+            )
+            for att in core_msg.attachments
+        ]
+    return HttpMessage(
+        role=core_msg.role,
+        content=content,
+        attachments=attachments,
+        tool_call_id=core_msg.tool_call_id,
+        tool_calls=core_msg.tool_calls
+    )
 def create_jaf_server(config: ServerConfig[Ctx]) -> FastAPI:
     """Create and configure a JAF server instance."""
     start_time = time.time()
+    # SSE subscribers for approval-related events (matching TypeScript)
+    approval_subscribers = set()
+    def sse_send(response, event: str, data: dict):
+        """Send SSE event to client."""
+        try:
+            response.write(f"event: {event}\n")
+            response.write(f"data: {json.dumps(data)}\n\n")
+        except Exception:
+            pass  # ignore connection errors
+    def broadcast_approval_required(payload: dict):
+        """Broadcast approval_required event to SSE clients."""
+        for client in approval_subscribers.copy():  # copy to avoid modification during iteration
+            filter_conv_id = client.get('filter_conversation_id')
+            if filter_conv_id and filter_conv_id != payload.get('conversationId'):
+                continue
+            payload_with_timestamp = {
+                **payload,
+                'timestamp': payload.get('timestamp', time.strftime('%Y-%m-%dT%H:%M:%S.%fZ'))
+            }
+            sse_send(client['response'], 'approval_required', payload_with_timestamp)
+    def broadcast_approval_decision(payload: dict):
+        """Broadcast approval_decision event to SSE clients."""
+        for client in approval_subscribers.copy():  # copy to avoid modification during iteration
+            filter_conv_id = client.get('filter_conversation_id')
+            if filter_conv_id and filter_conv_id != payload.get('conversationId'):
+                continue
+            payload_with_timestamp = {
+                **payload,
+                'timestamp': payload.get('timestamp', time.strftime('%Y-%m-%dT%H:%M:%S.%fZ'))
+            }
+            sse_send(client['response'], 'approval_decision', payload_with_timestamp)
     app = FastAPI(
         title="JAF Agent Framework Server",
-        description="HTTP API for JAF agents",
+        description="HTTP API for JAF agents with HITL support",
         version="2.0.0",
         docs_url="/docs",
         redoc_url="/redoc"
@@ -91,12 +296,36 @@ def create_jaf_server(config: ServerConfig[Ctx]) -> FastAPI:
     @app.post("/chat", response_model=ChatResponse)
     async def chat_completion(request: ChatRequest):
-        request_start_time = time.time()  # Track request start time, not server start time
+        request_start_time = time.time()
-        if request.agent_name not in config.agent_registry:
-            raise HTTPException(status_code=404, detail=f"Agent '{request.agent_name}' not found")
-        conversation_id = request.conversation_id or str(uuid.uuid4())
+        try:
+            # Validate request (matching TypeScript approach)
+            validated_request = request  # Already validated by FastAPI, but keeping TypeScript structure
+            # Check if agent exists (matching TypeScript response pattern)
+            if validated_request.agent_name not in config.agent_registry:
+                return ChatResponse(
+                    success=False,
+                    error=f"Agent '{validated_request.agent_name}' not found. Available agents: {', '.join(config.agent_registry.keys())}"
+                )
+            # Convert HTTP messages to JAF messages (matching TypeScript)
+            jaf_messages = [
+                Message(
+                    role='user' if msg.role == 'system' else msg.role,
+                    content=msg.content
+                )
+                for msg in validated_request.messages
+            ]
+            # Create initial state (matching TypeScript)
+            run_id = create_run_id(str(uuid.uuid4()))
+            trace_id = create_trace_id(str(uuid.uuid4()))
+            # Generate conversationId if not provided (matching TypeScript)
+            conversation_id = validated_request.conversation_id or f"conv-{uuid.uuid4()}"
+        except Exception as e:
+            return ChatResponse(success=False, error=f"Invalid request: {str(e)}")
         # Load conversation history to get correct turn count
         initial_turn_count = 0
@@ -111,45 +340,300 @@ def create_jaf_server(config: ServerConfig[Ctx]) -> FastAPI:
             except Exception as e:
                 print(f"[JAF:SERVER] Warning: Failed to load conversation history: {e}")
+        # Handle approval message(s) if present (matching TypeScript approach)
+        initial_approvals = {}  # Will act like TypeScript's Map
+        initial_state_messages = jaf_messages
+        approvals_list = validated_request.approvals or []
+        async def persist_approval(conv_id: str, appr: ApprovalMessage):
+            """Persist approval to memory provider with metadata (matching TypeScript)."""
+            if not config.default_memory_provider:
+                return
+            provider = config.default_memory_provider
+            # Keyed by previous run/session id + toolCallId for uniqueness (matching TypeScript)
+            approval_key = f"{appr.session_id}:{appr.tool_call_id}"
+            base_entry = {
+                'approved': appr.approved,
+                'status': 'approved' if appr.approved else 'rejected',
+                'additionalContext': appr.additional_context,
+                'sessionId': appr.session_id,
+                'toolCallId': appr.tool_call_id,
+            }
+            try:
+                existing = await provider.get_conversation(conv_id)
+                if existing.success and existing.data:
+                    # Try to enrich entry with tool name and signature for robust matching (exactly matching TypeScript)
+                    try:
+                        msgs = existing.data.messages
+                        for i in range(len(msgs) - 1, -1, -1):
+                            m = msgs[i]
+                            if m.role == 'assistant' and hasattr(m, 'tool_calls') and m.tool_calls:
+                                match = next((tc for tc in m.tool_calls if tc.id == appr.tool_call_id), None)
+                                if match:
+                                    base_entry['toolName'] = match.function.name
+                                    base_entry['signature'] = compute_tool_call_signature(match)
+                                    break
+                    except Exception:
+                        pass  # best-effort
+                    existing_approvals = (existing.data.metadata.get('toolApprovals') if existing.data.metadata else {}) or {}
+                    prev = existing_approvals.get(approval_key)
+                    # Merge additionalContext shallowly and avoid regressions (exactly matching TypeScript)
+                    merged_additional = {
+                        **(prev.get('additionalContext') if prev else {}),
+                        **(base_entry.get('additionalContext') or {}),
+                    }
+                    next_entry = {
+                        **(prev or {}),
+                        **base_entry,
+                        'additionalContext': merged_additional,
+                        # Preserve earliest timestamp if no effective change; else update (exactly matching TypeScript)
+                        'timestamp': (
+                            prev.get('timestamp') if prev and (
+                                prev.get('status') == base_entry['status'] and
+                                stable_stringify(prev.get('additionalContext')) == stable_stringify(merged_additional)
+                            ) else time.strftime('%Y-%m-%dT%H:%M:%S.%fZ')
+                        )
+                    }
+                    # Check if there's actually a change (exactly matching TypeScript)
+                    no_change = prev and (
+                        prev.get('status') == next_entry['status'] and
+                        stable_stringify(prev.get('additionalContext')) == stable_stringify(next_entry['additionalContext']) and
+                        (prev.get('toolName') or None) == (next_entry.get('toolName') or None) and
+                        (prev.get('signature') or None) == (next_entry.get('signature') or None)
+                    )
+                    if not no_change:
+                        merged_approvals = {**existing_approvals, approval_key: next_entry}
+                        await provider.appendMessages(conv_id, [], {'toolApprovals': merged_approvals, 'traceId': trace_id})
+                elif existing.success and not existing.data:
+                    # Create conversation shell with just metadata if not present (exactly matching TypeScript)
+                    entry = {**base_entry, 'timestamp': time.strftime('%Y-%m-%dT%H:%M:%S.%fZ')}
+                    await provider.storeMessages(conv_id, [], {'toolApprovals': {approval_key: entry}, 'traceId': trace_id})
+                # If provider call failed, we intentionally do not throw; run will proceed
+            except Exception:
+                # Ignore persistence errors here to avoid breaking the request path (exactly matching TypeScript)
+                pass
+            # Broadcast decision to approvals SSE (exactly matching TypeScript)
+            try:
+                broadcast_approval_decision({
+                    'conversationId': conv_id,
+                    'sessionId': appr.session_id,
+                    'toolCallId': appr.tool_call_id,
+                    'status': 'approved' if appr.approved else 'rejected',
+                    'additionalContext': appr.additional_context
+                })
+            except Exception:
+                pass  # ignore
+        if len(approvals_list) > 0:
+            for approval in approvals_list:
+                if approval.session_id:  # Matching TypeScript condition
+                    initial_approvals[approval.tool_call_id] = {
+                        'status': 'approved' if approval.approved else 'rejected',
+                        'approved': approval.approved,
+                        'additionalContext': approval.additional_context
+                    }
+                await persist_approval(conversation_id, approval)
+        # Seed approvals from persisted conversation metadata
+        if config.default_memory_provider:
+            try:
+                conv_result = await config.default_memory_provider.get_conversation(conversation_id)
+                if hasattr(conv_result, 'data') and conv_result.data:
+                    conversation_data = conv_result.data
+                    tool_approvals = getattr(conversation_data.metadata, 'tool_approvals', {}) if conversation_data.metadata else {}
+                    if tool_approvals:
+                        # Find latest assistant message with tool calls for matching
+                        assistant_msg = None
+                        for msg in reversed(conversation_data.messages):
+                            if hasattr(msg, 'role') and msg.role == 'assistant' and hasattr(msg, 'tool_calls') and msg.tool_calls:
+                                assistant_msg = msg
+                                break
+                        if assistant_msg:
+                            candidate_ids = {tc.id for tc in assistant_msg.tool_calls}
+                            candidate_signatures = {tc.id: compute_tool_call_signature(tc) for tc in assistant_msg.tool_calls}
+                            # Load persisted approvals that aren't already in initial_approvals
+                            for approval_entry in tool_approvals.values():
+                                if not isinstance(approval_entry, dict):
+                                    continue
+                                persisted_tool_call_id = approval_entry.get('tool_call_id')
+                                persisted_signature = approval_entry.get('signature')
+                                # Try direct ID match first
+                                target_id = None
+                                if persisted_tool_call_id and persisted_tool_call_id in candidate_ids:
+                                    target_id = persisted_tool_call_id
+                                elif persisted_signature:
+                                    # Signature fallback
+                                    for tc_id, sig in candidate_signatures.items():
+                                        if sig == persisted_signature:
+                                            target_id = tc_id
+                                            break
+                                if target_id and target_id not in initial_approvals:
+                                    status = approval_entry.get('status', 'pending')
+                                    if approval_entry.get('approved') is True:
+                                        status = 'approved'
+                                    elif approval_entry.get('approved') is False:
+                                        status = 'rejected'
+                                    initial_approvals[target_id] = ApprovalValue(
+                                        status=status,
+                                        approved=approval_entry.get('approved', False),
+                                        additional_context=approval_entry.get('additional_context')
+                                    )
+            except Exception as e:
+                print(f"[JAF:SERVER] Warning: Failed to seed approvals from metadata: {e}")
         initial_state = RunState(
             run_id=create_run_id(str(uuid.uuid4())),
             trace_id=create_trace_id(str(uuid.uuid4())),
-            messages=[Message(**msg.model_dump()) for msg in request.messages],
+            messages=[_convert_http_message_to_core(msg) for msg in request.messages],
             current_agent_name=request.agent_name,
             context=request.context or {},
-            turn_count=initial_turn_count  # Use loaded turn count instead of always 0
+            turn_count=initial_turn_count,  # Use loaded turn count instead of always 0
+            approvals=initial_approvals
         )
         run_config_with_memory = config.run_config
         if config.default_memory_provider:
+            # Handle memory configuration with request overrides (matching TypeScript)
+            memory_config = MemoryConfig(
+                provider=config.default_memory_provider,
+                auto_store=request.memory.get('auto_store', True) if request.memory else True,
+                max_messages=request.memory.get('max_messages') if request.memory else None,
+                compression_threshold=request.memory.get('compression_threshold') if request.memory else None,
+                store_on_completion=request.store_on_completion if request.store_on_completion is not None else True
+            )
             run_config_with_memory = replace(
                 run_config_with_memory,
-                memory=MemoryConfig(provider=config.default_memory_provider, auto_store=True),
+                memory=memory_config,
                 conversation_id=conversation_id
             )
         if request.max_turns is not None:
             run_config_with_memory = replace(run_config_with_memory, max_turns=request.max_turns)
+        # Handle streaming vs non-streaming (matching TypeScript)
+        if request.stream:
+            async def event_stream():
+                try:
+                    # Send initial metadata
+                    yield f"event: stream_start\ndata: {json.dumps({
+                        'runId': str(initial_state.run_id),
+                        'traceId': str(initial_state.trace_id),
+                        'conversationId': conversation_id,
+                        'agent': request.agent_name
+                    })}\n\n"
+                    # Stream events from the engine
+                    async for event in run_streaming(initial_state, run_config_with_memory):
+                        yield f"event: {event.type}\ndata: {json.dumps(asdict(event))}\n\n"
+                        # Check for run end and handle approval broadcasts
+                        if event.type == 'complete' and hasattr(event, 'data'):
+                            outcome = getattr(event.data, 'outcome', None)
+                            if outcome and getattr(outcome, 'status', None) == 'interrupted':
+                                interruptions = getattr(outcome, 'interruptions', [])
+                                for intr in interruptions:
+                                    if getattr(intr, 'type', None) == 'tool_approval':
+                                        tool_call = getattr(intr, 'tool_call', None)
+                                        if tool_call:
+                                            broadcast_approval_required({
+                                                'conversationId': conversation_id,
+                                                'sessionId': getattr(intr, 'session_id', None) or str(initial_state.run_id),
+                                                'toolCallId': tool_call.id,
+                                                'toolName': tool_call.function.name,
+                                                'args': try_parse_json(tool_call.function.arguments),
+                                                'signature': compute_tool_call_signature(tool_call)
+                                            })
+                            break
+                except Exception as e:
+                    yield f"event: error\ndata: {json.dumps({'message': str(e)})}\n\n"
+                finally:
+                    yield f"event: stream_end\ndata: {json.dumps({'ended': True})}\n\n"
+            return StreamingResponse(
+                event_stream(),
+                media_type="text/event-stream",
+                headers={
+                    "Cache-Control": "no-cache, no-transform",
+                    "Connection": "keep-alive",
+                    "X-Accel-Buffering": "no",
+                    "Access-Control-Allow-Origin": "*",
+                    "Access-Control-Allow-Headers": "*"
+                }
+            )
+        # Non-streaming execution
         result = await run(initial_state, run_config_with_memory)
-        http_messages = [HttpMessage.model_validate(asdict(msg)) for msg in result.final_state.messages]
+        http_messages = [_convert_core_message_to_http(msg) for msg in result.final_state.messages]
-        outcome_dict = {}
+        # Create proper outcome object
         if isinstance(result.outcome, CompletedOutcome):
-            outcome_dict = {
-                'status': 'completed',
-                'output': result.outcome.output
-            }
+            outcome_data = BaseOutcomeData(
+                status='completed',
+                output=result.outcome.output
+            )
         elif isinstance(result.outcome, ErrorOutcome):
             error_info = result.outcome.error
-            outcome_dict = {
-                'status': 'error',
-                'error': {
+            outcome_data = BaseOutcomeData(
+                status='error',
+                error={
                     'type': error_info.__class__.__name__,
                     'message': str(error_info)
                 }
-            }
+            )
+        elif isinstance(result.outcome, InterruptedOutcome):
+            # Convert interruptions to response format
+            interruptions = []
+            for interruption in result.outcome.interruptions:
+                if hasattr(interruption, 'tool_call') and hasattr(interruption, 'type'):
+                    tool_call_data = ToolCallInterruption(
+                        id=interruption.tool_call.id,
+                        function={
+                            'name': interruption.tool_call.function.name,
+                            'arguments': interruption.tool_call.function.arguments
+                        }
+                    )
+                    interruptions.append(InterruptionData(
+                        type='tool_approval',
+                        tool_call=tool_call_data,
+                        session_id=interruption.session_id or str(result.final_state.run_id)
+                    ))
+                    # Broadcast approval request via SSE
+                    broadcast_approval_required({
+                        'conversationId': conversation_id,
+                        'sessionId': interruption.session_id or str(result.final_state.run_id),
+                        'toolCallId': interruption.tool_call.id,
+                        'toolName': interruption.tool_call.function.name,
+                        'args': try_parse_json(interruption.tool_call.function.arguments),
+                        'signature': compute_tool_call_signature(interruption.tool_call)
+                    })
+            outcome_data = InterruptedOutcomeData(
+                status='interrupted',
+                interruptions=interruptions
+            )
+        else:
+            outcome_data = BaseOutcomeData(status='error', error='Unknown outcome type')
         return ChatResponse(
             success=True,
@@ -157,7 +641,7 @@ def create_jaf_server(config: ServerConfig[Ctx]) -> FastAPI:
                 run_id=str(result.final_state.run_id),
                 trace_id=str(result.final_state.trace_id),
                 messages=http_messages,
-                outcome=outcome_dict,
+                outcome=outcome_data,
                 turn_count=result.final_state.turn_count,
                 execution_time_ms=int((time.time() - request_start_time) * 1000),  # Use request start time
                 conversation_id=conversation_id
@@ -211,4 +695,163 @@ def create_jaf_server(config: ServerConfig[Ctx]) -> FastAPI:
             return MemoryHealthResponse(success=True, data=result.data)
+    # Approval endpoints for HITL functionality
+    @app.get("/approvals/pending", response_model=PendingApprovalsResponse)
+    async def get_pending_approvals(conversation_id: str = None):
+        """Get pending approvals for a conversation."""
+        try:
+            if not conversation_id:
+                raise HTTPException(status_code=400, detail="conversation_id is required")
+            if not config.default_memory_provider:
+                return PendingApprovalsResponse(
+                    success=False,
+                    error="Memory provider not configured"
+                )
+            # Get conversation to analyze pending approvals
+            conv_result = await config.default_memory_provider.get_conversation(conversation_id)
+            if hasattr(conv_result, 'error'):
+                return PendingApprovalsResponse(success=False, error=str(conv_result.error.message))
+            if not conv_result.data:
+                return PendingApprovalsResponse(
+                    success=True,
+                    data=PendingApprovalsData(pending=[])
+                )
+            conversation = conv_result.data
+            messages = conversation.messages
+            approvals_meta = getattr(conversation.metadata, 'tool_approvals', {}) if conversation.metadata else {}
+            # Find most recent assistant message with tool calls
+            assistant_msg = None
+            assistant_index = -1
+            for i in range(len(messages) - 1, -1, -1):
+                msg = messages[i]
+                if hasattr(msg, 'role') and msg.role == 'assistant' and hasattr(msg, 'tool_calls') and msg.tool_calls:
+                    assistant_msg = msg
+                    assistant_index = i
+                    break
+            if not assistant_msg:
+                return PendingApprovalsResponse(
+                    success=True,
+                    data=PendingApprovalsData(pending=[])
+                )
+            # Check which tool calls have already been executed
+            tool_ids = {tc.id for tc in assistant_msg.tool_calls}
+            executed = set()
+            for j in range(assistant_index + 1, len(messages)):
+                msg = messages[j]
+                if hasattr(msg, 'role') and msg.role == 'tool' and hasattr(msg, 'tool_call_id'):
+                    if msg.tool_call_id in tool_ids:
+                        executed.add(msg.tool_call_id)
+            # Build pending approvals list
+            pending_approvals = []
+            for tc in assistant_msg.tool_calls:
+                if tc.id in executed:
+                    continue  # Already executed
+                # Check approval status
+                approval_key = f"{conversation.conversation_id}:{tc.id}"
+                approval_entry = approvals_meta.get(approval_key)
+                status = 'pending'
+                if approval_entry:
+                    status = approval_entry.get('status', 'pending')
+                    if approval_entry.get('approved') is True:
+                        status = 'approved'
+                    elif approval_entry.get('approved') is False:
+                        status = 'rejected'
+                if status == 'pending':
+                    pending_approvals.append(PendingApprovalData(
+                        conversation_id=conversation_id,
+                        tool_call_id=tc.id,
+                        tool_name=tc.function.name,
+                        args=try_parse_json(tc.function.arguments),
+                        signature=compute_tool_call_signature(tc),
+                        status='pending',
+                        session_id=getattr(conversation.metadata, 'run_id', None) if conversation.metadata else None
+                    ))
+            return PendingApprovalsResponse(
+                success=True,
+                data=PendingApprovalsData(pending=pending_approvals)
+            )
+        except Exception as e:
+            return PendingApprovalsResponse(success=False, error=str(e))
+    # Agent-specific chat endpoint (convenience - matching TypeScript)
+    @app.post("/agents/{agent_name}/chat", response_model=ChatResponse)
+    async def agent_chat_completion(agent_name: str, request_body: ChatRequest):
+        """Agent-specific chat endpoint for convenience."""
+        # Create modified request with agent name
+        modified_request = ChatRequest(
+            messages=request_body.messages,
+            agent_name=agent_name,
+            context=request_body.context,
+            max_turns=request_body.max_turns,
+            stream=request_body.stream,
+            conversation_id=request_body.conversation_id,
+            memory=request_body.memory,
+            approvals=request_body.approvals
+        )
+        # Delegate to main chat endpoint logic
+        return await chat_completion(modified_request)
+    # Approvals SSE stream endpoint (matching TypeScript placement inside start function)
+    @app.get("/approvals/stream")
+    async def stream_approval_updates(request: Request, conversation_id: str = None):
+        """Stream real-time approval updates via Server-Sent Events."""
+        async def event_stream():
+            # Simple client structure matching TypeScript
+            client = {
+                'response': request,  # Store request for disconnection check
+                'filter_conversation_id': conversation_id
+            }
+            approval_subscribers.add(client)
+            try:
+                # Initial greeting (matching TypeScript)
+                yield f"event: stream_start\ndata: {json.dumps({'conversationId': conversation_id})}\n\n"
+                # Heartbeat like TypeScript (15 second interval)
+                last_heartbeat = time.time()
+                while True:
+                    # Check client disconnection
+                    if await request.is_disconnected():
+                        break
+                    # Send heartbeat every 15 seconds
+                    current_time = time.time()
+                    if current_time - last_heartbeat >= 15:
+                        yield f"event: ping\ndata: {json.dumps({'ts': int(current_time * 1000)})}\n\n"
+                        last_heartbeat = current_time
+                    await asyncio.sleep(1)
+            except Exception as e:
+                yield f"event: error\ndata: {json.dumps({'message': str(e)})}\n\n"
+            finally:
+                approval_subscribers.discard(client)
+        return StreamingResponse(
+            event_stream(),
+            media_type="text/event-stream",
+            headers={
+                "Cache-Control": "no-cache, no-transform",
+                "Connection": "keep-alive",
+                "X-Accel-Buffering": "no",
+                "Access-Control-Allow-Origin": "*",
+                "Access-Control-Allow-Headers": "*"
+            }
+        )
     return app

jaf-py 2.4.1__py3-none-any.whl → 2.4.3__py3-none-any.whl

jaf-py 2.4.1py3-none-any.whl → 2.4.3py3-none-any.whl