PyPI - zwarm - Versions diffs - 1.3.10__py3-none-any.whl - Mend

zwarm 1.3.10__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (37) hide show

zwarm/__init__.py +38 -0
zwarm/adapters/__init__.py +21 -0
zwarm/adapters/base.py +109 -0
zwarm/adapters/claude_code.py +357 -0
zwarm/adapters/codex_mcp.py +968 -0
zwarm/adapters/registry.py +69 -0
zwarm/adapters/test_codex_mcp.py +274 -0
zwarm/adapters/test_registry.py +68 -0
zwarm/cli/__init__.py +0 -0
zwarm/cli/main.py +2052 -0
zwarm/core/__init__.py +0 -0
zwarm/core/compact.py +329 -0
zwarm/core/config.py +342 -0
zwarm/core/environment.py +154 -0
zwarm/core/models.py +315 -0
zwarm/core/state.py +355 -0
zwarm/core/test_compact.py +312 -0
zwarm/core/test_config.py +160 -0
zwarm/core/test_models.py +265 -0
zwarm/orchestrator.py +623 -0
zwarm/prompts/__init__.py +10 -0
zwarm/prompts/orchestrator.py +214 -0
zwarm/sessions/__init__.py +24 -0
zwarm/sessions/manager.py +589 -0
zwarm/test_orchestrator_watchers.py +23 -0
zwarm/tools/__init__.py +17 -0
zwarm/tools/delegation.py +630 -0
zwarm/watchers/__init__.py +26 -0
zwarm/watchers/base.py +131 -0
zwarm/watchers/builtin.py +424 -0
zwarm/watchers/manager.py +181 -0
zwarm/watchers/registry.py +57 -0
zwarm/watchers/test_watchers.py +237 -0
zwarm-1.3.10.dist-info/METADATA +525 -0
zwarm-1.3.10.dist-info/RECORD +37 -0
zwarm-1.3.10.dist-info/WHEEL +4 -0
zwarm-1.3.10.dist-info/entry_points.txt +2 -0

zwarm/tools/delegation.py ADDED Viewed

@@ -0,0 +1,630 @@
+"""
+Delegation tools for the orchestrator.
+These are the core tools that orchestrators use to delegate work to executors:
+- delegate: Start a new session with an executor
+- converse: Continue a sync conversation
+- check_session: Check status of an async session
+- end_session: End a session
+Sessions are also registered with CodexSessionManager for unified visibility
+in `zwarm interactive`.
+"""
+from __future__ import annotations
+import asyncio
+from datetime import datetime
+from pathlib import Path
+from typing import TYPE_CHECKING, Any, Literal
+from wbal.helper import weaveTool
+if TYPE_CHECKING:
+    from zwarm.orchestrator import Orchestrator
+def _get_session_manager(orchestrator: "Orchestrator"):
+    """Get or create the CodexSessionManager for unified session tracking."""
+    if not hasattr(orchestrator, "_session_manager"):
+        from zwarm.sessions import CodexSessionManager
+        orchestrator._session_manager = CodexSessionManager(orchestrator.working_dir / ".zwarm")
+    return orchestrator._session_manager
+def _register_session_for_visibility(
+    orchestrator: "Orchestrator",
+    session_id: str,
+    task: str,
+    adapter: str,
+    model: str,
+    working_dir: Path,
+    status: str = "running",
+    pid: int | None = None,
+):
+    """
+    Register an orchestrator session with CodexSessionManager for visibility.
+    This allows `zwarm interactive` to show orchestrator-delegated sessions
+    in its unified dashboard.
+    """
+    from zwarm.sessions import CodexSession, SessionStatus, SessionMessage
+    manager = _get_session_manager(orchestrator)
+    now = datetime.now().isoformat()
+    # Map status
+    status_map = {
+        "running": SessionStatus.RUNNING,
+        "active": SessionStatus.RUNNING,
+        "completed": SessionStatus.COMPLETED,
+        "failed": SessionStatus.FAILED,
+    }
+    session = CodexSession(
+        id=session_id,
+        task=task,
+        status=status_map.get(status, SessionStatus.RUNNING),
+        working_dir=working_dir,
+        created_at=now,
+        updated_at=now,
+        model=model or "unknown",
+        pid=pid,
+        source=f"orchestrator:{orchestrator.instance_id or 'unknown'}",
+        adapter=adapter,
+        messages=[SessionMessage(role="user", content=task, timestamp=now)],
+    )
+    # Save to disk
+    manager._save_session(session)
+    return session
+def _update_session_visibility(
+    orchestrator: "Orchestrator",
+    session_id: str,
+    status: str | None = None,
+    messages: list | None = None,
+    token_usage: dict | None = None,
+    error: str | None = None,
+):
+    """Update a session's visibility record."""
+    manager = _get_session_manager(orchestrator)
+    session = manager._load_session(session_id)
+    if not session:
+        return
+    from zwarm.sessions import SessionStatus, SessionMessage
+    if status:
+        status_map = {
+            "running": SessionStatus.RUNNING,
+            "active": SessionStatus.RUNNING,
+            "completed": SessionStatus.COMPLETED,
+            "failed": SessionStatus.FAILED,
+        }
+        session.status = status_map.get(status, session.status)
+    if messages:
+        for msg in messages:
+            if hasattr(msg, "role") and hasattr(msg, "content"):
+                session.messages.append(SessionMessage(
+                    role=msg.role,
+                    content=msg.content,
+                    timestamp=datetime.now().isoformat(),
+                ))
+    if token_usage:
+        session.token_usage = token_usage
+    if error:
+        session.error = error
+    manager._save_session(session)
+def _truncate(text: str, max_len: int = 200) -> str:
+    """Truncate text with ellipsis."""
+    if len(text) <= max_len:
+        return text
+    return text[:max_len - 3] + "..."
+def _format_session_header(session_id: str, adapter: str, mode: str) -> str:
+    """Format a nice session header."""
+    return f"[{session_id[:8]}] {adapter} ({mode})"
+def _validate_working_dir(
+    requested_dir: Path | str | None,
+    default_dir: Path,
+    allowed_dirs: list[str] | None,
+) -> tuple[Path, str | None]:
+    """
+    Validate requested working directory against allowed_dirs config.
+    Args:
+        requested_dir: Directory requested by the agent (or None for default)
+        default_dir: The orchestrator's working directory
+        allowed_dirs: Config setting - None means only default allowed,
+                     ["*"] means any, or list of allowed paths
+    Returns:
+        (validated_path, error_message) - error is None if valid
+    """
+    if requested_dir is None:
+        return default_dir, None
+    requested = Path(requested_dir).resolve()
+    # Check if directory exists
+    if not requested.exists():
+        return default_dir, f"Directory does not exist: {requested}"
+    if not requested.is_dir():
+        return default_dir, f"Not a directory: {requested}"
+    # If allowed_dirs is None, only default is allowed
+    if allowed_dirs is None:
+        if requested == default_dir.resolve():
+            return requested, None
+        return default_dir, (
+            f"Directory not allowed: {requested}. "
+            f"Agent can only delegate to working directory ({default_dir}). "
+            "Set orchestrator.allowed_dirs in config to allow other directories."
+        )
+    # If ["*"], any directory is allowed
+    if allowed_dirs == ["*"]:
+        return requested, None
+    # Check against allowed list
+    for allowed in allowed_dirs:
+        allowed_path = Path(allowed).resolve()
+        # Allow if requested is the allowed path or a subdirectory of it
+        try:
+            requested.relative_to(allowed_path)
+            return requested, None
+        except ValueError:
+            continue
+    return default_dir, (
+        f"Directory not allowed: {requested}. "
+        f"Allowed directories: {allowed_dirs}"
+    )
+@weaveTool
+def delegate(
+    self: "Orchestrator",
+    task: str,
+    mode: Literal["sync", "async"] = "sync",
+    adapter: str | None = None,
+    model: str | None = None,
+    working_dir: str | None = None,
+) -> dict[str, Any]:
+    """
+    Delegate work to an executor agent.
+    Use this to assign coding tasks to an executor. Two modes available:
+    **sync** (default): Start a conversation with the executor.
+    You can iteratively refine requirements using converse().
+    Best for: ambiguous tasks, complex requirements, tasks needing guidance.
+    **async**: Fire-and-forget execution.
+    Check progress later with check_session().
+    Best for: clear self-contained tasks, parallel work.
+    Args:
+        task: Clear description of what to do. Be specific about requirements.
+        mode: "sync" for conversational, "async" for fire-and-forget.
+        adapter: Which executor adapter to use (default: config setting).
+        model: Model override for the executor.
+        working_dir: Directory for the executor to work in (default: orchestrator's dir).
+                    NOTE: May be restricted by orchestrator.allowed_dirs config.
+    Returns:
+        {session_id, status, response (if sync)}
+    Example:
+        delegate(task="Add a logout button to the navbar", mode="sync")
+        # Then use converse() to refine: "Also add a confirmation dialog"
+    """
+    # Validate working directory against allowed_dirs config
+    effective_dir, dir_error = _validate_working_dir(
+        working_dir,
+        self.working_dir,
+        self.config.orchestrator.allowed_dirs,
+    )
+    if dir_error:
+        return {
+            "success": False,
+            "error": dir_error,
+            "hint": "Use the default working directory or ask user to update allowed_dirs config",
+        }
+    # Get adapter (use default from config if not specified)
+    adapter_name = adapter or self.config.executor.adapter
+    executor = self._get_adapter(adapter_name)
+    # Run async start_session
+    session = asyncio.run(
+        executor.start_session(
+            task=task,
+            working_dir=effective_dir,
+            mode=mode,
+            model=model or self.config.executor.model,
+            sandbox=self.config.executor.sandbox,
+        )
+    )
+    # Track session
+    self._sessions[session.id] = session
+    self.state.add_session(session)
+    # Register for unified visibility in zwarm interactive
+    _register_session_for_visibility(
+        orchestrator=self,
+        session_id=session.id,
+        task=task,
+        adapter=adapter_name,
+        model=model or self.config.executor.model,
+        working_dir=effective_dir,
+        status="running" if mode == "async" else "active",
+        pid=getattr(session, "process", None) and session.process.pid,
+    )
+    # Log events
+    from zwarm.core.models import event_session_started, event_message_sent, Message
+    self.state.log_event(event_session_started(session))
+    self.state.log_event(event_message_sent(session, Message(role="user", content=task)))
+    # Get response for sync mode
+    response_text = ""
+    if mode == "sync" and session.messages:
+        response_text = session.messages[-1].content
+        # Log the assistant response too
+        self.state.log_event(event_message_sent(
+            session,
+            Message(role="assistant", content=response_text)
+        ))
+    # Log delegation result for debugging
+    from zwarm.core.models import Event
+    self.state.log_event(Event(
+        kind="delegation_result",
+        payload={
+            "session_id": session.id,
+            "mode": mode,
+            "adapter": adapter_name,
+            "response_length": len(response_text),
+            "response_preview": response_text[:500] if response_text else "(empty)",
+            "message_count": len(session.messages),
+        },
+    ))
+    # Build nice result
+    header = _format_session_header(session.id, adapter_name, mode)
+    if mode == "sync":
+        result = {
+            "success": True,
+            "session": header,
+            "session_id": session.id,
+            "status": "active",
+            "task": _truncate(task, 100),
+            "response": response_text,
+            "tokens": session.token_usage.get("total_tokens", 0),
+            "hint": "Use converse(session_id, message) to continue this conversation",
+        }
+        # Warn if no conversation ID - converse() won't work
+        if not session.conversation_id:
+            result["warning"] = "no_conversation_id"
+            result["hint"] = (
+                "WARNING: MCP didn't return a conversation ID. "
+                "You cannot use converse() - send all instructions upfront or use async mode."
+            )
+        return result
+    else:
+        return {
+            "success": True,
+            "session": header,
+            "session_id": session.id,
+            "status": "running",
+            "task": _truncate(task, 100),
+            "hint": "Use check_session(session_id) to monitor progress",
+        }
+@weaveTool
+def converse(
+    self: "Orchestrator",
+    session_id: str,
+    message: str,
+) -> dict[str, Any]:
+    """
+    Continue a sync conversation with an executor.
+    Use this to iteratively refine requirements, ask for changes,
+    or guide the executor step-by-step. Like chatting with a developer.
+    Args:
+        session_id: The session to continue (from delegate() result).
+        message: Your next message to the executor.
+    Returns:
+        {session_id, response, turn}
+    Example:
+        result = delegate(task="Add user authentication")
+        # Executor responds with initial plan
+        converse(session_id=result["session_id"], message="Use JWT, not sessions")
+        # Executor adjusts approach
+        converse(session_id=result["session_id"], message="Now add tests")
+    """
+    session = self._sessions.get(session_id)
+    if not session:
+        return {
+            "success": False,
+            "error": f"Unknown session: {session_id}",
+            "hint": "Use list_sessions() to see available sessions",
+        }
+    if session.mode.value != "sync":
+        return {
+            "success": False,
+            "error": "Cannot converse with async session",
+            "hint": "Use check_session() for async sessions instead",
+        }
+    if session.status.value != "active":
+        return {
+            "success": False,
+            "error": f"Session is {session.status.value}, not active",
+            "hint": "Start a new session with delegate()",
+        }
+    # Check for stale/missing conversation_id (common after resume)
+    if not session.conversation_id:
+        return {
+            "success": False,
+            "error": "Session has no conversation ID (likely stale after resume)",
+            "hint": (
+                "This session's conversation was lost (MCP server restarted). "
+                "Use end_session() to close it, then delegate() a new task."
+            ),
+            "session_id": session_id,
+        }
+    # Get adapter and send message
+    executor = self._get_adapter(session.adapter)
+    try:
+        response = asyncio.run(
+            executor.send_message(session, message)
+        )
+    except Exception as e:
+        return {
+            "success": False,
+            "error": str(e),
+            "session_id": session_id,
+        }
+    # Update state
+    self.state.update_session(session)
+    # Update visibility record
+    from zwarm.core.models import Message
+    _update_session_visibility(
+        orchestrator=self,
+        session_id=session_id,
+        messages=[Message(role="user", content=message), Message(role="assistant", content=response)],
+        token_usage=session.token_usage,
+    )
+    # Log both messages
+    from zwarm.core.models import event_message_sent
+    self.state.log_event(event_message_sent(session, Message(role="user", content=message)))
+    self.state.log_event(event_message_sent(session, Message(role="assistant", content=response)))
+    # Calculate turn number
+    turn = len([m for m in session.messages if m.role == "user"])
+    header = _format_session_header(session.id, session.adapter, session.mode.value)
+    # Check for conversation loss (indicated by error in response)
+    conversation_lost = (
+        "[ERROR] Conversation lost" in response
+        or session.conversation_id is None
+    )
+    result = {
+        "success": True,
+        "session": header,
+        "session_id": session_id,
+        "turn": turn,
+        "you_said": _truncate(message, 100),
+        "response": response,
+        "tokens": session.token_usage.get("total_tokens", 0),
+    }
+    if conversation_lost:
+        result["warning"] = "conversation_lost"
+        result["hint"] = (
+            "The MCP server lost this conversation. You should end_session() "
+            "and delegate() a new task with the full context."
+        )
+    return result
+@weaveTool
+def check_session(
+    self: "Orchestrator",
+    session_id: str,
+) -> dict[str, Any]:
+    """
+    Check the status of a session.
+    For async sessions: Check if the executor has finished.
+    For sync sessions: Get current status and message count.
+    Args:
+        session_id: The session to check.
+    Returns:
+        {session_id, status, ...}
+    """
+    session = self._sessions.get(session_id)
+    if not session:
+        return {
+            "success": False,
+            "error": f"Unknown session: {session_id}",
+            "hint": "Use list_sessions() to see available sessions",
+        }
+    executor = self._get_adapter(session.adapter)
+    status = asyncio.run(
+        executor.check_status(session)
+    )
+    # Update state if status changed
+    self.state.update_session(session)
+    # Sync visibility record
+    _update_session_visibility(
+        orchestrator=self,
+        session_id=session_id,
+        status=session.status.value,
+        token_usage=session.token_usage,
+    )
+    header = _format_session_header(session.id, session.adapter, session.mode.value)
+    return {
+        "success": True,
+        "session": header,
+        "session_id": session_id,
+        "mode": session.mode.value,
+        "status": session.status.value,
+        "messages": len(session.messages),
+        "task": _truncate(session.task_description, 80),
+        **status,
+    }
+@weaveTool
+def end_session(
+    self: "Orchestrator",
+    session_id: str,
+    verdict: Literal["completed", "failed", "cancelled"] = "completed",
+    summary: str | None = None,
+) -> dict[str, Any]:
+    """
+    End a session with a verdict.
+    Call this when:
+    - Task is done (verdict="completed")
+    - Task failed and you're giving up (verdict="failed")
+    - You want to stop early (verdict="cancelled")
+    Args:
+        session_id: The session to end.
+        verdict: How the session ended.
+        summary: Optional summary of what was accomplished.
+    Returns:
+        {session_id, status, summary}
+    """
+    session = self._sessions.get(session_id)
+    if not session:
+        return {
+            "success": False,
+            "error": f"Unknown session: {session_id}",
+        }
+    # Stop the session if still running
+    if session.status.value == "active":
+        executor = self._get_adapter(session.adapter)
+        if verdict == "completed":
+            session.complete(summary)
+        else:
+            asyncio.run(executor.stop(session))
+            if verdict == "failed":
+                session.fail(summary)
+            else:
+                session.fail(f"Cancelled: {summary}" if summary else "Cancelled")
+    # Update state
+    self.state.update_session(session)
+    # Update visibility record
+    _update_session_visibility(
+        orchestrator=self,
+        session_id=session_id,
+        status=verdict,
+        token_usage=session.token_usage,
+        error=summary if verdict == "failed" else None,
+    )
+    # Log event
+    from zwarm.core.models import event_session_completed
+    self.state.log_event(event_session_completed(session))
+    header = _format_session_header(session.id, session.adapter, session.mode.value)
+    verdict_icon = {"completed": "✓", "failed": "✗", "cancelled": "○"}.get(verdict, "?")
+    return {
+        "success": True,
+        "session": header,
+        "session_id": session_id,
+        "verdict": f"{verdict_icon} {verdict}",
+        "summary": session.exit_message or "(no summary)",
+        "total_turns": len([m for m in session.messages if m.role == "user"]),
+        "total_tokens": session.token_usage.get("total_tokens", 0),
+        "token_usage": session.token_usage,
+    }
+@weaveTool
+def list_sessions(
+    self: "Orchestrator",
+    status: str | None = None,
+) -> dict[str, Any]:
+    """
+    List all sessions, optionally filtered by status.
+    Args:
+        status: Filter by status ("active", "completed", "failed").
+    Returns:
+        {sessions: [...], count}
+    """
+    sessions = self.state.list_sessions(status=status)
+    session_list = []
+    for s in sessions:
+        status_icon = {
+            "active": "●",
+            "completed": "✓",
+            "failed": "✗",
+        }.get(s.status.value, "?")
+        session_list.append({
+            "id": s.id[:8] + "...",
+            "full_id": s.id,
+            "status": f"{status_icon} {s.status.value}",
+            "adapter": s.adapter,
+            "mode": s.mode.value,
+            "task": _truncate(s.task_description, 60),
+            "turns": len([m for m in s.messages if m.role == "user"]),
+            "tokens": s.token_usage.get("total_tokens", 0),
+        })
+    return {
+        "success": True,
+        "sessions": session_list,
+        "count": len(sessions),
+        "filter": status or "all",
+    }

zwarm/watchers/__init__.py ADDED Viewed

@@ -0,0 +1,26 @@
+"""
+Watchers: Trajectory aligners for agent behavior.
+Watchers observe agent activity and can intervene to correct course.
+They are composable and can be layered.
+"""
+from zwarm.watchers.base import Watcher, WatcherContext, WatcherResult, WatcherAction
+from zwarm.watchers.registry import register_watcher, get_watcher, list_watchers
+from zwarm.watchers.manager import WatcherManager, WatcherConfig, build_watcher_manager
+# Import built-in watchers to register them
+from zwarm.watchers import builtin as _builtin  # noqa: F401
+__all__ = [
+    "Watcher",
+    "WatcherContext",
+    "WatcherResult",
+    "WatcherAction",
+    "WatcherConfig",
+    "WatcherManager",
+    "register_watcher",
+    "get_watcher",
+    "list_watchers",
+    "build_watcher_manager",
+]