PyPI - zwarm - Versions diffs - 2.3.5__py3-none-any.whl - Mend

zwarm 2.3.5__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (38) hide show

zwarm/__init__.py +38 -0
zwarm/adapters/__init__.py +21 -0
zwarm/adapters/base.py +109 -0
zwarm/adapters/claude_code.py +357 -0
zwarm/adapters/codex_mcp.py +1262 -0
zwarm/adapters/registry.py +69 -0
zwarm/adapters/test_codex_mcp.py +274 -0
zwarm/adapters/test_registry.py +68 -0
zwarm/cli/__init__.py +0 -0
zwarm/cli/main.py +2503 -0
zwarm/core/__init__.py +0 -0
zwarm/core/compact.py +329 -0
zwarm/core/config.py +344 -0
zwarm/core/environment.py +173 -0
zwarm/core/models.py +315 -0
zwarm/core/state.py +355 -0
zwarm/core/test_compact.py +312 -0
zwarm/core/test_config.py +160 -0
zwarm/core/test_models.py +265 -0
zwarm/orchestrator.py +683 -0
zwarm/prompts/__init__.py +10 -0
zwarm/prompts/orchestrator.py +230 -0
zwarm/sessions/__init__.py +26 -0
zwarm/sessions/manager.py +792 -0
zwarm/test_orchestrator_watchers.py +23 -0
zwarm/tools/__init__.py +17 -0
zwarm/tools/delegation.py +784 -0
zwarm/watchers/__init__.py +31 -0
zwarm/watchers/base.py +131 -0
zwarm/watchers/builtin.py +518 -0
zwarm/watchers/llm_watcher.py +319 -0
zwarm/watchers/manager.py +181 -0
zwarm/watchers/registry.py +57 -0
zwarm/watchers/test_watchers.py +237 -0
zwarm-2.3.5.dist-info/METADATA +309 -0
zwarm-2.3.5.dist-info/RECORD +38 -0
zwarm-2.3.5.dist-info/WHEEL +4 -0
zwarm-2.3.5.dist-info/entry_points.txt +2 -0

zwarm/core/environment.py ADDED Viewed

@@ -0,0 +1,173 @@
+"""
+OrchestratorEnv: A lean environment for the zwarm orchestrator.
+Unlike ChatEnv, this environment:
+- Has no notes/observations (we use StateManager instead)
+- Has no chat() tool (orchestrator communicates via output_handler)
+- Shows active sessions, step progress, and budget in observe()
+"""
+from __future__ import annotations
+from pathlib import Path
+from typing import TYPE_CHECKING, Any, Callable
+from pydantic import PrivateAttr
+from wbal.environment import Environment
+if TYPE_CHECKING:
+    from zwarm.core.models import ConversationSession
+    from zwarm.sessions import CodexSessionManager
+class OrchestratorEnv(Environment):
+    """
+    Lean environment for the orchestrator agent.
+    Provides:
+    - Task context
+    - Working directory info
+    - Active session visibility
+    - Step progress tracking
+    - Budget/resource monitoring
+    - Output handler for messages
+    """
+    task: str = ""
+    working_dir: Path = Path(".")
+    output_handler: Callable[[str], None] = lambda x: print(x)
+    # Session manager (set by orchestrator) - pulls live data each observe()
+    _session_manager: "CodexSessionManager | None" = PrivateAttr(default=None)
+    # Legacy: old sessions dict (deprecated, for backwards compat)
+    _sessions: dict[str, "ConversationSession"] | None = PrivateAttr(default=None)
+    # Progress tracking (updated by orchestrator each step)
+    _step_count: int = PrivateAttr(default=0)
+    _max_steps: int = PrivateAttr(default=50)
+    _total_tokens: int = PrivateAttr(default=0)
+    _executor_tokens: int = PrivateAttr(default=0)  # Executor token usage
+    # Budget config (set from config)
+    _budget_max_sessions: int | None = PrivateAttr(default=None)
+    def set_session_manager(self, manager: "CodexSessionManager") -> None:
+        """Set the session manager for live session visibility in observe()."""
+        self._session_manager = manager
+    def set_sessions(self, sessions: dict[str, "ConversationSession"]) -> None:
+        """Legacy: Set the sessions dict for observe() visibility."""
+        self._sessions = sessions
+    def update_progress(
+        self,
+        step_count: int,
+        max_steps: int,
+        total_tokens: int = 0,
+        executor_tokens: int = 0,
+    ) -> None:
+        """Update progress tracking (called by orchestrator each step)."""
+        self._step_count = step_count
+        self._max_steps = max_steps
+        self._total_tokens = total_tokens
+        self._executor_tokens = executor_tokens
+    def set_budget(self, max_sessions: int | None = None) -> None:
+        """Set budget limits from config."""
+        self._budget_max_sessions = max_sessions
+    def observe(self) -> str:
+        """
+        Return observable state for the orchestrator.
+        Shows:
+        - Progress (steps, tokens)
+        - Session summary (pulled LIVE from CodexSessionManager)
+        - Active sessions with their status
+        - Working directory
+        Note: Task is NOT included here as it's already in the user message.
+        """
+        parts = []
+        # Progress bar and stats
+        progress_pct = (
+            (self._step_count / self._max_steps * 100) if self._max_steps > 0 else 0
+        )
+        bar_len = 20
+        filled = (
+            int(bar_len * self._step_count / self._max_steps)
+            if self._max_steps > 0
+            else 0
+        )
+        bar = "█" * filled + "░" * (bar_len - filled)
+        progress_lines = [
+            f"Steps: [{bar}] {self._step_count}/{self._max_steps} ({progress_pct:.0f}%)",
+        ]
+        if self._total_tokens > 0 or self._executor_tokens > 0:
+            token_parts = []
+            if self._total_tokens > 0:
+                token_parts.append(f"orchestrator: ~{self._total_tokens:,}")
+            if self._executor_tokens > 0:
+                token_parts.append(f"executors: ~{self._executor_tokens:,}")
+            progress_lines.append(f"Tokens: {', '.join(token_parts)}")
+        parts.append("## Progress\n" + "\n".join(progress_lines))
+        # Session summary - pull LIVE from CodexSessionManager
+        if self._session_manager is not None:
+            sessions = self._session_manager.list_sessions()
+            running = sum(1 for s in sessions if s.status.value == "running")
+            completed = sum(1 for s in sessions if s.status.value == "completed")
+            failed = sum(1 for s in sessions if s.status.value == "failed")
+            total = len(sessions)
+            summary = f"Sessions: {running} running, {completed} done, {failed} failed ({total} total)"
+            if self._budget_max_sessions:
+                summary += f" [limit: {self._budget_max_sessions}]"
+            parts.append(f"## Resources\n{summary}")
+            # Running sessions detail
+            running_sessions = [s for s in sessions if s.status.value == "running"]
+            if running_sessions:
+                session_lines = []
+                for session in running_sessions:
+                    task_preview = (
+                        session.task[:50] + "..."
+                        if len(session.task) > 50
+                        else session.task
+                    )
+                    tokens = session.token_usage.get("total_tokens", 0)
+                    token_info = f", {tokens:,} tok" if tokens else ""
+                    session_lines.append(
+                        f"  • {session.short_id} (turn {session.turn}{token_info}): {task_preview}"
+                    )
+                parts.append("## Running Sessions\n" + "\n".join(session_lines))
+            # Recently completed (for visibility)
+            recent_completed = [
+                s for s in sessions
+                if s.status.value == "completed"
+            ][:3]  # Last 3 completed
+            if recent_completed:
+                session_lines = []
+                for session in recent_completed:
+                    task_preview = (
+                        session.task[:40] + "..."
+                        if len(session.task) > 40
+                        else session.task
+                    )
+                    tokens = session.token_usage.get("total_tokens", 0)
+                    session_lines.append(
+                        f"  • {session.short_id} ✓ ({tokens:,} tok): {task_preview}"
+                    )
+                parts.append("## Recently Completed\n" + "\n".join(session_lines))
+        # Working directory (less prominent)
+        parts.append(f"## Context\nWorking dir: {self.working_dir.absolute()}")
+        return "\n\n".join(parts)

zwarm/core/models.py ADDED Viewed

@@ -0,0 +1,315 @@
+"""
+Core models for zwarm.
+These are the fundamental data structures:
+- ConversationSession: A session with an executor agent (sync or async)
+- Task: A unit of work that may be delegated
+- Event: An append-only log entry for audit/debugging
+"""
+from __future__ import annotations
+import subprocess
+from dataclasses import dataclass, field
+from datetime import datetime
+from enum import Enum
+from pathlib import Path
+from typing import Any, Literal
+from uuid import uuid4
+class SessionMode(str, Enum):
+    """Execution mode for a session."""
+    SYNC = "sync"
+    ASYNC = "async"
+class SessionStatus(str, Enum):
+    """Status of a conversation session."""
+    ACTIVE = "active"
+    COMPLETED = "completed"
+    FAILED = "failed"
+class TaskStatus(str, Enum):
+    """Status of a task."""
+    PENDING = "pending"
+    IN_PROGRESS = "in_progress"
+    COMPLETED = "completed"
+    FAILED = "failed"
+@dataclass
+class Message:
+    """A single message in a conversation."""
+    role: Literal["user", "assistant", "system"]
+    content: str
+    timestamp: datetime = field(default_factory=datetime.now)
+    def to_dict(self) -> dict[str, Any]:
+        return {
+            "role": self.role,
+            "content": self.content,
+            "timestamp": self.timestamp.isoformat(),
+        }
+    @classmethod
+    def from_dict(cls, data: dict[str, Any]) -> Message:
+        return cls(
+            role=data["role"],
+            content=data["content"],
+            timestamp=datetime.fromisoformat(data["timestamp"]) if "timestamp" in data else datetime.now(),
+        )
+@dataclass
+class ConversationSession:
+    """
+    A conversational session with an executor agent.
+    Supports both sync (iterative conversation) and async (fire-and-forget) modes.
+    """
+    id: str = field(default_factory=lambda: str(uuid4()))
+    adapter: str = "codex_mcp"  # codex_mcp | codex_exec | claude_code
+    mode: SessionMode = SessionMode.SYNC
+    status: SessionStatus = SessionStatus.ACTIVE
+    working_dir: Path = field(default_factory=Path.cwd)
+    messages: list[Message] = field(default_factory=list)
+    started_at: datetime = field(default_factory=datetime.now)
+    completed_at: datetime | None = None
+    # Adapter-specific handles (not serialized)
+    conversation_id: str | None = None  # MCP conversationId for codex
+    process: subprocess.Popen | None = field(default=None, repr=False)
+    # Metadata
+    task_description: str = ""
+    model: str | None = None
+    exit_message: str | None = None
+    # Token usage tracking for cost calculation
+    token_usage: dict[str, int] = field(default_factory=lambda: {
+        "input_tokens": 0,
+        "output_tokens": 0,
+        "total_tokens": 0,
+    })
+    def add_usage(self, usage: dict[str, int]) -> None:
+        """Add token usage from an interaction."""
+        if not usage:
+            return
+        for key in self.token_usage:
+            self.token_usage[key] += usage.get(key, 0)
+    def add_message(self, role: Literal["user", "assistant", "system"], content: str) -> Message:
+        """Add a message to the conversation."""
+        msg = Message(role=role, content=content)
+        self.messages.append(msg)
+        return msg
+    def complete(self, exit_message: str | None = None) -> None:
+        """Mark session as completed."""
+        self.status = SessionStatus.COMPLETED
+        self.completed_at = datetime.now()
+        self.exit_message = exit_message
+    def fail(self, error: str | None = None) -> None:
+        """Mark session as failed."""
+        self.status = SessionStatus.FAILED
+        self.completed_at = datetime.now()
+        self.exit_message = error
+    def to_dict(self) -> dict[str, Any]:
+        """Serialize to dictionary (for persistence)."""
+        return {
+            "id": self.id,
+            "adapter": self.adapter,
+            "mode": self.mode.value,
+            "status": self.status.value,
+            "working_dir": str(self.working_dir),
+            "messages": [m.to_dict() for m in self.messages],
+            "started_at": self.started_at.isoformat(),
+            "completed_at": self.completed_at.isoformat() if self.completed_at else None,
+            "conversation_id": self.conversation_id,
+            "task_description": self.task_description,
+            "model": self.model,
+            "exit_message": self.exit_message,
+            "token_usage": self.token_usage,
+        }
+    @classmethod
+    def from_dict(cls, data: dict[str, Any]) -> ConversationSession:
+        """Deserialize from dictionary."""
+        return cls(
+            id=data["id"],
+            adapter=data.get("adapter", "codex_mcp"),
+            mode=SessionMode(data["mode"]),
+            status=SessionStatus(data["status"]),
+            working_dir=Path(data["working_dir"]),
+            messages=[Message.from_dict(m) for m in data.get("messages", [])],
+            started_at=datetime.fromisoformat(data["started_at"]),
+            completed_at=datetime.fromisoformat(data["completed_at"]) if data.get("completed_at") else None,
+            conversation_id=data.get("conversation_id"),
+            task_description=data.get("task_description", ""),
+            model=data.get("model"),
+            exit_message=data.get("exit_message"),
+            token_usage=data.get("token_usage", {"input_tokens": 0, "output_tokens": 0, "total_tokens": 0}),
+        )
+@dataclass
+class Task:
+    """
+    A unit of work that may be delegated to an executor.
+    Tasks track what needs to be done and link to the session doing the work.
+    """
+    id: str = field(default_factory=lambda: str(uuid4()))
+    description: str = ""
+    status: TaskStatus = TaskStatus.PENDING
+    session_id: str | None = None
+    created_at: datetime = field(default_factory=datetime.now)
+    completed_at: datetime | None = None
+    result: str | None = None
+    parent_task_id: str | None = None  # For subtasks
+    def start(self, session_id: str) -> None:
+        """Mark task as started with a session."""
+        self.status = TaskStatus.IN_PROGRESS
+        self.session_id = session_id
+    def complete(self, result: str | None = None) -> None:
+        """Mark task as completed."""
+        self.status = TaskStatus.COMPLETED
+        self.completed_at = datetime.now()
+        self.result = result
+    def fail(self, error: str | None = None) -> None:
+        """Mark task as failed."""
+        self.status = TaskStatus.FAILED
+        self.completed_at = datetime.now()
+        self.result = error
+    def to_dict(self) -> dict[str, Any]:
+        return {
+            "id": self.id,
+            "description": self.description,
+            "status": self.status.value,
+            "session_id": self.session_id,
+            "created_at": self.created_at.isoformat(),
+            "completed_at": self.completed_at.isoformat() if self.completed_at else None,
+            "result": self.result,
+            "parent_task_id": self.parent_task_id,
+        }
+    @classmethod
+    def from_dict(cls, data: dict[str, Any]) -> Task:
+        return cls(
+            id=data["id"],
+            description=data["description"],
+            status=TaskStatus(data["status"]),
+            session_id=data.get("session_id"),
+            created_at=datetime.fromisoformat(data["created_at"]),
+            completed_at=datetime.fromisoformat(data["completed_at"]) if data.get("completed_at") else None,
+            result=data.get("result"),
+            parent_task_id=data.get("parent_task_id"),
+        )
+@dataclass
+class Event:
+    """
+    An append-only log entry for audit and debugging.
+    Events capture everything that happens in the system.
+    """
+    id: str = field(default_factory=lambda: str(uuid4()))
+    timestamp: datetime = field(default_factory=datetime.now)
+    kind: str = ""  # session_started, message_sent, task_completed, etc.
+    session_id: str | None = None
+    task_id: str | None = None
+    payload: dict[str, Any] = field(default_factory=dict)
+    def to_dict(self) -> dict[str, Any]:
+        return {
+            "id": self.id,
+            "timestamp": self.timestamp.isoformat(),
+            "kind": self.kind,
+            "session_id": self.session_id,
+            "task_id": self.task_id,
+            "payload": self.payload,
+        }
+    @classmethod
+    def from_dict(cls, data: dict[str, Any]) -> Event:
+        return cls(
+            id=data["id"],
+            timestamp=datetime.fromisoformat(data["timestamp"]),
+            kind=data["kind"],
+            session_id=data.get("session_id"),
+            task_id=data.get("task_id"),
+            payload=data.get("payload", {}),
+        )
+# Event factory functions for common event types
+def event_session_started(session: ConversationSession) -> Event:
+    return Event(
+        kind="session_started",
+        session_id=session.id,
+        payload={
+            "adapter": session.adapter,
+            "mode": session.mode.value,
+            "task": session.task_description,
+        },
+    )
+def event_message_sent(session: ConversationSession, message: Message) -> Event:
+    return Event(
+        kind="message_sent",
+        session_id=session.id,
+        payload={
+            "role": message.role,
+            "content": message.content[:500],  # Truncate for log
+        },
+    )
+def event_session_completed(session: ConversationSession) -> Event:
+    return Event(
+        kind="session_completed",
+        session_id=session.id,
+        payload={
+            "status": session.status.value,
+            "exit_message": session.exit_message,
+            "message_count": len(session.messages),
+        },
+    )
+def event_task_created(task: Task) -> Event:
+    return Event(
+        kind="task_created",
+        task_id=task.id,
+        payload={"description": task.description},
+    )
+def event_task_completed(task: Task) -> Event:
+    return Event(
+        kind="task_completed",
+        task_id=task.id,
+        session_id=task.session_id,
+        payload={
+            "status": task.status.value,
+            "result": task.result[:500] if task.result else None,
+        },
+    )