PyPI - gobby - Versions diffs - 0.2.5__py3-none-any.whl - Mend

gobby 0.2.5__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (383) hide show

gobby/__init__.py +3 -0
gobby/adapters/__init__.py +30 -0
gobby/adapters/base.py +93 -0
gobby/adapters/claude_code.py +276 -0
gobby/adapters/codex.py +1292 -0
gobby/adapters/gemini.py +343 -0
gobby/agents/__init__.py +37 -0
gobby/agents/codex_session.py +120 -0
gobby/agents/constants.py +112 -0
gobby/agents/context.py +362 -0
gobby/agents/definitions.py +133 -0
gobby/agents/gemini_session.py +111 -0
gobby/agents/registry.py +618 -0
gobby/agents/runner.py +968 -0
gobby/agents/session.py +259 -0
gobby/agents/spawn.py +916 -0
gobby/agents/spawners/__init__.py +77 -0
gobby/agents/spawners/base.py +142 -0
gobby/agents/spawners/cross_platform.py +266 -0
gobby/agents/spawners/embedded.py +225 -0
gobby/agents/spawners/headless.py +226 -0
gobby/agents/spawners/linux.py +125 -0
gobby/agents/spawners/macos.py +277 -0
gobby/agents/spawners/windows.py +308 -0
gobby/agents/tty_config.py +319 -0
gobby/autonomous/__init__.py +32 -0
gobby/autonomous/progress_tracker.py +447 -0
gobby/autonomous/stop_registry.py +269 -0
gobby/autonomous/stuck_detector.py +383 -0
gobby/cli/__init__.py +67 -0
gobby/cli/__main__.py +8 -0
gobby/cli/agents.py +529 -0
gobby/cli/artifacts.py +266 -0
gobby/cli/daemon.py +329 -0
gobby/cli/extensions.py +526 -0
gobby/cli/github.py +263 -0
gobby/cli/init.py +53 -0
gobby/cli/install.py +614 -0
gobby/cli/installers/__init__.py +37 -0
gobby/cli/installers/antigravity.py +65 -0
gobby/cli/installers/claude.py +363 -0
gobby/cli/installers/codex.py +192 -0
gobby/cli/installers/gemini.py +294 -0
gobby/cli/installers/git_hooks.py +377 -0
gobby/cli/installers/shared.py +737 -0
gobby/cli/linear.py +250 -0
gobby/cli/mcp.py +30 -0
gobby/cli/mcp_proxy.py +698 -0
gobby/cli/memory.py +304 -0
gobby/cli/merge.py +384 -0
gobby/cli/projects.py +79 -0
gobby/cli/sessions.py +622 -0
gobby/cli/tasks/__init__.py +30 -0
gobby/cli/tasks/_utils.py +658 -0
gobby/cli/tasks/ai.py +1025 -0
gobby/cli/tasks/commits.py +169 -0
gobby/cli/tasks/crud.py +685 -0
gobby/cli/tasks/deps.py +135 -0
gobby/cli/tasks/labels.py +63 -0
gobby/cli/tasks/main.py +273 -0
gobby/cli/tasks/search.py +178 -0
gobby/cli/tui.py +34 -0
gobby/cli/utils.py +513 -0
gobby/cli/workflows.py +927 -0
gobby/cli/worktrees.py +481 -0
gobby/config/__init__.py +129 -0
gobby/config/app.py +551 -0
gobby/config/extensions.py +167 -0
gobby/config/features.py +472 -0
gobby/config/llm_providers.py +98 -0
gobby/config/logging.py +66 -0
gobby/config/mcp.py +346 -0
gobby/config/persistence.py +247 -0
gobby/config/servers.py +141 -0
gobby/config/sessions.py +250 -0
gobby/config/tasks.py +784 -0
gobby/hooks/__init__.py +104 -0
gobby/hooks/artifact_capture.py +213 -0
gobby/hooks/broadcaster.py +243 -0
gobby/hooks/event_handlers.py +723 -0
gobby/hooks/events.py +218 -0
gobby/hooks/git.py +169 -0
gobby/hooks/health_monitor.py +171 -0
gobby/hooks/hook_manager.py +856 -0
gobby/hooks/hook_types.py +575 -0
gobby/hooks/plugins.py +813 -0
gobby/hooks/session_coordinator.py +396 -0
gobby/hooks/verification_runner.py +268 -0
gobby/hooks/webhooks.py +339 -0
gobby/install/claude/commands/gobby/bug.md +51 -0
gobby/install/claude/commands/gobby/chore.md +51 -0
gobby/install/claude/commands/gobby/epic.md +52 -0
gobby/install/claude/commands/gobby/eval.md +235 -0
gobby/install/claude/commands/gobby/feat.md +49 -0
gobby/install/claude/commands/gobby/nit.md +52 -0
gobby/install/claude/commands/gobby/ref.md +52 -0
gobby/install/claude/hooks/HOOK_SCHEMAS.md +632 -0
gobby/install/claude/hooks/hook_dispatcher.py +364 -0
gobby/install/claude/hooks/validate_settings.py +102 -0
gobby/install/claude/hooks-template.json +118 -0
gobby/install/codex/hooks/hook_dispatcher.py +153 -0
gobby/install/codex/prompts/forget.md +7 -0
gobby/install/codex/prompts/memories.md +7 -0
gobby/install/codex/prompts/recall.md +7 -0
gobby/install/codex/prompts/remember.md +13 -0
gobby/install/gemini/hooks/hook_dispatcher.py +268 -0
gobby/install/gemini/hooks-template.json +138 -0
gobby/install/shared/plugins/code_guardian.py +456 -0
gobby/install/shared/plugins/example_notify.py +331 -0
gobby/integrations/__init__.py +10 -0
gobby/integrations/github.py +145 -0
gobby/integrations/linear.py +145 -0
gobby/llm/__init__.py +40 -0
gobby/llm/base.py +120 -0
gobby/llm/claude.py +578 -0
gobby/llm/claude_executor.py +503 -0
gobby/llm/codex.py +322 -0
gobby/llm/codex_executor.py +513 -0
gobby/llm/executor.py +316 -0
gobby/llm/factory.py +34 -0
gobby/llm/gemini.py +258 -0
gobby/llm/gemini_executor.py +339 -0
gobby/llm/litellm.py +287 -0
gobby/llm/litellm_executor.py +303 -0
gobby/llm/resolver.py +499 -0
gobby/llm/service.py +236 -0
gobby/mcp_proxy/__init__.py +29 -0
gobby/mcp_proxy/actions.py +175 -0
gobby/mcp_proxy/daemon_control.py +198 -0
gobby/mcp_proxy/importer.py +436 -0
gobby/mcp_proxy/lazy.py +325 -0
gobby/mcp_proxy/manager.py +798 -0
gobby/mcp_proxy/metrics.py +609 -0
gobby/mcp_proxy/models.py +139 -0
gobby/mcp_proxy/registries.py +215 -0
gobby/mcp_proxy/schema_hash.py +381 -0
gobby/mcp_proxy/semantic_search.py +706 -0
gobby/mcp_proxy/server.py +549 -0
gobby/mcp_proxy/services/__init__.py +0 -0
gobby/mcp_proxy/services/fallback.py +306 -0
gobby/mcp_proxy/services/recommendation.py +224 -0
gobby/mcp_proxy/services/server_mgmt.py +214 -0
gobby/mcp_proxy/services/system.py +72 -0
gobby/mcp_proxy/services/tool_filter.py +231 -0
gobby/mcp_proxy/services/tool_proxy.py +309 -0
gobby/mcp_proxy/stdio.py +565 -0
gobby/mcp_proxy/tools/__init__.py +27 -0
gobby/mcp_proxy/tools/agents.py +1103 -0
gobby/mcp_proxy/tools/artifacts.py +207 -0
gobby/mcp_proxy/tools/hub.py +335 -0
gobby/mcp_proxy/tools/internal.py +337 -0
gobby/mcp_proxy/tools/memory.py +543 -0
gobby/mcp_proxy/tools/merge.py +422 -0
gobby/mcp_proxy/tools/metrics.py +283 -0
gobby/mcp_proxy/tools/orchestration/__init__.py +23 -0
gobby/mcp_proxy/tools/orchestration/cleanup.py +619 -0
gobby/mcp_proxy/tools/orchestration/monitor.py +380 -0
gobby/mcp_proxy/tools/orchestration/orchestrate.py +746 -0
gobby/mcp_proxy/tools/orchestration/review.py +736 -0
gobby/mcp_proxy/tools/orchestration/utils.py +16 -0
gobby/mcp_proxy/tools/session_messages.py +1056 -0
gobby/mcp_proxy/tools/task_dependencies.py +219 -0
gobby/mcp_proxy/tools/task_expansion.py +591 -0
gobby/mcp_proxy/tools/task_github.py +393 -0
gobby/mcp_proxy/tools/task_linear.py +379 -0
gobby/mcp_proxy/tools/task_orchestration.py +77 -0
gobby/mcp_proxy/tools/task_readiness.py +522 -0
gobby/mcp_proxy/tools/task_sync.py +351 -0
gobby/mcp_proxy/tools/task_validation.py +843 -0
gobby/mcp_proxy/tools/tasks/__init__.py +25 -0
gobby/mcp_proxy/tools/tasks/_context.py +112 -0
gobby/mcp_proxy/tools/tasks/_crud.py +516 -0
gobby/mcp_proxy/tools/tasks/_factory.py +176 -0
gobby/mcp_proxy/tools/tasks/_helpers.py +129 -0
gobby/mcp_proxy/tools/tasks/_lifecycle.py +517 -0
gobby/mcp_proxy/tools/tasks/_lifecycle_validation.py +301 -0
gobby/mcp_proxy/tools/tasks/_resolution.py +55 -0
gobby/mcp_proxy/tools/tasks/_search.py +215 -0
gobby/mcp_proxy/tools/tasks/_session.py +125 -0
gobby/mcp_proxy/tools/workflows.py +973 -0
gobby/mcp_proxy/tools/worktrees.py +1264 -0
gobby/mcp_proxy/transports/__init__.py +0 -0
gobby/mcp_proxy/transports/base.py +95 -0
gobby/mcp_proxy/transports/factory.py +44 -0
gobby/mcp_proxy/transports/http.py +139 -0
gobby/mcp_proxy/transports/stdio.py +213 -0
gobby/mcp_proxy/transports/websocket.py +136 -0
gobby/memory/backends/__init__.py +116 -0
gobby/memory/backends/mem0.py +408 -0
gobby/memory/backends/memu.py +485 -0
gobby/memory/backends/null.py +111 -0
gobby/memory/backends/openmemory.py +537 -0
gobby/memory/backends/sqlite.py +304 -0
gobby/memory/context.py +87 -0
gobby/memory/manager.py +1001 -0
gobby/memory/protocol.py +451 -0
gobby/memory/search/__init__.py +66 -0
gobby/memory/search/text.py +127 -0
gobby/memory/viz.py +258 -0
gobby/prompts/__init__.py +13 -0
gobby/prompts/defaults/expansion/system.md +119 -0
gobby/prompts/defaults/expansion/user.md +48 -0
gobby/prompts/defaults/external_validation/agent.md +72 -0
gobby/prompts/defaults/external_validation/external.md +63 -0
gobby/prompts/defaults/external_validation/spawn.md +83 -0
gobby/prompts/defaults/external_validation/system.md +6 -0
gobby/prompts/defaults/features/import_mcp.md +22 -0
gobby/prompts/defaults/features/import_mcp_github.md +17 -0
gobby/prompts/defaults/features/import_mcp_search.md +16 -0
gobby/prompts/defaults/features/recommend_tools.md +32 -0
gobby/prompts/defaults/features/recommend_tools_hybrid.md +35 -0
gobby/prompts/defaults/features/recommend_tools_llm.md +30 -0
gobby/prompts/defaults/features/server_description.md +20 -0
gobby/prompts/defaults/features/server_description_system.md +6 -0
gobby/prompts/defaults/features/task_description.md +31 -0
gobby/prompts/defaults/features/task_description_system.md +6 -0
gobby/prompts/defaults/features/tool_summary.md +17 -0
gobby/prompts/defaults/features/tool_summary_system.md +6 -0
gobby/prompts/defaults/research/step.md +58 -0
gobby/prompts/defaults/validation/criteria.md +47 -0
gobby/prompts/defaults/validation/validate.md +38 -0
gobby/prompts/loader.py +346 -0
gobby/prompts/models.py +113 -0
gobby/py.typed +0 -0
gobby/runner.py +488 -0
gobby/search/__init__.py +23 -0
gobby/search/protocol.py +104 -0
gobby/search/tfidf.py +232 -0
gobby/servers/__init__.py +7 -0
gobby/servers/http.py +636 -0
gobby/servers/models.py +31 -0
gobby/servers/routes/__init__.py +23 -0
gobby/servers/routes/admin.py +416 -0
gobby/servers/routes/dependencies.py +118 -0
gobby/servers/routes/mcp/__init__.py +24 -0
gobby/servers/routes/mcp/hooks.py +135 -0
gobby/servers/routes/mcp/plugins.py +121 -0
gobby/servers/routes/mcp/tools.py +1337 -0
gobby/servers/routes/mcp/webhooks.py +159 -0
gobby/servers/routes/sessions.py +582 -0
gobby/servers/websocket.py +766 -0
gobby/sessions/__init__.py +13 -0
gobby/sessions/analyzer.py +322 -0
gobby/sessions/lifecycle.py +240 -0
gobby/sessions/manager.py +563 -0
gobby/sessions/processor.py +225 -0
gobby/sessions/summary.py +532 -0
gobby/sessions/transcripts/__init__.py +41 -0
gobby/sessions/transcripts/base.py +125 -0
gobby/sessions/transcripts/claude.py +386 -0
gobby/sessions/transcripts/codex.py +143 -0
gobby/sessions/transcripts/gemini.py +195 -0
gobby/storage/__init__.py +21 -0
gobby/storage/agents.py +409 -0
gobby/storage/artifact_classifier.py +341 -0
gobby/storage/artifacts.py +285 -0
gobby/storage/compaction.py +67 -0
gobby/storage/database.py +357 -0
gobby/storage/inter_session_messages.py +194 -0
gobby/storage/mcp.py +680 -0
gobby/storage/memories.py +562 -0
gobby/storage/merge_resolutions.py +550 -0
gobby/storage/migrations.py +860 -0
gobby/storage/migrations_legacy.py +1359 -0
gobby/storage/projects.py +166 -0
gobby/storage/session_messages.py +251 -0
gobby/storage/session_tasks.py +97 -0
gobby/storage/sessions.py +817 -0
gobby/storage/task_dependencies.py +223 -0
gobby/storage/tasks/__init__.py +42 -0
gobby/storage/tasks/_aggregates.py +180 -0
gobby/storage/tasks/_crud.py +449 -0
gobby/storage/tasks/_id.py +104 -0
gobby/storage/tasks/_lifecycle.py +311 -0
gobby/storage/tasks/_manager.py +889 -0
gobby/storage/tasks/_models.py +300 -0
gobby/storage/tasks/_ordering.py +119 -0
gobby/storage/tasks/_path_cache.py +110 -0
gobby/storage/tasks/_queries.py +343 -0
gobby/storage/tasks/_search.py +143 -0
gobby/storage/workflow_audit.py +393 -0
gobby/storage/worktrees.py +547 -0
gobby/sync/__init__.py +29 -0
gobby/sync/github.py +333 -0
gobby/sync/linear.py +304 -0
gobby/sync/memories.py +284 -0
gobby/sync/tasks.py +641 -0
gobby/tasks/__init__.py +8 -0
gobby/tasks/build_verification.py +193 -0
gobby/tasks/commits.py +633 -0
gobby/tasks/context.py +747 -0
gobby/tasks/criteria.py +342 -0
gobby/tasks/enhanced_validator.py +226 -0
gobby/tasks/escalation.py +263 -0
gobby/tasks/expansion.py +626 -0
gobby/tasks/external_validator.py +764 -0
gobby/tasks/issue_extraction.py +171 -0
gobby/tasks/prompts/expand.py +327 -0
gobby/tasks/research.py +421 -0
gobby/tasks/tdd.py +352 -0
gobby/tasks/tree_builder.py +263 -0
gobby/tasks/validation.py +712 -0
gobby/tasks/validation_history.py +357 -0
gobby/tasks/validation_models.py +89 -0
gobby/tools/__init__.py +0 -0
gobby/tools/summarizer.py +170 -0
gobby/tui/__init__.py +5 -0
gobby/tui/api_client.py +281 -0
gobby/tui/app.py +327 -0
gobby/tui/screens/__init__.py +25 -0
gobby/tui/screens/agents.py +333 -0
gobby/tui/screens/chat.py +450 -0
gobby/tui/screens/dashboard.py +377 -0
gobby/tui/screens/memory.py +305 -0
gobby/tui/screens/metrics.py +231 -0
gobby/tui/screens/orchestrator.py +904 -0
gobby/tui/screens/sessions.py +412 -0
gobby/tui/screens/tasks.py +442 -0
gobby/tui/screens/workflows.py +289 -0
gobby/tui/screens/worktrees.py +174 -0
gobby/tui/widgets/__init__.py +21 -0
gobby/tui/widgets/chat.py +210 -0
gobby/tui/widgets/conductor.py +104 -0
gobby/tui/widgets/menu.py +132 -0
gobby/tui/widgets/message_panel.py +160 -0
gobby/tui/widgets/review_gate.py +224 -0
gobby/tui/widgets/task_tree.py +99 -0
gobby/tui/widgets/token_budget.py +166 -0
gobby/tui/ws_client.py +258 -0
gobby/utils/__init__.py +3 -0
gobby/utils/daemon_client.py +235 -0
gobby/utils/git.py +222 -0
gobby/utils/id.py +38 -0
gobby/utils/json_helpers.py +161 -0
gobby/utils/logging.py +376 -0
gobby/utils/machine_id.py +135 -0
gobby/utils/metrics.py +589 -0
gobby/utils/project_context.py +182 -0
gobby/utils/project_init.py +263 -0
gobby/utils/status.py +256 -0
gobby/utils/validation.py +80 -0
gobby/utils/version.py +23 -0
gobby/workflows/__init__.py +4 -0
gobby/workflows/actions.py +1310 -0
gobby/workflows/approval_flow.py +138 -0
gobby/workflows/artifact_actions.py +103 -0
gobby/workflows/audit_helpers.py +110 -0
gobby/workflows/autonomous_actions.py +286 -0
gobby/workflows/context_actions.py +394 -0
gobby/workflows/definitions.py +130 -0
gobby/workflows/detection_helpers.py +208 -0
gobby/workflows/engine.py +485 -0
gobby/workflows/evaluator.py +669 -0
gobby/workflows/git_utils.py +96 -0
gobby/workflows/hooks.py +169 -0
gobby/workflows/lifecycle_evaluator.py +613 -0
gobby/workflows/llm_actions.py +70 -0
gobby/workflows/loader.py +333 -0
gobby/workflows/mcp_actions.py +60 -0
gobby/workflows/memory_actions.py +272 -0
gobby/workflows/premature_stop.py +164 -0
gobby/workflows/session_actions.py +139 -0
gobby/workflows/state_actions.py +123 -0
gobby/workflows/state_manager.py +104 -0
gobby/workflows/stop_signal_actions.py +163 -0
gobby/workflows/summary_actions.py +344 -0
gobby/workflows/task_actions.py +249 -0
gobby/workflows/task_enforcement_actions.py +901 -0
gobby/workflows/templates.py +52 -0
gobby/workflows/todo_actions.py +84 -0
gobby/workflows/webhook.py +223 -0
gobby/workflows/webhook_executor.py +399 -0
gobby/worktrees/__init__.py +5 -0
gobby/worktrees/git.py +690 -0
gobby/worktrees/merge/__init__.py +20 -0
gobby/worktrees/merge/conflict_parser.py +177 -0
gobby/worktrees/merge/resolver.py +485 -0
gobby-0.2.5.dist-info/METADATA +351 -0
gobby-0.2.5.dist-info/RECORD +383 -0
gobby-0.2.5.dist-info/WHEEL +5 -0
gobby-0.2.5.dist-info/entry_points.txt +2 -0
gobby-0.2.5.dist-info/licenses/LICENSE.md +193 -0
gobby-0.2.5.dist-info/top_level.txt +1 -0

gobby/mcp_proxy/tools/orchestration/review.py ADDED Viewed

@@ -0,0 +1,736 @@
+"""Task orchestration tools: review (spawn_review_agent, process_completed_agents)."""
+from __future__ import annotations
+import logging
+from typing import TYPE_CHECKING, Any, Literal
+from gobby.mcp_proxy.tools.internal import InternalToolRegistry
+from gobby.storage.tasks import TaskNotFoundError
+from .utils import get_current_project_id
+if TYPE_CHECKING:
+    from gobby.agents.runner import AgentRunner
+    from gobby.storage.tasks import LocalTaskManager
+    from gobby.storage.worktrees import LocalWorktreeManager
+logger = logging.getLogger(__name__)
+def register_reviewer(
+    registry: InternalToolRegistry,
+    task_manager: LocalTaskManager,
+    worktree_storage: LocalWorktreeManager,
+    agent_runner: AgentRunner | None = None,
+    default_project_id: str | None = None,
+) -> None:
+    """Register review tools."""
+    from gobby.mcp_proxy.tools.tasks import resolve_task_id_for_mcp
+    async def spawn_review_agent(
+        task_id: str,
+        review_provider: Literal["claude", "gemini", "codex", "antigravity"] = "claude",
+        review_model: str | None = "claude-opus-4-5",
+        terminal: str = "auto",
+        mode: str = "terminal",
+        parent_session_id: str | None = None,
+        project_path: str | None = None,
+    ) -> dict[str, Any]:
+        """
+        Spawn a review agent for a completed task.
+        Used by the auto-orchestrator workflow's review step to validate
+        completed work before merging/cleanup.
+        Args:
+            task_id: Task reference: #N, N (seq_num), path (1.2.3), or UUID
+            review_provider: LLM provider for review (default: claude)
+            review_model: Model for review (default: claude-opus-4-5 for thorough analysis)
+            terminal: Terminal for terminal mode (default: auto)
+            mode: Execution mode (terminal, embedded, headless)
+            parent_session_id: Parent session ID for context (required)
+            project_path: Path to project directory
+        Returns:
+            Dict with:
+            - success: bool
+            - agent_id: ID of spawned review agent
+            - session_id: Child session ID
+            - error: Optional error message
+        """
+        # Validate mode and review_provider
+        allowed_modes = {"terminal", "embedded", "headless"}
+        allowed_providers = {"claude", "gemini", "codex", "antigravity"}
+        mode_lower = mode.lower() if mode else "terminal"
+        if mode_lower not in allowed_modes:
+            return {
+                "success": False,
+                "error": f"Invalid mode '{mode}'. Must be one of: {sorted(allowed_modes)}",
+            }
+        mode = mode_lower  # Use normalized value
+        if review_provider not in allowed_providers:
+            return {
+                "success": False,
+                "error": f"Invalid review_provider '{review_provider}'. Must be one of: {sorted(allowed_providers)}",
+            }
+        # Resolve task_id reference
+        try:
+            resolved_task_id = resolve_task_id_for_mcp(task_manager, task_id)
+        except (TaskNotFoundError, ValueError) as e:
+            return {
+                "success": False,
+                "error": f"Invalid task_id: {e}",
+            }
+        if agent_runner is None:
+            return {
+                "success": False,
+                "error": "Agent runner not configured. Cannot spawn review agent.",
+            }
+        if parent_session_id is None:
+            return {
+                "success": False,
+                "error": "parent_session_id is required for spawning review agent",
+            }
+        # Resolve project ID
+        resolved_project_id = default_project_id
+        if project_path:
+            from pathlib import Path
+            from gobby.utils.project_context import get_project_context
+            ctx = get_project_context(Path(project_path))
+            if ctx:
+                resolved_project_id = ctx.get("id")
+        if not resolved_project_id:
+            resolved_project_id = get_current_project_id()
+        if not resolved_project_id:
+            return {
+                "success": False,
+                "error": "Could not resolve project ID",
+            }
+        # Get the task
+        try:
+            task = task_manager.get_task(resolved_task_id)
+        except ValueError as e:
+            return {
+                "success": False,
+                "error": f"Task {task_id} not found: {e}",
+            }
+        if not task:
+            return {
+                "success": False,
+                "error": f"Task {task_id} not found",
+            }
+        # Get worktree for the task
+        worktree = worktree_storage.get_by_task(resolved_task_id)
+        if not worktree:
+            return {
+                "success": False,
+                "error": f"No worktree found for task {resolved_task_id}",
+            }
+        # Build review prompt
+        review_prompt = _build_review_prompt(task, worktree)
+        # Check spawn depth
+        can_spawn, reason, _depth = agent_runner.can_spawn(parent_session_id)
+        if not can_spawn:
+            return {
+                "success": False,
+                "error": reason,
+            }
+        # Prepare agent run
+        from gobby.agents.runner import AgentConfig
+        from gobby.llm.executor import AgentResult
+        from gobby.utils.machine_id import get_machine_id
+        machine_id = get_machine_id()
+        config = AgentConfig(
+            prompt=review_prompt,
+            parent_session_id=parent_session_id,
+            project_id=resolved_project_id,
+            machine_id=machine_id,
+            source=review_provider,
+            workflow=None,  # Review doesn't need a workflow
+            task=resolved_task_id,
+            session_context="summary_markdown",
+            mode=mode,
+            terminal=terminal,
+            worktree_id=worktree.id,
+            provider=review_provider,
+            model=review_model,
+            max_turns=20,  # Reviews should be shorter
+            timeout=300.0,  # 5 minutes
+            project_path=worktree.worktree_path,
+        )
+        prepare_result = agent_runner.prepare_run(config)
+        if isinstance(prepare_result, AgentResult):
+            return {
+                "success": False,
+                "error": prepare_result.error or "Failed to prepare review agent run",
+            }
+        context = prepare_result
+        if context.session is None or context.run is None:
+            return {
+                "success": False,
+                "error": "Internal error: context missing session or run",
+            }
+        child_session = context.session
+        agent_run = context.run
+        # Spawn the review agent
+        if mode == "terminal":
+            from gobby.agents.spawn import TerminalSpawner
+            spawner = TerminalSpawner()
+            spawn_result = spawner.spawn_agent(
+                cli=review_provider,
+                cwd=worktree.worktree_path,
+                session_id=child_session.id,
+                parent_session_id=parent_session_id,
+                agent_run_id=agent_run.id,
+                project_id=resolved_project_id,
+                workflow_name=None,
+                agent_depth=child_session.agent_depth,
+                max_agent_depth=agent_runner._child_session_manager.max_agent_depth,
+                terminal=terminal,
+                prompt=review_prompt,
+            )
+            if not spawn_result.success:
+                return {
+                    "success": False,
+                    "error": spawn_result.error or "Terminal spawn failed",
+                }
+            return {
+                "success": True,
+                "task_id": resolved_task_id,
+                "agent_id": agent_run.id,
+                "session_id": child_session.id,
+                "worktree_id": worktree.id,
+                "terminal_type": spawn_result.terminal_type,
+                "pid": spawn_result.pid,
+                "provider": review_provider,
+                "model": review_model,
+            }
+        elif mode == "embedded":
+            from gobby.agents.spawn import EmbeddedSpawner
+            embedded_spawner = EmbeddedSpawner()
+            embedded_result = embedded_spawner.spawn_agent(
+                cli=review_provider,
+                cwd=worktree.worktree_path,
+                session_id=child_session.id,
+                parent_session_id=parent_session_id,
+                agent_run_id=agent_run.id,
+                project_id=resolved_project_id,
+                workflow_name=None,
+                agent_depth=child_session.agent_depth,
+                max_agent_depth=agent_runner._child_session_manager.max_agent_depth,
+                prompt=review_prompt,
+            )
+            if not embedded_result.success:
+                return {
+                    "success": False,
+                    "error": embedded_result.error or "Embedded spawn failed",
+                }
+            return {
+                "success": True,
+                "task_id": resolved_task_id,
+                "agent_id": agent_run.id,
+                "session_id": child_session.id,
+                "worktree_id": worktree.id,
+                "provider": review_provider,
+                "model": review_model,
+            }
+        else:  # headless
+            from gobby.agents.spawn import HeadlessSpawner
+            headless_spawner = HeadlessSpawner()
+            headless_result = headless_spawner.spawn_agent(
+                cli=review_provider,
+                cwd=worktree.worktree_path,
+                session_id=child_session.id,
+                parent_session_id=parent_session_id,
+                agent_run_id=agent_run.id,
+                project_id=resolved_project_id,
+                workflow_name=None,
+                agent_depth=child_session.agent_depth,
+                max_agent_depth=agent_runner._child_session_manager.max_agent_depth,
+                prompt=review_prompt,
+            )
+            if not headless_result.success:
+                return {
+                    "success": False,
+                    "error": headless_result.error or "Headless spawn failed",
+                }
+            return {
+                "success": True,
+                "task_id": resolved_task_id,
+                "agent_id": agent_run.id,
+                "session_id": child_session.id,
+                "worktree_id": worktree.id,
+                "pid": headless_result.pid,
+                "provider": review_provider,
+                "model": review_model,
+            }
+    registry.register(
+        name="spawn_review_agent",
+        description=(
+            "Spawn a review agent for a completed task. "
+            "Used by auto-orchestrator workflow for code review. "
+            "Uses review_provider/review_model for thorough analysis."
+        ),
+        input_schema={
+            "type": "object",
+            "properties": {
+                "task_id": {
+                    "type": "string",
+                    "description": "Task reference: #N, N (seq_num), path (1.2.3), or UUID",
+                },
+                "review_provider": {
+                    "type": "string",
+                    "description": "LLM provider for review (claude, gemini, codex, antigravity)",
+                    "default": "claude",
+                },
+                "review_model": {
+                    "type": "string",
+                    "description": "Model for review (default: claude-opus-4-5 for thorough analysis)",
+                    "default": "claude-opus-4-5",
+                },
+                "terminal": {
+                    "type": "string",
+                    "description": "Terminal for terminal mode (auto, ghostty, iterm2, etc.)",
+                    "default": "auto",
+                },
+                "mode": {
+                    "type": "string",
+                    "description": "Execution mode (terminal, embedded, headless)",
+                    "default": "terminal",
+                },
+                "parent_session_id": {
+                    "type": "string",
+                    "description": "Parent session ID for context (required)",
+                },
+                "project_path": {
+                    "type": ["string", "null"],
+                    "description": "Path to project directory",
+                    "default": None,
+                },
+            },
+            "required": ["task_id", "parent_session_id"],
+        },
+        func=spawn_review_agent,
+    )
+    async def process_completed_agents(
+        parent_session_id: str,
+        spawn_reviews: bool = True,
+        review_provider: Literal["claude", "gemini", "codex", "antigravity"] | None = None,
+        review_model: str | None = None,
+        terminal: str = "auto",
+        mode: str = "terminal",
+        project_path: str | None = None,
+    ) -> dict[str, Any]:
+        """
+        Process completed agents and route them to review or cleanup.
+        Takes agents from completed_agents list and either:
+        - Spawns review agents for validation (if spawn_reviews=True)
+        - Moves directly to reviewed_agents list (if already validated)
+        For failed agents, optionally retries or escalates.
+        Args:
+            parent_session_id: Parent session ID (orchestrator session)
+            spawn_reviews: Whether to spawn review agents for completed tasks
+            review_provider: LLM provider for reviews (uses workflow variable if not set)
+            review_model: Model for reviews (uses workflow variable if not set)
+            terminal: Terminal for terminal mode
+            mode: Execution mode for review agents
+            project_path: Path to project directory
+        Returns:
+            Dict with:
+            - reviews_spawned: List of review agents spawned
+            - ready_for_cleanup: List of agents ready for worktree cleanup
+            - retries_scheduled: List of failed agents scheduled for retry
+            - escalated: List of agents escalated for manual intervention
+        """
+        if agent_runner is None:
+            return {
+                "success": False,
+                "error": "Agent runner not configured",
+            }
+        # Get workflow state
+        from gobby.workflows.state_manager import WorkflowStateManager
+        state_manager = WorkflowStateManager(task_manager.db)
+        state = state_manager.get_state(parent_session_id)
+        if not state:
+            return {
+                "success": True,
+                "reviews_spawned": [],
+                "ready_for_cleanup": [],
+                "retries_scheduled": [],
+                "escalated": [],
+                "message": "No workflow state found",
+            }
+        workflow_vars = state.variables
+        # Defensive type coercion - ensure lists of dicts, handle None/wrong types
+        def _safe_list_of_dicts(val: Any) -> list[dict[str, Any]]:
+            """Coerce value to list of dicts, filtering out non-dict entries."""
+            if not val:
+                return []
+            if not isinstance(val, list):
+                return []
+            return [x for x in val if isinstance(x, dict)]
+        completed_agents = _safe_list_of_dicts(workflow_vars.get("completed_agents"))
+        failed_agents = _safe_list_of_dicts(workflow_vars.get("failed_agents"))
+        # Create a fresh list for newly reviewed agents to avoid aliasing the stored list
+        newly_reviewed: list[dict[str, Any]] = []
+        # Shallow copy to avoid aliasing
+        review_agents_spawned = list(
+            _safe_list_of_dicts(workflow_vars.get("review_agents_spawned"))
+        )
+        # Resolve review provider from workflow vars or parameters
+        effective_review_provider = (
+            review_provider or workflow_vars.get("review_provider") or "claude"
+        )
+        effective_review_model = (
+            review_model or workflow_vars.get("review_model") or "claude-opus-4-5"
+        )
+        reviews_spawned: list[dict[str, Any]] = []
+        ready_for_cleanup: list[dict[str, Any]] = []
+        retries_scheduled: list[dict[str, Any]] = []
+        escalated: list[dict[str, Any]] = []
+        # Process completed agents
+        still_pending_review: list[dict[str, Any]] = []
+        for agent_info in completed_agents:
+            task_id = agent_info.get("task_id")
+            if not task_id:
+                # Invalid agent info
+                escalated.append(
+                    {
+                        **agent_info,
+                        "escalation_reason": "Missing task_id",
+                    }
+                )
+                continue
+            # Check task validation status
+            try:
+                task = task_manager.get_task(task_id)
+            except ValueError as e:
+                escalated.append(
+                    {
+                        **agent_info,
+                        "escalation_reason": f"Task lookup failed: {e}",
+                    }
+                )
+                continue
+            if not task:
+                escalated.append(
+                    {
+                        **agent_info,
+                        "escalation_reason": "Task not found",
+                    }
+                )
+                continue
+            # Check if task is already validated (passed validation)
+            if task.validation_status == "valid":
+                # Ready for cleanup
+                ready_for_cleanup.append(
+                    {
+                        **agent_info,
+                        "validation_status": "valid",
+                    }
+                )
+                newly_reviewed.append(agent_info)
+                continue
+            # Check if task validation failed - may need retry
+            if task.validation_status == "invalid":
+                # Check failure count
+                fail_count = task.validation_fail_count or 0
+                max_retries = 3
+                if fail_count >= max_retries:
+                    # Escalate - too many failures
+                    escalated.append(
+                        {
+                            **agent_info,
+                            "escalation_reason": f"Validation failed {fail_count} times",
+                            "validation_feedback": task.validation_feedback,
+                        }
+                    )
+                else:
+                    # Retry - reopen task and add back to queue
+                    try:
+                        task_manager.reopen_task(task_id, reason="Validation failed, retrying")
+                        retries_scheduled.append(
+                            {
+                                **agent_info,
+                                "retry_count": fail_count + 1,
+                            }
+                        )
+                    except Exception as e:
+                        escalated.append(
+                            {
+                                **agent_info,
+                                "escalation_reason": f"Failed to reopen task: {e}",
+                            }
+                        )
+                continue
+            # Task needs review - spawn review agent if enabled
+            if spawn_reviews:
+                # Check if review agent already spawned for this task
+                already_spawned = any(ra.get("task_id") == task_id for ra in review_agents_spawned)
+                if already_spawned:
+                    # Keep in pending review list
+                    still_pending_review.append(agent_info)
+                    continue
+                # Spawn review agent
+                review_result = await spawn_review_agent(
+                    task_id=task_id,
+                    review_provider=effective_review_provider,
+                    review_model=effective_review_model,
+                    terminal=terminal,
+                    mode=mode,
+                    parent_session_id=parent_session_id,
+                    project_path=project_path,
+                )
+                if review_result.get("success"):
+                    reviews_spawned.append(
+                        {
+                            "task_id": task_id,
+                            "agent_id": review_result.get("agent_id"),
+                            "session_id": review_result.get("session_id"),
+                            "worktree_id": review_result.get("worktree_id"),
+                        }
+                    )
+                    review_agents_spawned.append(
+                        {
+                            "task_id": task_id,
+                            "agent_id": review_result.get("agent_id"),
+                        }
+                    )
+                    # Keep agent in completed list until review completes
+                    still_pending_review.append(agent_info)
+                else:
+                    # Review spawn failed - escalate
+                    escalated.append(
+                        {
+                            **agent_info,
+                            "escalation_reason": f"Review spawn failed: {review_result.get('error')}",
+                        }
+                    )
+            else:
+                # Not spawning reviews - move to ready_for_cleanup
+                ready_for_cleanup.append(
+                    {
+                        **agent_info,
+                        "skipped_review": True,
+                    }
+                )
+                newly_reviewed.append(agent_info)
+        # Process failed agents
+        still_failed: list[dict[str, Any]] = []
+        for agent_info in failed_agents:
+            task_id = agent_info.get("task_id")
+            failure_reason = agent_info.get("failure_reason") or "Unknown"
+            # Check if this is a retriable failure
+            if "crashed" in failure_reason.lower() or "exited" in failure_reason.lower():
+                # Potentially retriable - reopen task
+                if task_id:
+                    retry_task: Any = None
+                    try:
+                        retry_task = task_manager.get_task(task_id)
+                    except ValueError:
+                        # Task was deleted concurrently - skip
+                        pass
+                    if retry_task and retry_task.status == "in_progress":
+                        # Reopen for retry
+                        try:
+                            task_manager.update_task(task_id, status="open")
+                            retries_scheduled.append(
+                                {
+                                    **agent_info,
+                                    "retry_reason": "Agent crashed, reopened task",
+                                }
+                            )
+                            continue
+                        except Exception as e:
+                            # Task update failed - keep in still_failed for next cycle
+                            still_failed.append(
+                                {
+                                    **agent_info,
+                                    "pending_retry": True,
+                                    "retry_error": str(e),
+                                }
+                            )
+                            continue
+            # Non-retriable - escalate
+            escalated.append(
+                {
+                    **agent_info,
+                    "escalation_reason": failure_reason,
+                }
+            )
+        # Update workflow state
+        try:
+            state = state_manager.get_state(parent_session_id)
+            if state:
+                # Update completed_agents to only include pending review
+                state.variables["completed_agents"] = still_pending_review
+                # Update reviewed_agents - copy existing to avoid aliasing, then extend
+                existing_reviewed = list(state.variables.get("reviewed_agents", []))
+                existing_reviewed.extend(newly_reviewed)
+                state.variables["reviewed_agents"] = existing_reviewed
+                # Update review_agents_spawned
+                state.variables["review_agents_spawned"] = review_agents_spawned
+                # Update failed_agents
+                state.variables["failed_agents"] = still_failed
+                # Track escalated agents
+                existing_escalated = list(state.variables.get("escalated_agents", []))
+                existing_escalated.extend(escalated)
+                state.variables["escalated_agents"] = existing_escalated
+                state_manager.save_state(state)
+        except Exception as e:
+            logger.warning(f"Failed to update workflow state during processing: {e}")
+        return {
+            "success": True,
+            "reviews_spawned": reviews_spawned,
+            "ready_for_cleanup": ready_for_cleanup,
+            "retries_scheduled": retries_scheduled,
+            "escalated": escalated,
+            "summary": {
+                "reviews_spawned": len(reviews_spawned),
+                "ready_for_cleanup": len(ready_for_cleanup),
+                "retries_scheduled": len(retries_scheduled),
+                "escalated": len(escalated),
+                "pending_review": len(still_pending_review),
+            },
+        }
+    registry.register(
+        name="process_completed_agents",
+        description=(
+            "Process completed agents and route to review or cleanup. "
+            "Spawns review agents for validation, handles retries for failures, "
+            "escalates unrecoverable errors. Used by auto-orchestrator review step."
+        ),
+        input_schema={
+            "type": "object",
+            "properties": {
+                "parent_session_id": {
+                    "type": "string",
+                    "description": "Parent session ID (orchestrator session)",
+                },
+                "spawn_reviews": {
+                    "type": "boolean",
+                    "description": "Whether to spawn review agents for completed tasks",
+                    "default": True,
+                },
+                "review_provider": {
+                    "type": ["string", "null"],
+                    "description": "LLM provider for reviews (uses workflow variable if not set)",
+                    "default": None,
+                },
+                "review_model": {
+                    "type": ["string", "null"],
+                    "description": "Model for reviews (uses workflow variable if not set)",
+                    "default": None,
+                },
+                "terminal": {
+                    "type": "string",
+                    "description": "Terminal for terminal mode",
+                    "default": "auto",
+                },
+                "mode": {
+                    "type": "string",
+                    "description": "Execution mode for review agents",
+                    "default": "terminal",
+                },
+                "project_path": {
+                    "type": ["string", "null"],
+                    "description": "Path to project directory",
+                    "default": None,
+                },
+            },
+            "required": ["parent_session_id"],
+        },
+        func=process_completed_agents,
+    )
+def _build_review_prompt(task: Any, worktree: Any) -> str:
+    """Build a review prompt for a completed task."""
+    prompt_parts = [
+        "# Code Review Request",
+        f"\n## Task: {task.title}",
+        f"Task ID: {task.id}",
+        f"Branch: {worktree.branch_name}",
+    ]
+    if task.description:
+        prompt_parts.append(f"\n## Task Description\n{task.description}")
+    if task.validation_criteria:
+        prompt_parts.append(f"\n## Validation Criteria\n{task.validation_criteria}")
+    prompt_parts.append(
+        "\n## Review Instructions\n"
+        "1. Review the code changes on this branch\n"
+        "2. Check that the implementation matches the task description\n"
+        "3. Verify tests exist and pass (if applicable)\n"
+        "4. Check for code quality, security issues, and best practices\n"
+        "5. Use validate_task() to mark as valid/invalid with feedback\n"
+        "6. If valid, the task can proceed to merge\n"
+        "7. If invalid, provide clear feedback for the implementer"
+    )
+    return "\n".join(prompt_parts)