npm - pi-crew - Versions diffs - 0.2.2 → 0.2.4 - Mend

pi-crew 0.2.2 → 0.2.4

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (354) hide show

package/AGENTS.md +57 -32
package/CHANGELOG.md +466 -413
package/LICENSE +21 -21
package/NOTICE.md +16 -16
package/README.md +323 -323
package/docs/FEATURE_INTAKE.md +126 -0
package/docs/HARNESS.md +86 -0
package/docs/HARNESS_BACKLOG.md +41 -0
package/docs/TEST_MATRIX.md +49 -0
package/docs/actions-reference.md +595 -595
package/docs/architecture.md +180 -180
package/docs/code-review-2026-05-11.md +592 -0
package/docs/commands-reference.md +347 -347
package/docs/comparison-pi-subagents-vs-pi-crew.md +303 -0
package/docs/decisions/0001-durable-state.md +41 -0
package/docs/decisions/0002-child-process-for-async.md +42 -0
package/docs/decisions/0003-depth-guard.md +36 -0
package/docs/decisions/0004-execfile-over-exec.md +34 -0
package/docs/decisions/0005-no-parameter-properties.md +49 -0
package/docs/decisions/0006-publish-bundled-esm.md +63 -0
package/docs/decisions/0007-active-run-binary-index.md +54 -0
package/docs/decisions/0008-child-pi-warm-pool.md +61 -0
package/docs/decisions/README.md +23 -0
package/docs/followup-plan-2026-05-12.md +463 -0
package/docs/followup-review-2026-05-12.md +297 -0
package/docs/followup-review-round3-2026-05-12.md +342 -0
package/docs/followup-review-round4-2026-05-13.md +107 -0
package/docs/implementation-plan-top3.md +333 -0
package/docs/live-mailbox-runtime.md +36 -36
package/docs/next-upgrade-roadmap.md +808 -808
package/docs/oh-my-pi-research.md +509 -0
package/docs/perf/baseline-2026-05.md +113 -0
package/docs/perf/final-report-2026-05.md +206 -0
package/docs/perf/sprint-1-report.md +71 -0
package/docs/perf/sprint-2-report.md +81 -0
package/docs/perf/sprint-2.5-report.md +53 -0
package/docs/perf/sprint-3-report.md +36 -0
package/docs/perf/sprint-4-report.md +47 -0
package/docs/perf/sprint-5-report.md +51 -0
package/docs/perf/sprint-6-report.md +94 -0
package/docs/perf/sprint-7-report.md +74 -0
package/docs/perf/upgrade-plan-2026-05.md +147 -0
package/docs/pi-subagents3-deep-analysis.md +508 -0
package/docs/product/README.md +31 -0
package/docs/product/platform.md +27 -0
package/docs/product/runtime-safety.md +37 -0
package/docs/product/team-run.md +39 -0
package/docs/product/team-tool.md +37 -0
package/docs/publishing.md +65 -65
package/docs/resource-formats.md +134 -134
package/docs/runtime-analysis-child-vs-live.md +171 -0
package/docs/runtime-flow.md +148 -148
package/docs/runtime-migration-in-process-analysis.md +250 -0
package/docs/stories/README.md +30 -0
package/docs/stories/backlog.md +36 -0
package/docs/templates/decision.md +27 -0
package/docs/templates/story.md +44 -0
package/docs/templates/validation-report.md +32 -0
package/docs/usage.md +238 -238
package/index.ts +7 -6
package/install.mjs +65 -65
package/package.json +107 -99
package/schema.json +222 -222
package/skills/child-pi-spawning/SKILL.md +213 -0
package/skills/context-artifact-hygiene/SKILL.md +32 -0
package/skills/event-log-tracing/SKILL.md +299 -0
package/skills/git-master/SKILL.md +225 -24
package/skills/live-agent-lifecycle/SKILL.md +192 -0
package/skills/mailbox-interactive/SKILL.md +300 -19
package/skills/model-routing-context/SKILL.md +94 -0
package/skills/multi-perspective-review/SKILL.md +88 -0
package/skills/read-only-explorer/SKILL.md +250 -26
package/skills/safe-bash/SKILL.md +307 -21
package/skills/verification-before-done/SKILL.md +11 -2
package/skills/widget-rendering/SKILL.md +258 -0
package/skills/workspace-isolation/SKILL.md +202 -0
package/skills/worktree-isolation/SKILL.md +202 -18
package/src/adapters/claude-adapter.ts +25 -25
package/src/adapters/codex-adapter.ts +21 -21
package/src/adapters/cursor-adapter.ts +17 -17
package/src/adapters/export-util.ts +137 -137
package/src/adapters/index.ts +15 -15
package/src/adapters/registry.ts +18 -18
package/src/adapters/types.ts +23 -23
package/src/agents/agent-config.ts +38 -38
package/src/agents/agent-serializer.ts +38 -38
package/src/agents/discover-agents.ts +121 -118
package/src/config/config.ts +740 -858
package/src/config/defaults.ts +96 -96
package/src/config/drift-detector.ts +211 -211
package/src/config/markers.ts +327 -327
package/src/config/resilient-parser.ts +109 -108
package/src/config/suggestions.ts +74 -74
package/src/config/types.ts +199 -0
package/src/extension/async-notifier.ts +123 -89
package/src/extension/autonomous-policy.ts +169 -169
package/src/extension/cross-extension-rpc.ts +104 -103
package/src/extension/help.ts +47 -47
package/src/extension/import-index.ts +69 -69
package/src/extension/management.ts +395 -382
package/src/extension/notification-router.ts +116 -116
package/src/extension/notification-sink.ts +51 -51
package/src/extension/project-init.ts +168 -168
package/src/extension/register.ts +859 -668
package/src/extension/registration/artifact-cleanup.ts +15 -15
package/src/extension/registration/command-utils.ts +54 -54
package/src/extension/registration/commands.ts +559 -452
package/src/extension/registration/compaction-guard.ts +125 -125
package/src/extension/registration/subagent-helpers.ts +102 -102
package/src/extension/registration/subagent-tools.ts +220 -158
package/src/extension/registration/team-tool.ts +159 -98
package/src/extension/registration/viewers.ts +29 -0
package/src/extension/result-watcher.ts +128 -128
package/src/extension/run-bundle-schema.ts +89 -89
package/src/extension/run-export.ts +73 -73
package/src/extension/run-import.ts +84 -84
package/src/extension/run-index.ts +94 -94
package/src/extension/run-maintenance.ts +142 -142
package/src/extension/session-summary.ts +8 -8
package/src/extension/team-manager-command.ts +96 -95
package/src/extension/team-recommendation.ts +188 -188
package/src/extension/team-tool/api.ts +5 -2
package/src/extension/team-tool/cancel.ts +224 -209
package/src/extension/team-tool/config-patch.ts +36 -36
package/src/extension/team-tool/context.ts +60 -60
package/src/extension/team-tool/doctor.ts +242 -242
package/src/extension/team-tool/handle-settings.ts +421 -195
package/src/extension/team-tool/inspect.ts +41 -41
package/src/extension/team-tool/lifecycle-actions.ts +139 -139
package/src/extension/team-tool/parallel-dispatch.ts +156 -156
package/src/extension/team-tool/plan.ts +19 -19
package/src/extension/team-tool/respond.ts +112 -111
package/src/extension/team-tool/run.ts +246 -228
package/src/extension/team-tool/status.ts +110 -110
package/src/extension/team-tool-types.ts +13 -13
package/src/extension/team-tool.ts +16 -4
package/src/extension/tool-result.ts +16 -16
package/src/extension/validate-resources.ts +77 -77
package/src/hooks/registry.ts +61 -61
package/src/hooks/types.ts +40 -40
package/src/i18n.ts +184 -184
package/src/observability/correlation.ts +35 -35
package/src/observability/event-to-metric.ts +68 -68
package/src/observability/exporters/adapter.ts +30 -30
package/src/observability/exporters/otlp-exporter.ts +106 -92
package/src/observability/exporters/prometheus-exporter.ts +54 -54
package/src/observability/metric-registry.ts +87 -87
package/src/observability/metric-retention.ts +54 -54
package/src/observability/metric-sink.ts +81 -56
package/src/observability/metrics-primitives.ts +167 -167
package/src/prompt/prompt-runtime.ts +72 -72
package/src/runtime/adaptive-plan.ts +338 -0
package/src/runtime/agent-control.ts +169 -169
package/src/runtime/agent-memory.ts +72 -72
package/src/runtime/agent-observability.ts +114 -114
package/src/runtime/async-marker.ts +26 -26
package/src/runtime/async-runner.ts +153 -79
package/src/runtime/attention-events.ts +28 -28
package/src/runtime/auto-resume.ts +100 -100
package/src/runtime/background-runner.ts +122 -88
package/src/runtime/cancellation.ts +61 -61
package/src/runtime/capability-inventory.ts +116 -116
package/src/runtime/child-pi-pool.ts +68 -0
package/src/runtime/child-pi.ts +541 -463
package/src/runtime/code-summary.ts +247 -247
package/src/runtime/compaction-summary.ts +271 -271
package/src/runtime/concurrency.ts +58 -58
package/src/runtime/crash-recovery.ts +317 -301
package/src/runtime/crew-agent-records.ts +379 -281
package/src/runtime/crew-agent-runtime.ts +60 -60
package/src/runtime/cross-extension-rpc.ts +72 -0
package/src/runtime/custom-tools/irc-tool.ts +201 -201
package/src/runtime/custom-tools/submit-result-tool.ts +90 -90
package/src/runtime/deadletter.ts +47 -47
package/src/runtime/delivery-coordinator.ts +176 -176
package/src/runtime/delta-conflict.ts +360 -360
package/src/runtime/diagnostic-export.ts +102 -102
package/src/runtime/direct-run.ts +35 -35
package/src/runtime/effectiveness.ts +82 -81
package/src/runtime/errors/crew-errors.ts +166 -0
package/src/runtime/event-stream-bridge.ts +92 -92
package/src/runtime/foreground-control.ts +82 -82
package/src/runtime/green-contract.ts +46 -46
package/src/runtime/group-join.ts +234 -106
package/src/runtime/heartbeat-watcher.ts +145 -124
package/src/runtime/iteration-hooks.ts +267 -264
package/src/runtime/live-agent-control.ts +88 -88
package/src/runtime/live-agent-manager.ts +377 -179
package/src/runtime/live-control-realtime.ts +36 -36
package/src/runtime/live-session-runtime.ts +676 -599
package/src/runtime/loop-gates.ts +129 -129
package/src/runtime/manifest-cache.ts +263 -263
package/src/runtime/mcp-proxy.ts +113 -113
package/src/runtime/metric-parser.ts +40 -40
package/src/runtime/model-fallback.ts +282 -274
package/src/runtime/model-resolver.ts +118 -0
package/src/runtime/output-validator.ts +187 -187
package/src/runtime/overflow-recovery.ts +175 -175
package/src/runtime/parallel-research.ts +44 -44
package/src/runtime/parallel-utils.ts +156 -156
package/src/runtime/parent-guard.ts +80 -80
package/src/runtime/phase-progress.ts +217 -217
package/src/runtime/pi-args.ts +165 -165
package/src/runtime/pi-json-output.ts +111 -111
package/src/runtime/pi-spawn.ts +167 -167
package/src/runtime/policy-engine.ts +79 -79
package/src/runtime/post-checks.ts +125 -122
package/src/runtime/post-exit-stdio-guard.ts +86 -86
package/src/runtime/process-status.ts +97 -73
package/src/runtime/progress-event-coalescer.ts +43 -43
package/src/runtime/recovery-recipes.ts +74 -74
package/src/runtime/retry-executor.ts +81 -81
package/src/runtime/role-permission.ts +39 -39
package/src/runtime/run-tracker.ts +99 -0
package/src/runtime/runtime-policy.ts +21 -0
package/src/runtime/runtime-resolver.ts +94 -90
package/src/runtime/scheduler.ts +294 -0
package/src/runtime/semaphore.ts +131 -131
package/src/runtime/sensitive-paths.ts +92 -92
package/src/runtime/session-usage.ts +79 -79
package/src/runtime/settings-store.ts +103 -0
package/src/runtime/sidechain-output.ts +29 -29
package/src/runtime/skill-instructions.ts +222 -222
package/src/runtime/stale-reconciler.ts +198 -189
package/src/runtime/streaming-output.ts +47 -0
package/src/runtime/subagent-manager.ts +404 -395
package/src/runtime/subprocess-tool-registry.ts +67 -67
package/src/runtime/task-display.ts +38 -38
package/src/runtime/task-graph-scheduler.ts +122 -122
package/src/runtime/task-graph.ts +207 -207
package/src/runtime/task-output-context.ts +177 -177
package/src/runtime/task-packet.ts +93 -93
package/src/runtime/task-quality.ts +207 -207
package/src/runtime/task-runner/capabilities.ts +78 -78
package/src/runtime/task-runner/live-executor.ts +131 -113
package/src/runtime/task-runner/progress.ts +119 -119
package/src/runtime/task-runner/prompt-builder.ts +139 -139
package/src/runtime/task-runner/prompt-pipeline.ts +64 -64
package/src/runtime/task-runner/result-utils.ts +14 -14
package/src/runtime/task-runner/run-projection.ts +103 -103
package/src/runtime/task-runner/state-helpers.ts +22 -22
package/src/runtime/task-runner.ts +469 -458
package/src/runtime/team-runner.ts +693 -945
package/src/runtime/usage-tracker.ts +71 -0
package/src/runtime/worker-heartbeat.ts +21 -21
package/src/runtime/worker-startup.ts +57 -57
package/src/runtime/workflow-state.ts +187 -187
package/src/runtime/yield-handler.ts +190 -189
package/src/schema/config-schema.ts +172 -168
package/src/schema/team-tool-schema.ts +126 -125
package/src/schema/validation-types.ts +151 -148
package/src/skills/discover-skills.ts +67 -67
package/src/skills/skill-templates.ts +374 -374
package/src/state/active-run-registry.ts +227 -191
package/src/state/artifact-store.ts +130 -129
package/src/state/atomic-write.ts +262 -178
package/src/state/blob-store.ts +116 -116
package/src/state/contracts.ts +111 -111
package/src/state/event-log-rotation.ts +161 -158
package/src/state/event-log.ts +383 -240
package/src/state/event-reconstructor.ts +217 -217
package/src/state/jsonl-writer.ts +82 -82
package/src/state/locks.ts +146 -148
package/src/state/mailbox.ts +446 -405
package/src/state/state-store.ts +364 -351
package/src/state/task-claims.ts +44 -44
package/src/state/types.ts +285 -285
package/src/state/usage.ts +29 -29
package/src/subagents/async-entry.ts +1 -1
package/src/subagents/index.ts +3 -3
package/src/subagents/live/control.ts +1 -1
package/src/subagents/live/manager.ts +1 -1
package/src/subagents/live/realtime.ts +1 -1
package/src/subagents/live/session-runtime.ts +1 -1
package/src/subagents/manager.ts +1 -1
package/src/subagents/spawn.ts +1 -1
package/src/teams/discover-teams.ts +116 -116
package/src/teams/team-config.ts +27 -27
package/src/teams/team-serializer.ts +38 -38
package/src/types/diff.d.ts +18 -18
package/src/ui/agent-management-overlay.ts +144 -144
package/src/ui/crew-widget.ts +487 -370
package/src/ui/dashboard-panes/agents-pane.ts +109 -28
package/src/ui/dashboard-panes/cancellation-pane.ts +42 -42
package/src/ui/dashboard-panes/capability-pane.ts +59 -59
package/src/ui/dashboard-panes/health-pane.ts +30 -30
package/src/ui/dashboard-panes/mailbox-pane.ts +35 -35
package/src/ui/dashboard-panes/progress-pane.ts +30 -30
package/src/ui/dashboard-panes/transcript-pane.ts +10 -10
package/src/ui/heartbeat-aggregator.ts +63 -63
package/src/ui/keybinding-map.ts +97 -94
package/src/ui/live-conversation-overlay.ts +152 -0
package/src/ui/live-run-sidebar.ts +180 -180
package/src/ui/mascot.ts +442 -442
package/src/ui/overlays/agent-picker-overlay.ts +57 -57
package/src/ui/overlays/confirm-overlay.ts +58 -58
package/src/ui/overlays/mailbox-compose-overlay.ts +144 -144
package/src/ui/overlays/mailbox-compose-preview.ts +63 -63
package/src/ui/overlays/mailbox-detail-overlay.ts +122 -122
package/src/ui/pi-ui-compat.ts +57 -57
package/src/ui/powerbar-publisher.ts +221 -197
package/src/ui/render-scheduler.ts +216 -143
package/src/ui/run-action-dispatcher.ts +118 -117
package/src/ui/run-dashboard.ts +526 -464
package/src/ui/run-event-bus.ts +208 -208
package/src/ui/run-snapshot-cache.ts +826 -777
package/src/ui/settings-overlay.ts +721 -0
package/src/ui/snapshot-types.ts +86 -70
package/src/ui/theme-adapter.ts +190 -190
package/src/ui/tool-progress-formatter.ts +89 -0
package/src/ui/transcript-cache.ts +94 -94
package/src/ui/transcript-viewer.ts +335 -335
package/src/utils/conflict-detect.ts +662 -0
package/src/utils/env-filter.ts +30 -0
package/src/utils/file-coalescer.ts +86 -86
package/src/utils/frontmatter.ts +68 -68
package/src/utils/fs-watch.ts +88 -31
package/src/utils/gh-protocol.ts +479 -0
package/src/utils/ids.ts +17 -17
package/src/utils/incremental-reader.ts +104 -104
package/src/utils/internal-error.ts +6 -6
package/src/utils/names.ts +27 -27
package/src/utils/paths.ts +102 -63
package/src/utils/redaction.ts +44 -44
package/src/utils/resolve-shell.ts +34 -0
package/src/utils/safe-paths.ts +47 -47
package/src/utils/scan-cache.ts +136 -136
package/src/utils/sleep.ts +2 -1
package/src/utils/sse-parser.ts +134 -134
package/src/utils/task-name-generator.ts +337 -337
package/src/utils/timings.ts +33 -33
package/src/utils/visual.ts +243 -198
package/src/workflows/discover-workflows.ts +139 -139
package/src/workflows/validate-workflow.ts +40 -40
package/src/workflows/workflow-config.ts +26 -26
package/src/workflows/workflow-serializer.ts +32 -32
package/src/worktree/branch-freshness.ts +45 -45
package/src/worktree/cleanup.ts +75 -72
package/src/worktree/worktree-manager.ts +188 -146
package/teams/default.team.md +12 -12
package/teams/fast-fix.team.md +11 -11
package/teams/implementation.team.md +18 -18
package/teams/parallel-research.team.md +14 -14
package/teams/research.team.md +11 -11
package/teams/review.team.md +12 -12
package/tsconfig.json +19 -19
package/workflows/default.workflow.md +30 -30
package/workflows/fast-fix.workflow.md +23 -23
package/workflows/implementation.workflow.md +43 -43
package/workflows/parallel-research.workflow.md +46 -46
package/workflows/research.workflow.md +22 -22
package/workflows/review.workflow.md +30 -30
package/skills/task-packet/SKILL.md +0 -28
package/skills/verify-evidence/SKILL.md +0 -27

package/docs/pi-subagents3-deep-analysis.md ADDED Viewed

@@ -0,0 +1,508 @@
+# pi-subagents3 Deep Analysis — Patterns for pi-crew In-Process Runtime
+## Executive Summary
+After deep reading of `source/pi-subagents3/`, this document catalogs every production-ready pattern that pi-crew should adopt for its in-process (live-session) runtime. pi-subagents3 is a mature single-agent system with many features pi-crew's team orchestration currently lacks.
+---
+## 1. Promise-Based Agent Lifecycle ✅ DONE
+### pi-subagents3 Pattern
+```typescript
+class AgentManager {
+    spawn(...) {
+        const record = { ... };
+        record.promise = runAgent(...).then(...);
+        return id;
+    }
+    async spawnAndWait(...) {
+        const id = this.spawn(...);
+        const record = this.agents.get(id)!;
+        await record.promise;  // ← Await actual completion
+        return record;
+    }
+    async waitForAll() {
+        while (true) {
+            const pending = [...this.agents.values()]
+                .filter(r => r.status === "running" || r.status === "queued")
+                .map(r => r.promise);
+            if (pending.length === 0) break;
+            await Promise.allSettled(pending);
+        }
+    }
+}
+```
+### pi-crew Implementation
+**Status:** Done in `src/runtime/run-tracker.ts` (`a88e552`)
+- `registerRunPromise()`, `resolveRunPromise()`, `waitForRun()`
+- Fast path (disk terminal), medium path (foreground Promise), fallback (exponential backoff poll)
+---
+## 2. Soft Turn Limit + Graceful Steering ⬜ NOT IN PI-CREW
+### pi-subagents3 Pattern
+```typescript
+let turnCount = 0;
+const maxTurns = normalizeMaxTurns(options.maxTurns ?? agentConfig?.maxTurns ?? defaultMaxTurns);
+let softLimitReached = false;
+let aborted = false;
+session.subscribe((event) => {
+    if (event.type === "turn_end") {
+        turnCount++;
+        if (maxTurns != null) {
+            if (!softLimitReached && turnCount >= maxTurns) {
+                softLimitReached = true;
+                session.steer("You have reached your turn limit. Wrap up immediately — provide your final answer now.");
+            } else if (softLimitReached && turnCount >= maxTurns + graceTurns) {
+                aborted = true;
+                session.abort();
+            }
+        }
+    }
+});
+```
+**Key insight:** Instead of hard cutoff, it steers the agent to wrap up. Only aborts after `graceTurns` (default 5) additional turns. This produces much better output than sudden termination.
+**Settings:** `defaultMaxTurns`, `graceTurns` — persisted per project.
+### pi-crew Gap
+- `maxTurns` exists but no soft-limit steering mechanism
+- No `graceTurns` concept
+- Hard abort at maxTurns causes incomplete responses
+### Implementation Sketch
+Add to `live-session-runtime.ts`:
+```typescript
+const turnCount = 0;
+const maxTurns = agent.maxTurns ?? config.defaultMaxTurns;
+const graceTurns = config.graceTurns ?? 5;
+let softLimitReached = false;
+session.subscribe((event) => {
+    if (event.type === "turn_end") {
+        turnCount++;
+        if (maxTurns != null && !softLimitReached && turnCount >= maxTurns) {
+            softLimitReached = true;
+            session.steer("You have reached your turn limit. Wrap up immediately — provide your final answer now.");
+        } else if (softLimitReached && turnCount >= maxTurns + graceTurns) {
+            session.abort();
+        }
+    }
+});
+```
+---
+## 3. Persistent Agent Memory ⬜ NOT IN PI-CREW
+### pi-subagents3 Pattern
+```typescript
+// Memory scopes: "user" | "project" | "local"
+const memoryDir = resolveMemoryDir(agentName, scope, cwd);
+// Agent gets a persistent directory and MEMORY.md instructions
+// Agent can read/write/edit memory files using its tools
+```
+**Memory block injected into system prompt:**
+```markdown
+# Agent Memory
+You have a persistent memory directory at: {memoryDir}/
+Memory scope: {scope}
+This memory persists across sessions. Use it to build up knowledge over time.
+```
+**Features:**
+- MEMORY.md index file (max 200 lines)
+- Frontmatter format for structured memories
+- Read-only mode for agents without write/edit tools
+- Symlink attack prevention (`isSymlink`, `safeReadFile`)
+### pi-crew Gap
+- No persistent memory per agent across runs
+- Agents start fresh every time
+- No MEMORY.md concept
+---
+## 4. Context % Indicator ⬜ NOT IN PI-CREW
+### pi-subagents3 Pattern
+```typescript
+export function getSessionContextPercent(session: SessionLike | undefined): number | null {
+    if (!session) return null;
+    try { return session.getSessionStats().contextUsage?.percent ?? null; }
+    catch { return null; }
+}
+```
+**Used in:**
+- Dashboard widget showing "Context: 67%" to warn before compaction
+- Scheduling decisions (don't schedule if context is critically full)
+- UI streaming display
+### pi-crew Gap
+- No context usage percentage display
+- No early warning before compaction
+- Dashboard doesn't show "how full is the context window"
+---
+## 5. Skill Preloading (vs. Skill Path Passing) ⬜ PARTIAL IN PI-CREW
+### pi-subagents3 Pattern
+```typescript
+// Load skill content INTO the prompt instead of passing paths to child
+const loaded = preloadSkills(skills, effectiveCwd);
+if (loaded.length > 0) {
+    extras.skillBlocks = loaded;
+}
+// In prompt:
+// # Preloaded Skill: skill-name
+// <skill content here>
+```
+**Advantages over path passing:**
+- No child-process skill loader dependency
+- Content is visible to LLM immediately (no extra tool call)
+- Works with `noSkills: true` (skills already in prompt)
+- Graceful degradation: missing skills show "(Skill not found)" note instead of crash
+### pi-crew Gap
+- pi-crew passes `--skill <path>` to child Pi process
+- Child has to load skills separately
+- For live-session, skills should be preloaded into prompt
+---
+## 6. Batch Notification Grouping (GroupJoinManager) ⬜ NOT IN PI-CREW
+### pi-subagents3 Pattern
+```typescript
+class GroupJoinManager {
+    registerGroup(groupId, agentIds);
+    onAgentComplete(record) {
+        // Hold results until ALL agents in group complete
+        // OR timeout fires (default 30s)
+        // Then deliver ONE consolidated notification
+    }
+}
+```
+**Join modes:** `async` (individual), `group` (batch), `smart` (heuristic)
+**Benefits:**
+- 10 parallel research agents → 1 notification instead of 10
+- Reduces parent context disruption
+- Configurable timeout for stragglers
+### pi-crew Gap
+- Each completed task sends individual notification
+- No batch grouping for parallel tasks
+- Parent gets spammed with completion messages
+---
+## 7. Scheduling (SubagentScheduler) ⬜ NOT IN PI-CREW
+### pi-subagents3 Pattern
+```typescript
+class SubagentScheduler {
+    addJob({ name, schedule: "0 0 9 * * 1", subagent_type, prompt });
+    // Supports: cron | interval ("5m") | once ("+10m" | ISO)
+    // Persistence: session-scoped ScheduleStore with PID-locked atomic writes
+    // Bypasses concurrency queue when firing
+}
+```
+**Features:**
+- Croner library for cron expressions
+- Session-scoped persistence (survives `/resume`, resets on `/new`)
+- PID-based file locking with stale lock detection
+- Master switch: `schedulingEnabled` setting
+### pi-crew Gap
+- No scheduling capability at all
+- No cron/interval/once job support
+- No session-scoped persistent job store
+---
+## 8. Settings Persistence with Sanitization ⬜ NOT IN PI-CREW
+### pi-subagents3 Pattern
+```typescript
+// Global: ~/.pi/agent/subagents.json (defaults, never written here)
+// Project: <cwd>/.pi/subagents.json (overrides)
+export interface SubagentsSettings {
+    maxConcurrent?: number;
+    defaultMaxTurns?: number;
+    graceTurns?: number;
+    defaultJoinMode?: JoinMode;
+    schedulingEnabled?: boolean;
+}
+function sanitize(raw: unknown): SubagentsSettings {
+    // Drop invalid fields, apply ceilings
+    // maxConcurrent: 1-1024
+    // defaultMaxTurns: 0-10000 (0 = unlimited)
+    // graceTurns: 1-1000
+}
+```
+**Features:**
+- Merged load: global defaults + project overrides
+- Sanitization drops garbage silently
+- Settings events: `subagents:settings_loaded`, `subagents:settings_changed`
+- Toast formatting for persist success/failure
+### pi-crew Gap
+- pi-crew has `CrewConfig` but no project-local `.pi/crew.json` persistence
+- No sanitization with ceilings
+- No settings change events
+---
+## 9. Usage Tracking (Survives Compaction) ⬜ NOT IN PI-CREW
+### pi-subagents3 Pattern
+```typescript
+export type LifetimeUsage = { input: number; output: number; cacheWrite: number };
+// Accumulated via message_end events (survives compaction)
+session.subscribe((event) => {
+    if (event.type === "message_end" && event.message.role === "assistant") {
+        const u = event.message.usage;
+        if (u) options.onAssistantUsage?.({
+            input: u.input ?? 0,
+            output: u.output ?? 0,
+            cacheWrite: u.cacheWrite ?? 0,
+        });
+    }
+});
+```
+**Key design:** `getSessionTokens()` resets at compaction (upstream replaces messages array), but `LifetimeUsage` survives because it's independently accumulated.
+**cacheRead deliberately excluded** — summing across turns counts the cached prefix N times (issue #38).
+### pi-crew Gap
+- pi-crew tracks usage per task but doesn't survive compaction
+- No lifetime usage across sessions
+- No `cacheWrite`/`cacheRead` distinction logic
+---
+## 10. Worktree Isolation ⬜ NOT IN PI-CREW
+### pi-subagents3 Pattern
+```typescript
+export function createWorktree(cwd: string, agentId: string): WorktreeInfo | undefined {
+    // git worktree add --detach <temp-path> HEAD
+    // Returns { path, branch }
+}
+export function cleanupWorktree(cwd, worktree, description) {
+    // No changes → remove worktree
+    // Changes → git add -A, git commit, create branch, remove worktree
+    // Returns { hasChanges, branch }
+}
+```
+**Features:**
+- Strict: fails loud if not a git repo (no silent fallback)
+- Crash recovery: `pruneWorktrees()` on dispose
+- Branch naming: `pi-agent-{agentId}`, with timestamp suffix if conflict
+### pi-crew Gap
+- pi-crew has worktree support but less robust
+- No automatic branch creation for changes
+- No worktree cleanup on error
+---
+## 11. Model Resolution (Fuzzy + Availability) ⬜ NOT IN PI-CREW
+### pi-subagents3 Pattern
+```typescript
+export function resolveModel(input: string, registry: ModelRegistry): any | string {
+    // 1. Exact match "provider/modelId" — only if available (has auth)
+    // 2. Fuzzy match with scoring:
+    //    - exact id match (100)
+    //    - id contains query (60-90)
+    //    - name contains query (40-60)
+    //    - all parts present (20)
+    // 3. No match → return error message with available models list
+}
+```
+### pi-crew Gap
+- pi-crew passes model string directly to child Pi
+- No fuzzy resolution
+- No availability check before spawn
+---
+## 12. Agent Config System (Defaults + Override) ⬜ PARTIAL IN PI-CREW
+### pi-subagents3 Pattern
+```typescript
+const DEFAULT_AGENTS = new Map([
+    ["general-purpose", { extensions: true, skills: true, promptMode: "append" }],
+    ["Explore", { builtinToolNames: ["read", "bash", "grep", "find", "ls"], model: "anthropic/claude-haiku-...", promptMode: "replace" }],
+    ["Plan", { builtinToolNames: ["read", "bash", "grep", "find", "ls"], promptMode: "replace" }],
+]);
+// User-defined .md files with same name override defaults
+// Resolution: explicit option > config.model > parent model
+```
+**Features:**
+- `builtinToolNames` — restrict tool set per agent type
+- `disallowedTools` — denylist (removed even if extensions include them)
+- `promptMode: "replace" | "append"` — full control vs. parent clone
+- `extensions: true | string[] | false` — selective extension inheritance
+- `skills: true | string[] | false` — selective skill inheritance
+- `isolated: boolean` — no extension tools
+### pi-crew Gap
+- pi-crew has agent configs but no `builtinToolNames` per agent
+- No `disallowedTools` concept
+- No `promptMode` (always append-ish)
+- `extensions`/`skills` are boolean only (no selective)
+---
+## 13. Streaming Output (Real-Time Transcript) ⬜ NOT IN PI-CREW
+### pi-subagents3 Pattern
+```typescript
+// AgentRecord has:
+outputFile?: string;
+outputCleanup?: () => void;
+// In spawn:
+const outputFile = path.join(stateDir, `${id}.output.md`);
+const stream = createWriteStream(outputFile);
+// Subscribe to session events, write text deltas to stream
+// onComplete: flush stream, cleanup
+```
+**Benefits:**
+- Real-time transcript file for long-running agents
+- Parent can `tail -f` the file for progress
+- `outputCleanup` ensures stream is closed
+### pi-crew Gap
+- pi-crew writes artifacts after task completes
+- No real-time streaming transcript during task execution
+- Parent must wait for completion to see output
+---
+## 14. Cross-Extension RPC ⬜ NOT IN PI-CREW
+### pi-subagents3 Pattern
+```typescript
+export function registerRpcHandlers(deps: RpcDeps): RpcHandle {
+    const unsubPing = handleRpc(events, "subagents:rpc:ping", () => ({ version: PROTOCOL_VERSION }));
+    const unsubSpawn = handleRpc(events, "subagents:rpc:spawn", ({ type, prompt, options }) => {
+        const ctx = getCtx();
+        return { id: manager.spawn(pi, ctx, type, prompt, options ?? {}) };
+    });
+    const unsubStop = handleRpc(events, "subagents:rpc:stop", ({ agentId }) => {
+        if (!manager.abort(agentId)) throw new Error("Agent not found");
+    });
+    return { unsubPing, unsubSpawn, unsubStop };
+}
+```
+**Features:**
+- Per-request scoped reply channels: `${channel}:reply:${requestId}`
+- Envelope: `{ success: true, data? } | { success: false, error }`
+- Protocol versioning
+### pi-crew Gap
+- pi-crew has no RPC for external extensions to spawn team runs
+- No protocol versioning
+- Extensions can only use `team` tool
+---
+## 15. Concurrency Queue with Bypass ⬜ PARTIAL IN PI-CREW
+### pi-subagents3 Pattern
+```typescript
+spawn(..., { isBackground: true, bypassQueue: false }) {
+    if (runningBackground >= maxConcurrent) {
+        record.status = "queued";
+        queue.push({ id, args });
+        return id;
+    }
+    startAgent(id, record, args);
+}
+// When agent completes:
+this.runningBackground--;
+this.drainQueue();  // Start next queued agent
+// Scheduled jobs bypass queue:
+manager.spawn(..., { bypassQueue: true });  // Always starts immediately
+```
+### pi-crew Status
+- pi-crew has `SubagentManager` with `runningBackground` counter
+- Has queue logic but no `bypassQueue` flag
+- No `drainQueue()` — queued agents may not auto-start
+---
+## 16. Parent Signal Wiring ⬜ PARTIAL IN PI-CREW
+### pi-subagents3 Pattern
+```typescript
+// In spawn:
+if (options.signal) {
+    const onParentAbort = () => this.abort(id);
+    options.signal.addEventListener("abort", onParentAbort, { once: true });
+    detachParentSignal = () => options.signal!.removeEventListener("abort", onParentAbort);
+}
+// Cleanup in .then() and .catch():
+detach();  // Remove listener to avoid leak
+```
+### pi-crew Status
+- pi-crew passes `signal` to `runTeamTask` and `runLiveSessionTask`
+- But no explicit detach cleanup after completion
+- Listener may leak
+---
+## Priority Implementation Roadmap
+### P0 — Immediate (next commit)
+1. **Soft turn limit + grace steering** — Best output quality improvement
+2. **Context % indicator** — Dashboard enhancement, low effort
+### P1 — This Week
+3. **Skill preloading** — Required for live-session to work without child-process skill loader
+4. **Persistent agent memory** — Major differentiator, medium effort
+5. **Usage tracking (survives compaction)** — Metrics accuracy
+### P2 — Next Sprint
+6. **Batch notification grouping** — Parallel run UX
+7. **Settings persistence with sanitization** — Config robustness
+8. **Streaming output transcript** — Real-time progress visibility
+9. **Worktree auto-branch** — Isolation improvement
+### P3 — Future
+10. **Scheduling** — New feature category
+11. **Cross-extension RPC** — Ecosystem integration
+12. **Model fuzzy resolution** — UX polish

package/docs/product/README.md ADDED Viewed

@@ -0,0 +1,31 @@
+# Product Docs
+Product documentation for pi-crew. Each file describes a product domain —
+what it does, how it behaves, and what contracts it maintains.
+## Update Rule
+When behavior changes:
+1. Update the affected product doc
+2. Update or create the story packet
+3. Update `docs/TEST_MATRIX.md`
+4. Record a decision if it affects architecture, scope, risk, or settled rules
+## Domain Index
+| File | Domain | Description |
+|------|--------|-------------|
+| `team-run.md` | Core | Team run lifecycle: start, execute, complete |
+| `team-tool.md` | API | Team tool actions: run, status, list, plan |
+| `child-process.md` | Runtime | Child Pi process spawning and management |
+| `live-session.md` | Runtime | In-process agent execution |
+| `async-runner.md` | Runtime | Background/async run execution |
+| `state.md` | State | Durable state: manifests, tasks, events |
+| `worktree.md` | Isolation | Git worktree isolation for parallel work |
+| `group-join.md` | Coordination | Agent result grouping and delivery |
+| `model-fallback.md` | Runtime | Model selection and fallback chain |
+| `conflict-detect.md` | Utils | Merge conflict detection in file edits |
+| `crash-recovery.md` | Reliability | Crash recovery and stale reconciliation |
+| `effectiveness.md` | Quality | Effectiveness guard for worker activity |
+| `platform.md` | Platform | Cross-platform considerations (Windows) |
+| `runtime-safety.md` | Safety | Runtime safety: depth guard, resource limits |

package/docs/product/platform.md ADDED Viewed

@@ -0,0 +1,27 @@
+# Platform (Cross-Platform)
+## Behavior
+pi-crew runs on Windows, macOS, and Linux. Primary development is on Windows.
+### Windows Considerations
+- **EBUSY/EPERM**: Files locked by antivirus, shell, or indexer
+  - `rmSyncRetry()` with exponential backoff (50ms, 100ms, 200ms, 400ms)
+  - `existsSync` check before cleanup in finally blocks
+- **Path separators**: Use `path.join()` everywhere, never hardcoded `/`
+- **Shell**: `resolve-shell.ts` handles `cmd.exe` vs `bash` detection
+- **Case sensitivity**: Windows is case-insensitive for file paths
+### Unix Considerations
+- `unref()` on timers to prevent blocking process exit
+- POSIX shell compatibility in any shell scripts
+- Signal handling (SIGTERM, SIGINT) for graceful shutdown
+### CI Matrix
+All changes validated on:
+- `ubuntu-latest` / Node 22
+- `windows-latest` / Node 22
+- `macos-latest` / Node 22

package/docs/product/runtime-safety.md ADDED Viewed

@@ -0,0 +1,37 @@
+# Runtime Safety
+## Behavior
+pi-crew enforces multiple safety layers to prevent resource leaks, crashes,
+and runaway execution.
+### Depth Guard
+- Tracks `PI_CREW_SESSION_DEPTH` environment variable
+- Depth >= 2 forces `child-process` mode instead of `live-session`
+- Prevents stack overflow from nested team runs
+### Resource Limits
+- Memory cap on live-session agents
+- Prompt timeout for agent responses
+- Tool count restoration after session error
+### Process Cleanup
+- `cleanupTempDir()` with `existsSync` guard against double cleanup
+- `safeDisposeLiveSession()` for clean resource teardown
+- `removeLiveAgentHandle()` for registry cleanup
+### Error Handling
+- `try/catch` around all I/O operations in UI code
+- `rmSyncRetry()` with exponential backoff for Windows EBUSY
+- `rejectRunPromise` (not `resolveRunPromise`) in error paths
+### State Integrity
+- `withRunLockSync` for all state mutations
+- Atomic write helpers (`writeJsonAtomic`, `appendJsonAtomic`)
+- `markActiveTasksAndAgentsFailed()` for crash recovery
+- Event log append-only for audit trail

package/docs/product/team-run.md ADDED Viewed

@@ -0,0 +1,39 @@
+# Team Run
+## Behavior
+A team run executes a workflow with multiple agents, tracking progress through
+durable state on disk.
+### Lifecycle
+1. User invokes `team action='run'` with a goal
+2. Team runner creates a manifest, resolves team/workflow
+3. Task graph is built from workflow steps
+4. Tasks execute (parallel or sequential per workflow)
+5. Results are collected, artifacts written
+6. Run completes with final status
+### Statuses
+| Status | Meaning |
+|--------|---------|
+| pending | Manifest created, not yet executing |
+| running | Tasks executing |
+| completed | All tasks finished successfully |
+| failed | One or more tasks failed |
+| cancelled | User cancelled the run |
+| partial | Some tasks completed, others still pending |
+### Concurrency
+- Tasks without dependencies run in parallel (up to concurrency limit)
+- Tasks with `dependsOn` wait for predecessors
+- Workflow phases enforce ordering
+### Artifacts
+- `results/{taskId}.txt` — task output
+- `logs/{taskId}.log` — full transcript
+- `metadata/` — task metadata files
+- `shared/` — inter-agent shared context

package/docs/product/team-tool.md ADDED Viewed

@@ -0,0 +1,37 @@
+# Team Tool API
+## Behavior
+The `team` tool is the primary interface for users to interact with pi-crew.
+### Actions
+| Action | Description |
+|--------|-------------|
+| `run` | Start a team run |
+| `plan` | Create a plan without executing |
+| `status` | Check run/task status |
+| `list` | List teams, agents, workflows |
+| `get` | Get resource details |
+| `cancel` | Cancel a running task/run |
+| `resume` | Resume a paused run |
+| `respond` | Respond to a waiting task |
+| `recommend` | Get team/workflow recommendations |
+| `create/update/delete` | Manage resources |
+| `doctor` | Diagnose configuration issues |
+### Parameters
+- `action` (required): The action to perform
+- `team`: Team name for run operations
+- `goal`: High-level objective
+- `runId`: Run ID for status/cancel/resume
+- `taskId`: Task ID for respond operations
+- `confirm: true`: Required for destructive actions
+### Safety Rules
+- Delete operations require `confirm: true`
+- Referenced resources blocked unless `force: true`
+- Cancel requires explicit run ID
+- Respond requires task ID + message