npm - @os-eco/overstory-cli - Versions diffs - 0.7.0 → 0.7.3 - Mend

@os-eco/overstory-cli 0.7.0 → 0.7.3

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (91) hide show

package/README.md +7 -6
package/agents/builder.md +1 -1
package/agents/coordinator.md +12 -11
package/agents/lead.md +6 -6
package/agents/monitor.md +4 -4
package/agents/reviewer.md +1 -1
package/agents/scout.md +5 -5
package/agents/supervisor.md +36 -32
package/package.json +1 -1
package/src/agents/guard-rules.ts +97 -0
package/src/agents/hooks-deployer.test.ts +6 -5
package/src/agents/hooks-deployer.ts +7 -90
package/src/agents/identity.test.ts +3 -2
package/src/agents/manifest.test.ts +4 -3
package/src/agents/overlay.test.ts +10 -9
package/src/agents/overlay.ts +5 -5
package/src/commands/agents.test.ts +10 -4
package/src/commands/clean.test.ts +3 -0
package/src/commands/completions.test.ts +8 -5
package/src/commands/completions.ts +38 -2
package/src/commands/coordinator.test.ts +1 -0
package/src/commands/coordinator.ts +15 -11
package/src/commands/costs.test.ts +9 -3
package/src/commands/dashboard.test.ts +265 -6
package/src/commands/dashboard.ts +367 -64
package/src/commands/doctor.test.ts +3 -2
package/src/commands/errors.test.ts +3 -2
package/src/commands/feed.test.ts +3 -2
package/src/commands/feed.ts +2 -29
package/src/commands/init.test.ts +1 -2
package/src/commands/init.ts +1 -8
package/src/commands/inspect.test.ts +17 -2
package/src/commands/log.test.ts +262 -8
package/src/commands/log.ts +232 -110
package/src/commands/logs.test.ts +3 -2
package/src/commands/mail.test.ts +8 -2
package/src/commands/metrics.test.ts +4 -3
package/src/commands/monitor.ts +15 -11
package/src/commands/nudge.test.ts +4 -2
package/src/commands/prime.test.ts +4 -2
package/src/commands/prime.ts +6 -2
package/src/commands/replay.test.ts +3 -2
package/src/commands/run.test.ts +3 -1
package/src/commands/sling.test.ts +142 -1
package/src/commands/sling.ts +145 -24
package/src/commands/status.test.ts +9 -8
package/src/commands/stop.test.ts +1 -0
package/src/commands/supervisor.ts +19 -12
package/src/commands/trace.test.ts +4 -2
package/src/commands/watch.test.ts +3 -2
package/src/commands/worktree.test.ts +9 -0
package/src/config.test.ts +3 -3
package/src/config.ts +29 -0
package/src/doctor/agents.test.ts +3 -2
package/src/doctor/consistency.test.ts +14 -0
package/src/doctor/logs.test.ts +3 -2
package/src/doctor/structure.test.ts +3 -2
package/src/e2e/init-sling-lifecycle.test.ts +3 -5
package/src/index.ts +3 -1
package/src/logging/color.ts +1 -1
package/src/logging/format.test.ts +110 -0
package/src/logging/format.ts +42 -1
package/src/logging/logger.test.ts +3 -2
package/src/mail/broadcast.test.ts +1 -0
package/src/mail/client.test.ts +3 -2
package/src/mail/store.test.ts +3 -2
package/src/merge/queue.test.ts +3 -2
package/src/merge/resolver.test.ts +39 -0
package/src/merge/resolver.ts +24 -5
package/src/mulch/client.test.ts +63 -2
package/src/mulch/client.ts +62 -1
package/src/runtimes/claude.test.ts +5 -4
package/src/runtimes/pi-guards.test.ts +457 -0
package/src/runtimes/pi-guards.ts +349 -0
package/src/runtimes/pi.test.ts +620 -0
package/src/runtimes/pi.ts +244 -0
package/src/runtimes/registry.test.ts +33 -0
package/src/runtimes/registry.ts +15 -2
package/src/runtimes/types.ts +63 -0
package/src/schema-consistency.test.ts +5 -2
package/src/sessions/compat.test.ts +3 -2
package/src/sessions/compat.ts +1 -0
package/src/sessions/store.test.ts +34 -2
package/src/sessions/store.ts +37 -4
package/src/test-helpers.ts +20 -1
package/src/types.ts +17 -0
package/src/watchdog/daemon.test.ts +11 -7
package/src/watchdog/daemon.ts +1 -1
package/src/watchdog/health.test.ts +1 -0
package/src/watchdog/triage.test.ts +3 -2
package/src/watchdog/triage.ts +14 -4

package/src/types.ts CHANGED Viewed

@@ -22,6 +22,14 @@ export interface ResolvedModel {
 	env?: Record<string, string>;
 }
+/** Configuration for the Pi runtime's model alias expansion. */
+export interface PiRuntimeConfig {
+	/** Provider prefix for unqualified model aliases (e.g., "anthropic", "amazon-bedrock"). */
+	provider: string;
+	/** Maps short aliases (e.g., "opus") to provider-qualified model IDs. */
+	modelMap: Record<string, string>;
+}
 // === Task Tracker ===
 /** Backend for the task tracker. Defined here for use in OverstoryConfig. */
@@ -89,6 +97,14 @@ export interface OverstoryConfig {
 	runtime?: {
 		/** Default runtime adapter name (default: "claude"). */
 		default: string;
+		/**
+		 * Runtime adapter for headless one-shot AI calls (--print mode).
+		 * Used by merge/resolver.ts and watchdog/triage.ts.
+		 * Falls back to runtime.default when omitted.
+		 */
+		printCommand?: string;
+		/** Pi runtime configuration for model alias expansion. */
+		pi?: PiRuntimeConfig;
 	};
 }
@@ -145,6 +161,7 @@ export interface AgentSession {
 	lastActivity: string;
 	escalationLevel: number; // Progressive nudge stage: 0=warn, 1=nudge, 2=escalate, 3=terminate
 	stalledSince: string | null; // ISO timestamp when agent first entered stalled state
+	transcriptPath: string | null; // Runtime-provided transcript JSONL path (decoupled from ~/.claude/)
 }
 // === Agent Identity ===

package/src/watchdog/daemon.test.ts CHANGED Viewed

@@ -15,11 +15,12 @@
  */
 import { afterEach, beforeEach, describe, expect, test } from "bun:test";
-import { mkdir, mkdtemp, rm } from "node:fs/promises";
+import { mkdir, mkdtemp } from "node:fs/promises";
 import { tmpdir } from "node:os";
 import { join } from "node:path";
 import { createEventStore } from "../events/store.ts";
 import { createSessionStore } from "../sessions/store.ts";
+import { cleanupTempDir } from "../test-helpers.ts";
 import type { AgentSession, HealthCheck, StoredEvent } from "../types.ts";
 import { buildCompletionMessage, runDaemonTick } from "./daemon.ts";
@@ -75,6 +76,7 @@ function makeSession(overrides: Partial<AgentSession> = {}): AgentSession {
 		runId: null,
 		escalationLevel: 0,
 		stalledSince: null,
+		transcriptPath: null,
 		startedAt: new Date().toISOString(),
 		lastActivity: new Date().toISOString(),
 		...overrides,
@@ -162,7 +164,7 @@ beforeEach(async () => {
 });
 afterEach(async () => {
-	await rm(tempRoot, { recursive: true, force: true });
+	await cleanupTempDir(tempRoot);
 });
 describe("daemon tick", () => {
@@ -804,6 +806,7 @@ describe("daemon tick", () => {
 			pid: process.pid,
 			escalationLevel: 0,
 			stalledSince: null,
+			transcriptPath: null,
 		});
 		writeSessionsToStore(tempRoot, [session]);
@@ -1098,7 +1101,7 @@ describe("daemon mulch failure recording", () => {
 	});
 	afterEach(async () => {
-		await rm(tempRoot, { recursive: true, force: true });
+		await cleanupTempDir(tempRoot);
 	});
 	/** Track calls to the recordFailure mock. */
@@ -1389,7 +1392,7 @@ describe("run completion detection", () => {
 		expect(coordinatorNudges).toHaveLength(1);
 		// The test creates builders, so the message should be builder-specific
 		expect(coordinatorNudges[0]?.message).toContain("builder");
-		expect(coordinatorNudges[0]?.message).toContain("merge/cleanup");
+		expect(coordinatorNudges[0]?.message).toContain("Awaiting lead verification");
 	});
 	test("does not nudge when some workers still active", async () => {
@@ -1581,7 +1584,7 @@ describe("run completion detection", () => {
 		expect(coordinatorNudges).toHaveLength(1);
 		// The test creates builders, so the message should be builder-specific
 		expect(coordinatorNudges[0]?.message).toContain("builder");
-		expect(coordinatorNudges[0]?.message).toContain("merge/cleanup");
+		expect(coordinatorNudges[0]?.message).toContain("Awaiting lead verification");
 	});
 	test("does not nudge when no worker sessions in run", async () => {
@@ -1916,14 +1919,15 @@ describe("buildCompletionMessage", () => {
 		expect(msg).not.toContain("merge/cleanup");
 	});
-	test("all builders → contains 'builder' and 'Ready for merge/cleanup'", () => {
+	test("all builders → contains 'builder' and 'Awaiting lead verification' (not merge authorization)", () => {
 		const sessions = [
 			makeSession({ capability: "builder", agentName: "builder-1" }),
 			makeSession({ capability: "builder", agentName: "builder-2" }),
 		];
 		const msg = buildCompletionMessage(sessions, testRunId);
 		expect(msg).toContain("builder");
-		expect(msg).toContain("Ready for merge/cleanup");
+		expect(msg).toContain("Awaiting lead verification");
+		expect(msg).not.toContain("merge/cleanup");
 	});
 	test("all reviewers → contains 'reviewer' and 'Reviews done'", () => {

package/src/watchdog/daemon.ts CHANGED Viewed

@@ -148,7 +148,7 @@ export function buildCompletionMessage(
 			return `[WATCHDOG] All ${count} scout(s) in run ${runId} have completed. Ready for next phase.`;
 		}
 		if (capabilities.has("builder")) {
-			return `[WATCHDOG] All ${count} builder(s) in run ${runId} have completed. Ready for merge/cleanup.`;
+			return `[WATCHDOG] All ${count} builder(s) in run ${runId} have completed. Awaiting lead verification.`;
 		}
 		if (capabilities.has("reviewer")) {
 			return `[WATCHDOG] All ${count} reviewer(s) in run ${runId} have completed. Reviews done.`;

package/src/watchdog/health.test.ts CHANGED Viewed

@@ -47,6 +47,7 @@ function makeSession(overrides: Partial<AgentSession> = {}): AgentSession {
 		lastActivity: new Date().toISOString(),
 		escalationLevel: 0,
 		stalledSince: null,
+		transcriptPath: null,
 		...overrides,
 	};
 }

package/src/watchdog/triage.test.ts CHANGED Viewed

@@ -7,9 +7,10 @@
  */
 import { afterEach, beforeEach, describe, expect, test } from "bun:test";
-import { mkdir, mkdtemp, rm } from "node:fs/promises";
+import { mkdir, mkdtemp } from "node:fs/promises";
 import { tmpdir } from "node:os";
 import { join } from "node:path";
+import { cleanupTempDir } from "../test-helpers.ts";
 import { buildTriagePrompt, classifyResponse, triageAgent } from "./triage.ts";
 describe("classifyResponse", () => {
@@ -97,7 +98,7 @@ describe("triageAgent", () => {
 	});
 	afterEach(async () => {
-		await rm(tempRoot, { recursive: true, force: true });
+		await cleanupTempDir(tempRoot);
 	});
 	test("returns 'extend' when no logs directory exists", async () => {

package/src/watchdog/triage.ts CHANGED Viewed

@@ -9,6 +9,8 @@
 import { readdir } from "node:fs/promises";
 import { join } from "node:path";
 import { AgentError } from "../errors.ts";
+import { getRuntime } from "../runtimes/registry.ts";
+import type { OverstoryConfig } from "../types.ts";
 /**
  * Triage a stalled agent by analyzing its recent log output with Claude.
@@ -30,8 +32,10 @@ export async function triageAgent(options: {
 	lastActivity: string;
 	/** Timeout in ms for the Claude subprocess. Defaults to 30_000 (30s). */
 	timeoutMs?: number;
+	/** Overstory config for runtime resolution. */
+	config?: OverstoryConfig;
 }): Promise<"retry" | "terminate" | "extend"> {
-	const { agentName, root, lastActivity, timeoutMs } = options;
+	const { agentName, root, lastActivity, timeoutMs, config } = options;
 	const logsDir = join(root, ".overstory", "logs", agentName);
 	let logContent: string;
@@ -45,7 +49,7 @@ export async function triageAgent(options: {
 	const prompt = buildTriagePrompt(agentName, lastActivity, logContent);
 	try {
-		const response = await spawnClaude(prompt, timeoutMs);
+		const response = await spawnClaude(prompt, timeoutMs, config);
 		return classifyResponse(response);
 	} catch {
 		// Claude not available — default to extend (safe fallback)
@@ -130,10 +134,16 @@ const DEFAULT_TRIAGE_TIMEOUT_MS = 30_000;
  * @returns Claude's response text
  * @throws Error if claude is not installed, the process fails, or the timeout is reached
  */
-async function spawnClaude(prompt: string, timeoutMs?: number): Promise<string> {
+async function spawnClaude(
+	prompt: string,
+	timeoutMs?: number,
+	config?: OverstoryConfig,
+): Promise<string> {
 	const timeout = timeoutMs ?? DEFAULT_TRIAGE_TIMEOUT_MS;
-	const proc = Bun.spawn(["claude", "--print", "-p", prompt], {
+	const runtime = getRuntime(config?.runtime?.printCommand ?? config?.runtime?.default, config);
+	const argv = runtime.buildPrintCommand(prompt);
+	const proc = Bun.spawn(argv, {
 		stdout: "pipe",
 		stderr: "pipe",
 	});