npm - ultimate-pi - Versions diffs - 0.17.0 → 0.18.1 - Mend

ultimate-pi 0.17.0 → 0.18.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (137) hide show

package/.agents/skills/harness-context/SKILL.md +13 -6
package/.agents/skills/harness-debate-plan/SKILL.md +37 -20
package/.agents/skills/harness-decisions/SKILL.md +1 -1
package/.agents/skills/harness-eval/SKILL.md +6 -21
package/.agents/skills/harness-governor/SKILL.md +4 -3
package/.agents/skills/harness-orchestration/SKILL.md +41 -53
package/.agents/skills/harness-plan/SKILL.md +23 -12
package/.agents/skills/harness-review/SKILL.md +52 -0
package/.agents/skills/harness-sentrux-setup/SKILL.md +16 -3
package/.agents/skills/harness-steer/SKILL.md +14 -0
package/.agents/skills/sentrux/SKILL.md +9 -9
package/.pi/agents/harness/planning/decompose.md +7 -4
package/.pi/agents/harness/planning/hypothesis-validator.md +2 -0
package/.pi/agents/harness/planning/hypothesis.md +3 -1
package/.pi/agents/harness/planning/plan-adversary.md +2 -0
package/.pi/agents/harness/planning/plan-evaluator.md +2 -0
package/.pi/agents/harness/planning/plan-synthesizer.md +25 -0
package/.pi/agents/harness/planning/planning-context.md +48 -0
package/.pi/agents/harness/planning/review-integrator.md +2 -0
package/.pi/agents/harness/planning/sprint-contract-auditor.md +2 -0
package/.pi/agents/harness/{adversary.md → reviewing/adversary.md} +3 -10
package/.pi/agents/harness/{evaluator.md → reviewing/evaluator.md} +3 -12
package/.pi/agents/harness/running/executor.md +45 -0
package/.pi/agents/harness/sentrux-steward.md +51 -0
package/.pi/extensions/00-harness-project-control.ts +133 -0
package/.pi/extensions/00-posthog-network-bootstrap.ts +11 -0
package/.pi/extensions/budget-guard.ts +2 -0
package/.pi/extensions/debate-orchestrator.ts +2 -0
package/.pi/extensions/harness-ask-user.ts +2 -2
package/.pi/extensions/harness-debate-tools.ts +2 -2
package/.pi/extensions/harness-live-widget.ts +60 -3
package/.pi/extensions/harness-plan-approval.ts +64 -58
package/.pi/extensions/harness-run-context.ts +715 -90
package/.pi/extensions/harness-subagent-submit.ts +46 -12
package/.pi/extensions/harness-subagents.ts +2 -2
package/.pi/extensions/harness-telemetry.ts +2 -0
package/.pi/extensions/harness-web-tools.ts +2 -2
package/.pi/extensions/lib/extension-load-guard.ts +10 -0
package/.pi/extensions/lib/harness-artifact-gate.ts +172 -0
package/.pi/extensions/lib/harness-posthog.ts +9 -5
package/.pi/extensions/lib/harness-spawn-topology.ts +165 -0
package/.pi/extensions/lib/harness-subagent-auth.ts +1 -2
package/.pi/extensions/lib/harness-subagent-policy.ts +28 -24
package/.pi/extensions/lib/harness-subagent-precheck.ts +36 -10
package/.pi/extensions/lib/harness-subagent-submit-pipeline.ts +66 -2
package/.pi/extensions/lib/harness-subagent-submit-registry.ts +22 -22
package/.pi/extensions/lib/harness-subagents-bridge.ts +7 -29
package/.pi/extensions/lib/harness-subprocess-bootstrap.ts +73 -0
package/.pi/extensions/lib/plan-approval/create-plan.ts +2 -3
package/.pi/extensions/lib/plan-approval/resolve-disk.ts +102 -0
package/.pi/extensions/lib/plan-approval/schema.ts +22 -8
package/.pi/extensions/lib/plan-approval/types.ts +1 -1
package/.pi/extensions/lib/plan-approval/validate.ts +2 -2
package/.pi/extensions/lib/plan-approval-readiness.ts +192 -0
package/.pi/extensions/lib/plan-debate-eligibility.ts +12 -5
package/.pi/extensions/lib/plan-debate-gate.ts +22 -1
package/.pi/extensions/lib/plan-debate-lanes.ts +32 -2
package/.pi/extensions/lib/plan-review-gate.ts +8 -0
package/.pi/extensions/lib/posthog-client.ts +76 -0
package/.pi/extensions/lib/spawn-policy.ts +3 -3
package/.pi/extensions/observation-bus.ts +2 -0
package/.pi/extensions/policy-gate.ts +26 -19
package/.pi/extensions/review-integrity.ts +91 -10
package/.pi/extensions/sentrux-rules-sync.ts +2 -0
package/.pi/extensions/test-diff-integrity.ts +1 -0
package/.pi/extensions/trace-recorder.ts +2 -0
package/.pi/harness/agents.manifest.json +37 -37
package/.pi/harness/corpus/cron.example +8 -0
package/.pi/harness/corpus/graphify-kb-updater.config.json +214 -0
package/.pi/harness/corpus/systemd/graphify-kb-updater.env.template +4 -0
package/.pi/harness/corpus/systemd/graphify-kb-updater.service +17 -0
package/.pi/harness/corpus/systemd/graphify-kb-updater.timer +11 -0
package/.pi/harness/docs/adrs/0001-harness-constitution.md +2 -1
package/.pi/harness/docs/adrs/0006-sentrux-dual-layer.md +8 -6
package/.pi/harness/docs/adrs/0009-sentrux-rules-lifecycle.md +6 -1
package/.pi/harness/docs/adrs/0031-harness-run-context.md +1 -1
package/.pi/harness/docs/adrs/0032-harness-command-orchestration.md +7 -0
package/.pi/harness/docs/adrs/0034-darwin-plan-research-pipeline.md +3 -3
package/.pi/harness/docs/adrs/0036-implementation-research-and-selective-debate.md +8 -5
package/.pi/harness/docs/adrs/0039-harness-post-run-review-gate.md +47 -0
package/.pi/harness/docs/adrs/0040-practice-grounded-orchestration.md +40 -0
package/.pi/harness/docs/adrs/0041-intelligent-planning-reconnaissance.md +39 -0
package/.pi/harness/docs/adrs/0042-agent-native-orchestration.md +35 -0
package/.pi/harness/docs/adrs/0043-path-first-harness-tools.md +38 -0
package/.pi/harness/docs/adrs/0044-harness-steer-loop.md +37 -0
package/.pi/harness/docs/adrs/0045-phase-scoped-agent-directories.md +33 -0
package/.pi/harness/docs/adrs/README.md +11 -0
package/.pi/harness/docs/graphify-kb-updater-runbook.md +163 -0
package/.pi/harness/docs/practice-map.md +110 -0
package/.pi/harness/env.harness.template +5 -3
package/.pi/harness/evals/smoke/sentrux-stub.json +1 -1
package/.pi/harness/evals/smoke/smoke-harness-plan.mjs +5 -2
package/.pi/harness/specs/README.md +1 -1
package/.pi/harness/specs/harness-run-context.schema.json +11 -0
package/.pi/harness/specs/harness-spawn-context.schema.json +15 -1
package/.pi/harness/specs/plan-execution-plan.schema.json +39 -1
package/.pi/harness/specs/plan-packet.schema.json +4 -0
package/.pi/harness/specs/plan-phase-status.schema.json +17 -0
package/.pi/harness/specs/plan-phase-waiver.schema.json +25 -0
package/.pi/harness/specs/plan-planning-context.schema.json +50 -0
package/.pi/harness/specs/repair-brief.schema.json +45 -0
package/.pi/harness/specs/review-outcome.schema.json +46 -0
package/.pi/harness/specs/sentrux-manifest-proposal.schema.json +80 -0
package/.pi/harness/specs/sentrux-signal.schema.json +43 -0
package/.pi/harness/specs/steer-state.schema.json +20 -0
package/.pi/lib/harness-context-mode-policy.ts +256 -0
package/.pi/lib/harness-project-config.ts +91 -0
package/.pi/lib/harness-repair-brief.ts +145 -0
package/.pi/lib/harness-run-context.ts +591 -32
package/.pi/lib/harness-ui-state.ts +114 -21
package/.pi/prompts/harness-auto.md +10 -10
package/.pi/prompts/harness-critic.md +3 -30
package/.pi/prompts/harness-eval.md +4 -37
package/.pi/prompts/harness-plan.md +116 -54
package/.pi/prompts/harness-review.md +150 -15
package/.pi/prompts/harness-run.md +62 -10
package/.pi/prompts/harness-sentrux-steward.md +55 -0
package/.pi/prompts/harness-setup.md +5 -4
package/.pi/prompts/harness-steer.md +30 -0
package/.pi/scripts/README.md +1 -0
package/.pi/scripts/graphify-kb-updater.mjs +398 -0
package/.pi/scripts/harness-agents-manifest.mjs +1 -1
package/.pi/scripts/harness-project-toggle.mjs +129 -0
package/.pi/scripts/harness-sentrux-cli.mjs +142 -0
package/.pi/scripts/harness-verify.mjs +22 -6
package/.pi/scripts/harness-web-policy-guard.mjs +68 -0
package/.pi/scripts/validate-plan-dag.mjs +3 -3
package/AGENTS.md +1 -0
package/CHANGELOG.md +23 -0
package/README.md +94 -58
package/package.json +5 -4
package/.pi/agents/harness/executor.md +0 -47
package/.pi/agents/harness/planning/scout-graphify.md +0 -37
package/.pi/agents/harness/planning/scout-semantic.md +0 -39
package/.pi/agents/harness/planning/scout-structure.md +0 -35
package/.pi/prompts/git-sync.md +0 -124
/package/.pi/agents/harness/{tie-breaker.md → reviewing/tie-breaker.md} +0 -0

package/.pi/extensions/harness-run-context.ts CHANGED Viewed

@@ -5,18 +5,27 @@
  * in before_agent_start so trace-recorder reuses it on agent_start.
  */
-import { constants } from "node:fs";
-import { access, mkdir, readFile, writeFile } from "node:fs/promises";
-import { dirname, join } from "node:path";
+import {
+	mkdir,
+	readdir,
+	readFile,
+	rename,
+	stat,
+	writeFile,
+} from "node:fs/promises";
+import { basename, dirname, join } from "node:path";
 import type { ExtensionAPI } from "@earendil-works/pi-coding-agent";
 import { Type } from "@sinclair/typebox";
 import {
 	canonicalPlanPath,
+	claimRunOwnership,
 	createFreshRunContext,
+	criticalPathWorkItemIdsFromPlanPacket,
 	driftGateActive,
-	extractCompletionStatuses,
+	evaluateCrossSessionResume,
 	extractWritePathFromToolInput,
 	formatActivePlanBlock,
+	formatCrossSessionResumeMessage,
 	formatPlanContextBlock,
 	getLatestHarnessTurn,
 	getLatestPolicyPhase,
@@ -40,13 +49,20 @@ import {
 	nowIso,
 	type PlanPacketSummary,
 	parseHarnessSlashInput,
+	parseHarnessUseRunArgs,
 	parsePlanApprovalFromMessage,
 	planPacketSummary,
+	readExecutorHandoffFromRun,
 	readPlanPacketFromPath,
+	readReviewOutcomeFromRun,
 	resolveArgsForCommand,
+	resolveCompletionStatuses,
 	saveProjectActiveRun,
 	saveRunContextToDisk,
+	sessionHasResumePromptForRun,
+	shouldAutoClaimHarnessRun,
 	shouldReuseHarnessRunId,
+	steerMaxAttemptsFromEnv,
 	userVisiblePromptSlice,
 	validatePlanOverridePath,
 	validatePlanPacket,
@@ -56,11 +72,12 @@ import {
 	parseStructuredDocument,
 	writeYamlFile,
 } from "../lib/harness-yaml.js";
-import { claimExtensionLoad } from "./lib/extension-load-guard.js";
+import { claimHarnessGovernanceLoad } from "./lib/extension-load-guard.js";
 import {
 	evaluateHarnessSubagentToolCall,
 	isSubmitToolName,
 } from "./lib/harness-subagent-policy.js";
+import { bootstrapHarnessSubprocessFromEnv } from "./lib/harness-subprocess-bootstrap.js";
 import { isReviewRoundArtifactPath } from "./lib/plan-debate-gate.js";
 import { isReviewRoundYamlWriteAllowed } from "./lib/plan-debate-write-guard.js";
@@ -83,6 +100,151 @@ function persistContext(pi: ExtensionAPI, ctx: HarnessRunContext): void {
 	pi.appendEntry("harness-run-context", ctx);
 	void saveRunContextToDisk(ctx);
 	void saveProjectActiveRun(ctx);
+	pi.events.emit("harness-run-context:updated", { run_id: ctx.run_id });
+}
+const PLAN_REVISION_ARTIFACT_FILES = new Set([
+	"planning-context.yaml",
+	"decomposition.yaml",
+	"hypothesis.yaml",
+	"implementation-research.yaml",
+	"stack.yaml",
+	"execution-plan-draft.yaml",
+	"plan-phase-status.yaml",
+	"plan-phase-waiver.yaml",
+	"sentrux-manifest-proposal.yaml",
+]);
+const PLAN_REVISION_ARTIFACT_PREFIXES = [
+	"hypothesis-validation-r",
+	"review-round-r",
+	"plan-evaluator-r",
+	"plan-adversary-r",
+	"sprint-contract-audit-r",
+	"adversary-brief-r",
+] as const;
+async function moveIfExists(from: string, to: string): Promise<boolean> {
+	try {
+		await stat(from);
+	} catch {
+		return false;
+	}
+	await mkdir(dirname(to), { recursive: true });
+	await rename(from, to);
+	return true;
+}
+function isPlanRevisionArtifactFile(name: string): boolean {
+	if (PLAN_REVISION_ARTIFACT_FILES.has(name)) return true;
+	if (name === "review-round-consolidated.yaml") return true;
+	return PLAN_REVISION_ARTIFACT_PREFIXES.some((prefix) =>
+		name.startsWith(prefix),
+	);
+}
+export async function archivePlanRevisionArtifacts(input: {
+	projectRoot: string;
+	runId: string;
+	reason: string;
+	recordedAt?: string;
+}): Promise<{ archiveDir: string; moved: string[] }> {
+	const recordedAt = input.recordedAt ?? nowIso();
+	const revisionId = recordedAt.replace(/[:.]/g, "-");
+	const runDir = join(input.projectRoot, ".pi", "harness", "runs", input.runId);
+	const artifactsDir = join(runDir, "artifacts");
+	const archiveDir = join(artifactsDir, "revisions", revisionId);
+	const moved: string[] = [];
+	async function archiveRel(rel: string): Promise<void> {
+		const ok = await moveIfExists(join(runDir, rel), join(archiveDir, rel));
+		if (ok) moved.push(rel);
+	}
+	await archiveRel("plan-packet.yaml");
+	await archiveRel("plan-review.md");
+	await archiveRel("research-brief.yaml");
+	await archiveRel("debate-messenger");
+	try {
+		const names = await readdir(artifactsDir);
+		for (const name of names) {
+			if (!isPlanRevisionArtifactFile(name)) continue;
+			await archiveRel(join("artifacts", name));
+		}
+	} catch {
+		// No artifacts yet.
+	}
+	const debateRel = join(
+		".pi",
+		"harness",
+		"debates",
+		`plan-${input.runId}.jsonl`,
+	);
+	const debateArchived = await moveIfExists(
+		join(input.projectRoot, debateRel),
+		join(archiveDir, "debates", basename(debateRel)),
+	);
+	if (debateArchived) moved.push(debateRel);
+	if (moved.length > 0) {
+		await mkdir(archiveDir, { recursive: true });
+		await writeFile(
+			join(archiveDir, "revision-reset.json"),
+			`${JSON.stringify(
+				{
+					schema_version: "1.0.0",
+					run_id: input.runId,
+					reason: input.reason,
+					recorded_at: recordedAt,
+					moved,
+				},
+				null,
+				2,
+			)}\n`,
+			"utf-8",
+		);
+	}
+	return { archiveDir, moved };
+}
+function shouldArchiveForPlanRevise(input: {
+	command: string;
+	mode: "create" | "revise" | null;
+	runCtx: HarnessRunContext;
+	reviewOutcome: Awaited<ReturnType<typeof readReviewOutcomeFromRun>>;
+	userPrompt: string;
+}): boolean {
+	if (input.command !== "harness-plan" && input.command !== "harness-auto") {
+		return false;
+	}
+	if (input.mode !== "revise") return false;
+	const next = (input.runCtx.next_recommended_command ?? "").toLowerCase();
+	const prompt = input.userPrompt.toLowerCase();
+	return (
+		input.reviewOutcome?.remediation_class === "plan_gap" ||
+		next.includes("/harness-plan") ||
+		next.includes("revise") ||
+		prompt.includes("--mode revise") ||
+		prompt.includes("--mode=revise") ||
+		prompt.includes("mode: revise")
+	);
+}
+function syncPolicyFromRunContext(
+	pi: ExtensionAPI,
+	entries: unknown[],
+	runCtx: HarnessRunContext,
+): void {
+	syncPolicyFromPlan(
+		pi,
+		entries,
+		runCtx.plan_id ?? "plan-unknown",
+		runCtx.phase,
+		runCtx.plan_ready,
+	);
 }
 function extractTaskSummary(args: string, prompt?: string): string | null {
@@ -164,6 +326,10 @@ function syncPolicyFromPlan(
 	});
 }
+function hydrateFromSession(entries: unknown[]): HarnessRunContext | null {
+	return getLatestRunContext(entries);
+}
 async function hydrateFromDisk(
 	sessionId: string,
 	projectRoot: string,
@@ -201,15 +367,54 @@ function needsClarificationFollowUp(ctx: HarnessRunContext | null): boolean {
 	return ctx?.status === "active" && ctx.last_outcome === "needs_clarification";
 }
+async function offerCrossSessionResume(
+	pi: ExtensionAPI,
+	ctx: {
+		hasUI: boolean;
+		sessionManager: { getEntries(): unknown[] };
+		ui: {
+			notify(message: string, type?: "info" | "warning" | "error"): void;
+		};
+	},
+): Promise<void> {
+	const projectRoot = process.cwd();
+	const entries = getEntries(ctx);
+	const info = await evaluateCrossSessionResume(projectRoot, entries);
+	if (!info || sessionHasResumePromptForRun(entries, info.runId)) return;
+	const content = formatCrossSessionResumeMessage(info);
+	pi.appendEntry("harness-session-resume-prompt", {
+		run_id: info.runId,
+		resume_command: info.resumeCommand,
+		shown_at: nowIso(),
+	});
+	pi.sendMessage({
+		customType: "harness-session-resume-prompt",
+		content,
+		display: true,
+	});
+	if (ctx.hasUI) {
+		ctx.ui.notify(
+			`Harness run on disk. Resume with ${info.resumeCommand}`,
+			"info",
+		);
+	}
+	pi.events.emit("harness-cross-session-resume", {
+		run_id: info.runId,
+		resume_command: info.resumeCommand,
+	});
+}
 export default function harnessRunContext(pi: ExtensionAPI) {
-	if (!claimExtensionLoad("harness-run-context", MODULE_URL)) return;
+	if (!claimHarnessGovernanceLoad("harness-run-context", MODULE_URL)) return;
 	let activeCtx: HarnessRunContext | null = null;
 	pi.on("session_start", async (_event, ctx) => {
-		const sessionId = ctx.sessionManager.getSessionId();
-		const projectRoot = process.cwd();
 		const entries = getEntries(ctx);
-		activeCtx = await hydrateFromDisk(sessionId, projectRoot, entries);
+		activeCtx = hydrateFromSession(entries);
+		const booted = await bootstrapHarnessSubprocessFromEnv(pi, ctx);
+		if (booted) activeCtx = booted;
+		if (!booted) await offerCrossSessionResume(pi, ctx);
 	});
 	pi.on("input", async (event) => {
@@ -338,36 +543,57 @@ export default function harnessRunContext(pi: ExtensionAPI) {
 		}
 		if (command === "harness-use-run") {
-			const runId = args.trim().split(/\s+/)[0];
-			if (!runId) {
+			const parsed = parseHarnessUseRunArgs(args);
+			if (!parsed.runId) {
 				return {
 					message: {
 						customType: "harness-run-context-block",
 						display: true,
-						content: "Usage: /harness-use-run <run-id>",
+						content: "Usage: /harness-use-run <run-id> [--claim] [--readonly]",
 					},
 				};
 			}
-			const disk = await loadRunContextFromDisk(runId, projectRoot);
+			const disk = await loadRunContextFromDisk(parsed.runId, projectRoot);
 			if (!disk) {
 				return {
 					message: {
 						customType: "harness-run-context-block",
 						display: true,
-						content: `No run directory for ${runId}. Check .pi/harness/runs/.`,
+						content: `No run directory for ${parsed.runId}. Check .pi/harness/runs/.`,
 					},
 				};
 			}
 			activeCtx = {
 				...disk,
 				pi_session_id: sessionId,
-				turn_override_run_id: runId,
+				turn_override_run_id: parsed.runId,
 			};
-			if (activeCtx.owner_pi_session_id !== sessionId) {
+			if (parsed.claim) {
+				activeCtx = claimRunOwnership(activeCtx, sessionId);
+			}
+			const statuses = await resolveCompletionStatuses(
+				getEntries(ctx),
+				activeCtx.run_id,
+				projectRoot,
+			);
+			if (activeCtx.owner_pi_session_id !== sessionId && !parsed.claim) {
 				activeCtx.next_recommended_command =
-					"Read-only: owner session holds this run. Use /harness-new-run to take over.";
+					"Read-only: use /harness-use-run <run-id> --claim to take ownership, or /harness-new-run.";
+			} else {
+				activeCtx.next_recommended_command = nextStepAfterOutcome({
+					phase: activeCtx.phase,
+					planStatus: activeCtx.plan_ready ? "ready" : null,
+					lastCompletedStep: activeCtx.last_completed_step,
+					lastOutcome: activeCtx.last_outcome,
+					executionStatus: statuses.executionStatus,
+					evalStatus: statuses.evalStatus,
+					adversaryComplete: statuses.adversaryComplete,
+					aborted: activeCtx.status === "aborted",
+				});
 			}
+			activeCtx.updated_at = nowIso();
 			persistContext(pi, activeCtx);
+			syncPolicyFromRunContext(pi, getEntries(ctx), activeCtx);
 			return {
 				systemPrompt: `${event.systemPrompt}\n\n${formatPlanContextBlock(activeCtx)}`,
 			};
@@ -445,6 +671,7 @@ export default function harnessRunContext(pi: ExtensionAPI) {
 					const crossSessionCmd = new Set([
 						"harness-eval",
 						"harness-review",
+						"harness-steer",
 						"harness-critic",
 						"harness-trace",
 						"harness-incident",
@@ -484,6 +711,13 @@ export default function harnessRunContext(pi: ExtensionAPI) {
 		activeCtx.updated_at = new Date().toISOString();
 		activeCtx.pi_session_id = sessionId;
+		if (
+			shouldAutoClaimHarnessRun(command, args) &&
+			activeCtx.owner_pi_session_id !== sessionId
+		) {
+			activeCtx = claimRunOwnership(activeCtx, sessionId);
+		}
 		if (resolved.planPath && resolved.runId) {
 			const check = validatePlanOverridePath(
 				resolved.planPath,
@@ -518,37 +752,71 @@ export default function harnessRunContext(pi: ExtensionAPI) {
 			activeCtx.last_completed_step === "execute" &&
 			activeCtx.last_outcome === "completed"
 		) {
-			const warn =
-				"Plan already executed in this run. Prefer a new Pi session → /harness-eval, or /harness-abort to replan.";
-			if (ctx.hasUI) ctx.ui.notify(warn, "warning");
+			return {
+				message: {
+					customType: "harness-run-context-block",
+					display: true,
+					content:
+						"Execute already completed for this run. Next: /harness-review (same session), or /harness-abort to replan.",
+				},
+			};
 		}
 		let planSummary: PlanPacketSummary | null = null;
+		let planPacketForSpawn: Awaited<ReturnType<typeof readPlanPacketFromPath>> =
+			null;
 		if (activeCtx.plan_packet_path) {
-			const packet = await readPlanPacketFromPath(activeCtx.plan_packet_path);
-			if (packet) {
+			planPacketForSpawn = await readPlanPacketFromPath(
+				activeCtx.plan_packet_path,
+			);
+			if (planPacketForSpawn) {
 				planSummary = planPacketSummary(
-					packet,
+					planPacketForSpawn,
 					activeCtx.plan_packet_path,
 					activeCtx.plan_ready ? "ready" : "draft",
 				);
-				activeCtx.plan_id = packet.plan_id ?? activeCtx.plan_id;
+				activeCtx.plan_id = planPacketForSpawn.plan_id ?? activeCtx.plan_id;
 			}
 		}
+		let contextSpawnOpts:
+			| Parameters<typeof formatPlanContextBlock>[1]
+			| undefined;
+		if (command === "harness-run" && planPacketForSpawn) {
+			const criticalIds =
+				criticalPathWorkItemIdsFromPlanPacket(planPacketForSpawn);
+			contextSpawnOpts = {
+				mode: "execute",
+				critical_path_work_item_ids: criticalIds,
+			};
+		}
 		let activePlanBlock = "";
+		let planMode: "create" | "revise" | null = null;
 		if (command === "harness-plan" || command === "harness-auto") {
-			const mode =
-				activeCtx.plan_ready || activeCtx.status === "aborted"
+			planMode =
+				activeCtx.plan_id ||
+				activeCtx.plan_packet_path ||
+				activeCtx.status === "aborted"
 					? "revise"
 					: "create";
-			activePlanBlock = formatActivePlanBlock(activeCtx, mode, planSummary);
+			activePlanBlock = formatActivePlanBlock(activeCtx, planMode, planSummary);
 		} else if (command === "harness-run") {
 			activePlanBlock = formatActivePlanBlock(
 				activeCtx,
 				"execute",
 				planSummary,
 			);
+		} else if (command === "harness-steer") {
+			activePlanBlock = formatActivePlanBlock(
+				activeCtx,
+				"execute",
+				planSummary,
+			);
+			contextSpawnOpts = {
+				mode: "repair",
+				repair_brief_path: "artifacts/repair-brief.yaml",
+			};
 		} else if (
 			command === "harness-eval" ||
 			command === "harness-review" ||
@@ -557,14 +825,46 @@ export default function harnessRunContext(pi: ExtensionAPI) {
 			activePlanBlock = formatActivePlanBlock(activeCtx, "read", planSummary);
 		}
+		if (command === "harness-plan" || command === "harness-auto") {
+			const reviewOutcome = await readReviewOutcomeFromRun(
+				activeCtx.run_id,
+				projectRoot,
+			);
+			if (
+				shouldArchiveForPlanRevise({
+					command,
+					mode: planMode,
+					runCtx: activeCtx,
+					reviewOutcome,
+					userPrompt,
+				})
+			) {
+				const reset = await archivePlanRevisionArtifacts({
+					projectRoot,
+					runId: activeCtx.run_id,
+					reason: "review_plan_gap_revise",
+				});
+				if (reset.moved.length > 0) {
+					pi.appendEntry("harness-plan-revision-reset", {
+						run_id: activeCtx.run_id,
+						archive_dir: reset.archiveDir,
+						moved: reset.moved,
+						reason: "review_plan_gap_revise",
+						recorded_at: nowIso(),
+					});
+				}
+			}
+		}
 		persistContext(pi, activeCtx);
 		return {
-			systemPrompt: `${event.systemPrompt}\n\n${formatPlanContextBlock(activeCtx)}${activePlanBlock ? `\n\n${activePlanBlock}` : ""}`,
+			systemPrompt: `${event.systemPrompt}\n\n${formatPlanContextBlock(activeCtx, contextSpawnOpts)}${activePlanBlock ? `\n\n${activePlanBlock}` : ""}`,
 		};
 	});
 	pi.on("agent_end", async (_event, ctx) => {
+		const projectRoot = process.cwd();
 		const entries = getEntries(ctx);
 		if (!activeCtx) {
 			activeCtx = getLatestRunContext(entries);
@@ -591,9 +891,6 @@ export default function harnessRunContext(pi: ExtensionAPI) {
 			: parseHarnessSlashInput(userVisiblePromptSlice(lastPrompt));
 		if (!parsed && !needsClarificationFollowUp(activeCtx)) return;
-		const policyPhase = getLatestPolicyPhase(entries) ?? activeCtx.phase;
-		activeCtx.phase = policyPhase;
 		if (parsed?.command === "harness-abort") {
 			activeCtx.status = "aborted";
 			activeCtx.plan_ready = false;
@@ -654,27 +951,82 @@ export default function harnessRunContext(pi: ExtensionAPI) {
 		activeCtx.plan_ready = planReady;
-		const statuses = extractCompletionStatuses(entries);
+		const statuses = await resolveCompletionStatuses(
+			entries,
+			activeCtx.run_id,
+			projectRoot,
+		);
 		if (parsed?.command === "harness-run") {
 			activeCtx.last_completed_step = "execute";
-			activeCtx.last_outcome =
-				statuses.executionStatus ?? activeCtx.last_outcome ?? "completed";
+			let execStatus = statuses.executionStatus;
+			if (!execStatus) {
+				const handoff = await readExecutorHandoffFromRun(
+					activeCtx.run_id,
+					projectRoot,
+				);
+				execStatus = handoff?.execution_status ?? null;
+			}
+			activeCtx.last_outcome = execStatus ?? "completed";
+			activeCtx.phase = "evaluate";
 		}
-		if (parsed?.command === "harness-eval") {
-			activeCtx.last_completed_step = "evaluate";
-			activeCtx.last_outcome = statuses.evalStatus ?? activeCtx.last_outcome;
+		if (parsed?.command === "harness-steer") {
+			activeCtx.last_completed_step = "steer";
+			activeCtx.steer_attempt = (activeCtx.steer_attempt ?? 0) + 1;
+			activeCtx.steer_max_attempts =
+				activeCtx.steer_max_attempts ?? steerMaxAttemptsFromEnv();
+			activeCtx.phase = "execute";
+			syncPolicyFromRunContext(pi, getEntries(ctx), activeCtx);
+		}
+		if (
+			parsed?.command === "harness-eval" ||
+			parsed?.command === "harness-review" ||
+			parsed?.command === "harness-critic"
+		) {
+			activeCtx.last_completed_step =
+				parsed.command === "harness-critic" ? "adversary" : "review";
+			if (statuses.evalStatus) {
+				activeCtx.last_outcome = statuses.evalStatus;
+			}
+			if (statuses.adversaryComplete) {
+				activeCtx.phase = "adversary";
+				activeCtx.last_completed_step = "adversary";
+			} else if (statuses.evalStatus) {
+				activeCtx.phase = "evaluate";
+			}
 		}
+		const reviewOutcome = await readReviewOutcomeFromRun(
+			activeCtx.run_id,
+			projectRoot,
+		);
+		const reviewComplete =
+			activeCtx.last_completed_step === "review" ||
+			activeCtx.last_completed_step === "adversary";
 		const next = nextStepAfterOutcome({
 			phase: activeCtx.phase,
-			planStatus: statuses.planStatus ?? activeCtx.last_outcome,
+			planStatus: statuses.planStatus,
+			lastCompletedStep: activeCtx.last_completed_step,
+			lastOutcome: activeCtx.last_outcome,
 			executionStatus: statuses.executionStatus,
 			evalStatus: statuses.evalStatus,
+			adversaryComplete: statuses.adversaryComplete,
 			aborted: activeCtx.status === "aborted",
+			remediationClass: reviewOutcome?.remediation_class ?? null,
+			steerAttempt: activeCtx.steer_attempt ?? 0,
+			steerMaxAttempts:
+				activeCtx.steer_max_attempts ?? steerMaxAttemptsFromEnv(),
+			reviewComplete,
 		});
 		activeCtx.next_recommended_command = next;
 		activeCtx.updated_at = new Date().toISOString();
+		if (
+			parsed?.command === "harness-run" &&
+			activeCtx.last_outcome === "completed"
+		) {
+			syncPolicyFromRunContext(pi, getEntries(ctx), activeCtx);
+		}
 		persistContext(pi, activeCtx);
 		pi.appendEntry("harness-step-handoff", {
@@ -719,26 +1071,6 @@ export default function harnessRunContext(pi: ExtensionAPI) {
 	});
 	pi.on("tool_call", async (event, ctx) => {
-		// #region agent log
-		fetch("http://127.0.0.1:7928/ingest/a5d40896-34cb-4f12-97db-df7ada0b22f0", {
-			method: "POST",
-			headers: {
-				"Content-Type": "application/json",
-				"X-Debug-Session-Id": "2ca12b",
-			},
-			body: JSON.stringify({
-				sessionId: "2ca12b",
-				location: "harness-run-context.ts:tool_call",
-				message: "submit policy hook",
-				data: {
-					toolName: event.toolName,
-					typeofIsSubmitToolName: typeof isSubmitToolName,
-				},
-				timestamp: Date.now(),
-				hypothesisId: "H1",
-			}),
-		}).catch(() => {});
-		// #endregion
 		if (isSubmitToolName(event.toolName)) {
 			const decision = evaluateHarnessSubagentToolCall(
 				event.toolName,
@@ -997,6 +1329,19 @@ export default function harnessRunContext(pi: ExtensionAPI) {
 			}
 			const pathArg = String((params as { path?: string }).path ?? "").trim();
 			const content = String((params as { content?: string }).content ?? "");
+			const HARNESS_YAML_INLINE_MAX = 32 * 1024;
+			if (content.length > HARNESS_YAML_INLINE_MAX) {
+				return {
+					content: [
+						{
+							type: "text",
+							text: `Content exceeds ${HARNESS_YAML_INLINE_MAX} bytes. Subagent must submit_* to disk, then use merge_harness_yaml with source_path or a small patch.`,
+						},
+					],
+					details: { path: pathArg, bytes: content.length },
+					isError: true,
+				};
+			}
 			if (!pathArg || !content.trim()) {
 				return {
 					content: [
@@ -1025,6 +1370,22 @@ export default function harnessRunContext(pi: ExtensionAPI) {
 				};
 			}
 			const relForGate = pathArg.replace(/\\/g, "/");
+			const subagentOnly = new Set([
+				"artifacts/eval-verdict.yaml",
+				"artifacts/adversary-report.yaml",
+			]);
+			if (subagentOnly.has(relForGate)) {
+				return {
+					content: [
+						{
+							type: "text",
+							text: `Path not allowed: ${pathArg}. Post-run verdicts must be written via submit_* in harness/reviewing/evaluator or harness/reviewing/adversary subagents; parent gates with harness_artifact_ready only.`,
+						},
+					],
+					details: { path: pathArg },
+					isError: true,
+				};
+			}
 			if (/\.json$/i.test(relForGate) && relForGate.startsWith("artifacts/")) {
 				return {
 					content: [
@@ -1078,18 +1439,34 @@ export default function harnessRunContext(pi: ExtensionAPI) {
 	});
 	pi.registerTool({
-		name: "harness_artifact_ready",
-		label: "Harness Artifact Ready",
+		name: "merge_harness_yaml",
+		label: "Merge Harness YAML",
 		description:
-			"Check that harness artifact paths exist under the active run (no JSON parsing).",
+			"Shallow-merge a patch or another run artifact into an existing harness YAML file (path-first).",
+		promptSnippet:
+			"Merge artifact paths without pasting large bodies into tool args.",
+		promptGuidelines: [
+			"Prefer source_path pointing at artifacts/*.yaml from subagent submit_*.",
+			"Use patch for small top-level keys only.",
+		],
 		parameters: Type.Object({
-			paths: Type.Array(Type.String(), {
-				minItems: 1,
+			path: Type.String({
 				description:
-					"Relative paths under the run dir, e.g. artifacts/decomposition.yaml",
+					"Target path under the active run, e.g. research-brief.yaml",
 			}),
+			patch: Type.Optional(
+				Type.String({
+					description: "Small YAML/JSON object merged into the target",
+				}),
+			),
+			source_path: Type.Optional(
+				Type.String({
+					description:
+						"Relative path under the run to merge into target (e.g. artifacts/implementation-research.yaml)",
+				}),
+			),
 		}),
-		async execute(_id, params, _signal, _onUpdate, ctx) {
+		async execute(_toolCallId, params, _signal, _onUpdate, ctx) {
 			const entries = getEntries(ctx);
 			const runCtx = getLatestRunContext(entries) ?? activeCtx;
 			if (!runCtx?.run_id) {
@@ -1099,8 +1476,38 @@ export default function harnessRunContext(pi: ExtensionAPI) {
 					isError: true,
 				};
 			}
-			const paths = (params as { paths?: string[] }).paths ?? [];
+			const pathArg = String((params as { path?: string }).path ?? "").trim();
+			const patchRaw = String((params as { patch?: string }).patch ?? "");
+			const sourcePath = String(
+				(params as { source_path?: string }).source_path ?? "",
+			).trim();
+			if (!pathArg || (!patchRaw.trim() && !sourcePath)) {
+				return {
+					content: [
+						{
+							type: "text",
+							text: "merge_harness_yaml requires path and patch or source_path.",
+						},
+					],
+					details: {},
+					isError: true,
+				};
+			}
 			const projectRoot = process.cwd();
+			const absPath = normalizeHarnessPath(pathArg, projectRoot);
+			const scoped = await isPlanPhaseScopedWrite(absPath, runCtx, projectRoot);
+			if (!scoped) {
+				return {
+					content: [
+						{
+							type: "text",
+							text: `Path not allowed: ${pathArg}.`,
+						},
+					],
+					details: { path: pathArg },
+					isError: true,
+				};
+			}
 			const runRoot = join(
 				projectRoot,
 				".pi",
@@ -1108,59 +1515,277 @@ export default function harnessRunContext(pi: ExtensionAPI) {
 				"runs",
 				runCtx.run_id,
 			);
-			const missing: string[] = [];
-			const present: string[] = [];
-			for (const rel of paths) {
-				const normalized = rel.replace(/\\/g, "/");
-				const abs = join(runRoot, normalized);
+			let existing: Record<string, unknown> = {};
+			try {
+				const { readYamlFile } = await import("../lib/harness-yaml.js");
+				const cur = await readYamlFile(absPath, pathArg);
+				if (cur && typeof cur === "object" && !Array.isArray(cur)) {
+					existing = cur as Record<string, unknown>;
+				}
+			} catch {
+				existing = {};
+			}
+			let patchDoc: Record<string, unknown>;
+			if (sourcePath) {
+				const srcRel = sourcePath.replace(/\\/g, "/").replace(/^\.\//, "");
+				const srcAbs = srcRel.startsWith(".pi/")
+					? normalizeHarnessPath(srcRel, projectRoot)
+					: join(runRoot, srcRel);
 				try {
-					await access(abs, constants.R_OK);
-					present.push(normalized);
-				} catch {
-					missing.push(normalized);
+					patchDoc = parseStructuredDocument(
+						await readFile(srcAbs, "utf-8"),
+						sourcePath,
+					) as Record<string, unknown>;
+				} catch (err) {
+					const msg = err instanceof Error ? err.message : String(err);
+					return {
+						content: [{ type: "text", text: msg }],
+						details: { source_path: sourcePath },
+						isError: true,
+					};
 				}
+			} else {
+				try {
+					patchDoc = parseStructuredDocument(patchRaw, pathArg) as Record<
+						string,
+						unknown
+					>;
+				} catch (err) {
+					const msg = err instanceof Error ? err.message : String(err);
+					return {
+						content: [{ type: "text", text: msg }],
+						details: { path: pathArg },
+						isError: true,
+					};
+				}
+			}
+			const merged = { ...existing, ...patchDoc };
+			await mkdir(dirname(absPath), { recursive: true });
+			await writeYamlFile(absPath, merged);
+			return {
+				content: [
+					{
+						type: "text",
+						text: `Merged into ${pathArg} as canonical YAML.`,
+					},
+				],
+				details: { path: absPath },
+			};
+		},
+	});
+	pi.registerTool({
+		name: "harness_synthesize_repair_brief",
+		label: "Synthesize Repair Brief",
+		description:
+			"Build artifacts/repair-brief.yaml from review-outcome, eval-verdict, and adversary paths (no large inline bodies).",
+		promptSnippet:
+			"After /harness-review when remediation_class is implementation_gap.",
+		promptGuidelines: [
+			"Pass artifact paths only; tool reads YAML from disk.",
+			"Default output: artifacts/repair-brief.yaml with steer_attempt from run context + 1.",
+		],
+		parameters: Type.Object({
+			review_outcome_path: Type.Optional(Type.String()),
+			eval_verdict_path: Type.Optional(Type.String()),
+			adversary_report_path: Type.Optional(Type.String()),
+			plan_packet_path: Type.Optional(Type.String()),
+			output_path: Type.Optional(
+				Type.String({
+					description: "Default artifacts/repair-brief.yaml",
+				}),
+			),
+		}),
+		async execute(_toolCallId, params, _signal, _onUpdate, ctx) {
+			const entries = getEntries(ctx);
+			const runCtx = getLatestRunContext(entries) ?? activeCtx;
+			if (!runCtx?.run_id) {
+				return {
+					content: [{ type: "text", text: "No active harness run." }],
+					details: {},
+					isError: true,
+				};
+			}
+			const projectRoot = process.cwd();
+			const steerAttempt = (runCtx.steer_attempt ?? 0) + 1;
+			const { synthesizeRepairBrief } = await import(
+				"../lib/harness-repair-brief.js"
+			);
+			const brief = await synthesizeRepairBrief({
+				runId: runCtx.run_id,
+				projectRoot,
+				steerAttempt,
+				reviewOutcomePath: (params as { review_outcome_path?: string })
+					.review_outcome_path,
+				evalVerdictPath: (params as { eval_verdict_path?: string })
+					.eval_verdict_path,
+				adversaryReportPath: (params as { adversary_report_path?: string })
+					.adversary_report_path,
+				planPacketPath:
+					(params as { plan_packet_path?: string }).plan_packet_path ??
+					runCtx.plan_packet_path ??
+					"plan-packet.yaml",
+			});
+			const outputPath =
+				String((params as { output_path?: string }).output_path ?? "").trim() ||
+				"artifacts/repair-brief.yaml";
+			const absOut = normalizeHarnessPath(
+				outputPath.startsWith(runCtx.run_id)
+					? outputPath
+					: join(
+							projectRoot,
+							".pi",
+							"harness",
+							"runs",
+							runCtx.run_id,
+							outputPath,
+						),
+				projectRoot,
+			);
+			const scoped = await isPlanPhaseScopedWrite(absOut, runCtx, projectRoot);
+			if (!scoped) {
+				return {
+					content: [
+						{
+							type: "text",
+							text: `Output path not allowed: ${outputPath}`,
+						},
+					],
+					details: {},
+					isError: true,
+				};
 			}
-			const ok = missing.length === 0;
+			await mkdir(dirname(absOut), { recursive: true });
+			await writeYamlFile(absOut, brief);
 			return {
 				content: [
 					{
 						type: "text",
-						text: ok
-							? `All ${present.length} artifact(s) present.`
-							: `Missing: ${missing.join(", ")}`,
+						text: `Wrote ${outputPath} (steer_attempt=${steerAttempt}).`,
 					},
 				],
-				details: { ok, present, missing, run_id: runCtx.run_id },
-				isError: !ok,
+				details: { path: absOut, steer_attempt: steerAttempt },
+			};
+		},
+	});
+	pi.registerTool({
+		name: "harness_artifact_ready",
+		label: "Harness Artifact Ready",
+		description:
+			"Check harness artifact paths exist and pass minimal schema/content gates under the active run.",
+		parameters: Type.Object({
+			paths: Type.Array(Type.String(), {
+				minItems: 1,
+				description:
+					"Relative paths under the run dir, e.g. artifacts/decomposition.yaml",
+			}),
+		}),
+		async execute(_id, params, _signal, _onUpdate, ctx) {
+			const entries = getEntries(ctx);
+			const runCtx = getLatestRunContext(entries) ?? activeCtx;
+			if (!runCtx?.run_id) {
+				return {
+					content: [{ type: "text", text: "No active harness run." }],
+					details: {},
+					isError: true,
+				};
+			}
+			const paths = (params as { paths?: string[] }).paths ?? [];
+			const projectRoot = process.cwd();
+			const runRoot = join(
+				projectRoot,
+				".pi",
+				"harness",
+				"runs",
+				runCtx.run_id,
+			);
+			const specsDir = join(projectRoot, ".pi", "harness", "specs");
+			const { validateHarnessArtifactPaths } = await import(
+				"./lib/harness-artifact-gate.js"
+			);
+			const gate = await validateHarnessArtifactPaths(runRoot, paths, specsDir);
+			const text = gate.ok
+				? `All ${gate.present.length} artifact(s) present and valid.`
+				: [
+						gate.missing.length > 0
+							? `Missing: ${gate.missing.join(", ")}`
+							: null,
+						gate.errors.length > 0 ? gate.errors.join("\n") : null,
+					]
+						.filter(Boolean)
+						.join("\n");
+			return {
+				content: [{ type: "text", text }],
+				details: {
+					ok: gate.ok,
+					present: gate.present,
+					missing: gate.missing,
+					errors: gate.errors,
+					run_id: runCtx.run_id,
+				},
+				isError: !gate.ok,
 			};
 		},
 	});
 	pi.registerCommand("harness-use-run", {
-		description: "Point this session at an existing run directory (recovery)",
+		description:
+			"Point this session at an existing run directory (recovery; --claim for write ownership)",
 		handler: async (args, ctx) => {
-			const runId = args.trim().split(/\s+/)[0];
-			if (!runId) {
+			const parsed = parseHarnessUseRunArgs(args);
+			if (!parsed.runId) {
 				if (ctx.hasUI)
-					ctx.ui.notify("Usage: /harness-use-run <run-id>", "warning");
+					ctx.ui.notify(
+						"Usage: /harness-use-run <run-id> [--claim] [--readonly]",
+						"warning",
+					);
 				return;
 			}
 			const projectRoot = process.cwd();
-			const disk = await loadRunContextFromDisk(runId, projectRoot);
+			const sessionId = ctx.sessionManager.getSessionId();
+			const disk = await loadRunContextFromDisk(parsed.runId, projectRoot);
 			if (!disk) {
-				if (ctx.hasUI) ctx.ui.notify(`Run not found: ${runId}`, "error");
+				if (ctx.hasUI) ctx.ui.notify(`Run not found: ${parsed.runId}`, "error");
 				return;
 			}
 			activeCtx = {
 				...disk,
-				pi_session_id: ctx.sessionManager.getSessionId(),
+				pi_session_id: sessionId,
 			};
+			if (parsed.claim) {
+				activeCtx = claimRunOwnership(activeCtx, sessionId);
+			}
+			const statuses = await resolveCompletionStatuses(
+				getEntries(ctx),
+				activeCtx.run_id,
+				projectRoot,
+			);
+			if (activeCtx.owner_pi_session_id !== sessionId && !parsed.claim) {
+				activeCtx.next_recommended_command =
+					"Read-only: use /harness-use-run <run-id> --claim to take ownership.";
+			} else {
+				activeCtx.next_recommended_command = nextStepAfterOutcome({
+					phase: activeCtx.phase,
+					planStatus: activeCtx.plan_ready ? "ready" : null,
+					lastCompletedStep: activeCtx.last_completed_step,
+					lastOutcome: activeCtx.last_outcome,
+					executionStatus: statuses.executionStatus,
+					evalStatus: statuses.evalStatus,
+					adversaryComplete: statuses.adversaryComplete,
+					aborted: activeCtx.status === "aborted",
+				});
+			}
+			activeCtx.updated_at = nowIso();
 			persistContext(pi, activeCtx);
-			if (ctx.hasUI)
+			syncPolicyFromRunContext(pi, getEntries(ctx), activeCtx);
+			if (ctx.hasUI) {
+				const mode = parsed.claim ? "claimed" : "bound (read-only)";
 				ctx.ui.notify(
-					`Session bound to run ${runId}. See /harness-run-status.`,
+					`Session ${mode} to run ${parsed.runId}. See /harness-run-status.`,
 					"info",
 				);
+			}
 		},
 	});
 }