npm - ultimate-pi - Versions diffs - 0.17.0 → 0.18.1 - Mend

ultimate-pi 0.17.0 → 0.18.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (137) hide show

package/.agents/skills/harness-context/SKILL.md +13 -6
package/.agents/skills/harness-debate-plan/SKILL.md +37 -20
package/.agents/skills/harness-decisions/SKILL.md +1 -1
package/.agents/skills/harness-eval/SKILL.md +6 -21
package/.agents/skills/harness-governor/SKILL.md +4 -3
package/.agents/skills/harness-orchestration/SKILL.md +41 -53
package/.agents/skills/harness-plan/SKILL.md +23 -12
package/.agents/skills/harness-review/SKILL.md +52 -0
package/.agents/skills/harness-sentrux-setup/SKILL.md +16 -3
package/.agents/skills/harness-steer/SKILL.md +14 -0
package/.agents/skills/sentrux/SKILL.md +9 -9
package/.pi/agents/harness/planning/decompose.md +7 -4
package/.pi/agents/harness/planning/hypothesis-validator.md +2 -0
package/.pi/agents/harness/planning/hypothesis.md +3 -1
package/.pi/agents/harness/planning/plan-adversary.md +2 -0
package/.pi/agents/harness/planning/plan-evaluator.md +2 -0
package/.pi/agents/harness/planning/plan-synthesizer.md +25 -0
package/.pi/agents/harness/planning/planning-context.md +48 -0
package/.pi/agents/harness/planning/review-integrator.md +2 -0
package/.pi/agents/harness/planning/sprint-contract-auditor.md +2 -0
package/.pi/agents/harness/{adversary.md → reviewing/adversary.md} +3 -10
package/.pi/agents/harness/{evaluator.md → reviewing/evaluator.md} +3 -12
package/.pi/agents/harness/running/executor.md +45 -0
package/.pi/agents/harness/sentrux-steward.md +51 -0
package/.pi/extensions/00-harness-project-control.ts +133 -0
package/.pi/extensions/00-posthog-network-bootstrap.ts +11 -0
package/.pi/extensions/budget-guard.ts +2 -0
package/.pi/extensions/debate-orchestrator.ts +2 -0
package/.pi/extensions/harness-ask-user.ts +2 -2
package/.pi/extensions/harness-debate-tools.ts +2 -2
package/.pi/extensions/harness-live-widget.ts +60 -3
package/.pi/extensions/harness-plan-approval.ts +64 -58
package/.pi/extensions/harness-run-context.ts +715 -90
package/.pi/extensions/harness-subagent-submit.ts +46 -12
package/.pi/extensions/harness-subagents.ts +2 -2
package/.pi/extensions/harness-telemetry.ts +2 -0
package/.pi/extensions/harness-web-tools.ts +2 -2
package/.pi/extensions/lib/extension-load-guard.ts +10 -0
package/.pi/extensions/lib/harness-artifact-gate.ts +172 -0
package/.pi/extensions/lib/harness-posthog.ts +9 -5
package/.pi/extensions/lib/harness-spawn-topology.ts +165 -0
package/.pi/extensions/lib/harness-subagent-auth.ts +1 -2
package/.pi/extensions/lib/harness-subagent-policy.ts +28 -24
package/.pi/extensions/lib/harness-subagent-precheck.ts +36 -10
package/.pi/extensions/lib/harness-subagent-submit-pipeline.ts +66 -2
package/.pi/extensions/lib/harness-subagent-submit-registry.ts +22 -22
package/.pi/extensions/lib/harness-subagents-bridge.ts +7 -29
package/.pi/extensions/lib/harness-subprocess-bootstrap.ts +73 -0
package/.pi/extensions/lib/plan-approval/create-plan.ts +2 -3
package/.pi/extensions/lib/plan-approval/resolve-disk.ts +102 -0
package/.pi/extensions/lib/plan-approval/schema.ts +22 -8
package/.pi/extensions/lib/plan-approval/types.ts +1 -1
package/.pi/extensions/lib/plan-approval/validate.ts +2 -2
package/.pi/extensions/lib/plan-approval-readiness.ts +192 -0
package/.pi/extensions/lib/plan-debate-eligibility.ts +12 -5
package/.pi/extensions/lib/plan-debate-gate.ts +22 -1
package/.pi/extensions/lib/plan-debate-lanes.ts +32 -2
package/.pi/extensions/lib/plan-review-gate.ts +8 -0
package/.pi/extensions/lib/posthog-client.ts +76 -0
package/.pi/extensions/lib/spawn-policy.ts +3 -3
package/.pi/extensions/observation-bus.ts +2 -0
package/.pi/extensions/policy-gate.ts +26 -19
package/.pi/extensions/review-integrity.ts +91 -10
package/.pi/extensions/sentrux-rules-sync.ts +2 -0
package/.pi/extensions/test-diff-integrity.ts +1 -0
package/.pi/extensions/trace-recorder.ts +2 -0
package/.pi/harness/agents.manifest.json +37 -37
package/.pi/harness/corpus/cron.example +8 -0
package/.pi/harness/corpus/graphify-kb-updater.config.json +214 -0
package/.pi/harness/corpus/systemd/graphify-kb-updater.env.template +4 -0
package/.pi/harness/corpus/systemd/graphify-kb-updater.service +17 -0
package/.pi/harness/corpus/systemd/graphify-kb-updater.timer +11 -0
package/.pi/harness/docs/adrs/0001-harness-constitution.md +2 -1
package/.pi/harness/docs/adrs/0006-sentrux-dual-layer.md +8 -6
package/.pi/harness/docs/adrs/0009-sentrux-rules-lifecycle.md +6 -1
package/.pi/harness/docs/adrs/0031-harness-run-context.md +1 -1
package/.pi/harness/docs/adrs/0032-harness-command-orchestration.md +7 -0
package/.pi/harness/docs/adrs/0034-darwin-plan-research-pipeline.md +3 -3
package/.pi/harness/docs/adrs/0036-implementation-research-and-selective-debate.md +8 -5
package/.pi/harness/docs/adrs/0039-harness-post-run-review-gate.md +47 -0
package/.pi/harness/docs/adrs/0040-practice-grounded-orchestration.md +40 -0
package/.pi/harness/docs/adrs/0041-intelligent-planning-reconnaissance.md +39 -0
package/.pi/harness/docs/adrs/0042-agent-native-orchestration.md +35 -0
package/.pi/harness/docs/adrs/0043-path-first-harness-tools.md +38 -0
package/.pi/harness/docs/adrs/0044-harness-steer-loop.md +37 -0
package/.pi/harness/docs/adrs/0045-phase-scoped-agent-directories.md +33 -0
package/.pi/harness/docs/adrs/README.md +11 -0
package/.pi/harness/docs/graphify-kb-updater-runbook.md +163 -0
package/.pi/harness/docs/practice-map.md +110 -0
package/.pi/harness/env.harness.template +5 -3
package/.pi/harness/evals/smoke/sentrux-stub.json +1 -1
package/.pi/harness/evals/smoke/smoke-harness-plan.mjs +5 -2
package/.pi/harness/specs/README.md +1 -1
package/.pi/harness/specs/harness-run-context.schema.json +11 -0
package/.pi/harness/specs/harness-spawn-context.schema.json +15 -1
package/.pi/harness/specs/plan-execution-plan.schema.json +39 -1
package/.pi/harness/specs/plan-packet.schema.json +4 -0
package/.pi/harness/specs/plan-phase-status.schema.json +17 -0
package/.pi/harness/specs/plan-phase-waiver.schema.json +25 -0
package/.pi/harness/specs/plan-planning-context.schema.json +50 -0
package/.pi/harness/specs/repair-brief.schema.json +45 -0
package/.pi/harness/specs/review-outcome.schema.json +46 -0
package/.pi/harness/specs/sentrux-manifest-proposal.schema.json +80 -0
package/.pi/harness/specs/sentrux-signal.schema.json +43 -0
package/.pi/harness/specs/steer-state.schema.json +20 -0
package/.pi/lib/harness-context-mode-policy.ts +256 -0
package/.pi/lib/harness-project-config.ts +91 -0
package/.pi/lib/harness-repair-brief.ts +145 -0
package/.pi/lib/harness-run-context.ts +591 -32
package/.pi/lib/harness-ui-state.ts +114 -21
package/.pi/prompts/harness-auto.md +10 -10
package/.pi/prompts/harness-critic.md +3 -30
package/.pi/prompts/harness-eval.md +4 -37
package/.pi/prompts/harness-plan.md +116 -54
package/.pi/prompts/harness-review.md +150 -15
package/.pi/prompts/harness-run.md +62 -10
package/.pi/prompts/harness-sentrux-steward.md +55 -0
package/.pi/prompts/harness-setup.md +5 -4
package/.pi/prompts/harness-steer.md +30 -0
package/.pi/scripts/README.md +1 -0
package/.pi/scripts/graphify-kb-updater.mjs +398 -0
package/.pi/scripts/harness-agents-manifest.mjs +1 -1
package/.pi/scripts/harness-project-toggle.mjs +129 -0
package/.pi/scripts/harness-sentrux-cli.mjs +142 -0
package/.pi/scripts/harness-verify.mjs +22 -6
package/.pi/scripts/harness-web-policy-guard.mjs +68 -0
package/.pi/scripts/validate-plan-dag.mjs +3 -3
package/AGENTS.md +1 -0
package/CHANGELOG.md +23 -0
package/README.md +94 -58
package/package.json +5 -4
package/.pi/agents/harness/executor.md +0 -47
package/.pi/agents/harness/planning/scout-graphify.md +0 -37
package/.pi/agents/harness/planning/scout-semantic.md +0 -39
package/.pi/agents/harness/planning/scout-structure.md +0 -35
package/.pi/prompts/git-sync.md +0 -124
/package/.pi/agents/harness/{tie-breaker.md → reviewing/tie-breaker.md} +0 -0

package/.pi/lib/harness-run-context.ts CHANGED Viewed

@@ -37,6 +37,10 @@ export interface HarnessRunContext {
 	updated_at: string;
 	harness_run_started_emitted?: boolean;
 	turn_override_run_id?: string | null;
+	/** Persisted steer gate approval (cross-session via run-context.yaml). */
+	steer_approved?: boolean;
+	steer_attempt?: number;
+	steer_max_attempts?: number;
 }
 export interface ProjectActiveRunPointer {
@@ -84,6 +88,7 @@ const HARNESS_COMMANDS = new Set([
 	"harness-run",
 	"harness-eval",
 	"harness-review",
+	"harness-steer",
 	"harness-critic",
 	"harness-trace",
 	"harness-incident",
@@ -147,6 +152,24 @@ const PLAN_RUN_SCOPED_ROOT_FILES = new Set([
 	PLAN_REVIEW_BASENAME,
 ]);
+/** Parent orchestrator artifacts writable during evaluate/adversary (ADR 0044). */
+export const EVALUATE_PHASE_ORCHESTRATOR_ARTIFACTS = new Set([
+	"benchmark-log.yaml",
+	"review-outcome.yaml",
+	"repair-brief.yaml",
+	"steer-state.yaml",
+	"eval-benchmark.yaml",
+]);
+export const DEFAULT_STEER_MAX_ATTEMPTS = 3;
+export function steerMaxAttemptsFromEnv(): number {
+	const raw = process.env.HARNESS_STEER_MAX_ATTEMPTS?.trim();
+	if (!raw) return DEFAULT_STEER_MAX_ATTEMPTS;
+	const n = Number.parseInt(raw, 10);
+	return Number.isFinite(n) && n > 0 ? n : DEFAULT_STEER_MAX_ATTEMPTS;
+}
 const MUTATING_FILE_TOOLS = new Set(["write", "edit"]);
 const PLAN_APPROVE_OPTION =
@@ -179,6 +202,7 @@ export const HARNESS_COMMAND_PHASE: Record<string, HarnessPhase> = {
 	"harness-run": "execute",
 	"harness-eval": "evaluate",
 	"harness-review": "evaluate",
+	"harness-steer": "execute",
 	"harness-critic": "adversary",
 	"harness-trace": "evaluate",
 	"harness-incident": "evaluate",
@@ -241,9 +265,49 @@ export function isPlanRunScopedRelativePath(rel: string): boolean {
 		const file = parts[2];
 		return file.endsWith(".yaml") || file.endsWith(".yml");
 	}
+	if (
+		parts.length === 4 &&
+		parts[1] === "artifacts" &&
+		parts[2] === "context-bundles" &&
+		(parts[3].endsWith(".yaml") || parts[3].endsWith(".yml"))
+	) {
+		return true;
+	}
 	return false;
 }
+export function isEvaluatePhaseOrchestratorArtifact(rel: string): boolean {
+	if (rel.startsWith("..") || isAbsolute(rel)) return false;
+	const parts = rel.split(/[/\\]/);
+	if (parts.length !== 3 || parts[1] !== "artifacts") return false;
+	return EVALUATE_PHASE_ORCHESTRATOR_ARTIFACTS.has(parts[2]);
+}
+async function planRunScopedRelative(
+	absPath: string,
+	runCtx: HarnessRunContext,
+	projectRoot: string,
+): Promise<string | null> {
+	let resolved: string;
+	try {
+		resolved = await realpath(normalizeHarnessPath(absPath, projectRoot));
+	} catch {
+		resolved = normalizeHarnessPath(absPath, projectRoot);
+	}
+	const runsRoot = resolve(harnessRunsRoot(projectRoot));
+	let runsReal: string;
+	try {
+		runsReal = await realpath(runsRoot);
+	} catch {
+		runsReal = runsRoot;
+	}
+	const rel = relative(runsReal, resolved);
+	if (!isPlanRunScopedRelativePath(rel)) return null;
+	const parts = rel.split(/[/\\]/);
+	if (parts[0] !== runCtx.run_id) return null;
+	return rel;
+}
 /** True when absPath is a writable plan-run artifact for the active run. */
 export async function isPlanPhaseScopedWrite(
 	absPath: string,
@@ -502,7 +566,8 @@ export async function isPlanPhaseAllowedMutation(
 	if (
 		runCtx?.owner_pi_session_id &&
 		opts.currentSessionId &&
-		runCtx.owner_pi_session_id !== opts.currentSessionId
+		runCtx.owner_pi_session_id !== opts.currentSessionId &&
+		!isHarnessSubprocess()
 	) {
 		return {
 			allowed: false,
@@ -540,10 +605,16 @@ export async function isPlanPhaseAllowedMutation(
 		if (phase === "execute" || phase === "merge") {
 			return { allowed: true, isScopedPlanWrite: true };
 		}
+		if (phase === "evaluate" || phase === "adversary") {
+			const rel = await planRunScopedRelative(target, runCtx, projectRoot);
+			if (rel && isEvaluatePhaseOrchestratorArtifact(rel)) {
+				return { allowed: true, isScopedPlanWrite: true };
+			}
+		}
 		return {
 			allowed: false,
 			isScopedPlanWrite: true,
-			reason: `harness-run-context: plan-packet.yaml is read-only in phase '${phase}'.`,
+			reason: `harness-run-context: plan-run artifact is read-only in phase '${phase}'.`,
 		};
 	}
@@ -844,6 +915,97 @@ export function isStaleActiveRunPointer(
 	return ageMs > activeRunTtlHours() * 60 * 60 * 1000;
 }
+export interface CrossSessionResumeInfo {
+	runId: string;
+	resumeCommand: string;
+	phase: HarnessPhase;
+	planReady: boolean;
+	nextAfterResume: string | null;
+	taskSummary: string | null;
+}
+/** True when this session already showed the cross-session resume prompt for runId. */
+export function sessionHasResumePromptForRun(
+	entries: unknown[],
+	runId: string,
+): boolean {
+	for (let i = entries.length - 1; i >= 0; i--) {
+		const entry = entries[i] as SessionEntryLike;
+		if (entry.type !== "custom") continue;
+		if (entry.customType !== "harness-session-resume-prompt") continue;
+		const data = entry.data as { run_id?: string } | undefined;
+		return data?.run_id === runId;
+	}
+	return false;
+}
+export function formatCrossSessionResumeMessage(
+	info: CrossSessionResumeInfo,
+): string {
+	const lines = [
+		"Previous Pi session left an active harness run on disk.",
+		`  run_id: ${info.runId}`,
+		`  phase: ${info.phase}`,
+		info.planReady ? "  plan: approved" : "  plan: not ready",
+	];
+	if (info.taskSummary) {
+		const summary =
+			info.taskSummary.length > 80
+				? `${info.taskSummary.slice(0, 77)}...`
+				: info.taskSummary;
+		lines.push(`  task: ${summary}`);
+	}
+	lines.push("", `Resume this session with: ${info.resumeCommand}`);
+	if (info.nextAfterResume) {
+		lines.push(`After binding, next step: ${info.nextAfterResume}`);
+	}
+	return lines.join("\n");
+}
+export async function resolveCrossSessionResumeInfo(
+	projectRoot: string,
+	pointer: ProjectActiveRunPointer,
+): Promise<CrossSessionResumeInfo | null> {
+	if (isStaleActiveRunPointer(pointer, projectRoot)) return null;
+	const disk = await loadRunContextFromDisk(pointer.run_id, projectRoot);
+	if (!disk || disk.status === "completed") return null;
+	const resumeCommand = `/harness-use-run ${pointer.run_id} --claim`;
+	const statuses = await resolveCompletionStatuses(
+		[],
+		pointer.run_id,
+		projectRoot,
+	);
+	const nextAfterResume = nextStepAfterOutcome({
+		phase: disk.phase,
+		planStatus: disk.plan_ready ? "ready" : null,
+		lastCompletedStep: disk.last_completed_step,
+		lastOutcome: disk.last_outcome,
+		executionStatus: statuses.executionStatus,
+		evalStatus: statuses.evalStatus,
+		adversaryComplete: statuses.adversaryComplete,
+		aborted: disk.status === "aborted",
+	});
+	return {
+		runId: pointer.run_id,
+		resumeCommand,
+		phase: disk.phase,
+		planReady: disk.plan_ready,
+		nextAfterResume,
+		taskSummary: disk.task_summary,
+	};
+}
+/** Offer resume when disk has an active run but this Pi session is not bound yet. */
+export async function evaluateCrossSessionResume(
+	projectRoot: string,
+	entries: unknown[],
+): Promise<CrossSessionResumeInfo | null> {
+	if (getLatestRunContext(entries)) return null;
+	const pointer = await loadProjectActiveRun(projectRoot);
+	if (!pointer) return null;
+	return resolveCrossSessionResumeInfo(projectRoot, pointer);
+}
 export async function readPlanPacketFromPath(
 	planPath: string,
 ): Promise<PlanPacketLike | null> {
@@ -906,31 +1068,78 @@ export function planPacketSummary(
 	};
 }
+export function criticalPathWorkItemIdsFromPlanPacket(
+	packet: PlanPacketLike | null | undefined,
+): string[] | undefined {
+	if (!packet?.execution_plan || typeof packet.execution_plan !== "object") {
+		return undefined;
+	}
+	const ep = packet.execution_plan as Record<string, unknown>;
+	const meta = ep.schedule_metadata;
+	if (!meta || typeof meta !== "object") return undefined;
+	const ids = (meta as Record<string, unknown>).critical_path_work_item_ids;
+	if (!Array.isArray(ids)) return undefined;
+	const out = ids.map((id) => String(id).trim()).filter((id) => id.length > 0);
+	return out.length > 0 ? out : undefined;
+}
 export function buildHarnessSpawnContextSnippet(
 	ctx: HarnessRunContext,
-	opts?: { mode?: "create" | "revise"; risk_level?: string; quick?: boolean },
+	opts?: {
+		mode?:
+			| "create"
+			| "revise"
+			| "execute"
+			| "repair"
+			| "benchmark"
+			| "verdict"
+			| "adversary";
+		risk_level?: string;
+		quick?: boolean;
+		critical_path_work_item_ids?: string[];
+		repair_brief_path?: string;
+	},
 ): string {
 	const mode =
 		opts?.mode ??
 		(ctx.plan_ready || ctx.status === "aborted" ? "revise" : "create");
-	return JSON.stringify(
-		{
-			schema_version: "1.0.0",
-			run_id: ctx.run_id,
-			plan_packet_path: ctx.plan_packet_path,
-			task_summary: ctx.task_summary,
-			mode,
-			risk_level: opts?.risk_level ?? "med",
-			quick: opts?.quick ?? false,
-		},
-		null,
-		2,
-	);
+	const body: Record<string, unknown> = {
+		schema_version: "1.0.0",
+		run_id: ctx.run_id,
+		plan_packet_path: ctx.plan_packet_path,
+		task_summary: ctx.task_summary,
+		mode,
+		risk_level: opts?.risk_level ?? "med",
+		quick: opts?.quick ?? false,
+	};
+	if (
+		opts?.critical_path_work_item_ids &&
+		opts.critical_path_work_item_ids.length > 0
+	) {
+		body.critical_path_work_item_ids = opts.critical_path_work_item_ids;
+	}
+	if (opts?.repair_brief_path) {
+		body.repair_brief_path = opts.repair_brief_path;
+	}
+	return JSON.stringify(body, null, 2);
 }
 export function formatPlanContextBlock(
 	ctx: HarnessRunContext,
-	opts?: { mode?: "create" | "revise"; risk_level?: string; quick?: boolean },
+	opts?: {
+		mode?:
+			| "create"
+			| "revise"
+			| "execute"
+			| "repair"
+			| "benchmark"
+			| "verdict"
+			| "adversary";
+		risk_level?: string;
+		quick?: boolean;
+		critical_path_work_item_ids?: string[];
+		repair_brief_path?: string;
+	},
 ): string {
 	const lines = [
 		"[HarnessRunContext]",
@@ -952,6 +1161,14 @@ export function formatPlanContextBlock(
 	if (ctx.task_summary) {
 		lines.push(`task_summary=${ctx.task_summary}`);
 	}
+	if (
+		opts?.critical_path_work_item_ids &&
+		opts.critical_path_work_item_ids.length > 0
+	) {
+		lines.push(
+			`critical_path_work_item_ids=${opts.critical_path_work_item_ids.join(",")}`,
+		);
+	}
 	lines.push(
 		`HarnessSpawnContext=${buildHarnessSpawnContextSnippet(ctx, opts)}`,
 	);
@@ -1006,6 +1223,160 @@ export function parseArgFlag(args: string, flag: string): string | null {
 	return m[2] ?? m[3] ?? null;
 }
+export function hasHarnessArgFlag(args: string, flag: string): boolean {
+	return new RegExp(`(?:^|\\s)${flag}(?:\\s|$)`).test(args.trim());
+}
+/** Split slash-command args into flags and positional tokens (run-id, task text, etc.). */
+export function parseHarnessArgTokens(args: string): {
+	flags: Set<string>;
+	positional: string[];
+} {
+	const flags = new Set<string>();
+	const positional: string[] = [];
+	for (const raw of args.trim().split(/\s+/)) {
+		if (!raw) continue;
+		if (raw.startsWith("--")) {
+			flags.add(raw);
+			continue;
+		}
+		positional.push(raw);
+	}
+	return { flags, positional };
+}
+export interface HarnessUseRunArgs {
+	runId: string | null;
+	claim: boolean;
+	readonly: boolean;
+}
+export function parseHarnessUseRunArgs(args: string): HarnessUseRunArgs {
+	const { flags, positional } = parseHarnessArgTokens(args);
+	return {
+		runId: positional[0] ?? null,
+		claim: flags.has("--claim"),
+		readonly: flags.has("--readonly"),
+	};
+}
+/** Post-run orchestration commands that may take ownership of a resumed run. */
+export const HARNESS_POST_RUN_CLAIM_COMMANDS = new Set([
+	"harness-review",
+	"harness-steer",
+	"harness-eval",
+	"harness-critic",
+]);
+export function shouldAutoClaimHarnessRun(
+	command: string,
+	args: string,
+): boolean {
+	if (hasHarnessArgFlag(args, "--readonly")) return false;
+	return HARNESS_POST_RUN_CLAIM_COMMANDS.has(command);
+}
+export function claimRunOwnership(
+	ctx: HarnessRunContext,
+	sessionId: string,
+): HarnessRunContext {
+	return {
+		...ctx,
+		pi_session_id: sessionId,
+		owner_pi_session_id: sessionId,
+		updated_at: nowIso(),
+	};
+}
+export interface EvalVerdictDisk {
+	status?: string;
+	recommended_action?: string;
+}
+export interface AdversaryReportDisk {
+	block_merge?: boolean;
+	severity?: string;
+}
+export async function readEvalVerdictFromRun(
+	runId: string,
+	projectRoot: string,
+): Promise<EvalVerdictDisk | null> {
+	try {
+		const path = join(
+			harnessRunsRoot(projectRoot),
+			runId,
+			"artifacts",
+			"eval-verdict.yaml",
+		);
+		return (await readYamlFile(path, "eval-verdict")) as EvalVerdictDisk;
+	} catch {
+		return null;
+	}
+}
+export async function readAdversaryReportFromRun(
+	runId: string,
+	projectRoot: string,
+): Promise<AdversaryReportDisk | null> {
+	try {
+		const path = join(
+			harnessRunsRoot(projectRoot),
+			runId,
+			"artifacts",
+			"adversary-report.yaml",
+		);
+		return (await readYamlFile(
+			path,
+			"adversary-report",
+		)) as AdversaryReportDisk;
+	} catch {
+		return null;
+	}
+}
+export interface CompletionStatuses {
+	planStatus: string | null;
+	executionStatus: string | null;
+	evalStatus: string | null;
+	adversaryComplete: boolean;
+}
+/** Session handoff entries overlaid with canonical on-disk post-run artifacts. */
+export async function resolveCompletionStatuses(
+	entries: unknown[],
+	runId: string | null,
+	projectRoot: string,
+): Promise<CompletionStatuses> {
+	const session = extractCompletionStatuses(entries);
+	if (!runId) {
+		return { ...session, adversaryComplete: false };
+	}
+	let evalStatus = session.evalStatus;
+	let executionStatus = session.executionStatus;
+	const verdict = await readEvalVerdictFromRun(runId, projectRoot);
+	if (verdict?.status) {
+		evalStatus = verdict.status;
+	}
+	const handoff = await readExecutorHandoffFromRun(runId, projectRoot);
+	if (handoff?.execution_status && !executionStatus) {
+		executionStatus = handoff.execution_status;
+	}
+	const adversary = await readAdversaryReportFromRun(runId, projectRoot);
+	const adversaryComplete = adversary != null;
+	return {
+		planStatus: session.planStatus,
+		executionStatus,
+		evalStatus,
+		adversaryComplete,
+	};
+}
 export function resolveArgsForCommand(
 	command: string,
 	args: string,
@@ -1026,8 +1397,11 @@ export function resolveArgsForCommand(
 	}
 	if (command === "harness-use-run" && args.trim()) {
-		runId = args.trim().split(/\s+/)[0] ?? runId;
-		overrideRun = true;
+		const parsed = parseHarnessUseRunArgs(args);
+		if (parsed.runId) {
+			runId = parsed.runId;
+			overrideRun = true;
+		}
 	}
 	return { runId, planPath, overrideRun };
@@ -1129,7 +1503,9 @@ export function inferHarnessPhaseFromPrompt(prompt: string): HarnessPhase {
 	if (p.startsWith("/harness-plan") || p.startsWith("/harness-auto")) {
 		return "plan";
 	}
-	if (p.startsWith("/harness-run")) return "execute";
+	if (p.startsWith("/harness-run") || p.startsWith("/harness-steer")) {
+		return "execute";
+	}
 	if (p.startsWith("/harness-eval") || p.startsWith("/harness-review")) {
 		return "evaluate";
 	}
@@ -1262,13 +1638,51 @@ export function isNewTaskPlanBlocked(
 	return newTask.length > 0 && prior.length > 0;
 }
+export type RemediationClass =
+	| "pass"
+	| "implementation_gap"
+	| "plan_gap"
+	| "rollback"
+	| "inconclusive";
+export interface ReviewOutcomeLike {
+	schema_version?: string;
+	status?: string;
+	remediation_class?: RemediationClass | string;
+	recommended_next?: string;
+}
+export async function readReviewOutcomeFromRun(
+	runId: string,
+	projectRoot: string,
+): Promise<ReviewOutcomeLike | null> {
+	try {
+		const path = join(
+			harnessRunsRoot(projectRoot),
+			runId,
+			"artifacts",
+			"review-outcome.yaml",
+		);
+		return (await readYamlFile(path, "review-outcome")) as ReviewOutcomeLike;
+	} catch {
+		return null;
+	}
+}
 export function nextStepAfterOutcome(input: {
 	phase: HarnessPhase;
 	planStatus?: string | null;
 	executionStatus?: string | null;
 	evalStatus?: string | null;
+	lastCompletedStep?: string | null;
+	lastOutcome?: string | null;
 	policyDecision?: string | null;
 	aborted?: boolean;
+	adversaryComplete?: boolean;
+	remediationClass?: string | null;
+	steerAttempt?: number;
+	steerMaxAttempts?: number;
+	reviewComplete?: boolean;
 }): string {
 	if (input.aborted) {
 		return '/harness-plan "<task>"';
@@ -1277,26 +1691,103 @@ export function nextStepAfterOutcome(input: {
 	if (plan === "needs_clarification") {
 		return "Reply with answers or run /harness-plan with updates";
 	}
-	if (input.phase === "plan" && plan === "ready") return "/harness-run";
-	if (input.phase === "execute") {
-		const exec = (input.executionStatus ?? "").toLowerCase();
-		if (exec === "blocked" || exec === "scope_drift") {
-			return "/harness-plan or /harness-abort";
+	const lastStep = (input.lastCompletedStep ?? "").toLowerCase();
+	const exec = (input.executionStatus ?? "").toLowerCase();
+	const lastOutcome = (input.lastOutcome ?? "").toLowerCase();
+	const evalSt = (input.evalStatus ?? "").toLowerCase();
+	const remediation = (input.remediationClass ?? "").toLowerCase();
+	const steerAttempt = input.steerAttempt ?? 0;
+	const steerMax = input.steerMaxAttempts ?? steerMaxAttemptsFromEnv();
+	const executionResolved = exec || (lastStep === "execute" ? lastOutcome : "");
+	const executeFinished =
+		executionResolved === "completed" ||
+		(lastStep === "execute" && input.phase === "evaluate") ||
+		lastStep === "steer";
+	if (
+		(executionResolved === "blocked" || executionResolved === "scope_drift") &&
+		!input.reviewComplete &&
+		lastStep !== "review"
+	) {
+		return "/harness-review";
+	}
+	if (input.phase === "plan" && plan === "ready") {
+		return "/harness-run";
+	}
+	if (executeFinished && !input.reviewComplete && lastStep !== "review") {
+		return "/harness-review";
+	}
+	if (input.phase === "execute" && lastStep === "steer") {
+		return "/harness-review";
+	}
+	if (input.phase === "execute" && !executeFinished) {
+		return "/harness-run-status";
+	}
+	if (input.phase === "evaluate" || input.phase === "adversary") {
+		if (remediation === "pass" || evalSt === "pass") {
+			if (input.adversaryComplete) return "/harness-policy-status";
+			return "/harness-review";
 		}
-		if (exec === "completed") {
-			return "/harness-eval";
+		if (remediation === "rollback") {
+			return "/harness-incident";
 		}
-	}
-	if (input.phase === "evaluate") {
-		const ev = (input.evalStatus ?? "").toLowerCase();
-		if (ev === "fail") return "/harness-plan or /harness-incident";
+		if (remediation === "plan_gap") {
+			return "/harness-plan (mode: revise)";
+		}
+		if (
+			remediation === "implementation_gap" ||
+			(remediation === "inconclusive" && evalSt === "fail")
+		) {
+			if (steerAttempt < steerMax) {
+				return "/harness-steer";
+			}
+			return "/harness-plan (mode: revise) or /harness-abort";
+		}
+		if (evalSt === "fail") {
+			if (steerAttempt < steerMax) return "/harness-steer";
+			return "/harness-plan (mode: revise) or /harness-incident";
+		}
+		if (input.adversaryComplete) return "/harness-policy-status";
 		return "/harness-review";
 	}
-	if (input.phase === "adversary") return "/harness-policy-status";
 	if (input.phase === "merge") return "/harness-policy-status";
 	return "/harness-run-status";
 }
+/** Read executor handoff artifact written by harness/running/executor submit pipeline. */
+export async function readExecutorHandoffFromRun(
+	runId: string,
+	projectRoot: string,
+): Promise<{
+	execution_status?: string;
+	next_command?: string;
+} | null> {
+	try {
+		const path = join(
+			harnessRunsRoot(projectRoot),
+			runId,
+			"handoff",
+			"executor-summary.yaml",
+		);
+		const doc = (await readYamlFile(path, "executor-handoff")) as {
+			execution_status?: string;
+			next_command?: string;
+		};
+		return doc;
+	} catch {
+		return null;
+	}
+}
 export function extractCompletionStatuses(entries: unknown[]): {
 	planStatus: string | null;
 	executionStatus: string | null;
@@ -1398,3 +1889,71 @@ export function extractPlanApprovalsFromEntries(
 	}
 	return out;
 }
+/** True inside `pi --mode json` harness subagent subprocesses. */
+export function isHarnessSubprocess(): boolean {
+	return process.env.PI_HARNESS_SUBPROCESS === "1";
+}
+export function harnessSubprocessRunId(): string | null {
+	const runId = process.env.HARNESS_RUN_ID?.trim();
+	return runId || null;
+}
+/** Load approved run context for a harness subagent subprocess (env + disk). */
+export async function loadRunContextForSubprocess(
+	projectRoot: string,
+): Promise<HarnessRunContext | null> {
+	if (!isHarnessSubprocess()) return null;
+	const runId = harnessSubprocessRunId();
+	if (!runId) return null;
+	const disk = await loadRunContextFromDisk(runId, projectRoot);
+	if (disk) return disk;
+	const pointer = await loadProjectActiveRun(projectRoot);
+	if (!pointer || pointer.run_id !== runId) return null;
+	return {
+		schema_version: "1.0.0",
+		run_id: pointer.run_id,
+		pi_session_id: "",
+		project_root: projectRoot,
+		phase: pointer.phase,
+		plan_id: pointer.plan_id,
+		plan_packet_path: canonicalPlanPath(pointer.run_id, projectRoot),
+		plan_ready: pointer.plan_ready,
+		task_summary: null,
+		status: "active",
+		last_completed_step: null,
+		last_outcome: null,
+		next_recommended_command: null,
+		owner_pi_session_id: pointer.owner_pi_session_id,
+		updated_at: pointer.updated_at,
+	};
+}
+export interface HarnessPolicyBootstrap {
+	phase: HarnessPhase;
+	approvedPlan: boolean;
+	planId: string | null;
+}
+/** Map disk run context + subprocess agent id to policy-gate phase flags. */
+export function policyBootstrapFromRunContext(
+	runCtx: HarnessRunContext,
+): HarnessPolicyBootstrap {
+	const agentId = process.env.HARNESS_AGENT_ID?.trim() ?? "";
+	let phase = runCtx.phase;
+	if (agentId.includes("executor")) phase = "execute";
+	else if (agentId.includes("evaluator")) phase = "evaluate";
+	else if (agentId.includes("adversary") || agentId.includes("tie-breaker")) {
+		phase = "adversary";
+	} else if (agentId.startsWith("harness/planning/")) phase = "plan";
+	return {
+		phase,
+		approvedPlan: runCtx.plan_ready,
+		planId: runCtx.plan_id,
+	};
+}