npm - @zhixuan92/multi-model-agent-core - Versions diffs - 3.8.0 → 3.9.0 - Mend

@zhixuan92/multi-model-agent-core 3.8.0 → 3.9.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (91) hide show

package/README.md +1 -1
package/dist/config/schema.d.ts +12 -0
package/dist/config/schema.d.ts.map +1 -1
package/dist/config/schema.js +16 -9
package/dist/config/schema.js.map +1 -1
package/dist/executors/_shared/findings-schema.d.ts +61 -21
package/dist/executors/_shared/findings-schema.d.ts.map +1 -1
package/dist/executors/_shared/findings-schema.js +27 -15
package/dist/executors/_shared/findings-schema.js.map +1 -1
package/dist/executors/audit.d.ts.map +1 -1
package/dist/executors/audit.js +2 -1
package/dist/executors/audit.js.map +1 -1
package/dist/executors/debug.d.ts.map +1 -1
package/dist/executors/debug.js +2 -1
package/dist/executors/debug.js.map +1 -1
package/dist/executors/execute-plan.d.ts.map +1 -1
package/dist/executors/execute-plan.js +2 -1
package/dist/executors/execute-plan.js.map +1 -1
package/dist/executors/investigate.d.ts.map +1 -1
package/dist/executors/investigate.js +4 -2
package/dist/executors/investigate.js.map +1 -1
package/dist/executors/review.d.ts.map +1 -1
package/dist/executors/review.js +2 -1
package/dist/executors/review.js.map +1 -1
package/dist/executors/verify.d.ts.map +1 -1
package/dist/executors/verify.js +2 -1
package/dist/executors/verify.js.map +1 -1
package/dist/heartbeat.d.ts +3 -0
package/dist/heartbeat.d.ts.map +1 -1
package/dist/heartbeat.js +5 -0
package/dist/heartbeat.js.map +1 -1
package/dist/intake/resolve.d.ts.map +1 -1
package/dist/intake/resolve.js +21 -6
package/dist/intake/resolve.js.map +1 -1
package/dist/observability/events.d.ts +192 -23
package/dist/observability/events.d.ts.map +1 -1
package/dist/observability/events.js +50 -11
package/dist/observability/events.js.map +1 -1
package/dist/review/aggregate-result.d.ts +1 -1
package/dist/review/aggregate-result.d.ts.map +1 -1
package/dist/review/aggregate-result.js.map +1 -1
package/dist/review/diff-review.d.ts +7 -2
package/dist/review/diff-review.d.ts.map +1 -1
package/dist/review/diff-review.js +11 -2
package/dist/review/diff-review.js.map +1 -1
package/dist/review/quality-only-prompts.d.ts +11 -5
package/dist/review/quality-only-prompts.d.ts.map +1 -1
package/dist/review/quality-only-prompts.js +98 -51
package/dist/review/quality-only-prompts.js.map +1 -1
package/dist/review/quality-reviewer.d.ts +51 -10
package/dist/review/quality-reviewer.d.ts.map +1 -1
package/dist/review/quality-reviewer.js +163 -21
package/dist/review/quality-reviewer.js.map +1 -1
package/dist/review/spec-reviewer.d.ts +1 -1
package/dist/review/spec-reviewer.d.ts.map +1 -1
package/dist/review/spec-reviewer.js +4 -3
package/dist/review/spec-reviewer.js.map +1 -1
package/dist/run-tasks/index.d.ts +1 -0
package/dist/run-tasks/index.d.ts.map +1 -1
package/dist/run-tasks/reviewed-lifecycle.d.ts +16 -3
package/dist/run-tasks/reviewed-lifecycle.d.ts.map +1 -1
package/dist/run-tasks/reviewed-lifecycle.js +278 -212
package/dist/run-tasks/reviewed-lifecycle.js.map +1 -1
package/dist/run-tasks/stage-idle-tracker.d.ts +14 -0
package/dist/run-tasks/stage-idle-tracker.d.ts.map +1 -0
package/dist/run-tasks/stage-idle-tracker.js +17 -0
package/dist/run-tasks/stage-idle-tracker.js.map +1 -0
package/dist/tool-schemas/audit.d.ts +2 -0
package/dist/tool-schemas/audit.d.ts.map +1 -1
package/dist/tool-schemas/debug.d.ts +2 -0
package/dist/tool-schemas/debug.d.ts.map +1 -1
package/dist/tool-schemas/delegate.d.ts +2 -0
package/dist/tool-schemas/delegate.d.ts.map +1 -1
package/dist/tool-schemas/execute-plan.d.ts +2 -0
package/dist/tool-schemas/execute-plan.d.ts.map +1 -1
package/dist/tool-schemas/investigate.d.ts +2 -0
package/dist/tool-schemas/investigate.d.ts.map +1 -1
package/dist/tool-schemas/retry.d.ts +2 -0
package/dist/tool-schemas/retry.d.ts.map +1 -1
package/dist/tool-schemas/review.d.ts +2 -0
package/dist/tool-schemas/review.d.ts.map +1 -1
package/dist/tool-schemas/shared-output.d.ts +2 -0
package/dist/tool-schemas/shared-output.d.ts.map +1 -1
package/dist/tool-schemas/shared-output.js +1 -1
package/dist/tool-schemas/shared-output.js.map +1 -1
package/dist/tool-schemas/verify.d.ts +2 -0
package/dist/tool-schemas/verify.d.ts.map +1 -1
package/dist/types.d.ts +8 -2
package/dist/types.d.ts.map +1 -1
package/dist/types.js.map +1 -1
package/package.json +1 -1

package/dist/run-tasks/reviewed-lifecycle.js CHANGED Viewed

@@ -7,6 +7,8 @@ import { pickEscalation, pickReviewer, maxRowsFor, } from '../escalation/policy.
 import { runWithFallback, makeSyntheticRunResult, TRANSPORT_FAILURES, isReviewTransportFailure, } from '../escalation/fallback.js';
 import { findModelCapabilities, extractCanonicalModelName } from '../routing/model-profiles.js';
 import { HeartbeatTimer } from '../heartbeat.js';
+import { newStageIdleTracker, snapshotIdle } from './stage-idle-tracker.js';
+import { DEFAULT_TASK_TIMEOUT_MS, DEFAULT_STALL_TIMEOUT_MS } from '../config/schema.js';
 import { runSpecReview } from '../review/spec-reviewer.js';
 import { makeSkippedReviewResult } from '../review/skipped-result.js';
 import { runQualityReview } from '../review/quality-reviewer.js';
@@ -28,14 +30,14 @@ const READ_ONLY_TOOL_NAMES = new Set([
 ]);
 export function emptyStats() {
     return {
-        implementing: { stage: 'implementing', entered: false, durationMs: null, costUSD: null, agentTier: null, modelFamily: null, model: null },
-        spec_rework: { stage: 'spec_rework', entered: false, durationMs: null, costUSD: null, agentTier: null, modelFamily: null, model: null },
-        quality_rework: { stage: 'quality_rework', entered: false, durationMs: null, costUSD: null, agentTier: null, modelFamily: null, model: null },
-        committing: { stage: 'committing', entered: false, durationMs: null, costUSD: null, agentTier: null, modelFamily: null, model: null },
-        verifying: { stage: 'verifying', entered: false, durationMs: null, costUSD: null, agentTier: null, modelFamily: null, model: null, outcome: null, skipReason: null },
-        spec_review: { stage: 'spec_review', entered: false, durationMs: null, costUSD: null, agentTier: null, modelFamily: null, model: null, verdict: null, roundsUsed: null },
-        quality_review: { stage: 'quality_review', entered: false, durationMs: null, costUSD: null, agentTier: null, modelFamily: null, model: null, verdict: null, roundsUsed: null },
-        diff_review: { stage: 'diff_review', entered: false, durationMs: null, costUSD: null, agentTier: null, modelFamily: null, model: null, verdict: null, roundsUsed: null },
+        implementing: { stage: 'implementing', entered: false, durationMs: null, costUSD: null, agentTier: null, modelFamily: null, model: null, maxIdleMs: null, totalIdleMs: null, activityEvents: null },
+        spec_rework: { stage: 'spec_rework', entered: false, durationMs: null, costUSD: null, agentTier: null, modelFamily: null, model: null, maxIdleMs: null, totalIdleMs: null, activityEvents: null },
+        quality_rework: { stage: 'quality_rework', entered: false, durationMs: null, costUSD: null, agentTier: null, modelFamily: null, model: null, maxIdleMs: null, totalIdleMs: null, activityEvents: null },
+        committing: { stage: 'committing', entered: false, durationMs: null, costUSD: null, agentTier: null, modelFamily: null, model: null, maxIdleMs: null, totalIdleMs: null, activityEvents: null },
+        verifying: { stage: 'verifying', entered: false, durationMs: null, costUSD: null, agentTier: null, modelFamily: null, model: null, maxIdleMs: null, totalIdleMs: null, activityEvents: null, outcome: null, skipReason: null },
+        spec_review: { stage: 'spec_review', entered: false, durationMs: null, costUSD: null, agentTier: null, modelFamily: null, model: null, maxIdleMs: null, totalIdleMs: null, activityEvents: null, verdict: null, roundsUsed: null },
+        quality_review: { stage: 'quality_review', entered: false, durationMs: null, costUSD: null, agentTier: null, modelFamily: null, model: null, maxIdleMs: null, totalIdleMs: null, activityEvents: null, verdict: null, roundsUsed: null },
+        diff_review: { stage: 'diff_review', entered: false, durationMs: null, costUSD: null, agentTier: null, modelFamily: null, model: null, maxIdleMs: null, totalIdleMs: null, activityEvents: null, verdict: null, roundsUsed: null },
     };
 }
 const FAMILY_MAP = {
@@ -50,7 +52,7 @@ function modelFamily(model) {
     const raw = dash > 0 ? canonical.slice(0, dash) : canonical;
     return FAMILY_MAP[raw.toLowerCase()] ?? 'other';
 }
-export function endBaseStage(stats, name, t0, c0, agent, finalCostUSD) {
+export function endBaseStage(stats, name, t0, c0, agent, finalCostUSD, idle) {
     // Cast through unknown — TS can't narrow stats[name] on a union-typed index;
     // the runtime invariant (set name's slot to its matching variant) is enforced
     // by the helper signature and tested by tests/run-tasks/stage-stats.test.ts.
@@ -62,9 +64,12 @@ export function endBaseStage(stats, name, t0, c0, agent, finalCostUSD) {
         agentTier: agent.tier,
         modelFamily: modelFamily(agent.model),
         model: agent.model,
+        maxIdleMs: idle?.maxIdleMs ?? null,
+        totalIdleMs: idle?.totalIdleMs ?? null,
+        activityEvents: idle?.activityEvents ?? null,
     };
 }
-export function endReviewStage(stats, name, t0, c0, agent, finalCostUSD, verdict, roundsUsed) {
+export function endReviewStage(stats, name, t0, c0, agent, finalCostUSD, idle, verdict, roundsUsed) {
     stats[name] = {
         stage: name,
         entered: true,
@@ -73,11 +78,14 @@ export function endReviewStage(stats, name, t0, c0, agent, finalCostUSD, verdict
         agentTier: agent.tier,
         modelFamily: modelFamily(agent.model),
         model: agent.model,
+        maxIdleMs: idle?.maxIdleMs ?? null,
+        totalIdleMs: idle?.totalIdleMs ?? null,
+        activityEvents: idle?.activityEvents ?? null,
         verdict,
         roundsUsed,
     };
 }
-export function endVerifyStage(stats, t0, c0, agent, finalCostUSD, outcome, skipReason) {
+export function endVerifyStage(stats, t0, c0, agent, finalCostUSD, idle, outcome, skipReason) {
     stats.verifying = {
         stage: 'verifying',
         entered: true,
@@ -86,6 +94,9 @@ export function endVerifyStage(stats, t0, c0, agent, finalCostUSD, outcome, skip
         agentTier: agent.tier,
         modelFamily: modelFamily(agent.model),
         model: agent.model,
+        maxIdleMs: idle?.maxIdleMs ?? null,
+        totalIdleMs: idle?.totalIdleMs ?? null,
+        activityEvents: idle?.activityEvents ?? null,
         outcome,
         skipReason,
     };
@@ -151,8 +162,9 @@ export async function executeReviewedLifecycle(task, resolved, config, taskIndex
         diagnostics?.logger !== undefined ||
         bus !== undefined;
     // Synthesize an onProgress sink when the caller didn't pass one — the
-    // heartbeat needs a place to emit heartbeat events so the stage-change
-    // detector below fires. Discards events if there is no external consumer.
+    // heartbeat needs a place to emit heartbeat events. Discards events if
+    // there is no external consumer. wrappedOnProgress (defined below) is
+    // ALWAYS defined and feeds the stall watchdog regardless of consumers.
     const synthOnProgress = onProgress ?? (() => { });
     const heartbeat = needHeartbeat
         ? new HeartbeatTimer((event) => {
@@ -162,6 +174,7 @@ export async function executeReviewedLifecycle(task, resolved, config, taskIndex
                 // only via explicit emit calls at lifecycle points; the
                 // heartbeat tick no longer infers transitions (P5).
                 const sinceLastMs = Date.now() - prevEventAtMs;
+                const tickInfo = heartbeat?.getHeartbeatTickInfo();
                 emitTaskEvent('heartbeat', {
                     elapsed: event.elapsed,
                     stage: event.stage,
@@ -173,6 +186,7 @@ export async function executeReviewedLifecycle(task, resolved, config, taskIndex
                     text: textEmissionChars,
                     cost: event.costUSD,
                     idle_ms: sinceLastMs,
+                    stage_idle_ms: tickInfo?.stageIdleMs ?? sinceLastMs,
                 });
             }
             synthOnProgress(taskIndex, event);
@@ -207,94 +221,108 @@ export async function executeReviewedLifecycle(task, resolved, config, taskIndex
     const implModel = resolved.provider.config.model;
     const progressCounters = { filesRead: 0, filesWritten: 0, toolCalls: 0 };
     const verboseStream = verboseStreamRaw;
-    let prevEventAtMs = verbose ? Date.now() : 0;
+    let prevEventAtMs = Date.now();
     // Wrap whenever we have ANY consumer for InternalRunnerEvent (heartbeat,
     // verbose stream, or verbose logger). Previously this only wrapped when
     // the caller passed onProgress, so --verbose + HTTP handlers (which don't
     // pass onProgress) silently dropped every tool_call / turn_complete event.
     let textEmissionChars = 0;
-    const markRunnerEvent = () => { lastRunnerEventAtMs = Date.now(); };
-    const wrappedOnProgress = needHeartbeat
-        ? (event) => {
-            if (event.kind === 'turn_start' || event.kind === 'text_emission' || event.kind === 'tool_call' || event.kind === 'turn_complete') {
-                markRunnerEvent();
-            }
-            if (event.kind === 'worker_start') {
-                emitTaskEvent('worker_start', {
+    const markRunnerEvent = () => {
+        const now = Date.now();
+        const gap = now - stageIdle.stageLastEventMs;
+        if (gap > stageIdle.stageMaxIdleMs)
+            stageIdle.stageMaxIdleMs = gap;
+        if (gap > taskMaxIdleMs)
+            taskMaxIdleMs = gap;
+        if (gap > 1000)
+            stageIdle.stageTotalIdleMs += gap;
+        stageIdle.stageActivityCount += 1;
+        stageIdle.stageLastEventMs = now;
+        lastRunnerEventAtMs = now;
+    };
+    const wrappedOnProgress = (event) => {
+        // Watchdog: fire on every activity event regardless of telemetry consumers.
+        // Without this, a no-consumer caller leaves lastRunnerEventAtMs frozen at
+        // taskStartMs and the stall watchdog fires at stallTimeoutMs regardless of
+        // actual LLM activity.
+        if (event.kind === 'turn_start' || event.kind === 'text_emission' || event.kind === 'tool_call' || event.kind === 'turn_complete') {
+            markRunnerEvent();
+        }
+        if (!needHeartbeat)
+            return;
+        if (event.kind === 'worker_start') {
+            emitTaskEvent('worker_start', {
+                model: event.model,
+                providerType: event.providerType,
+                tier: event.tier,
+            });
+        }
+        if (event.kind === 'turn_start') {
+            heartbeat?.markEvent('llm');
+            prevEventAtMs = Date.now();
+            if (verbose) {
+                emitTaskEvent('turn_start', {
+                    turn: event.turn,
+                    provider: event.provider,
                     model: event.model,
-                    providerType: event.providerType,
-                    tier: event.tier,
                 });
             }
-            if (event.kind === 'turn_start') {
-                heartbeat?.markEvent('llm');
-                if (verbose)
-                    prevEventAtMs = Date.now();
-                if (verbose) {
-                    emitTaskEvent('turn_start', {
-                        turn: event.turn,
-                        provider: event.provider,
-                        model: event.model,
-                    });
-                }
+        }
+        if (event.kind === 'text_emission') {
+            prevEventAtMs = Date.now();
+            heartbeat?.markEvent('text');
+            textEmissionChars += event.chars;
+            if (verbose && event.chars > 0) {
+                const preview = event.preview.length > 60
+                    ? event.preview.slice(0, 57) + '...'
+                    : event.preview;
+                emitTaskEvent('text_emission', {
+                    chars: event.chars,
+                    total: textEmissionChars,
+                    preview,
+                });
             }
-            if (event.kind === 'text_emission') {
-                heartbeat?.markEvent('text');
-                textEmissionChars += event.chars;
-                if (verbose && event.chars > 0) {
-                    const preview = event.preview.length > 60
-                        ? event.preview.slice(0, 57) + '...'
-                        : event.preview;
-                    emitTaskEvent('text_emission', {
-                        chars: event.chars,
-                        total: textEmissionChars,
-                        preview,
-                    });
-                }
+        }
+        if (event.kind === 'tool_call') {
+            heartbeat?.markEvent('tool');
+            progressCounters.toolCalls++;
+            const name = event.toolSummary.split('(')[0];
+            if (name === 'readFile' || name === 'grep' || name === 'glob' || name === 'listFiles') {
+                progressCounters.filesRead++;
             }
-            if (event.kind === 'tool_call') {
-                heartbeat?.markEvent('tool');
-                progressCounters.toolCalls++;
-                const name = event.toolSummary.split('(')[0];
-                if (name === 'readFile' || name === 'grep' || name === 'glob' || name === 'listFiles') {
-                    progressCounters.filesRead++;
-                }
-                else if (name === 'writeFile' || name === 'editFile') {
-                    progressCounters.filesWritten++;
-                }
-                heartbeat?.updateProgress(progressCounters.filesRead, progressCounters.filesWritten, progressCounters.toolCalls);
-                const now = verbose ? Date.now() : 0;
-                const sincePrevMs = verbose ? now - prevEventAtMs : 0;
-                if (verbose)
-                    prevEventAtMs = now;
-                if (verbose) {
-                    emitTaskEvent('tool_call', {
-                        tool: event.toolSummary,
-                        duration_ms: sincePrevMs,
-                    });
-                }
+            else if (name === 'writeFile' || name === 'editFile') {
+                progressCounters.filesWritten++;
             }
-            if (event.kind === 'turn_complete') {
-                heartbeat?.markEvent('llm');
-                const costUSD = computeCostUSD(event.cumulativeInputTokens, event.cumulativeOutputTokens, resolved.provider.config);
-                const savedCostUSD = computeSavedCostUSD(costUSD, event.cumulativeInputTokens, event.cumulativeOutputTokens, task.parentModel);
-                heartbeat?.updateCost(costUSD, savedCostUSD);
-                const nowTurn = verbose ? Date.now() : 0;
-                const turnDurMs = verbose ? nowTurn - prevEventAtMs : 0;
-                if (verbose)
-                    prevEventAtMs = nowTurn;
-                if (verbose) {
-                    emitTaskEvent('turn_complete', {
-                        input_tokens: event.cumulativeInputTokens,
-                        output_tokens: event.cumulativeOutputTokens,
-                        cost: costUSD,
-                        duration_ms: turnDurMs,
-                        provider: resolved.provider.config.model,
-                    });
-                }
+            heartbeat?.updateProgress(progressCounters.filesRead, progressCounters.filesWritten, progressCounters.toolCalls);
+            const now = Date.now();
+            const sincePrevMs = now - prevEventAtMs;
+            prevEventAtMs = now;
+            if (verbose) {
+                emitTaskEvent('tool_call', {
+                    tool: event.toolSummary,
+                    duration_ms: sincePrevMs,
+                });
             }
         }
-        : undefined;
+        if (event.kind === 'turn_complete') {
+            heartbeat?.markEvent('llm');
+            const costUSD = computeCostUSD(event.cumulativeInputTokens, event.cumulativeOutputTokens, resolved.provider.config);
+            const savedCostUSD = computeSavedCostUSD(costUSD, event.cumulativeInputTokens, event.cumulativeOutputTokens, task.parentModel);
+            heartbeat?.updateCost(costUSD, savedCostUSD);
+            const nowTurn = Date.now();
+            const turnDurMs = nowTurn - prevEventAtMs;
+            prevEventAtMs = nowTurn;
+            if (verbose) {
+                emitTaskEvent('turn_complete', {
+                    input_tokens: event.cumulativeInputTokens,
+                    output_tokens: event.cumulativeOutputTokens,
+                    cost: costUSD,
+                    duration_ms: turnDurMs,
+                    provider: resolved.provider.config.model,
+                });
+            }
+        }
+    };
     const cwd = task.cwd ?? process.cwd();
     const taskStartMs = Date.now();
     // Hard task-level wall-clock cap. Once Date.now() crosses this, no new
@@ -302,16 +330,31 @@ export async function executeReviewedLifecycle(task, resolved, config, taskIndex
     // any in-flight call gets a per-call timeoutMs clamped to remaining
     // budget so it returns its salvage promptly. The user gets *something*
     // back instead of an open-ended retry storm.
-    const taskTimeoutMs = task.timeoutMs ?? config.defaults.timeoutMs ?? 1_800_000;
+    const taskTimeoutMs = task.timeoutMs ?? config.defaults.timeoutMs ?? DEFAULT_TASK_TIMEOUT_MS;
     const taskDeadlineMs = taskStartMs + taskTimeoutMs;
     // Stall watchdog: when no LLM / tool / text event has fired for this
     // many ms, the in-flight runner is force-aborted via `stallController`.
     // Catches "model is silently thinking forever" and "transport hung" —
     // both invisible to the wall-clock cap until the very end.
-    const stallTimeoutMs = config.defaults.stallTimeoutMs ?? 600_000;
+    const stallTimeoutMs = config.defaults.stallTimeoutMs ?? DEFAULT_STALL_TIMEOUT_MS;
     const stallController = new AbortController();
     let lastRunnerEventAtMs = taskStartMs;
+    let stageIdle = newStageIdleTracker(taskStartMs);
+    let taskMaxIdleMs = 0;
     let stallFired = false;
+    // Track the current stage so the terminal transition can pass an accurate
+    // `from`. Initialized to 'implementing' (matching HeartbeatTimer.start's
+    // initial stage). Updated on every transitionStage call.
+    let currentStage = 'implementing';
+    function transitionStage(from, to, heartbeatPayload, jsonlPayload) {
+        if (heartbeatPayload !== null)
+            heartbeat?.transition(heartbeatPayload);
+        if (jsonlPayload !== null) {
+            emitTaskEvent('stage_change', { from, to, ...jsonlPayload });
+        }
+        stageIdle = newStageIdleTracker(Date.now());
+        currentStage = to;
+    }
     const commits = [];
     let commitError;
     let specAttemptIndex = 0;
@@ -410,18 +453,17 @@ export async function executeReviewedLifecycle(task, resolved, config, taskIndex
     const defaultVerification = { status: 'skipped', steps: [], totalDurationMs: 0, skipReason: 'no_command' };
     let latestVerification = defaultVerification;
     async function runVerificationStage() {
-        emitTaskEvent('stage_change', { from: 'implementing', to: 'verifying' });
-        heartbeat?.setStage('verifying', 4);
+        transitionStage('implementing', 'verifying', { stage: 'verifying', stageIndex: 4 }, {});
         const overallVerificationStart = Date.now();
         const verifyCostStart = runningCostUSD();
         const verification = await runVerifyStage({
             cwd,
             verifyCommand: task.verifyCommand,
-            taskTimeoutMs: task.timeoutMs ?? config.defaults.timeoutMs ?? 1_800_000,
+            taskTimeoutMs: task.timeoutMs ?? config.defaults.timeoutMs ?? DEFAULT_TASK_TIMEOUT_MS,
             taskStartMs,
         });
         latestVerification = verification;
-        endVerifyStage(stats, overallVerificationStart, verifyCostStart, implementerAgentInfo, runningCostUSD(), verification.status === 'passed' ? 'passed'
+        endVerifyStage(stats, overallVerificationStart, verifyCostStart, implementerAgentInfo, runningCostUSD(), snapshotIdle(stageIdle), verification.status === 'passed' ? 'passed'
             : verification.status === 'failed' ? 'failed'
                 : verification.status === 'skipped' ? 'skipped'
                     : 'not_applicable', verification.skipReason ?? null);
@@ -642,12 +684,12 @@ export async function executeReviewedLifecycle(task, resolved, config, taskIndex
             const validCommit = implReport?.commit ?? await repairCommitMetadata(implReport?.commitDiagnostic ?? 'no commit block emitted');
             if (!validCommit)
                 return;
-            heartbeat?.setStage('committing', 7);
+            transitionStage('verifying', 'committing', { stage: 'committing', stageIndex: 7 }, null);
             const commitT0 = Date.now();
             const commitC0 = runningCostUSD();
             const c = await runCommitStage({ cwd, filesWritten: implResult.filesWritten, commit: validCommit });
             commits.push(c);
-            endBaseStage(stats, 'committing', commitT0, commitC0, implementerAgentInfo, runningCostUSD());
+            endBaseStage(stats, 'committing', commitT0, commitC0, implementerAgentInfo, runningCostUSD(), snapshotIdle(stageIdle));
         }
     }
     // Tracks the final RunResult across every exit path so the `finally` block
@@ -657,10 +699,16 @@ export async function executeReviewedLifecycle(task, resolved, config, taskIndex
     // catch path. Without this, the recorder only fires on 2 of ~5 exit paths.
     let __finalRunResult;
     const __recordOnce = (r) => {
-        // Stamp stallTriggered on every exit path. The watchdog flag is owned
-        // by this scope; surfacing it on the RunResult lets the caller (and
-        // telemetry) distinguish "no progress" aborts from cap exhaustion.
-        const stamped = stallFired ? { ...r, stallTriggered: true } : r;
+        // Stamp stallTriggered and taskMaxIdleMs on every exit path.
+        // The watchdog flag is owned by this scope; surfacing it on the
+        // RunResult lets the caller (and telemetry) distinguish "no progress"
+        // aborts from cap exhaustion. taskMaxIdleMs is always populated so the
+        // task_completed JSONL event has it regardless of early return.
+        const stamped = {
+            ...r,
+            ...(stallFired ? { stallTriggered: true } : {}),
+            taskMaxIdleMs,
+        };
         if (__finalRunResult === undefined)
             __finalRunResult = stamped;
         return stamped;
@@ -745,7 +793,7 @@ export async function executeReviewedLifecycle(task, resolved, config, taskIndex
         latestAttemptedImpl = { tier: initialImpl.usedTier, result: implResult };
         lastNonRejectedImpl = { tier: initialImpl.usedTier, result: implResult };
         implementerHistory.push(initialImpl.usedTier);
-        endBaseStage(stats, 'implementing', implT0, implC0, implementerAgentInfo, runningCostUSD());
+        endBaseStage(stats, 'implementing', implT0, implC0, implementerAgentInfo, runningCostUSD(), snapshotIdle(stageIdle));
         specAttemptIndex = 1;
         const implReport = implResult.status === 'ok' ? parseStructuredReport(implResult.output) : undefined;
         const workerStatus = extractWorkerStatus(implReport);
@@ -762,7 +810,7 @@ export async function executeReviewedLifecycle(task, resolved, config, taskIndex
         const filePathsSkipped = !filePathsInteracted;
         if (implResult.filesWritten.length === 0 && reviewPolicy !== 'quality_only') {
             if (reviewPolicy === 'off') {
-                emitTaskEvent('stage_change', { from: 'verifying', to: 'terminal' });
+                transitionStage('verifying', 'terminal', null, {});
                 const terminal = resolveOffTerminal({
                     ...implResult,
                     workerStatus,
@@ -841,7 +889,7 @@ export async function executeReviewedLifecycle(task, resolved, config, taskIndex
             };
         }
         if (reviewPolicy === 'off') {
-            emitTaskEvent('stage_change', { from: 'verifying', to: 'terminal' });
+            transitionStage('verifying', 'terminal', null, {});
             const terminal = resolveOffTerminal({
                 ...implResult,
                 workerStatus,
@@ -874,10 +922,9 @@ export async function executeReviewedLifecycle(task, resolved, config, taskIndex
         if (reviewPolicy === 'diff_only') {
             const diffUnavailable = new Map();
             const diffReviewerTier = pickReviewer({ loop: 'spec', attemptIndex: 0, baseTier: resolved.slot });
-            emitTaskEvent('stage_change', { from: 'verifying', to: 'diff_review' });
+            transitionStage('verifying', 'diff_review', { stage: 'diff_review', stageIndex: 2, reviewRound: 1, attemptCap: 1 }, {});
             const diffReviewT0 = Date.now();
             const diffReviewC0 = runningCostUSD();
-            heartbeat?.transition({ stage: 'diff_review', stageIndex: 2, reviewRound: 1, attemptCap: 1 });
             const diffReviewT0_commit = Date.now();
             const diffReviewC0_commit = runningCostUSD();
             const diffCall = await runWithFallback({
@@ -887,7 +934,7 @@ export async function executeReviewedLifecycle(task, resolved, config, taskIndex
                 isTransportFailure: (r) => isReviewTransportFailure(r),
                 getStatus: (r) => r.status,
                 makeSyntheticFailure: () => makeSkippedReviewResult('all_tiers_unavailable'),
-                call: (provider) => runDiffReview({ cwd, diff: evidence.fullDiff, diffTruncated: evidence.diffTruncated, verification, worker: { call: (prompt) => provider.run(prompt) } }),
+                call: (provider) => runDiffReview({ cwd, diff: evidence.fullDiff, diffTruncated: evidence.diffTruncated, verification, worker: { call: (prompt, opts) => provider.run(prompt, { abortSignal: opts?.abortSignal, timeoutMs: opts?.timeoutMs }) }, taskDeadlineMs, abortSignal: stallController.signal }),
             });
             if (diffCall.fallbackFired) {
                 emitFallback({ batchId: heartbeatWiring?.batchId ?? '', taskIndex, loop: 'diff', attempt: 0, role: 'diffReviewer', assignedTier: diffReviewerTier, usedTier: diffCall.usedTier, reason: diffCall.fallbackReason, triggeringStatus: diffCall.fallbackTriggeringStatus, violatesSeparation: diffCall.usedTier === implementerHistory[implementerHistory.length - 1] });
@@ -897,8 +944,17 @@ export async function executeReviewedLifecycle(task, resolved, config, taskIndex
                 emitFallbackUnavailable({ batchId: heartbeatWiring?.batchId ?? '', taskIndex, loop: 'diff', attempt: 0, role: 'diffReviewer', assignedTier: diffReviewerTier, reason: diffCall.unavailableReason });
             }
             const verdict = diffCall.bothUnavailable || isReviewTransportFailure(diffCall.result) ? makeSkippedReviewResult('all_tiers_unavailable') : diffCall.result;
-            emitTaskEvent('review_decision', { stage: 'diff_review', verdict: 'kind' in verdict ? verdict.kind : 'skipped', round: 1 });
-            endReviewStage(stats, 'diff_review', diffReviewT0_commit, diffReviewC0_commit, implementerAgentInfo, runningCostUSD(),
+            emitTaskEvent('review_decision', {
+                stage: 'diff_review',
+                verdict: 'kind' in verdict
+                    ? (verdict.kind === 'approve' ? 'approved'
+                        : verdict.kind === 'concerns' ? 'concerns'
+                            : verdict.kind === 'reject' ? 'changes_required'
+                                : 'error') // verdict.kind === 'transport_failure'
+                    : 'skipped',
+                round: 1,
+            });
+            endReviewStage(stats, 'diff_review', diffReviewT0_commit, diffReviewC0_commit, implementerAgentInfo, runningCostUSD(), snapshotIdle(stageIdle),
             // Diff review uses 'approve' | 'concerns' | 'reject' | 'transport_failure' (DiffReviewVerdict),
             // distinct from spec/quality verdicts. Map to the telemetry verdict enum here.
             'kind' in verdict
@@ -929,7 +985,7 @@ export async function executeReviewedLifecycle(task, resolved, config, taskIndex
         let specReviewT0 = 0;
         let specReviewC0 = null;
         if (reviewPolicy !== 'quality_only') {
-            heartbeat?.transition({ stage: 'spec_review', stageIndex: 2, reviewRound: 1, attemptCap: maxSpecRows });
+            transitionStage('verifying', 'spec_review', { stage: 'spec_review', stageIndex: 2, reviewRound: 1, attemptCap: maxSpecRows }, null);
             const initialReviewerTier = pickReviewer({ loop: 'spec', attemptIndex: 0, baseTier: resolved.slot });
             specReviewT0 = Date.now();
             specReviewC0 = runningCostUSD();
@@ -940,7 +996,7 @@ export async function executeReviewedLifecycle(task, resolved, config, taskIndex
                 isTransportFailure: (r) => isReviewTransportFailure(r),
                 getStatus: (r) => r.status,
                 makeSyntheticFailure: () => makeSkippedReviewResult('all_tiers_unavailable'),
-                call: (provider) => runSpecReview(provider, packet, effectiveImplReport, fileContents, implResult.toolCalls, task.planContext, evidence.block),
+                call: (provider) => runSpecReview(provider, packet, effectiveImplReport, fileContents, implResult.toolCalls, task.planContext, evidence.block, taskDeadlineMs, stallController.signal, wrappedOnProgress),
             });
             if (initialSpecReview.bothUnavailable) {
                 emitFallbackUnavailable({ batchId: heartbeatWiring?.batchId ?? '', taskIndex, loop: 'spec', attempt: 0, role: 'specReviewer', assignedTier: initialReviewerTier, reason: initialSpecReview.unavailableReason });
@@ -972,8 +1028,7 @@ export async function executeReviewedLifecycle(task, resolved, config, taskIndex
                 const decision = pickEscalation({ loop: 'spec', attemptIndex: specAttemptIndex, baseTier: resolved.slot });
                 if (decision.isEscalated)
                     emitEscalationEvent('spec', specAttemptIndex, decision);
-                emitTaskEvent('stage_change', { from: 'spec_review', to: 'spec_rework', attempt: specAttemptIndex, attemptCap: maxSpecRows, implTier: decision.impl, reviewerTier: decision.reviewer, escalated: decision.isEscalated });
-                heartbeat?.transition({ stage: 'spec_rework', stageIndex: 3, reviewRound: specAttemptIndex, attemptCap: maxSpecRows });
+                transitionStage('spec_review', 'spec_rework', { stage: 'spec_rework', stageIndex: 3, reviewRound: specAttemptIndex, attemptCap: maxSpecRows }, { attempt: specAttemptIndex, attemptCap: maxSpecRows, implTier: decision.impl, reviewerTier: decision.reviewer, escalated: decision.isEscalated });
                 const feedback = specResult.findings.length > 0 ? `\n\n## Spec Review Feedback (round ${specAttemptIndex}):\n${specResult.findings.map(f => `- ${f}`).join('\n')}` : '';
                 const reworkTask = withDoneCondition({ ...task, prompt: `${task.prompt}${feedback}` });
                 const reworkCall = await runWithFallback({ assigned: decision.impl, providerFor, unavailableTiers: specUnavailable, isTransportFailure: (r) => TRANSPORT_FAILURES.has(r.status) && r.capExhausted === undefined, getStatus: (r) => r.status, makeSyntheticFailure: (assigned) => makeSyntheticRunResult(assigned, 'all_tiers_unavailable'), call: (provider) => delegateWithEscalation(reworkTask, [provider], { explicitlyPinned: true, onProgress: wrappedOnProgress, taskDeadlineMs, abortSignal: stallController.signal, assignedTier: decision.impl }) });
@@ -996,8 +1051,8 @@ export async function executeReviewedLifecycle(task, resolved, config, taskIndex
                 const reworkReport = parseStructuredReport(finalImplResult.output);
                 finalImplReport = reworkReport.summary ? reworkReport : buildFallbackImplReport(finalImplResult);
                 fileContents = await readImplementerFileContents(finalImplResult.filesWritten, task.cwd);
-                heartbeat?.transition({ stage: 'spec_review', stageIndex: 2, reviewRound: specAttemptIndex + 1, attemptCap: maxSpecRows });
-                const reviewCall = await runWithFallback({ assigned: decision.reviewer, providerFor, unavailableTiers: specUnavailable, isTransportFailure: (r) => isReviewTransportFailure(r), getStatus: (r) => r.status, makeSyntheticFailure: () => makeSkippedReviewResult('all_tiers_unavailable'), call: (provider) => runSpecReview(provider, packet, finalImplReport, fileContents, finalImplResult.toolCalls, task.planContext, evidence.block) });
+                transitionStage('spec_rework', 'spec_review', { stage: 'spec_review', stageIndex: 2, reviewRound: specAttemptIndex + 1, attemptCap: maxSpecRows }, null);
+                const reviewCall = await runWithFallback({ assigned: decision.reviewer, providerFor, unavailableTiers: specUnavailable, isTransportFailure: (r) => isReviewTransportFailure(r), getStatus: (r) => r.status, makeSyntheticFailure: () => makeSkippedReviewResult('all_tiers_unavailable'), call: (provider) => runSpecReview(provider, packet, finalImplReport, fileContents, finalImplResult.toolCalls, task.planContext, evidence.block, taskDeadlineMs, stallController.signal, wrappedOnProgress) });
                 if (reviewCall.bothUnavailable) {
                     emitFallbackUnavailable({ batchId: heartbeatWiring?.batchId ?? '', taskIndex, loop: 'spec', attempt: specAttemptIndex, role: 'specReviewer', assignedTier: decision.reviewer, reason: reviewCall.unavailableReason });
                     fallbackOverrides.push({ role: 'specReviewer', loop: 'spec', attempt: specAttemptIndex, assigned: decision.reviewer, used: reviewCall.usedTier, reason: reviewCall.unavailableReason, triggeringStatus: reviewCall.fallbackTriggeringStatus, bothUnavailable: true });
@@ -1042,10 +1097,10 @@ export async function executeReviewedLifecycle(task, resolved, config, taskIndex
         if (reviewPolicy === 'full' || reviewPolicy === 'quality_only') {
             qualityUnavailable = new Map();
             const qualityReviewerTier = pickReviewer({ loop: 'quality', attemptIndex: 0, baseTier: resolved.slot });
-            heartbeat?.transition({ stage: 'quality_review', stageIndex: 4, reviewRound: 1, attemptCap: maxQualityRows });
+            transitionStage(currentStage, 'quality_review', { stage: 'quality_review', stageIndex: 4, reviewRound: 1, attemptCap: maxQualityRows }, null);
             qualityReviewT0 = Date.now();
             qualityReviewC0 = runningCostUSD();
-            const initialQuality = await runWithFallback({ assigned: qualityReviewerTier, providerFor, unavailableTiers: qualityUnavailable, isTransportFailure: (r) => isReviewTransportFailure(r), getStatus: (r) => r.status, makeSyntheticFailure: () => makeSkippedReviewResult('all_tiers_unavailable'), call: (provider) => runQualityReview(provider, packet, specReport ?? finalImplReport, fileContents, finalImplResult.toolCalls, finalImplResult.filesWritten, evidence.block, qualityReviewPromptBuilder, finalImplResult.output) });
+            const initialQuality = await runWithFallback({ assigned: qualityReviewerTier, providerFor, unavailableTiers: qualityUnavailable, isTransportFailure: (r) => isReviewTransportFailure(r), getStatus: (r) => r.status, makeSyntheticFailure: () => makeSkippedReviewResult('all_tiers_unavailable'), call: (provider) => runQualityReview(provider, packet, specReport ?? finalImplReport, fileContents, finalImplResult.toolCalls, finalImplResult.filesWritten, evidence.block, qualityReviewPromptBuilder, finalImplResult.output, taskDeadlineMs, stallController.signal, wrappedOnProgress) });
             if (initialQuality.bothUnavailable) {
                 emitFallbackUnavailable({ batchId: heartbeatWiring?.batchId ?? '', taskIndex, loop: 'quality', attempt: 0, role: 'qualityReviewer', assignedTier: qualityReviewerTier, reason: initialQuality.unavailableReason });
                 fallbackOverrides.push({ role: 'qualityReviewer', loop: 'quality', attempt: 0, assigned: qualityReviewerTier, used: initialQuality.usedTier, reason: initialQuality.unavailableReason, triggeringStatus: initialQuality.fallbackTriggeringStatus, bothUnavailable: true });
@@ -1059,102 +1114,91 @@ export async function executeReviewedLifecycle(task, resolved, config, taskIndex
                 }
             }
             qualityResult = initialQuality.result;
+            qualityAttemptIndex = 1;
+            if (reviewDidNotReject(qualityResult.status))
+                lastNonRejectedImpl = { tier: implementerHistory[implementerHistory.length - 1], result: finalImplResult };
             if (reviewPolicy === 'quality_only') {
+                // Annotation model: emit one quality event per pass with severity-correction
+                // and mean-confidence summary fields. Then we are done — no rework loop.
+                const annotated = qualityResult.annotatedFindings ?? [];
+                const severityCorrections = annotated.filter(f => f.reviewerSeverity !== undefined).length;
+                const meanConfidence = annotated.length > 0
+                    ? Math.round((annotated.reduce((s, f) => s + f.reviewerConfidence, 0) / annotated.length) * 100) / 100
+                    : null;
                 emitTaskEvent('read_only_review.quality', {
                     route: routeKey,
-                    verdict: qualityResult.status === 'approved' ? 'approved'
-                        : qualityResult.status === 'changes_required' ? 'changes_required'
-                            : qualityResult.status === 'skipped' ? 'skipped'
-                                : 'error',
+                    verdict: qualityResult.status === 'annotated' ? 'annotated'
+                        : qualityResult.status === 'skipped' ? 'skipped'
+                            : 'error',
                     iterationIndex: 1,
-                    findingsReviewed: qualityResult.findings?.length ?? 0,
-                    findingsFlagged: qualityResult.status === 'changes_required' ? (qualityResult.findings?.length ?? 0) : 0,
+                    findingsReviewed: annotated.length,
+                    findingsFlagged: severityCorrections,
+                    severityCorrections,
+                    meanConfidence,
                     durationMs: Date.now() - qualityReviewT0,
                     costUSD: runningCostUSD() !== null && qualityReviewC0 !== null ? runningCostUSD() - qualityReviewC0 : null,
                 });
             }
-            let prevQualityFindings = [...(qualityResult.findings ?? [])];
-            qualityAttemptIndex = 1;
-            while (qualityResult.status === 'changes_required') {
-                if (qualityAttemptIndex >= maxQualityRows)
-                    return abortReviewLoop(finalImplResult, 'round_cap', 'review round cap reached before quality rework', 'quality');
-                const currentCostUSD = taskCostUSD();
-                if (currentCostUSD !== null && maxCostUSD !== undefined && currentCostUSD >= 0.8 * maxCostUSD) {
-                    emitTaskEvent('cost_check', { stage: 'quality_rework', tripped: true, cost_used_usd: currentCostUSD, cost_cap_usd: maxCostUSD, cost_available: true });
-                    return abortReviewLoop(finalImplResult, 'cost_ceiling', 'cost ceiling reached before quality rework', 'quality');
-                }
-                const decision = pickEscalation({ loop: 'quality', attemptIndex: qualityAttemptIndex, baseTier: resolved.slot });
-                if (decision.isEscalated)
-                    emitEscalationEvent('quality', qualityAttemptIndex, decision);
-                emitTaskEvent('stage_change', { from: 'quality_review', to: 'quality_rework', attempt: qualityAttemptIndex, attemptCap: maxQualityRows, implTier: decision.impl, reviewerTier: decision.reviewer, escalated: decision.isEscalated });
-                if (reviewPolicy === 'quality_only') {
-                    emitTaskEvent('read_only_review.rework', {
-                        route: routeKey,
-                        iterationIndex: qualityAttemptIndex,
-                        triggeringIssues: qualityResult.findings?.length ?? 0,
-                    });
-                }
-                heartbeat?.transition({ stage: 'quality_rework', stageIndex: 5, reviewRound: qualityAttemptIndex, attemptCap: maxQualityRows });
-                const feedback = qualityResult.findings.length > 0 ? `\n\n## Quality Review Feedback (round ${qualityAttemptIndex}):\n${qualityResult.findings.map(f => `- ${f}`).join('\n')}` : '';
-                const reworkTask = withDoneCondition({ ...task, prompt: `${task.prompt}${feedback}` });
-                const reworkCall = await runWithFallback({ assigned: decision.impl, providerFor, unavailableTiers: qualityUnavailable, isTransportFailure: (r) => TRANSPORT_FAILURES.has(r.status) && r.capExhausted === undefined, getStatus: (r) => r.status, makeSyntheticFailure: (assigned) => makeSyntheticRunResult(assigned, 'all_tiers_unavailable'), call: (provider) => delegateWithEscalation(reworkTask, [provider], { explicitlyPinned: true, onProgress: wrappedOnProgress, taskDeadlineMs, abortSignal: stallController.signal, assignedTier: decision.impl }) });
-                if (reworkCall.fallbackFired || reworkCall.bothUnavailable)
-                    fallbackOverrides.push({ role: 'implementer', loop: 'quality', attempt: qualityAttemptIndex, assigned: decision.impl, used: reworkCall.usedTier, reason: (reworkCall.fallbackReason ?? reworkCall.unavailableReason), triggeringStatus: reworkCall.fallbackTriggeringStatus, bothUnavailable: reworkCall.bothUnavailable });
-                if (reworkCall.fallbackFired)
-                    emitFallback({ batchId: heartbeatWiring?.batchId ?? '', taskIndex, loop: 'quality', attempt: qualityAttemptIndex, role: 'implementer', assignedTier: decision.impl, usedTier: reworkCall.usedTier, reason: reworkCall.fallbackReason, triggeringStatus: reworkCall.fallbackTriggeringStatus, violatesSeparation: false });
-                if (reworkCall.bothUnavailable) {
-                    emitFallbackUnavailable({ batchId: heartbeatWiring?.batchId ?? '', taskIndex, loop: 'quality', attempt: qualityAttemptIndex, role: 'implementer', assignedTier: decision.impl, reason: reworkCall.unavailableReason });
+            else {
+                // Artifact-route gating model — keep the rework loop.
+                let prevQualityFindings = [...(qualityResult.findings ?? [])];
+                while (qualityResult.status === 'changes_required') {
+                    if (qualityAttemptIndex >= maxQualityRows)
+                        return abortReviewLoop(finalImplResult, 'round_cap', 'review round cap reached before quality rework', 'quality');
+                    const currentCostUSD = taskCostUSD();
+                    if (currentCostUSD !== null && maxCostUSD !== undefined && currentCostUSD >= 0.8 * maxCostUSD) {
+                        emitTaskEvent('cost_check', { stage: 'quality_rework', tripped: true, cost_used_usd: currentCostUSD, cost_cap_usd: maxCostUSD, cost_available: true });
+                        return abortReviewLoop(finalImplResult, 'cost_ceiling', 'cost ceiling reached before quality rework', 'quality');
+                    }
+                    const decision = pickEscalation({ loop: 'quality', attemptIndex: qualityAttemptIndex, baseTier: resolved.slot });
                     if (decision.isEscalated)
-                        emitEscalationUnavailable({ batchId: heartbeatWiring?.batchId ?? '', taskIndex, loop: 'quality', attempt: qualityAttemptIndex, role: 'implementer', wantedTier: decision.impl, reason: reworkCall.unavailableReason });
-                    return __recordOnce(adaptForAllTiersUnavailable(reworkCall.result, 'quality', qualityAttemptIndex));
-                }
-                finalImplResult = reworkCall.result;
-                latestAttemptedImpl = { tier: reworkCall.usedTier, result: finalImplResult };
-                implementerHistory.push(reworkCall.usedTier);
-                const reworkReport = parseStructuredReport(finalImplResult.output);
-                finalImplReport = reworkReport.summary ? reworkReport : buildFallbackImplReport(finalImplResult);
-                fileContents = await readImplementerFileContents(finalImplResult.filesWritten, task.cwd);
-                heartbeat?.transition({ stage: 'quality_review', stageIndex: 4, reviewRound: qualityAttemptIndex + 1, attemptCap: maxQualityRows });
-                const reworkQualityT0 = Date.now();
-                const reworkQualityC0 = runningCostUSD();
-                const reviewCall = await runWithFallback({ assigned: decision.reviewer, providerFor, unavailableTiers: qualityUnavailable, isTransportFailure: (r) => isReviewTransportFailure(r), getStatus: (r) => r.status, makeSyntheticFailure: () => makeSkippedReviewResult('all_tiers_unavailable'), call: (provider) => runQualityReview(provider, packet, finalImplReport, fileContents, finalImplResult.toolCalls, finalImplResult.filesWritten, evidence.block, qualityReviewPromptBuilder, finalImplResult.output) });
-                if (reviewCall.bothUnavailable) {
-                    emitFallbackUnavailable({ batchId: heartbeatWiring?.batchId ?? '', taskIndex, loop: 'quality', attempt: qualityAttemptIndex, role: 'qualityReviewer', assignedTier: decision.reviewer, reason: reviewCall.unavailableReason });
-                    fallbackOverrides.push({ role: 'qualityReviewer', loop: 'quality', attempt: qualityAttemptIndex, assigned: decision.reviewer, used: reviewCall.usedTier, reason: reviewCall.unavailableReason, triggeringStatus: reviewCall.fallbackTriggeringStatus, bothUnavailable: true });
-                    qualityReviewerHistory.push('skipped');
-                }
-                else {
-                    qualityReviewerHistory.push(reviewCall.usedTier);
-                    if (reviewCall.fallbackFired) {
-                        emitFallback({ batchId: heartbeatWiring?.batchId ?? '', taskIndex, loop: 'quality', attempt: qualityAttemptIndex, role: 'qualityReviewer', assignedTier: decision.reviewer, usedTier: reviewCall.usedTier, reason: reviewCall.fallbackReason, triggeringStatus: reviewCall.fallbackTriggeringStatus, violatesSeparation: reviewCall.usedTier === implementerHistory[implementerHistory.length - 1] });
-                        fallbackOverrides.push({ role: 'qualityReviewer', loop: 'quality', attempt: qualityAttemptIndex, assigned: decision.reviewer, used: reviewCall.usedTier, reason: reviewCall.fallbackReason, triggeringStatus: reviewCall.fallbackTriggeringStatus, bothUnavailable: false });
+                        emitEscalationEvent('quality', qualityAttemptIndex, decision);
+                    transitionStage('quality_review', 'quality_rework', { stage: 'quality_rework', stageIndex: 5, reviewRound: qualityAttemptIndex, attemptCap: maxQualityRows }, { attempt: qualityAttemptIndex, attemptCap: maxQualityRows, implTier: decision.impl, reviewerTier: decision.reviewer, escalated: decision.isEscalated });
+                    const feedback = qualityResult.findings.length > 0 ? `\n\n## Quality Review Feedback (round ${qualityAttemptIndex}):\n${qualityResult.findings.map(f => `- ${f}`).join('\n')}` : '';
+                    const reworkTask = withDoneCondition({ ...task, prompt: `${task.prompt}${feedback}` });
+                    const reworkCall = await runWithFallback({ assigned: decision.impl, providerFor, unavailableTiers: qualityUnavailable, isTransportFailure: (r) => TRANSPORT_FAILURES.has(r.status) && r.capExhausted === undefined, getStatus: (r) => r.status, makeSyntheticFailure: (assigned) => makeSyntheticRunResult(assigned, 'all_tiers_unavailable'), call: (provider) => delegateWithEscalation(reworkTask, [provider], { explicitlyPinned: true, onProgress: wrappedOnProgress, taskDeadlineMs, abortSignal: stallController.signal, assignedTier: decision.impl }) });
+                    if (reworkCall.fallbackFired || reworkCall.bothUnavailable)
+                        fallbackOverrides.push({ role: 'implementer', loop: 'quality', attempt: qualityAttemptIndex, assigned: decision.impl, used: reworkCall.usedTier, reason: (reworkCall.fallbackReason ?? reworkCall.unavailableReason), triggeringStatus: reworkCall.fallbackTriggeringStatus, bothUnavailable: reworkCall.bothUnavailable });
+                    if (reworkCall.fallbackFired)
+                        emitFallback({ batchId: heartbeatWiring?.batchId ?? '', taskIndex, loop: 'quality', attempt: qualityAttemptIndex, role: 'implementer', assignedTier: decision.impl, usedTier: reworkCall.usedTier, reason: reworkCall.fallbackReason, triggeringStatus: reworkCall.fallbackTriggeringStatus, violatesSeparation: false });
+                    if (reworkCall.bothUnavailable) {
+                        emitFallbackUnavailable({ batchId: heartbeatWiring?.batchId ?? '', taskIndex, loop: 'quality', attempt: qualityAttemptIndex, role: 'implementer', assignedTier: decision.impl, reason: reworkCall.unavailableReason });
+                        if (decision.isEscalated)
+                            emitEscalationUnavailable({ batchId: heartbeatWiring?.batchId ?? '', taskIndex, loop: 'quality', attempt: qualityAttemptIndex, role: 'implementer', wantedTier: decision.impl, reason: reworkCall.unavailableReason });
+                        return __recordOnce(adaptForAllTiersUnavailable(reworkCall.result, 'quality', qualityAttemptIndex));
                     }
+                    finalImplResult = reworkCall.result;
+                    latestAttemptedImpl = { tier: reworkCall.usedTier, result: finalImplResult };
+                    implementerHistory.push(reworkCall.usedTier);
+                    const reworkReport = parseStructuredReport(finalImplResult.output);
+                    finalImplReport = reworkReport.summary ? reworkReport : buildFallbackImplReport(finalImplResult);
+                    fileContents = await readImplementerFileContents(finalImplResult.filesWritten, task.cwd);
+                    transitionStage('quality_rework', 'quality_review', { stage: 'quality_review', stageIndex: 4, reviewRound: qualityAttemptIndex + 1, attemptCap: maxQualityRows }, null);
+                    const reviewCall = await runWithFallback({ assigned: decision.reviewer, providerFor, unavailableTiers: qualityUnavailable, isTransportFailure: (r) => isReviewTransportFailure(r), getStatus: (r) => r.status, makeSyntheticFailure: () => makeSkippedReviewResult('all_tiers_unavailable'), call: (provider) => runQualityReview(provider, packet, finalImplReport, fileContents, finalImplResult.toolCalls, finalImplResult.filesWritten, evidence.block, qualityReviewPromptBuilder, finalImplResult.output, taskDeadlineMs, stallController.signal, wrappedOnProgress) });
+                    if (reviewCall.bothUnavailable) {
+                        emitFallbackUnavailable({ batchId: heartbeatWiring?.batchId ?? '', taskIndex, loop: 'quality', attempt: qualityAttemptIndex, role: 'qualityReviewer', assignedTier: decision.reviewer, reason: reviewCall.unavailableReason });
+                        fallbackOverrides.push({ role: 'qualityReviewer', loop: 'quality', attempt: qualityAttemptIndex, assigned: decision.reviewer, used: reviewCall.usedTier, reason: reviewCall.unavailableReason, triggeringStatus: reviewCall.fallbackTriggeringStatus, bothUnavailable: true });
+                        qualityReviewerHistory.push('skipped');
+                    }
+                    else {
+                        qualityReviewerHistory.push(reviewCall.usedTier);
+                        if (reviewCall.fallbackFired) {
+                            emitFallback({ batchId: heartbeatWiring?.batchId ?? '', taskIndex, loop: 'quality', attempt: qualityAttemptIndex, role: 'qualityReviewer', assignedTier: decision.reviewer, usedTier: reviewCall.usedTier, reason: reviewCall.fallbackReason, triggeringStatus: reviewCall.fallbackTriggeringStatus, violatesSeparation: reviewCall.usedTier === implementerHistory[implementerHistory.length - 1] });
+                            fallbackOverrides.push({ role: 'qualityReviewer', loop: 'quality', attempt: qualityAttemptIndex, assigned: decision.reviewer, used: reviewCall.usedTier, reason: reviewCall.fallbackReason, triggeringStatus: reviewCall.fallbackTriggeringStatus, bothUnavailable: false });
+                        }
+                    }
+                    qualityResult = reviewCall.result;
+                    if (reviewDidNotReject(qualityResult.status))
+                        lastNonRejectedImpl = { tier: implementerHistory[implementerHistory.length - 1], result: finalImplResult };
+                    qualityAttemptIndex++;
+                    if (qualityResult.status === 'approved' || qualityResult.status === 'skipped')
+                        break;
+                    const currentFindings = [...(qualityResult.findings ?? [])].sort().join('\0');
+                    const prevFindings = [...prevQualityFindings].sort().join('\0');
+                    if (currentFindings === prevFindings && currentFindings !== '')
+                        break;
+                    prevQualityFindings = [...(qualityResult.findings ?? [])];
                 }
-                qualityResult = reviewCall.result;
-                if (reviewPolicy === 'quality_only') {
-                    emitTaskEvent('read_only_review.quality', {
-                        route: routeKey,
-                        verdict: qualityResult.status === 'approved' ? 'approved'
-                            : qualityResult.status === 'changes_required' ? 'changes_required'
-                                : qualityResult.status === 'skipped' ? 'skipped'
-                                    : 'error',
-                        iterationIndex: qualityAttemptIndex + 1,
-                        findingsReviewed: qualityResult.findings?.length ?? 0,
-                        findingsFlagged: qualityResult.status === 'changes_required' ? (qualityResult.findings?.length ?? 0) : 0,
-                        durationMs: Date.now() - reworkQualityT0,
-                        costUSD: runningCostUSD() !== null && reworkQualityC0 !== null ? runningCostUSD() - reworkQualityC0 : null,
-                    });
-                }
-                if (reviewDidNotReject(qualityResult.status))
-                    lastNonRejectedImpl = { tier: implementerHistory[implementerHistory.length - 1], result: finalImplResult };
-                qualityAttemptIndex++;
-                if (qualityResult.status === 'approved' || qualityResult.status === 'skipped')
-                    break;
-                const currentFindings = [...(qualityResult.findings ?? [])].sort().join('\0');
-                const prevFindings = [...prevQualityFindings].sort().join('\0');
-                if (currentFindings === prevFindings && currentFindings !== '')
-                    break;
-                prevQualityFindings = [...(qualityResult.findings ?? [])];
             }
         }
         const finalReport = specReport ?? finalImplReport;
@@ -1180,17 +1224,18 @@ export async function executeReviewedLifecycle(task, resolved, config, taskIndex
             ? 'skipped'
             : (['approved', 'changes_required', 'skipped', 'error', 'api_error', 'network_error', 'timeout'].includes(specStatus) ? specStatus : 'error');
         if (reviewPolicy !== 'quality_only') {
-            endReviewStage(stats, 'spec_review', specReviewT0, specReviewC0, implementerAgentInfo, runningCostUSD(), specStatus === 'approved' ? 'approved'
+            endReviewStage(stats, 'spec_review', specReviewT0, specReviewC0, implementerAgentInfo, runningCostUSD(), snapshotIdle(stageIdle), specStatus === 'approved' ? 'approved'
                 : specStatus === 'changes_required' ? 'changes_required'
                     : specStatus === 'skipped' ? 'skipped'
                         : specStatus === 'not_applicable' ? 'not_applicable'
                             : 'error', specAttemptIndex - 1);
         }
         const qualityAggregateStatus = qualityResult.status;
-        endReviewStage(stats, 'quality_review', qualityReviewT0, qualityReviewC0, implementerAgentInfo, runningCostUSD(), qualityResult.status === 'approved' ? 'approved'
+        endReviewStage(stats, 'quality_review', qualityReviewT0, qualityReviewC0, implementerAgentInfo, runningCostUSD(), snapshotIdle(stageIdle), qualityResult.status === 'approved' ? 'approved'
             : qualityResult.status === 'changes_required' ? 'changes_required'
-                : qualityResult.status === 'skipped' ? 'skipped'
-                    : 'error', qualityAttemptIndex - 1);
+                : qualityResult.status === 'annotated' ? 'annotated'
+                    : qualityResult.status === 'skipped' ? 'skipped'
+                        : 'error', qualityAttemptIndex - 1);
         const aggregated = aggregateResult(finalReport, specReport, qualityResult.report, specAggregateStatus, qualityAggregateStatus);
         // File artifact verification: check whether output targets exist on disk after all work.
         // Only applies when status is ok; non-ok statuses skip verification entirely.
@@ -1205,8 +1250,8 @@ export async function executeReviewedLifecycle(task, resolved, config, taskIndex
             : finalImplResult.status === 'ok' && fileArtifactsMissing
                 ? 'incomplete'
                 : finalImplResult.status;
-        const specEnvelopeStatus = (specStatus === 'api_error' || specStatus === 'network_error' || specStatus === 'timeout' ? 'error' : specStatus);
-        const qualityEnvelopeStatus = qualityResult.status === 'api_error' || qualityResult.status === 'network_error' || qualityResult.status === 'timeout' ? 'error' : qualityResult.status;
+        const specEnvelopeStatus = (specStatus === 'api_error' || specStatus === 'network_error' || specStatus === 'timeout' || specStatus === 'api_aborted' ? 'error' : specStatus);
+        const qualityEnvelopeStatus = qualityResult.status === 'api_error' || qualityResult.status === 'network_error' || qualityResult.status === 'timeout' || qualityResult.status === 'api_aborted' ? 'error' : qualityResult.status;
         const runResult = {
             ...finalImplResult,
             status: finalStatus,
@@ -1238,10 +1283,9 @@ export async function executeReviewedLifecycle(task, resolved, config, taskIndex
             emitTaskEvent('read_only_review.terminal', {
                 route: routeKey,
                 roundsUsed: qualityAttemptIndex,
-                finalQualityVerdict: qualityResult.status === 'approved' ? 'approved'
-                    : qualityResult.status === 'changes_required' ? 'changes_required'
-                        : qualityResult.status === 'skipped' ? 'skipped'
-                            : 'error',
+                finalQualityVerdict: qualityResult.status === 'annotated' ? 'annotated'
+                    : qualityResult.status === 'skipped' ? 'skipped'
+                        : 'error',
                 costUSD: taskCostUSD(),
                 durationMs: Date.now() - taskStartMs,
             });
@@ -1276,8 +1320,30 @@ export async function executeReviewedLifecycle(task, resolved, config, taskIndex
                 });
             }
             catch { /* silent */ }
+            // NEW in v3.9.0: local JSONL emit. Distinct from cloud — local is
+            // for verbose/observability consumers; cloud is for telemetry sink.
+            try {
+                const r = __finalRunResult;
+                emitTaskEvent('task_completed', {
+                    status: r.status,
+                    workerStatus: r.workerStatus ?? null,
+                    turns: r.turns,
+                    durationMs: r.durationMs ?? null,
+                    filesRead: r.filesRead?.length ?? 0,
+                    filesWritten: r.filesWritten?.length ?? 0,
+                    toolCalls: r.toolCalls?.length ?? 0,
+                    inputTokens: r.usage.inputTokens,
+                    outputTokens: r.usage.outputTokens,
+                    costUSD: r.usage.costUSD,
+                    taskMaxIdleMs: r.taskMaxIdleMs ?? null,
+                    stallTriggered: r.stallTriggered ?? false,
+                    // JSON-stringify so verbose-stream primitives check passes
+                    stages: JSON.stringify(r.stageStats ?? emptyStats()),
+                });
+            }
+            catch { /* silent — never break the user task */ }
         }
-        heartbeat?.setStage('terminal', 8);
+        transitionStage(currentStage, 'terminal', { stage: 'terminal', stageIndex: 8 }, null);
         heartbeat?.stop();
         clearInterval(stallWatchdogInterval);
     }