npm - @gethmy/agent - Versions diffs - 1.0.9 → 1.1.1 - Mend

@gethmy/agent 1.0.9 → 1.1.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (72) hide show

package/README.md +67 -16
package/dist/__tests__/budget.test.d.ts +1 -0
package/dist/__tests__/budget.test.js +94 -0
package/dist/__tests__/config-validation.test.d.ts +1 -0
package/dist/__tests__/config-validation.test.js +65 -0
package/dist/__tests__/dev-server-readiness.test.d.ts +1 -0
package/dist/__tests__/dev-server-readiness.test.js +26 -0
package/dist/__tests__/http-server.test.d.ts +1 -0
package/dist/__tests__/http-server.test.js +115 -0
package/dist/__tests__/log.test.d.ts +1 -0
package/dist/__tests__/log.test.js +115 -0
package/dist/__tests__/process-group.test.d.ts +1 -0
package/dist/__tests__/process-group.test.js +68 -0
package/dist/__tests__/reconcile-heartbeat.test.d.ts +1 -0
package/dist/__tests__/reconcile-heartbeat.test.js +116 -0
package/dist/__tests__/recovery.test.d.ts +1 -0
package/dist/__tests__/recovery.test.js +126 -0
package/dist/__tests__/review-parser.test.d.ts +1 -0
package/dist/__tests__/review-parser.test.js +65 -0
package/dist/__tests__/state-store.test.d.ts +1 -0
package/dist/__tests__/state-store.test.js +132 -0
package/dist/__tests__/transitions.test.d.ts +1 -0
package/dist/__tests__/transitions.test.js +130 -0
package/dist/__tests__/worktree-gc.test.d.ts +1 -0
package/dist/__tests__/worktree-gc.test.js +137 -0
package/dist/budget.d.ts +45 -0
package/dist/budget.js +94 -0
package/dist/cli.d.ts +15 -1
package/dist/cli.js +239 -1
package/dist/completion.d.ts +9 -0
package/dist/completion.js +28 -2
package/dist/config-validation.d.ts +18 -0
package/dist/config-validation.js +66 -0
package/dist/config.js +12 -0
package/dist/http-server.d.ts +79 -0
package/dist/http-server.js +115 -0
package/dist/index.d.ts +4 -1
package/dist/index.js +125 -10
package/dist/log.d.ts +29 -5
package/dist/log.js +80 -15
package/dist/pool.d.ts +27 -2
package/dist/pool.js +69 -4
package/dist/process-group.d.ts +26 -0
package/dist/process-group.js +72 -0
package/dist/progress-tracker.js +2 -0
package/dist/queue.d.ts +2 -0
package/dist/queue.js +4 -0
package/dist/reconcile.d.ts +15 -1
package/dist/reconcile.js +63 -2
package/dist/recovery.d.ts +30 -0
package/dist/recovery.js +136 -0
package/dist/review-completion.d.ts +12 -4
package/dist/review-completion.js +158 -49
package/dist/review-worker.d.ts +9 -2
package/dist/review-worker.js +182 -78
package/dist/run-log.d.ts +6 -0
package/dist/run-log.js +19 -0
package/dist/state-store.d.ts +72 -0
package/dist/state-store.js +216 -0
package/dist/transitions.d.ts +57 -0
package/dist/transitions.js +131 -0
package/dist/types.d.ts +23 -0
package/dist/types.js +19 -1
package/dist/verification.d.ts +17 -0
package/dist/verification.js +71 -10
package/dist/watcher.d.ts +2 -0
package/dist/watcher.js +11 -0
package/dist/worker.d.ts +9 -2
package/dist/worker.js +168 -47
package/dist/worktree-gc.d.ts +39 -0
package/dist/worktree-gc.js +139 -0
package/package.json +2 -2

package/dist/review-completion.js CHANGED Viewed

@@ -1,66 +1,132 @@
 import { addLabelByName, moveCardToColumn } from "./board-helpers.js";
+import { buildTokenPayload } from "./completion.js";
 import { createPullRequest, detectGitProvider, pushBranch } from "./git-pr.js";
 import { log } from "./log.js";
+import { NEED_REVIEW_LABEL, NEED_REVIEW_LABEL_COLOR, } from "./types.js";
 import { cleanupWorktree } from "./worktree.js";
 const TAG = "review-completion";
 const MAX_FINDINGS = 10;
 const REVIEW_MARKER = "---\n**Review:";
+/**
+ * Extract structured fields from a parsed JSON object into a ReviewResult.
+ */
+function extractResult(parsed) {
+    const verdict = parsed.verdict === "approved" || parsed.verdict === "rejected"
+        ? parsed.verdict
+        : "rejected";
+    const findings = Array.isArray(parsed.findings)
+        ? parsed.findings
+            .filter((f) => typeof f === "object" && f !== null && "title" in f)
+            .map((f) => ({
+            severity: f.severity === "critical"
+                ? "critical"
+                : f.severity === "minor"
+                    ? "minor"
+                    : "major",
+            title: String(f.title ?? "Untitled finding"),
+            description: String(f.description ?? ""),
+            category: f.category ? String(f.category) : undefined,
+            location: f.location ? String(f.location) : undefined,
+        }))
+        : [];
+    const scopeCheck = parsed.scopeCheck &&
+        typeof parsed.scopeCheck === "object" &&
+        "status" in parsed.scopeCheck
+        ? {
+            status: ["clean", "drift", "missing"].includes(parsed.scopeCheck.status)
+                ? parsed.scopeCheck.status
+                : "clean",
+            notes: parsed.scopeCheck.notes
+                ? String(parsed.scopeCheck.notes)
+                : undefined,
+        }
+        : undefined;
+    return {
+        verdict,
+        summary: String(parsed.summary ?? "").slice(0, 2000),
+        scopeCheck,
+        findings,
+    };
+}
 /**
  * Parse Claude's review output into a structured ReviewResult.
- * Looks for a JSON block in the output.
+ *
+ * Tries multiple extraction strategies in order:
+ * 1. ```json ... ``` fenced block (what the prompt asks for)
+ * 2. Any top-level JSON object containing a "verdict" key (last-wins)
+ * 3. Regex for a bare `"verdict": "approved|rejected"` anywhere — lossy
+ *    but keeps the pipeline moving
+ * 4. Falls back to verdict: "error" — keeps card in Review instead of
+ *    bouncing it to To Do for a parse failure that isn't a code quality signal.
  */
 export function parseReviewOutput(stdout) {
-    // Try to find a JSON block in the output
-    const jsonMatch = stdout.match(/```json\s*([\s\S]*?)```/);
-    const rawJson = jsonMatch?.[1]?.trim() ?? stdout.trim();
-    try {
-        const parsed = JSON.parse(rawJson);
-        const verdict = parsed.verdict === "approved" || parsed.verdict === "rejected"
-            ? parsed.verdict
-            : "rejected";
-        const findings = Array.isArray(parsed.findings)
-            ? parsed.findings
-                .filter((f) => typeof f === "object" && f !== null && "title" in f)
-                .map((f) => ({
-                severity: f.severity === "critical"
-                    ? "critical"
-                    : f.severity === "minor"
-                        ? "minor"
-                        : "major",
-                title: String(f.title ?? "Untitled finding"),
-                description: String(f.description ?? ""),
-                category: f.category ? String(f.category) : undefined,
-                location: f.location ? String(f.location) : undefined,
-            }))
-            : [];
-        const scopeCheck = parsed.scopeCheck &&
-            typeof parsed.scopeCheck === "object" &&
-            "status" in parsed.scopeCheck
-            ? {
-                status: ["clean", "drift", "missing"].includes(parsed.scopeCheck.status)
-                    ? parsed.scopeCheck.status
-                    : "clean",
-                notes: parsed.scopeCheck.notes
-                    ? String(parsed.scopeCheck.notes)
-                    : undefined,
+    // Strategy 1: fenced ```json block (greedy-last to handle multiple blocks)
+    const fencedBlocks = [...stdout.matchAll(/```json\s*([\s\S]*?)```/g)];
+    for (let i = fencedBlocks.length - 1; i >= 0; i--) {
+        const raw = fencedBlocks[i][1].trim();
+        try {
+            const parsed = JSON.parse(raw);
+            if (parsed && typeof parsed === "object" && "verdict" in parsed) {
+                log.debug(TAG, "Parsed review output from fenced JSON block");
+                return extractResult(parsed);
             }
-            : undefined;
-        return {
-            verdict,
-            summary: String(parsed.summary ?? "").slice(0, 2000),
-            scopeCheck,
-            findings,
-        };
+        }
+        catch {
+            // try next block
+        }
     }
-    catch {
-        // If we can't parse JSON, treat as rejection with the raw output as summary
-        log.warn(TAG, "Failed to parse review JSON output, treating as rejection");
+    // Strategy 2: scan every top-level { ... } block and take the last one
+    // that parses AND contains "verdict". This handles cases where the output
+    // has multiple stray braces before the real JSON object.
+    const candidates = [];
+    let depth = 0;
+    let start = -1;
+    for (let i = 0; i < stdout.length; i++) {
+        const ch = stdout[i];
+        if (ch === "{") {
+            if (depth === 0)
+                start = i;
+            depth++;
+        }
+        else if (ch === "}") {
+            depth--;
+            if (depth === 0 && start !== -1) {
+                candidates.push(stdout.slice(start, i + 1));
+                start = -1;
+            }
+        }
+    }
+    for (let i = candidates.length - 1; i >= 0; i--) {
+        try {
+            const parsed = JSON.parse(candidates[i]);
+            if (parsed && typeof parsed === "object" && "verdict" in parsed) {
+                log.debug(TAG, "Parsed review output from raw JSON object");
+                return extractResult(parsed);
+            }
+        }
+        catch {
+            // try next
+        }
+    }
+    // Strategy 3: regex for a bare verdict declaration anywhere in the output.
+    // Loses findings/summary but preserves approve/reject signal so the pipeline
+    // can make progress instead of looping on "error".
+    const verdictMatch = stdout.match(/"verdict"\s*:\s*"(approved|rejected)"/i);
+    if (verdictMatch) {
+        log.warn(TAG, `Parsed verdict via regex fallback — findings lost (${verdictMatch[1]})`);
         return {
-            verdict: "rejected",
-            summary: stdout.slice(0, 500),
+            verdict: verdictMatch[1].toLowerCase(),
+            summary: "Parsed via regex fallback — original JSON was malformed. Check run log.",
             findings: [],
         };
     }
+    // Strategy 4: nothing parseable — return error verdict so the card stays in Review
+    log.warn(TAG, "Failed to parse review JSON output — returning error verdict (card stays in Review)");
+    return {
+        verdict: "error",
+        summary: stdout.slice(0, 500),
+        findings: [],
+    };
 }
 /**
  * Get the current review cycle count from card description.
@@ -97,7 +163,7 @@ function stripReviewSummary(description) {
  * Handles approved/rejected verdicts, creates subtasks for findings,
  * and moves the card to the appropriate column.
  */
-export async function runReviewCompletion(client, card, result, config, worktreePath, branchName) {
+export async function runReviewCompletion(client, card, result, config, worktreePath, branchName, sessionStats) {
     // Re-fetch card for fresh description (avoids stale data from enqueue time)
     let freshDesc;
     try {
@@ -109,6 +175,42 @@ export async function runReviewCompletion(client, card, result, config, worktree
     }
     const currentCycle = getReviewCycle(freshDesc) + 1;
     const maxCycles = config.review.maxReviewCycles;
+    if (result.verdict === "error") {
+        // Parse failure — not a code quality signal. Keep card in Review and
+        // add the "Need Review" label so reconcile stops re-enqueueing it.
+        // Without the label, the reconcile loop would respawn the review every
+        // cycle and burn budget on the same unparseable output (see #122).
+        log.warn(TAG, `#${card.short_id} review output unparseable — labelling "${NEED_REVIEW_LABEL}" for manual inspection`);
+        try {
+            await addLabelByName(client, card, NEED_REVIEW_LABEL, NEED_REVIEW_LABEL_COLOR);
+        }
+        catch (err) {
+            log.warn(TAG, `Failed to add "${NEED_REVIEW_LABEL}" label: ${err instanceof Error ? err.message : err}`);
+        }
+        if (config.review.postFindings) {
+            const baseDesc = stripReviewSummary(freshDesc);
+            const summary = [
+                `\n\n${REVIEW_MARKER} Parse error**`,
+                '\nThe review agent\'s output could not be parsed. Card stays in Review with the "Need Review" label — check the run log in ~/.harmony-mcp/runs/ for diagnosis.',
+                result.summary ? `\n\nRaw output (truncated):\n${result.summary}` : "",
+            ].join("");
+            try {
+                await client.updateCard(card.id, { description: baseDesc + summary });
+            }
+            catch (err) {
+                log.error(TAG, `Failed to update description: ${err instanceof Error ? err.message : err}`);
+            }
+        }
+        await client.endAgentSession(card.id, {
+            status: "paused",
+            ...buildTokenPayload(sessionStats),
+        });
+        // Cleanup worktree but do NOT move the card
+        if (branchName) {
+            cleanupWorktree(worktreePath, branchName);
+        }
+        return;
+    }
     if (result.verdict === "approved") {
         // Ensure branch is pushed (skip in local mode — no branch to push)
         let prUrl = null;
@@ -150,6 +252,7 @@ export async function runReviewCompletion(client, card, result, config, worktree
         await client.endAgentSession(card.id, {
             status: "completed",
             progressPercent: 100,
+            ...buildTokenPayload(sessionStats),
         });
         log.info(TAG, `#${card.short_id} approved${prUrl ? ` — PR: ${prUrl}` : ""} — labeled "${config.review.approvedLabel}"`);
     }
@@ -181,7 +284,10 @@ export async function runReviewCompletion(client, card, result, config, worktree
             catch (err) {
                 log.error(TAG, `Failed to update description: ${err instanceof Error ? err.message : err}`);
             }
-            await client.endAgentSession(card.id, { status: "completed" });
+            await client.endAgentSession(card.id, {
+                status: "completed",
+                ...buildTokenPayload(sessionStats),
+            });
             if (branchName) {
                 cleanupWorktree(worktreePath, branchName);
             }
@@ -243,7 +349,10 @@ export async function runReviewCompletion(client, card, result, config, worktree
         }
         // Move back to failColumn (To Do) for re-implementation
         await moveCardToColumn(client, card, config.review.failColumn);
-        await client.endAgentSession(card.id, { status: "paused" });
+        await client.endAgentSession(card.id, {
+            status: "paused",
+            ...buildTokenPayload(sessionStats),
+        });
         log.info(TAG, `#${card.short_id} rejected (cycle ${currentCycle}/${maxCycles}) — moved to "${config.review.failColumn}"`);
     }
     // Cleanup worktree (skip in local mode — no worktree to clean)

package/dist/review-worker.d.ts CHANGED Viewed

@@ -1,10 +1,12 @@
 import type { HarmonyApiClient } from "@gethmy/mcp/src/api-client.js";
 import type { Card, Column, Label, Subtask } from "@harmony/shared";
+import { type StateStore } from "./state-store.js";
 import { type AgentConfig, type WorkerState } from "./types.js";
 export declare class ReviewWorker {
     private config;
     private client;
     private onDone;
+    private stateStore;
     id: number;
     state: WorkerState;
     cardId: string | null;
@@ -14,9 +16,15 @@ export declare class ReviewWorker {
     private process;
     private devServerProcess;
     private timeoutTimer;
+    private heartbeatTimer;
     private progressTracker;
+    private lastSessionStats;
     private aborted;
-    constructor(id: number, config: AgentConfig, client: HarmonyApiClient, _userEmail: string, onDone: (worker: ReviewWorker) => void);
+    private runId;
+    constructor(id: number, config: AgentConfig, client: HarmonyApiClient, _userEmail: string, onDone: (worker: ReviewWorker) => void, stateStore: StateStore);
+    private startHeartbeat;
+    private stopHeartbeat;
+    private recordPhase;
     get tag(): string;
     get isIdle(): boolean;
     private get reviewPort();
@@ -39,7 +47,6 @@ export declare class ReviewWorker {
      */
     cancel(): Promise<void>;
     private spawnClaude;
-    private waitForExit;
     private killDevServer;
     private resolveLocalChanges;
     private cleanup;