npm - @united-workforce/cli - Versions diffs - 0.3.0 → 0.4.0 - Mend

@united-workforce/cli 0.3.0 → 0.4.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (219) hide show

package/README.md +15 -8
package/dist/__tests__/adapter-json-roundtrip.test.js +1 -1
package/dist/__tests__/adapter-json-roundtrip.test.js.map +1 -1
package/dist/__tests__/agent-resolution-llm-free.test.d.ts +2 -0
package/dist/__tests__/agent-resolution-llm-free.test.d.ts.map +1 -0
package/dist/__tests__/agent-resolution-llm-free.test.js +30 -0
package/dist/__tests__/agent-resolution-llm-free.test.js.map +1 -0
package/dist/__tests__/build-step-entry.test.d.ts +2 -0
package/dist/__tests__/build-step-entry.test.d.ts.map +1 -0
package/dist/__tests__/build-step-entry.test.js +173 -0
package/dist/__tests__/build-step-entry.test.js.map +1 -0
package/dist/__tests__/clear-thread-failed-attempts.test.d.ts +2 -0
package/dist/__tests__/clear-thread-failed-attempts.test.d.ts.map +1 -0
package/dist/__tests__/clear-thread-failed-attempts.test.js +93 -0
package/dist/__tests__/clear-thread-failed-attempts.test.js.map +1 -0
package/dist/__tests__/config.test.js +26 -302
package/dist/__tests__/config.test.js.map +1 -1
package/dist/__tests__/current-role.test.js +7 -6
package/dist/__tests__/current-role.test.js.map +1 -1
package/dist/__tests__/e2e-mock-agent.test.js +20 -23
package/dist/__tests__/e2e-mock-agent.test.js.map +1 -1
package/dist/__tests__/issue-180-workflow-ref-removed.test.d.ts +2 -0
package/dist/__tests__/issue-180-workflow-ref-removed.test.d.ts.map +1 -0
package/dist/__tests__/issue-180-workflow-ref-removed.test.js +40 -0
package/dist/__tests__/issue-180-workflow-ref-removed.test.js.map +1 -0
package/dist/__tests__/moderator-evaluate.test.js +9 -50
package/dist/__tests__/moderator-evaluate.test.js.map +1 -1
package/dist/__tests__/pid-recycling.test.d.ts +2 -0
package/dist/__tests__/pid-recycling.test.d.ts.map +1 -0
package/dist/__tests__/pid-recycling.test.js +271 -0
package/dist/__tests__/pid-recycling.test.js.map +1 -0
package/dist/__tests__/prompt.test.js +321 -0
package/dist/__tests__/prompt.test.js.map +1 -1
package/dist/__tests__/resolve-head-hash.test.js +4 -4
package/dist/__tests__/resolve-head-hash.test.js.map +1 -1
package/dist/__tests__/setup-agent-discovery.test.js +21 -30
package/dist/__tests__/setup-agent-discovery.test.js.map +1 -1
package/dist/__tests__/setup-complexity.test.js +2 -168
package/dist/__tests__/setup-complexity.test.js.map +1 -1
package/dist/__tests__/setup-no-llm.test.d.ts +2 -0
package/dist/__tests__/setup-no-llm.test.d.ts.map +1 -0
package/dist/__tests__/setup-no-llm.test.js +52 -0
package/dist/__tests__/setup-no-llm.test.js.map +1 -0
package/dist/__tests__/solve-issue-tea-worktree.test.js +24 -27
package/dist/__tests__/solve-issue-tea-worktree.test.js.map +1 -1
package/dist/__tests__/step-ask.test.d.ts +2 -0
package/dist/__tests__/step-ask.test.d.ts.map +1 -0
package/dist/__tests__/step-ask.test.js +499 -0
package/dist/__tests__/step-ask.test.js.map +1 -0
package/dist/__tests__/step-show-json.test.js +1 -0
package/dist/__tests__/step-show-json.test.js.map +1 -1
package/dist/__tests__/step-timing.test.js +2 -0
package/dist/__tests__/step-timing.test.js.map +1 -1
package/dist/__tests__/store-global-cas.test.js +2 -2
package/dist/__tests__/store-global-cas.test.js.map +1 -1
package/dist/__tests__/store-unified-threads.test.js +9 -9
package/dist/__tests__/store-unified-threads.test.js.map +1 -1
package/dist/__tests__/thread-cancel-status.test.js +6 -6
package/dist/__tests__/thread-cancel-status.test.js.map +1 -1
package/dist/__tests__/thread-list-filters.test.js +344 -9
package/dist/__tests__/thread-list-filters.test.js.map +1 -1
package/dist/__tests__/thread-poke.test.d.ts +2 -0
package/dist/__tests__/thread-poke.test.d.ts.map +1 -0
package/dist/__tests__/thread-poke.test.js +412 -0
package/dist/__tests__/thread-poke.test.js.map +1 -0
package/dist/__tests__/thread-resume.test.js +10 -14
package/dist/__tests__/thread-resume.test.js.map +1 -1
package/dist/__tests__/thread-show-status.test.js +17 -28
package/dist/__tests__/thread-show-status.test.js.map +1 -1
package/dist/__tests__/thread-suspend-step.test.js +8 -14
package/dist/__tests__/thread-suspend-step.test.js.map +1 -1
package/dist/__tests__/thread-suspended-display.test.js +10 -22
package/dist/__tests__/thread-suspended-display.test.js.map +1 -1
package/dist/__tests__/thread.test.js +4 -4
package/dist/__tests__/thread.test.js.map +1 -1
package/dist/__tests__/validate-semantic.test.js +49 -21
package/dist/__tests__/validate-semantic.test.js.map +1 -1
package/dist/__tests__/workflow-list-recursive.test.d.ts +2 -0
package/dist/__tests__/workflow-list-recursive.test.d.ts.map +1 -0
package/dist/__tests__/workflow-list-recursive.test.js +283 -0
package/dist/__tests__/workflow-list-recursive.test.js.map +1 -0
package/dist/__tests__/workflow-resolution.test.js +36 -21
package/dist/__tests__/workflow-resolution.test.js.map +1 -1
package/dist/__tests__/workflow-show-resolution.test.d.ts +2 -0
package/dist/__tests__/workflow-show-resolution.test.d.ts.map +1 -0
package/dist/__tests__/workflow-show-resolution.test.js +210 -0
package/dist/__tests__/workflow-show-resolution.test.js.map +1 -0
package/dist/__tests__/workflow-validate.test.d.ts +2 -0
package/dist/__tests__/workflow-validate.test.d.ts.map +1 -0
package/dist/__tests__/workflow-validate.test.js +687 -0
package/dist/__tests__/workflow-validate.test.js.map +1 -0
package/dist/background/background.d.ts +22 -1
package/dist/background/background.d.ts.map +1 -1
package/dist/background/background.js +83 -6
package/dist/background/background.js.map +1 -1
package/dist/background/index.d.ts +1 -1
package/dist/background/index.d.ts.map +1 -1
package/dist/background/index.js +1 -1
package/dist/background/index.js.map +1 -1
package/dist/background/types.d.ts +1 -0
package/dist/background/types.d.ts.map +1 -1
package/dist/cli.js +66 -31
package/dist/cli.js.map +1 -1
package/dist/commands/config.d.ts +3 -1
package/dist/commands/config.d.ts.map +1 -1
package/dist/commands/config.js +7 -33
package/dist/commands/config.js.map +1 -1
package/dist/commands/prompt.d.ts.map +1 -1
package/dist/commands/prompt.js +15 -2
package/dist/commands/prompt.js.map +1 -1
package/dist/commands/setup.d.ts +7 -39
package/dist/commands/setup.d.ts.map +1 -1
package/dist/commands/setup.js +27 -302
package/dist/commands/setup.js.map +1 -1
package/dist/commands/step.d.ts +44 -1
package/dist/commands/step.d.ts.map +1 -1
package/dist/commands/step.js +255 -11
package/dist/commands/step.js.map +1 -1
package/dist/commands/thread.d.ts +16 -3
package/dist/commands/thread.d.ts.map +1 -1
package/dist/commands/thread.js +379 -140
package/dist/commands/thread.js.map +1 -1
package/dist/commands/workflow.d.ts +9 -1
package/dist/commands/workflow.d.ts.map +1 -1
package/dist/commands/workflow.js +130 -6
package/dist/commands/workflow.js.map +1 -1
package/dist/moderator/__tests__/evaluate.test.js +31 -17
package/dist/moderator/__tests__/evaluate.test.js.map +1 -1
package/dist/moderator/evaluate.d.ts.map +1 -1
package/dist/moderator/evaluate.js +4 -16
package/dist/moderator/evaluate.js.map +1 -1
package/dist/moderator/index.d.ts +1 -2
package/dist/moderator/index.d.ts.map +1 -1
package/dist/moderator/index.js +0 -1
package/dist/moderator/index.js.map +1 -1
package/dist/moderator/types.d.ts +6 -10
package/dist/moderator/types.d.ts.map +1 -1
package/dist/moderator/types.js +1 -3
package/dist/moderator/types.js.map +1 -1
package/dist/schemas.d.ts +2 -0
package/dist/schemas.d.ts.map +1 -1
package/dist/schemas.js +5 -3
package/dist/schemas.js.map +1 -1
package/dist/store.d.ts +28 -9
package/dist/store.d.ts.map +1 -1
package/dist/store.js +75 -16
package/dist/store.js.map +1 -1
package/dist/validate-semantic.d.ts.map +1 -1
package/dist/validate-semantic.js +83 -66
package/dist/validate-semantic.js.map +1 -1
package/dist/validate.d.ts +6 -0
package/dist/validate.d.ts.map +1 -1
package/dist/validate.js +24 -0
package/dist/validate.js.map +1 -1
package/package.json +8 -10
package/src/__tests__/adapter-json-roundtrip.test.ts +1 -1
package/src/__tests__/agent-resolution-llm-free.test.ts +39 -0
package/src/__tests__/build-step-entry.test.ts +203 -0
package/src/__tests__/clear-thread-failed-attempts.test.ts +122 -0
package/src/__tests__/config.test.ts +33 -321
package/src/__tests__/current-role.test.ts +7 -6
package/src/__tests__/e2e-mock-agent.test.ts +20 -23
package/src/__tests__/fixtures/e2e-count.workflow.yaml +1 -0
package/src/__tests__/fixtures/e2e-linear.workflow.yaml +1 -0
package/src/__tests__/fixtures/{e2e-mustache.workflow.yaml → e2e-liquid.workflow.yaml} +3 -2
package/src/__tests__/fixtures/e2e-loop.workflow.yaml +1 -0
package/src/__tests__/fixtures/e2e-suspend.mock.yaml +2 -2
package/src/__tests__/fixtures/e2e-suspend.workflow.yaml +6 -10
package/src/__tests__/issue-180-workflow-ref-removed.test.ts +43 -0
package/src/__tests__/moderator-evaluate.test.ts +9 -52
package/src/__tests__/pid-recycling.test.ts +328 -0
package/src/__tests__/prompt.test.ts +397 -0
package/src/__tests__/resolve-head-hash.test.ts +4 -4
package/src/__tests__/setup-agent-discovery.test.ts +26 -51
package/src/__tests__/setup-complexity.test.ts +1 -203
package/src/__tests__/setup-no-llm.test.ts +68 -0
package/src/__tests__/solve-issue-tea-worktree.test.ts +24 -30
package/src/__tests__/step-ask.test.ts +670 -0
package/src/__tests__/step-show-json.test.ts +1 -0
package/src/__tests__/step-timing.test.ts +2 -0
package/src/__tests__/store-global-cas.test.ts +2 -2
package/src/__tests__/store-unified-threads.test.ts +9 -9
package/src/__tests__/thread-cancel-status.test.ts +6 -6
package/src/__tests__/thread-list-filters.test.ts +434 -8
package/src/__tests__/thread-poke.test.ts +545 -0
package/src/__tests__/thread-resume.test.ts +10 -14
package/src/__tests__/thread-show-status.test.ts +17 -29
package/src/__tests__/thread-suspend-step.test.ts +8 -14
package/src/__tests__/thread-suspended-display.test.ts +10 -22
package/src/__tests__/thread.test.ts +4 -4
package/src/__tests__/validate-semantic.test.ts +59 -31
package/src/__tests__/workflow-list-recursive.test.ts +370 -0
package/src/__tests__/workflow-resolution.test.ts +39 -21
package/src/__tests__/workflow-show-resolution.test.ts +285 -0
package/src/__tests__/workflow-validate.test.ts +806 -0
package/src/background/background.ts +88 -6
package/src/background/index.ts +2 -0
package/src/background/types.ts +1 -0
package/src/cli.ts +97 -47
package/src/commands/config.ts +7 -35
package/src/commands/prompt.ts +15 -2
package/src/commands/setup.ts +29 -357
package/src/commands/step.ts +339 -12
package/src/commands/thread.ts +463 -169
package/src/commands/workflow.ts +159 -4
package/src/moderator/__tests__/evaluate.test.ts +34 -17
package/src/moderator/evaluate.ts +5 -17
package/src/moderator/index.ts +1 -6
package/src/moderator/types.ts +6 -14
package/src/schemas.ts +13 -3
package/src/store.ts +86 -20
package/src/validate-semantic.ts +109 -78
package/src/validate.ts +27 -0
package/dist/__tests__/setup-validate.test.d.ts +0 -2
package/dist/__tests__/setup-validate.test.d.ts.map +0 -1
package/dist/__tests__/setup-validate.test.js +0 -108
package/dist/__tests__/setup-validate.test.js.map +0 -1
package/src/__tests__/setup-validate.test.ts +0 -148
/package/src/__tests__/fixtures/{e2e-mustache.mock.yaml → e2e-liquid.mock.yaml} +0 -0

package/src/__tests__/thread-poke.test.ts ADDED Viewed

@@ -0,0 +1,545 @@
+import { execFileSync } from "node:child_process";
+import { mkdir, mkdtemp, readFile, rm, writeFile } from "node:fs/promises";
+import { tmpdir } from "node:os";
+import { dirname, join } from "node:path";
+import { fileURLToPath } from "node:url";
+import { putSchema } from "@ocas/core";
+import { openStore } from "@ocas/fs";
+import type {
+  CasRef,
+  StepNodePayload,
+  ThreadId,
+  ThreadIndexEntry,
+} from "@united-workforce/protocol";
+import { afterEach, beforeEach, describe, expect, test } from "vitest";
+import { registerUwfSchemas } from "../schemas.js";
+import { seedThreads } from "./thread-test-helpers.js";
+const OUTPUT_SCHEMA = {
+  type: "object" as const,
+  properties: {
+    $status: { type: "string" as const },
+    note: { type: "string" as const },
+  },
+  required: ["$status"],
+  additionalProperties: false,
+};
+const THREAD_ID = "01POKESTEPTEST00000000" as ThreadId;
+let tmpDir: string;
+beforeEach(async () => {
+  tmpDir = await mkdtemp(join(tmpdir(), "cli-uwf-poke-test-"));
+});
+afterEach(async () => {
+  await rm(tmpDir, { recursive: true, force: true });
+});
+type SetupResult = {
+  casDir: string;
+  oldStepHash: CasRef;
+  oldStepPrev: CasRef | null;
+  oldStepCompletedAtMs: number;
+  startHash: CasRef;
+  workflowHash: CasRef;
+  mockAgentPath: string;
+  failingAgentPath: string;
+  promptCapturePath: string;
+  envCapturePath: string;
+};
+type SetupOpts = {
+  threadStatus: ThreadIndexEntry["status"];
+  multipleSteps: boolean;
+  newCompletedAtMs: number;
+  newStatus: string;
+  // The agent name to record in the head StepNode.agent field. Defaults to mockAgentPath.
+  stepAgentNameOverride: string | null;
+  // Whether to seed an actual head StepNode (false → only StartNode is the head).
+  withHeadStep: boolean;
+};
+async function setupThread(opts: Partial<SetupOpts> = {}): Promise<SetupResult> {
+  const cfg: SetupOpts = {
+    threadStatus: opts.threadStatus ?? "idle",
+    multipleSteps: opts.multipleSteps ?? false,
+    newCompletedAtMs: opts.newCompletedAtMs ?? 1716600005000,
+    newStatus: opts.newStatus ?? "ok",
+    stepAgentNameOverride: opts.stepAgentNameOverride ?? null,
+    withHeadStep: opts.withHeadStep ?? true,
+  };
+  const casDir = join(tmpDir, "cas");
+  await mkdir(casDir, { recursive: true });
+  const store = await openStore(casDir);
+  const schemas = await registerUwfSchemas(store);
+  const outputSchemaHash = await putSchema(store, OUTPUT_SCHEMA);
+  const workflowHash = await store.cas.put(schemas.workflow, {
+    name: "test-poke",
+    description: "poke command integration test",
+    roles: {
+      worker: {
+        description: "Worker role",
+        goal: "Work",
+        capabilities: [],
+        procedure: "work",
+        output: "result",
+        frontmatter: outputSchemaHash,
+      },
+      reviewer: {
+        description: "Reviewer role",
+        goal: "Review",
+        capabilities: [],
+        procedure: "review",
+        output: "result",
+        frontmatter: outputSchemaHash,
+      },
+    },
+    graph: {
+      $START: {
+        new: { role: "worker", prompt: "Start work", location: null },
+        resume: { role: "worker", prompt: "Resume the work", location: null },
+      },
+      worker: {
+        ok: { role: "reviewer", prompt: "Review the work", location: null },
+      },
+      reviewer: { done: { role: "$END", prompt: "Done", location: null } },
+    },
+  });
+  const startHash = await store.cas.put(schemas.startNode, {
+    workflow: workflowHash,
+    prompt: "Test poke task",
+    cwd: tmpDir,
+  });
+  process.env.OCAS_HOME = casDir;
+  // Paths for mock agent and capture files (set early so we can use mockAgentPath as the recorded agent name)
+  const promptCapturePath = join(tmpDir, "captured-prompt.txt");
+  const envCapturePath = join(tmpDir, "captured-env.txt");
+  const mockAgentPath = join(tmpDir, "mock-agent.sh");
+  const failingAgentPath = join(tmpDir, "failing-agent.sh");
+  // Build head StepNode chain
+  let oldStepPrev: CasRef | null = null;
+  if (cfg.multipleSteps) {
+    // First step: prev=null
+    const firstOutputHash = await store.cas.put(outputSchemaHash, { $status: "ok" });
+    const firstDetailHash = await store.cas.put(schemas.text, "first detail");
+    const firstStepHash = await store.cas.put(schemas.stepNode, {
+      start: startHash,
+      prev: null,
+      role: "worker",
+      output: firstOutputHash,
+      detail: firstDetailHash,
+      agent: cfg.stepAgentNameOverride ?? mockAgentPath,
+      edgePrompt: "Start work",
+      startedAtMs: 1716600000000,
+      completedAtMs: 1716600001000,
+      cwd: tmpDir,
+      assembledPrompt: null,
+      usage: null,
+    });
+    oldStepPrev = firstStepHash;
+  }
+  let oldStepHash: CasRef = startHash;
+  const oldStepCompletedAtMs = 1716600002000;
+  if (cfg.withHeadStep) {
+    const outputHash = await store.cas.put(outputSchemaHash, { $status: "ok" });
+    const detailHash = await store.cas.put(schemas.text, "head step detail");
+    oldStepHash = await store.cas.put(schemas.stepNode, {
+      start: startHash,
+      prev: oldStepPrev,
+      role: "worker",
+      output: outputHash,
+      detail: detailHash,
+      agent: cfg.stepAgentNameOverride ?? mockAgentPath,
+      edgePrompt: "Start work",
+      startedAtMs: 1716600001500,
+      completedAtMs: oldStepCompletedAtMs,
+      cwd: tmpDir,
+      assembledPrompt: null,
+      usage: null,
+    });
+  }
+  // Seed thread index entry. For "running" we let the test create the marker separately.
+  await seedThreads(tmpDir, {
+    [THREAD_ID]: {
+      head: oldStepHash,
+      status: cfg.threadStatus,
+      suspendedRole: cfg.threadStatus === "suspended" ? "worker" : null,
+      suspendMessage: cfg.threadStatus === "suspended" ? "Please clarify" : null,
+      completedAt:
+        cfg.threadStatus === "end" || cfg.threadStatus === "cancelled"
+          ? oldStepCompletedAtMs
+          : null,
+    },
+  });
+  // Mock agent always emits a stepNode keyed off the current thread head (which we
+  // observe through OCAS_HOME). The script writes prompt/env captures and then prints
+  // an adapter JSON that references a pre-built stepHash.
+  // We pre-build the agent's stepHash with prev=oldStepHash (normal append behaviour).
+  const newOutputHash = await store.cas.put(outputSchemaHash, {
+    $status: cfg.newStatus,
+    note: "poked output",
+  });
+  const newDetailHash = await store.cas.put(schemas.text, "poked detail");
+  const agentStepHash = await store.cas.put(schemas.stepNode, {
+    start: startHash,
+    prev: cfg.withHeadStep ? oldStepHash : null,
+    role: "worker",
+    output: newOutputHash,
+    detail: newDetailHash,
+    agent: "mock-agent-output",
+    edgePrompt: "poke prompt placeholder",
+    startedAtMs: cfg.newCompletedAtMs - 100,
+    completedAtMs: cfg.newCompletedAtMs,
+    cwd: tmpDir,
+    assembledPrompt: null,
+    usage: null,
+  });
+  const adapterJson = JSON.stringify({
+    stepHash: agentStepHash,
+    detailHash: newDetailHash,
+    role: "worker",
+    frontmatter: { $status: cfg.newStatus, note: "poked output" },
+    body: "",
+    startedAtMs: cfg.newCompletedAtMs - 100,
+    completedAtMs: cfg.newCompletedAtMs,
+    usage: null,
+  });
+  await writeFile(
+    mockAgentPath,
+    `#!/bin/sh
+prompt=""
+while [ $# -gt 0 ]; do
+  if [ "$1" = "--prompt" ]; then
+    prompt="$2"
+    shift 2
+  else
+    shift
+  fi
+done
+printf '%s' "$prompt" > '${promptCapturePath}'
+printf 'OCAS_HOME=%s\\n' "$OCAS_HOME" > '${envCapturePath}'
+echo '${adapterJson}'
+`,
+    { mode: 0o755 },
+  );
+  await writeFile(
+    failingAgentPath,
+    `#!/bin/sh
+echo "boom" >&2
+exit 7
+`,
+    { mode: 0o755 },
+  );
+  const configPath = join(tmpDir, "config.yaml");
+  await writeFile(
+    configPath,
+    `defaultAgent: uwf-hermes\nagentOverrides: null\nagents:\n  uwf-hermes:\n    command: uwf-hermes\n`,
+  );
+  return {
+    casDir,
+    oldStepHash,
+    oldStepPrev,
+    oldStepCompletedAtMs,
+    startHash,
+    workflowHash,
+    mockAgentPath,
+    failingAgentPath,
+    promptCapturePath,
+    envCapturePath,
+  };
+}
+function runUwf(
+  args: string[],
+  casDir: string,
+): { stdout: string; stderr: string; status: number } {
+  const cliPath = join(dirname(fileURLToPath(import.meta.url)), "..", "..", "dist", "cli.js");
+  try {
+    const stdout = execFileSync(process.execPath, [cliPath, ...args], {
+      encoding: "utf8",
+      stdio: ["ignore", "pipe", "pipe"],
+      env: {
+        ...process.env,
+        UWF_HOME: tmpDir,
+        OCAS_HOME: casDir,
+      },
+      cwd: tmpDir,
+      timeout: 30000,
+    });
+    return { stdout, stderr: "", status: 0 };
+  } catch (error) {
+    const err = error as NodeJS.ErrnoException & {
+      stdout?: string | Buffer;
+      stderr?: string | Buffer;
+      status?: number;
+    };
+    return {
+      stdout: typeof err.stdout === "string" ? err.stdout : (err.stdout?.toString("utf8") ?? ""),
+      stderr: typeof err.stderr === "string" ? err.stderr : (err.stderr?.toString("utf8") ?? ""),
+      status: err.status ?? 1,
+    };
+  }
+}
+// ── Group 1: CLI argument validation ───────────────────────────────────────
+describe("uwf thread poke - CLI argument validation", () => {
+  test("1.1 missing -p flag exits non-zero", async () => {
+    const { casDir } = await setupThread();
+    const result = runUwf(["thread", "poke", THREAD_ID], casDir);
+    expect(result.status).not.toBe(0);
+    expect(result.stderr.toLowerCase()).toMatch(/required|missing|prompt/);
+  });
+  test("1.2 -p without --agent succeeds", async () => {
+    const { casDir } = await setupThread();
+    const result = runUwf(["thread", "poke", THREAD_ID, "-p", "do it again"], casDir);
+    expect(result.status).toBe(0);
+  });
+  test("1.3 -p with --agent succeeds", async () => {
+    const { casDir, mockAgentPath } = await setupThread();
+    const result = runUwf(
+      ["thread", "poke", THREAD_ID, "-p", "do it again", "--agent", mockAgentPath],
+      casDir,
+    );
+    expect(result.status).toBe(0);
+  });
+});
+// ── Group 2: Guard errors ──────────────────────────────────────────────────
+describe("uwf thread poke - guard errors", () => {
+  test("2.1 thread not found", async () => {
+    const { casDir } = await setupThread();
+    const result = runUwf(["thread", "poke", "01NOSUCHTHREAD0000000A", "-p", "prompt"], casDir);
+    expect(result.status).not.toBe(0);
+    expect(result.stderr.toLowerCase()).toMatch(/not found|not active/);
+  });
+  test("2.2 thread running rejects poke", async () => {
+    const { casDir, workflowHash } = await setupThread();
+    // Create background marker to simulate running
+    const { createMarker, getProcessStartTime } = await import("../background/index.js");
+    await createMarker(tmpDir, {
+      thread: THREAD_ID,
+      workflow: workflowHash,
+      pid: process.pid,
+      startedAt: Date.now(),
+      processStartTime: getProcessStartTime(process.pid),
+    });
+    const result = runUwf(["thread", "poke", THREAD_ID, "-p", "prompt"], casDir);
+    expect(result.status).not.toBe(0);
+    expect(result.stderr.toLowerCase()).toContain("already executing");
+  });
+  test("2.3 completed thread rejects poke", async () => {
+    const { casDir } = await setupThread({ threadStatus: "end" });
+    const result = runUwf(["thread", "poke", THREAD_ID, "-p", "prompt"], casDir);
+    expect(result.status).not.toBe(0);
+    expect(result.stderr.toLowerCase()).toMatch(/cannot be poked|end/);
+  });
+  test("2.4 cancelled thread rejects poke", async () => {
+    const { casDir } = await setupThread({ threadStatus: "cancelled" });
+    const result = runUwf(["thread", "poke", THREAD_ID, "-p", "prompt"], casDir);
+    expect(result.status).not.toBe(0);
+    expect(result.stderr.toLowerCase()).toMatch(/cannot be poked|cancelled/);
+  });
+  test("2.5 thread head is StartNode (no StepNode) rejects poke", async () => {
+    const { casDir } = await setupThread({ withHeadStep: false });
+    const result = runUwf(["thread", "poke", THREAD_ID, "-p", "prompt"], casDir);
+    expect(result.status).not.toBe(0);
+    expect(result.stderr.toLowerCase()).toMatch(/no step|cannot be poked/);
+  });
+});
+// ── Group 3: Success happy path ────────────────────────────────────────────
+describe("uwf thread poke - success", () => {
+  test("3.1, 3.4 idle thread → new head differs from old, thread index updated", async () => {
+    const { casDir, oldStepHash, mockAgentPath } = await setupThread();
+    const result = runUwf(
+      ["thread", "poke", THREAD_ID, "-p", "redo", "--agent", mockAgentPath],
+      casDir,
+    );
+    expect(result.status).toBe(0);
+    const cliOutput = JSON.parse(result.stdout.trim());
+    expect(cliOutput.head).not.toBe(oldStepHash);
+    const { createUwfStore, getThread } = await import("../store.js");
+    const uwf = await createUwfStore(tmpDir);
+    const entry = getThread(uwf.varStore, THREAD_ID);
+    expect(entry?.head).toBe(cliOutput.head);
+  });
+  test("3.2 new step's prev equals old head's prev (replace, not append)", async () => {
+    const { casDir, oldStepPrev, mockAgentPath } = await setupThread({ multipleSteps: true });
+    const result = runUwf(
+      ["thread", "poke", THREAD_ID, "-p", "redo", "--agent", mockAgentPath],
+      casDir,
+    );
+    expect(result.status).toBe(0);
+    const cliOutput = JSON.parse(result.stdout.trim());
+    const { createUwfStore } = await import("../store.js");
+    const uwf = await createUwfStore(tmpDir);
+    const node = uwf.store.cas.get(cliOutput.head as CasRef);
+    expect(node).not.toBeNull();
+    expect(node?.type).toBe(uwf.schemas.stepNode);
+    const payload = node?.payload as StepNodePayload;
+    expect(payload.prev).toBe(oldStepPrev);
+  });
+  test("3.2b new step's prev is null when old head was the first step", async () => {
+    // multipleSteps:false means oldHead.prev = null
+    const { casDir, mockAgentPath } = await setupThread({ multipleSteps: false });
+    const result = runUwf(
+      ["thread", "poke", THREAD_ID, "-p", "redo", "--agent", mockAgentPath],
+      casDir,
+    );
+    expect(result.status).toBe(0);
+    const cliOutput = JSON.parse(result.stdout.trim());
+    const { createUwfStore } = await import("../store.js");
+    const uwf = await createUwfStore(tmpDir);
+    const node = uwf.store.cas.get(cliOutput.head as CasRef);
+    const payload = node?.payload as StepNodePayload;
+    expect(payload.prev).toBeNull();
+  });
+  test("3.3 new step's completedAtMs is later than old", async () => {
+    const { casDir, oldStepCompletedAtMs, mockAgentPath } = await setupThread();
+    const result = runUwf(
+      ["thread", "poke", THREAD_ID, "-p", "redo", "--agent", mockAgentPath],
+      casDir,
+    );
+    expect(result.status).toBe(0);
+    const cliOutput = JSON.parse(result.stdout.trim());
+    const { createUwfStore } = await import("../store.js");
+    const uwf = await createUwfStore(tmpDir);
+    const node = uwf.store.cas.get(cliOutput.head as CasRef);
+    const payload = node?.payload as StepNodePayload;
+    expect(payload.completedAtMs).toBeGreaterThan(oldStepCompletedAtMs);
+  });
+  test("3.5 status remains idle after poke (no completion/suspend)", async () => {
+    const { casDir, mockAgentPath } = await setupThread();
+    const result = runUwf(
+      ["thread", "poke", THREAD_ID, "-p", "redo", "--agent", mockAgentPath],
+      casDir,
+    );
+    expect(result.status).toBe(0);
+    const cliOutput = JSON.parse(result.stdout.trim());
+    expect(cliOutput.status).toBe("idle");
+    expect(cliOutput.done).toBe(false);
+    expect(cliOutput.suspendedRole).toBeNull();
+    expect(cliOutput.suspendMessage).toBeNull();
+  });
+  test("3.6 currentRole unchanged after poke (no moderator re-route)", async () => {
+    // Before poke: idle thread with worker step having $status=ok → moderator would route to reviewer.
+    // After poke (mock returns same $status=ok), moderator routing remains the same.
+    const { casDir, mockAgentPath } = await setupThread();
+    const result = runUwf(
+      ["thread", "poke", THREAD_ID, "-p", "redo", "--agent", mockAgentPath],
+      casDir,
+    );
+    expect(result.status).toBe(0);
+    const cliOutput = JSON.parse(result.stdout.trim());
+    expect(cliOutput.currentRole).toBe("reviewer");
+  });
+});
+// ── Group 4: Agent resolution ──────────────────────────────────────────────
+describe("uwf thread poke - agent resolution", () => {
+  test("4.1 without --agent, agent command read from head step's agent field", async () => {
+    // Head step's agent field points at mockAgentPath (default in setupThread)
+    const { casDir, promptCapturePath } = await setupThread();
+    const result = runUwf(["thread", "poke", THREAD_ID, "-p", "redo"], casDir);
+    expect(result.status).toBe(0);
+    const captured = await readFile(promptCapturePath, "utf8");
+    expect(captured).toBe("redo");
+  });
+  test("4.2 with --agent, explicit override is used", async () => {
+    // Head step records "uwf-mock" (which is not a real binary). Override with mockAgentPath.
+    const { casDir, mockAgentPath } = await setupThread({ stepAgentNameOverride: "uwf-mock" });
+    const result = runUwf(
+      ["thread", "poke", THREAD_ID, "-p", "redo", "--agent", mockAgentPath],
+      casDir,
+    );
+    expect(result.status).toBe(0);
+  });
+});
+// ── Group 5: Prompt passthrough ────────────────────────────────────────────
+describe("uwf thread poke - prompt passthrough", () => {
+  test("5.1 -p value is passed to agent as --prompt", async () => {
+    const { casDir, mockAgentPath, promptCapturePath } = await setupThread();
+    const supplement = "Use the REST API instead.";
+    const result = runUwf(
+      ["thread", "poke", THREAD_ID, "-p", supplement, "--agent", mockAgentPath],
+      casDir,
+    );
+    expect(result.status).toBe(0);
+    const captured = await readFile(promptCapturePath, "utf8");
+    expect(captured).toBe(supplement);
+  });
+});
+// ── Group 6: Edge cases ────────────────────────────────────────────────────
+describe("uwf thread poke - edge cases", () => {
+  test("6.1 poke succeeds on suspended thread", async () => {
+    const { casDir, oldStepHash, mockAgentPath } = await setupThread({
+      threadStatus: "suspended",
+    });
+    const result = runUwf(
+      ["thread", "poke", THREAD_ID, "-p", "redo", "--agent", mockAgentPath],
+      casDir,
+    );
+    expect(result.status).toBe(0);
+    const cliOutput = JSON.parse(result.stdout.trim());
+    expect(cliOutput.head).not.toBe(oldStepHash);
+    expect(cliOutput.status).toBe("idle");
+    expect(cliOutput.suspendedRole).toBeNull();
+    expect(cliOutput.suspendMessage).toBeNull();
+  });
+  test("6.2 agent failure leaves thread head unchanged", async () => {
+    const { casDir, oldStepHash, failingAgentPath } = await setupThread();
+    const result = runUwf(
+      ["thread", "poke", THREAD_ID, "-p", "redo", "--agent", failingAgentPath],
+      casDir,
+    );
+    expect(result.status).not.toBe(0);
+    const { createUwfStore, getThread } = await import("../store.js");
+    const uwf = await createUwfStore(tmpDir);
+    const entry = getThread(uwf.varStore, THREAD_ID);
+    expect(entry?.head).toBe(oldStepHash);
+  });
+});

package/src/__tests__/thread-resume.test.ts CHANGED Viewed

@@ -75,11 +75,6 @@ async function setupSuspendedThread(mode: MockAgentMode): Promise<{
         resume: { role: "worker", prompt: "Resume the work", location: null },
       },
       worker: {
-        needs_input: {
-          role: "$SUSPEND",
-          prompt: "Please clarify: {{{question}}}",
-          location: null,
-        },
         ok: { role: "reviewer", prompt: "Review the work", location: null },
       },
       reviewer: { done: { role: "$END", prompt: "Done", location: null } },
@@ -95,9 +90,9 @@ async function setupSuspendedThread(mode: MockAgentMode): Promise<{
   process.env.OCAS_HOME = casDir;
   await seedThreads(tmpDir, { [THREAD_ID]: startHash });
-  const outputHash = await store.cas.put(outputSchemaHash, {
-    $status: "needs_input",
-    question: "Which API?",
+  const outputHash = await store.cas.put(schemas.suspendOutput, {
+    $status: "$SUSPEND",
+    reason: SUSPEND_MESSAGE,
   });
   const detailHash = await store.cas.put(schemas.text, "mock detail");
@@ -132,14 +127,15 @@ async function setupSuspendedThread(mode: MockAgentMode): Promise<{
   const mockAgentPath = join(tmpDir, "mock-agent.sh");
   const frontmatter =
-    mode === "suspend" ? { $status: "needs_input", question: "Which API?" } : { $status: "ok" };
+    mode === "suspend" ? { $status: "$SUSPEND", reason: SUSPEND_MESSAGE } : { $status: "ok" };
+  const frontmatterSchema = mode === "suspend" ? schemas.suspendOutput : outputSchemaHash;
   const adapterJson = JSON.stringify({
     stepHash: await store.cas.put(schemas.stepNode, {
       start: startHash,
       prev: stepHash,
       role: "worker",
-      output: await store.cas.put(outputSchemaHash, frontmatter),
+      output: await store.cas.put(frontmatterSchema, frontmatter),
       detail: detailHash,
       agent: "uwf-mock",
       edgePrompt: "resume prompt placeholder",
@@ -177,7 +173,7 @@ echo '${adapterJson}'
   const configPath = join(tmpDir, "config.yaml");
   await writeFile(
     configPath,
-    `defaultAgent: uwf-hermes\ndefaultModel: test-model\nagentOverrides: null\nagents: {}\nproviders: {}\nmodels: {}\n`,
+    `defaultAgent: uwf-hermes\nagentOverrides: null\nagents:\n  uwf-hermes:\n    command: uwf-hermes\n`,
   );
   return { casDir, mockAgentPath, promptCapturePath };
@@ -338,7 +334,7 @@ describe("uwf thread resume", () => {
     }
   });
-  test("multiple suspend/resume cycles", async () => {
+  test("multiple suspend/resume cycles", { timeout: 15_000 }, async () => {
     const originalCasDir = process.env.OCAS_HOME;
     const { casDir, mockAgentPath, promptCapturePath } = await setupSuspendedThread("suspend");
     process.env.OCAS_HOME = casDir;
@@ -537,7 +533,7 @@ describe("uwf thread resume - completed threads", () => {
     await seedThreads(tmpDir, {
       [THREAD_ID]: {
         head: reviewerStepHash,
-        status: "completed",
+        status: "end",
         suspendedRole: null,
         suspendMessage: null,
         completedAt: 1716600002000,
@@ -599,7 +595,7 @@ echo '${adapterJson}'
     const configPath = join(tmpDir, "config.yaml");
     await writeFile(
       configPath,
-      `defaultAgent: uwf-hermes\ndefaultModel: test-model\nagentOverrides: null\nagents: {}\nproviders: {}\nmodels: {}\n`,
+      `defaultAgent: uwf-hermes\nagentOverrides: null\nagents:\n  uwf-hermes:\n    command: uwf-hermes\n`,
     );
     const result = runUwf(