npm - @desplega.ai/agent-swarm - Versions diffs - 1.75.0 → 1.76.0 - Mend

@desplega.ai/agent-swarm 1.75.0 → 1.76.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (48) hide show

package/README.md +1 -1
package/openapi.json +973 -36
package/package.json +2 -2
package/src/be/db.ts +527 -9
package/src/be/memory/raters/llm-summarizer.ts +218 -0
package/src/be/memory/raters/llm.ts +56 -75
package/src/be/memory/retrieval-store.ts +21 -0
package/src/be/migrations/054_agent_harness_provider.sql +21 -0
package/src/be/migrations/055_agent_cred_status.sql +15 -0
package/src/be/migrations/056_drop_agent_tasks_source_check.sql +139 -0
package/src/be/migrations/057_inbox_item_state.sql +27 -0
package/src/be/migrations/058_task_templates.sql +31 -0
package/src/be/swarm-config-guard.ts +24 -0
package/src/commands/credential-wait.ts +1 -1
package/src/commands/provider-credentials.ts +434 -0
package/src/commands/runner.ts +229 -42
package/src/hooks/hook.ts +115 -95
package/src/http/agents.ts +82 -2
package/src/http/config.ts +11 -1
package/src/http/inbox-state.ts +89 -0
package/src/http/index.ts +10 -0
package/src/http/sessions.ts +86 -0
package/src/http/status.ts +665 -0
package/src/http/task-templates.ts +51 -0
package/src/http/tasks.ts +85 -5
package/src/http/users.ts +134 -0
package/src/providers/claude-adapter.ts +5 -0
package/src/providers/codex-adapter.ts +1 -1
package/src/providers/index.ts +1 -1
package/src/slack/handlers.ts +0 -1
package/src/tests/agents-harness-provider.test.ts +333 -0
package/src/tests/credential-check.test.ts +32 -1
package/src/tests/credential-status-api.test.ts +42 -0
package/src/tests/harness-provider-resolution.test.ts +242 -0
package/src/tests/jira-sync.test.ts +1 -1
package/src/tests/memory-rater-llm-summarizer.test.ts +317 -0
package/src/tests/memory-rater-llm.test.ts +265 -107
package/src/tests/migration-runner-regressions.test.ts +17 -2
package/src/tests/sessions.test.ts +141 -0
package/src/tests/status.test.ts +843 -0
package/src/tests/stop-hook-task-resolution.test.ts +98 -0
package/src/tests/template-recommendations.test.ts +148 -0
package/src/tests/use-dismissible-card.test.ts +140 -0
package/src/tools/swarm-config/set-config.ts +17 -1
package/src/types.ts +117 -0
package/src/utils/harness-provider.ts +32 -0
package/tsconfig.json +0 -2
package/src/providers/credentials.ts +0 -74

package/src/commands/runner.ts CHANGED Viewed

@@ -25,11 +25,17 @@ import { computeBudgetBackoffMs } from "../utils/budget-backoff.ts";
 import { getContextWindowSize } from "../utils/context-window.ts";
 import { type CredentialSelection, resolveCredentialPools } from "../utils/credentials.ts";
 import { parseRateLimitResetTime } from "../utils/error-tracker.ts";
+import { resolveHarnessProvider } from "../utils/harness-provider.ts";
 import { prettyPrintLine, prettyPrintStderr } from "../utils/pretty-print.ts";
 import { scrubSecrets } from "../utils/secret-scrubber.ts";
 import { detectVcsProvider } from "../vcs/index.ts";
 import { interpolate } from "../workflows/template.ts";
 import { awaitCredentials, BootMaxWaitExceededError, EX_CONFIG } from "./credential-wait.ts";
+import {
+  buildCredStatusReport,
+  isCredCheckDisabled,
+  reportCredStatus,
+} from "./provider-credentials.ts";
 // Side-effect import: registers runner trigger/resumption templates
 import "./templates.ts";
@@ -204,6 +210,13 @@ async function closeAgent(config: ApiConfig, role: string): Promise<void> {
 interface ResolvedEnvResult {
   env: Record<string, string | undefined>;
   credentialSelections: CredentialSelection[];
+  /**
+   * Effective `HARNESS_PROVIDER` after layering swarm_config over the base
+   * env. Callers should prefer this over `process.env.HARNESS_PROVIDER` so
+   * that an operator's swarm_config row (repo > agent > global) actually
+   * takes effect on the worker.
+   */
+  resolvedProvider: ProviderName;
 }
 async function fetchResolvedEnv(
@@ -241,6 +254,8 @@ async function fetchResolvedEnv(
     }
   }
+  const resolvedProvider = resolveHarnessProvider(env, baseEnv);
   const credentialSelections = await resolveCredentialPools(env, {
     apiUrl,
     apiKey,
@@ -248,10 +263,13 @@ async function fetchResolvedEnv(
     // CLAUDE_CODE_OAUTH_TOKEN stamped on their task record (and vice
     // versa) just because both env vars happen to be set in the worker
     // container. See `PROVIDER_CREDENTIAL_VARS` in src/utils/credentials.ts.
-    provider: process.env.HARNESS_PROVIDER,
+    //
+    // Use the resolved provider (swarm_config > env) so an operator can flip
+    // the worker's harness from the dashboard without restarting the container.
+    provider: resolvedProvider,
   });
-  return { env, credentialSelections };
+  return { env, credentialSelections, resolvedProvider };
 }
 /** Tools that produce noise — skip auto-progress for these */
@@ -535,6 +553,12 @@ export async function ensureTaskFinished(
   exitCode: number,
   failureReason?: string,
   providerOutput?: string,
+  /**
+   * Active provider for this task. When provided, gates the structured-output
+   * fallback path correctly even if `process.env.HARNESS_PROVIDER` differs
+   * from the resolved swarm_config value. Falls back to env when omitted.
+   */
+  provider?: ProviderName,
 ): Promise<void> {
   const headers: Record<string, string> = {
     "X-Agent-ID": config.agentId,
@@ -560,7 +584,7 @@ export async function ensureTaskFinished(
     body.output = providerOutput;
   } else {
     // Try structured output fallback if the task has an outputSchema
-    const adapterType = process.env.HARNESS_PROVIDER || "claude";
+    const adapterType = provider ?? process.env.HARNESS_PROVIDER ?? "claude";
     const fallback = await handleStructuredOutputFallback(config, taskId, adapterType);
     console.log(`[${role}] Task ${taskId.slice(0, 8)} fallback result: ${fallback.kind}`);
@@ -892,7 +916,15 @@ function setupShutdownHandlers(
               console.warn(
                 `[${role}] Failed to pause task ${taskId.slice(0, 8)}, marking as failed instead`,
               );
-              await ensureTaskFinished(apiConfig, role, taskId, 1);
+              await ensureTaskFinished(
+                apiConfig,
+                role,
+                taskId,
+                1,
+                undefined,
+                undefined,
+                state.harnessProvider,
+              );
             }
           }
         }
@@ -960,6 +992,14 @@ interface RunningTask {
 interface RunnerState {
   activeTasks: Map<string, RunningTask>;
   maxConcurrent: number;
+  /**
+   * Effective harness provider for this worker boot session — resolved
+   * from `swarm_config` (overlay) > `process.env.HARNESS_PROVIDER` > "claude".
+   * Used by error / cleanup paths so the structured-output fallback runs the
+   * right adapter even when env disagrees with swarm_config. Section 4
+   * (per-task live re-resolution) will mutate this between tasks.
+   */
+  harnessProvider: ProviderName;
 }
 /** Buffer for session logs */
@@ -1337,6 +1377,13 @@ async function registerAgent(opts: {
   role?: string;
   capabilities?: string[];
   maxTasks?: number;
+  /**
+   * Resolved harness provider (swarm_config > env > "claude"). Sent as both
+   * the legacy `provider` field and the canonical `harness_provider` column.
+   * Defaults to `process.env.HARNESS_PROVIDER || "claude"` for callers that
+   * haven't migrated to passing it explicitly.
+   */
+  harnessProvider?: ProviderName;
 }): Promise<void> {
   const headers: Record<string, string> = {
     "Content-Type": "application/json",
@@ -1346,7 +1393,16 @@ async function registerAgent(opts: {
     headers.Authorization = `Bearer ${opts.apiKey}`;
   }
-  const provider = (process.env.HARNESS_PROVIDER || "claude") as ProviderName;
+  const provider: ProviderName =
+    opts.harnessProvider ?? ((process.env.HARNESS_PROVIDER || "claude") as ProviderName);
+  // Phase 1.5 (cloud-personalization): also push the canonical
+  // `harness_provider` field so the API can persist it in its own column
+  // (`agents.harness_provider`). Always send the resolved provider value
+  // (defaulting to "claude" when HARNESS_PROVIDER is unset) so agents that
+  // don't explicitly set the env var still self-report instead of leaving
+  // the column NULL — matches how `provider` already defaults above.
+  const harnessProvider: ProviderName = provider;
   const response = await fetch(`${opts.apiUrl}/api/agents`, {
     method: "POST",
@@ -1358,6 +1414,7 @@ async function registerAgent(opts: {
       capabilities: opts.capabilities,
       maxTasks: opts.maxTasks,
       provider,
+      harness_provider: harnessProvider,
     }),
   });
@@ -2186,6 +2243,7 @@ async function checkCompletedProcesses(
         result.exitCode,
         failureReason,
         result.output,
+        state.harnessProvider,
       );
       ensure({
@@ -2296,9 +2354,6 @@ export async function runAgent(config: RunnerConfig, opts: RunnerOptions) {
   // Initialize Business-Use SDK for worker-side instrumentation
   initialize();
-  // Create provider adapter based on HARNESS_PROVIDER env var (default: claude)
-  const adapter = createProviderAdapter(process.env.HARNESS_PROVIDER || "claude");
   const sessionId = process.env.SESSION_ID || crypto.randomUUID().slice(0, 8);
   const baseLogDir = opts.logsDir || process.env.LOG_DIR || "/logs";
   const logDir = `${baseLogDir}/${sessionId}`;
@@ -2313,6 +2368,30 @@ export async function runAgent(config: RunnerConfig, opts: RunnerOptions) {
   const apiUrl = process.env.MCP_BASE_URL || `http://localhost:${process.env.PORT || "3013"}`;
   const swarmUrl = process.env.SWARM_URL || "localhost";
+  const apiKey = process.env.API_KEY || "";
+  // Resolve the boot harness provider from swarm_config (repo > agent > global,
+  // overlaid on top of `process.env`). This is what selects the adapter for
+  // this worker's lifetime. On a fresh worker (agentId="unknown") only global
+  // swarm_config applies; once registered, an operator writing an agent-scoped
+  // HARNESS_PROVIDER row takes effect on the next reconciliation cycle (Section 4)
+  // or worker restart.
+  //
+  // Failures (network, API down, malformed value) fall back to env then "claude"
+  // so a swarm_config outage cannot wedge boot.
+  let bootProvider: ProviderName;
+  try {
+    bootProvider = (await fetchResolvedEnv(apiUrl, apiKey, agentId)).resolvedProvider;
+  } catch (err) {
+    console.warn(`[runner] fetchResolvedEnv failed at boot, falling back to env: ${err}`);
+    bootProvider = resolveHarnessProvider({}, process.env);
+  }
+  console.log(`[runner] Resolved HARNESS_PROVIDER: ${bootProvider}`);
+  // Create provider adapter using the resolved value. `let` so the poll-loop
+  // reconciliation block (Section 4) can swap it live when an operator changes
+  // HARNESS_PROVIDER in swarm_config — call sites read the current binding.
+  let adapter = createProviderAdapter(bootProvider);
   // Configure HTTP-based template resolution (workers resolve via API, not local DB)
   if (process.env.API_KEY) {
@@ -2383,9 +2462,11 @@ export async function runAgent(config: RunnerConfig, opts: RunnerOptions) {
   // Slack context for current task (gates Slack instructions in prompt)
   let currentTaskSlackContext: BasePromptArgs["slackContext"] | undefined;
-  // Generate base prompt (identity fields injected after profile fetch below)
-  const { traits } = adapter;
+  // Generate base prompt (identity fields injected after profile fetch below).
+  // Traits are read fresh on each call so a live adapter swap (Section 4)
+  // produces a prompt matching the new provider's capabilities.
   const buildSystemPrompt = async () => {
+    const { traits } = adapter;
     return getBasePrompt({
       role,
       agentId,
@@ -2461,7 +2542,6 @@ export async function runAgent(config: RunnerConfig, opts: RunnerOptions) {
   console.log(`[${role}] Total system prompt length: ${resolvedSystemPrompt.length} chars`);
   const isAiLoop = opts.aiLoop || process.env.AI_LOOP === "true";
-  const apiKey = process.env.API_KEY || "";
   // Constants for polling
   const PollIntervalMs = 2000; // 2 seconds between polls
@@ -2509,11 +2589,27 @@ export async function runAgent(config: RunnerConfig, opts: RunnerOptions) {
     const state: RunnerState = {
       activeTasks: new Map(),
       maxConcurrent,
+      harnessProvider: bootProvider,
     };
     // Track tasks already signaled for cancellation to avoid repeated SIGTERM
     const cancelledSignaled = new Set<string>();
+    // Migration 055 — cache the harness_provider value used when we last
+    // built a `cred_status` snapshot. Re-runs the post-task check only when
+    // the resolved provider changes. Section 4 of the swarm_config-overrides-
+    // HARNESS_PROVIDER work makes this dynamic: state.harnessProvider is
+    // reconciled below from `swarm_config`, so an operator's change reaches
+    // here without a worker restart.
+    let cachedCredHarnessProvider: string | null = null;
+    // Throttle for live HARNESS_PROVIDER reconciliation. Each reconciliation
+    // calls `fetchResolvedEnv` which also re-resolves credential pools — we
+    // don't want that on every 2s poll. 10s gives operator changes a near-
+    // immediate effect from a UX perspective without hammering the API.
+    let lastHarnessReconcileAt = 0;
+    const HARNESS_RECONCILE_INTERVAL_MS = 10_000;
     // Create API config for ping/close
     const apiConfig: ApiConfig = { apiUrl, apiKey, agentId };
@@ -2535,6 +2631,7 @@ export async function runAgent(config: RunnerConfig, opts: RunnerOptions) {
         isLead,
         capabilities,
         maxTasks: maxConcurrent,
+        harnessProvider: bootProvider,
       });
       console.log(`[${role}] Registered as "${agentName}" (ID: ${agentId})`);
     } catch (error) {
@@ -2546,37 +2643,59 @@ export async function runAgent(config: RunnerConfig, opts: RunnerOptions) {
     // the old bash-level fail-fast in `docker-entrypoint.sh` — the worker is
     // already registered (visible to the dashboard) and self-heals once
     // creds appear in `swarm_config`. See plans/2026-05-06-worker-credential-safe-loop.md.
-    const harnessProvider = process.env.HARNESS_PROVIDER || "claude";
-    try {
-      await awaitCredentials({
-        provider: harnessProvider,
-        refreshEnv: async () => {
-          const { env } = await fetchResolvedEnv(apiUrl, apiKey, agentId);
-          return env;
-        },
-        onTick: (status) => {
-          // Best-effort status report — the dispatcher uses it to route
-          // around blocked agents. Failures are non-fatal (the wait loop
-          // already swallows onTick exceptions).
-          fetch(`${apiUrl}/api/agents/${encodeURIComponent(agentId)}/credential-status`, {
-            method: "PUT",
-            headers: {
-              Authorization: `Bearer ${apiKey}`,
-              "X-Agent-ID": agentId,
-              "Content-Type": "application/json",
-            },
-            body: JSON.stringify({ ready: status.ready, missing: status.missing }),
-          }).catch(() => {
-            // Swallowed — Phase 2 wait loop logs every tick anyway.
-          });
-        },
-      });
-    } catch (err) {
-      if (err instanceof BootMaxWaitExceededError) {
-        console.error(`[${role}] ${err.message}`);
-        process.exit(EX_CONFIG);
+    //
+    // CRED_CHECK_DISABLE=1 opts out entirely: the worker trusts the operator
+    // and starts polling immediately, with a NULL `cred_status` row that the
+    // dashboard surfaces as "unreported."
+    const harnessProvider = bootProvider;
+    cachedCredHarnessProvider = harnessProvider;
+    if (isCredCheckDisabled(process.env)) {
+      console.log(`[${role}] CRED_CHECK_DISABLE=1, skipping credential checks`);
+    } else {
+      try {
+        await awaitCredentials({
+          provider: harnessProvider,
+          refreshEnv: async () => {
+            const { env } = await fetchResolvedEnv(apiUrl, apiKey, agentId);
+            return env;
+          },
+          onTick: (status) => {
+            // Best-effort status report — the dispatcher uses it to route
+            // around blocked agents. Failures are non-fatal (the wait loop
+            // already swallows onTick exceptions). We do NOT include
+            // `cred_status` here — the live test runs once the worker is
+            // ready (below), and intermediate ticks are presence-only.
+            fetch(`${apiUrl}/api/agents/${encodeURIComponent(agentId)}/credential-status`, {
+              method: "PUT",
+              headers: {
+                Authorization: `Bearer ${apiKey}`,
+                "X-Agent-ID": agentId,
+                "Content-Type": "application/json",
+              },
+              body: JSON.stringify({ ready: status.ready, missing: status.missing }),
+            }).catch(() => {
+              // Swallowed — Phase 2 wait loop logs every tick anyway.
+            });
+          },
+        });
+      } catch (err) {
+        if (err instanceof BootMaxWaitExceededError) {
+          console.error(`[${role}] ${err.message}`);
+          process.exit(EX_CONFIG);
+        }
+        throw err;
+      }
+      // Migration 055: build the full snapshot (presence + live test) once
+      // creds are ready and POST it to the agent row. Status endpoint reads
+      // this instead of running predicates server-side.
+      try {
+        const snapshot = await buildCredStatusReport(harnessProvider, process.env, {}, "boot");
+        await reportCredStatus(apiUrl, apiKey, agentId, snapshot);
+      } catch (err) {
+        // Non-fatal — worker proceeds even if reporting fails.
+        console.warn(`[${role}] cred_status boot report failed (non-fatal): ${err}`);
       }
-      throw err;
     }
     // Clean up any stale active sessions from previous runs (crash recovery)
@@ -3009,7 +3128,15 @@ export async function runAgent(config: RunnerConfig, opts: RunnerOptions) {
             console.error(
               `[${role}] Failed to spawn process for resumed task ${task.id.slice(0, 8)}: ${errMsg}`,
             );
-            await ensureTaskFinished(apiConfig, role, task.id, 1, `Spawn failed: ${errMsg}`);
+            await ensureTaskFinished(
+              apiConfig,
+              role,
+              task.id,
+              1,
+              `Spawn failed: ${errMsg}`,
+              undefined,
+              state.harnessProvider,
+            );
             continue;
           }
@@ -3059,6 +3186,64 @@ export async function runAgent(config: RunnerConfig, opts: RunnerOptions) {
       // Check for completed processes first and ensure tasks are marked as finished
       await checkCompletedProcesses(state, role, apiConfig);
+      // Live HARNESS_PROVIDER reconciliation. Re-fetches `swarm_config` (overlaid
+      // on env) and swaps the adapter if the resolved provider changed —
+      // typically because an operator PATCH'd /api/agents/:id/harness-provider
+      // (which writes a swarm_config row) or upserted a config row directly.
+      //
+      // Safety: in-flight sessions hold their own `ProviderSession` references
+      // and continue on the old adapter unaffected. New spawns (below) read
+      // the current `adapter` binding and pick up the swap. `basePrompt` is
+      // rebuilt because traits (and therefore prompt content) may differ across
+      // providers.
+      if (Date.now() - lastHarnessReconcileAt > HARNESS_RECONCILE_INTERVAL_MS) {
+        lastHarnessReconcileAt = Date.now();
+        try {
+          const { resolvedProvider } = await fetchResolvedEnv(apiUrl, apiKey, agentId);
+          if (resolvedProvider !== state.harnessProvider) {
+            const previous = state.harnessProvider;
+            console.log(
+              `[${role}] [harness] Reconciling adapter: ${previous} → ${resolvedProvider}`,
+            );
+            try {
+              adapter = createProviderAdapter(resolvedProvider);
+              state.harnessProvider = resolvedProvider;
+              basePrompt = await buildSystemPrompt();
+              resolvedSystemPrompt = additionalSystemPrompt
+                ? `${basePrompt}\n\n${additionalSystemPrompt}`
+                : basePrompt;
+              // Force a fresh cred_status report below for the new provider.
+              cachedCredHarnessProvider = null;
+              console.log(
+                `[${role}] [harness] Swapped to ${resolvedProvider} (basePrompt rebuilt: ${basePrompt.length} chars)`,
+              );
+            } catch (err) {
+              console.warn(
+                `[${role}] [harness] Failed to swap to ${resolvedProvider} (staying on ${previous}): ${err}`,
+              );
+            }
+          }
+        } catch (err) {
+          console.warn(`[${role}] [harness] Reconcile fetch failed (non-fatal): ${err}`);
+        }
+      }
+      // Migration 055 — post-task credential refresh, cache-keyed on the
+      // *resolved* harness_provider. Re-runs the snapshot when the provider
+      // changes (boot, or after a live swap above) so the dashboard shows
+      // up-to-date credential status for the active adapter.
+      if (!isCredCheckDisabled(process.env)) {
+        const currentHarness = state.harnessProvider;
+        if (currentHarness !== cachedCredHarnessProvider) {
+          cachedCredHarnessProvider = currentHarness;
+          buildCredStatusReport(currentHarness, process.env, {}, "post_task")
+            .then((snap) => reportCredStatus(apiUrl, apiKey, agentId, snap))
+            .catch((err) =>
+              console.warn(`[${role}] cred_status post_task report failed (non-fatal): ${err}`),
+            );
+        }
+      }
       // Periodic VCS detection for running tasks (fire-and-forget, throttled per task)
       const now = Date.now();
       for (const [taskId, task] of state.activeTasks) {
@@ -3365,6 +3550,8 @@ export async function runAgent(config: RunnerConfig, opts: RunnerOptions) {
                 trigger.taskId,
                 1,
                 `Spawn failed: ${errMsg}`,
+                undefined,
+                state.harnessProvider,
               );
             }
             continue;