npm - @agent-native/core - Versions diffs - 0.52.0 → 0.54.0 - Mend

@agent-native/core 0.52.0 → 0.54.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (267) hide show

package/README.md +41 -95
package/blueprints/action/crud.md +98 -0
package/blueprints/channel/discord.md +74 -0
package/blueprints/provider/stripe.md +87 -0
package/blueprints/sandbox/docker.md +78 -0
package/dist/action.d.ts +64 -1
package/dist/action.d.ts.map +1 -1
package/dist/action.js +73 -2
package/dist/action.js.map +1 -1
package/dist/agent/index.d.ts +1 -0
package/dist/agent/index.d.ts.map +1 -1
package/dist/agent/index.js +1 -0
package/dist/agent/index.js.map +1 -1
package/dist/agent/observational-memory/compactor.d.ts +43 -0
package/dist/agent/observational-memory/compactor.d.ts.map +1 -0
package/dist/agent/observational-memory/compactor.js +50 -0
package/dist/agent/observational-memory/compactor.js.map +1 -0
package/dist/agent/observational-memory/config.d.ts +37 -0
package/dist/agent/observational-memory/config.d.ts.map +1 -0
package/dist/agent/observational-memory/config.js +48 -0
package/dist/agent/observational-memory/config.js.map +1 -0
package/dist/agent/observational-memory/index.d.ts +26 -0
package/dist/agent/observational-memory/index.d.ts.map +1 -0
package/dist/agent/observational-memory/index.js +25 -0
package/dist/agent/observational-memory/index.js.map +1 -0
package/dist/agent/observational-memory/internal-run.d.ts +37 -0
package/dist/agent/observational-memory/internal-run.d.ts.map +1 -0
package/dist/agent/observational-memory/internal-run.js +59 -0
package/dist/agent/observational-memory/internal-run.js.map +1 -0
package/dist/agent/observational-memory/message-text.d.ts +13 -0
package/dist/agent/observational-memory/message-text.d.ts.map +1 -0
package/dist/agent/observational-memory/message-text.js +46 -0
package/dist/agent/observational-memory/message-text.js.map +1 -0
package/dist/agent/observational-memory/migrations.d.ts +13 -0
package/dist/agent/observational-memory/migrations.d.ts.map +1 -0
package/dist/agent/observational-memory/migrations.js +43 -0
package/dist/agent/observational-memory/migrations.js.map +1 -0
package/dist/agent/observational-memory/observer.d.ts +37 -0
package/dist/agent/observational-memory/observer.d.ts.map +1 -0
package/dist/agent/observational-memory/observer.js +82 -0
package/dist/agent/observational-memory/observer.js.map +1 -0
package/dist/agent/observational-memory/plugin.d.ts +16 -0
package/dist/agent/observational-memory/plugin.d.ts.map +1 -0
package/dist/agent/observational-memory/plugin.js +26 -0
package/dist/agent/observational-memory/plugin.js.map +1 -0
package/dist/agent/observational-memory/prompts.d.ts +27 -0
package/dist/agent/observational-memory/prompts.d.ts.map +1 -0
package/dist/agent/observational-memory/prompts.js +42 -0
package/dist/agent/observational-memory/prompts.js.map +1 -0
package/dist/agent/observational-memory/read.d.ts +45 -0
package/dist/agent/observational-memory/read.d.ts.map +1 -0
package/dist/agent/observational-memory/read.js +97 -0
package/dist/agent/observational-memory/read.js.map +1 -0
package/dist/agent/observational-memory/reflector.d.ts +31 -0
package/dist/agent/observational-memory/reflector.d.ts.map +1 -0
package/dist/agent/observational-memory/reflector.js +76 -0
package/dist/agent/observational-memory/reflector.js.map +1 -0
package/dist/agent/observational-memory/schema.d.ts +267 -0
package/dist/agent/observational-memory/schema.d.ts.map +1 -0
package/dist/agent/observational-memory/schema.js +48 -0
package/dist/agent/observational-memory/schema.js.map +1 -0
package/dist/agent/observational-memory/store.d.ts +52 -0
package/dist/agent/observational-memory/store.d.ts.map +1 -0
package/dist/agent/observational-memory/store.js +197 -0
package/dist/agent/observational-memory/store.js.map +1 -0
package/dist/agent/observational-memory/types.d.ts +61 -0
package/dist/agent/observational-memory/types.d.ts.map +1 -0
package/dist/agent/observational-memory/types.js +9 -0
package/dist/agent/observational-memory/types.js.map +1 -0
package/dist/agent/processors.d.ts +146 -0
package/dist/agent/processors.d.ts.map +1 -0
package/dist/agent/processors.js +122 -0
package/dist/agent/processors.js.map +1 -0
package/dist/agent/production-agent.d.ts +25 -0
package/dist/agent/production-agent.d.ts.map +1 -1
package/dist/agent/production-agent.js +341 -1
package/dist/agent/production-agent.js.map +1 -1
package/dist/agent/run-loop-with-resume.d.ts.map +1 -1
package/dist/agent/run-loop-with-resume.js +48 -0
package/dist/agent/run-loop-with-resume.js.map +1 -1
package/dist/agent/run-store.d.ts +17 -0
package/dist/agent/run-store.d.ts.map +1 -1
package/dist/agent/run-store.js +55 -0
package/dist/agent/run-store.js.map +1 -1
package/dist/agent/runtime-context.d.ts +30 -0
package/dist/agent/runtime-context.d.ts.map +1 -1
package/dist/agent/runtime-context.js +54 -1
package/dist/agent/runtime-context.js.map +1 -1
package/dist/agent/tool-call-journal.d.ts +99 -0
package/dist/agent/tool-call-journal.d.ts.map +1 -0
package/dist/agent/tool-call-journal.js +212 -0
package/dist/agent/tool-call-journal.js.map +1 -0
package/dist/agent/types.d.ts +35 -0
package/dist/agent/types.d.ts.map +1 -1
package/dist/agent/types.js.map +1 -1
package/dist/cli/add.d.ts +109 -0
package/dist/cli/add.d.ts.map +1 -0
package/dist/cli/add.js +352 -0
package/dist/cli/add.js.map +1 -0
package/dist/cli/connect.d.ts +2 -2
package/dist/cli/connect.d.ts.map +1 -1
package/dist/cli/connect.js +92 -24
package/dist/cli/connect.js.map +1 -1
package/dist/cli/eval.d.ts +17 -0
package/dist/cli/eval.d.ts.map +1 -0
package/dist/cli/eval.js +121 -0
package/dist/cli/eval.js.map +1 -0
package/dist/cli/index.js +44 -3
package/dist/cli/index.js.map +1 -1
package/dist/cli/mcp.d.ts.map +1 -1
package/dist/cli/mcp.js +11 -5
package/dist/cli/mcp.js.map +1 -1
package/dist/cli/plan-local.d.ts +66 -5
package/dist/cli/plan-local.d.ts.map +1 -1
package/dist/cli/plan-local.js +622 -21
package/dist/cli/plan-local.js.map +1 -1
package/dist/cli/skills.d.ts +2 -2
package/dist/cli/skills.d.ts.map +1 -1
package/dist/cli/skills.js +108 -62
package/dist/cli/skills.js.map +1 -1
package/dist/client/AssistantChat.d.ts.map +1 -1
package/dist/client/AssistantChat.js +118 -92
package/dist/client/AssistantChat.js.map +1 -1
package/dist/client/agent-chat-adapter.d.ts.map +1 -1
package/dist/client/agent-chat-adapter.js +16 -0
package/dist/client/agent-chat-adapter.js.map +1 -1
package/dist/client/chat/tool-call-display.d.ts +20 -1
package/dist/client/chat/tool-call-display.d.ts.map +1 -1
package/dist/client/chat/tool-call-display.js +32 -7
package/dist/client/chat/tool-call-display.js.map +1 -1
package/dist/client/sse-event-processor.d.ts +13 -0
package/dist/client/sse-event-processor.d.ts.map +1 -1
package/dist/client/sse-event-processor.js +21 -0
package/dist/client/sse-event-processor.js.map +1 -1
package/dist/coding-tools/run-code.d.ts.map +1 -1
package/dist/coding-tools/run-code.js +18 -2
package/dist/coding-tools/run-code.js.map +1 -1
package/dist/db/client.d.ts +4 -2
package/dist/db/client.d.ts.map +1 -1
package/dist/db/client.js +6 -4
package/dist/db/client.js.map +1 -1
package/dist/deploy/route-discovery.d.ts.map +1 -1
package/dist/deploy/route-discovery.js +1 -0
package/dist/deploy/route-discovery.js.map +1 -1
package/dist/eval/agent-runner.d.ts +63 -0
package/dist/eval/agent-runner.d.ts.map +1 -0
package/dist/eval/agent-runner.js +142 -0
package/dist/eval/agent-runner.js.map +1 -0
package/dist/eval/define-eval.d.ts +29 -0
package/dist/eval/define-eval.d.ts.map +1 -0
package/dist/eval/define-eval.js +43 -0
package/dist/eval/define-eval.js.map +1 -0
package/dist/eval/index.d.ts +18 -0
package/dist/eval/index.d.ts.map +1 -0
package/dist/eval/index.js +17 -0
package/dist/eval/index.js.map +1 -0
package/dist/eval/report.d.ts +8 -0
package/dist/eval/report.d.ts.map +1 -0
package/dist/eval/report.js +44 -0
package/dist/eval/report.js.map +1 -0
package/dist/eval/runner.d.ts +67 -0
package/dist/eval/runner.d.ts.map +1 -0
package/dist/eval/runner.js +256 -0
package/dist/eval/runner.js.map +1 -0
package/dist/eval/scorer.d.ts +83 -0
package/dist/eval/scorer.d.ts.map +1 -0
package/dist/eval/scorer.js +195 -0
package/dist/eval/scorer.js.map +1 -0
package/dist/eval/types.d.ts +162 -0
package/dist/eval/types.d.ts.map +1 -0
package/dist/eval/types.js +20 -0
package/dist/eval/types.js.map +1 -0
package/dist/extensions/fetch-tool.d.ts.map +1 -1
package/dist/extensions/fetch-tool.js +80 -15
package/dist/extensions/fetch-tool.js.map +1 -1
package/dist/extensions/web-content.d.ts +61 -0
package/dist/extensions/web-content.d.ts.map +1 -0
package/dist/extensions/web-content.js +468 -0
package/dist/extensions/web-content.js.map +1 -0
package/dist/extensions/web-search-tool.js +3 -3
package/dist/extensions/web-search-tool.js.map +1 -1
package/dist/mcp/build-server.d.ts.map +1 -1
package/dist/mcp/build-server.js +4 -1
package/dist/mcp/build-server.js.map +1 -1
package/dist/observability/traces.d.ts.map +1 -1
package/dist/observability/traces.js +100 -1
package/dist/observability/traces.js.map +1 -1
package/dist/observability/tracing.d.ts +73 -0
package/dist/observability/tracing.d.ts.map +1 -0
package/dist/observability/tracing.js +126 -0
package/dist/observability/tracing.js.map +1 -0
package/dist/onboarding/default-steps.d.ts.map +1 -1
package/dist/onboarding/default-steps.js +4 -1
package/dist/onboarding/default-steps.js.map +1 -1
package/dist/provider-api/actions/query-staged-dataset.d.ts +1 -1
package/dist/provider-api/corpus-jobs.d.ts +80 -0
package/dist/provider-api/corpus-jobs.d.ts.map +1 -1
package/dist/provider-api/corpus-jobs.js +219 -22
package/dist/provider-api/corpus-jobs.js.map +1 -1
package/dist/provider-api/index.d.ts +24 -32
package/dist/provider-api/index.d.ts.map +1 -1
package/dist/provider-api/index.js +28 -1
package/dist/provider-api/index.js.map +1 -1
package/dist/scripts/agent-engines/list-agent-engines.d.ts.map +1 -1
package/dist/scripts/agent-engines/list-agent-engines.js +10 -3
package/dist/scripts/agent-engines/list-agent-engines.js.map +1 -1
package/dist/server/action-discovery.d.ts.map +1 -1
package/dist/server/action-discovery.js +4 -0
package/dist/server/action-discovery.js.map +1 -1
package/dist/server/agent-chat-plugin.d.ts +9 -0
package/dist/server/agent-chat-plugin.d.ts.map +1 -1
package/dist/server/agent-chat-plugin.js +119 -111
package/dist/server/agent-chat-plugin.js.map +1 -1
package/dist/server/agent-teams.d.ts +62 -0
package/dist/server/agent-teams.d.ts.map +1 -1
package/dist/server/agent-teams.js +99 -2
package/dist/server/agent-teams.js.map +1 -1
package/dist/server/better-auth-instance.d.ts +7 -0
package/dist/server/better-auth-instance.d.ts.map +1 -1
package/dist/server/better-auth-instance.js +90 -0
package/dist/server/better-auth-instance.js.map +1 -1
package/dist/server/core-routes-plugin.d.ts.map +1 -1
package/dist/server/core-routes-plugin.js +7 -4
package/dist/server/core-routes-plugin.js.map +1 -1
package/dist/server/credential-provider.d.ts.map +1 -1
package/dist/server/credential-provider.js +2 -0
package/dist/server/credential-provider.js.map +1 -1
package/dist/server/deep-link.d.ts +7 -0
package/dist/server/deep-link.d.ts.map +1 -1
package/dist/server/deep-link.js +13 -2
package/dist/server/deep-link.js.map +1 -1
package/dist/server/framework-request-handler.d.ts.map +1 -1
package/dist/server/framework-request-handler.js +33 -1
package/dist/server/framework-request-handler.js.map +1 -1
package/dist/server/index.d.ts +2 -1
package/dist/server/index.d.ts.map +1 -1
package/dist/server/index.js +2 -1
package/dist/server/index.js.map +1 -1
package/dist/templates/default/.agents/skills/actions/SKILL.md +52 -1
package/dist/templates/default/.agents/skills/security/SKILL.md +22 -0
package/dist/templates/workspace-core/.agents/skills/actions/SKILL.md +52 -1
package/dist/templates/workspace-core/.agents/skills/external-agents/SKILL.md +16 -4
package/dist/templates/workspace-core/.agents/skills/harness-agents/SKILL.md +20 -0
package/dist/templates/workspace-core/.agents/skills/observability/SKILL.md +31 -0
package/dist/templates/workspace-core/.agents/skills/security/SKILL.md +22 -0
package/docs/content/actions.md +50 -0
package/docs/content/agent-teams.md +32 -0
package/docs/content/blueprint-installer.md +73 -0
package/docs/content/durable-resume.md +49 -0
package/docs/content/evals.md +141 -0
package/docs/content/external-agents.md +2 -2
package/docs/content/human-approval.md +101 -0
package/docs/content/observability.md +21 -0
package/docs/content/observational-memory.md +63 -0
package/docs/content/plan-plugin.md +5 -0
package/docs/content/pr-visual-recap.md +9 -5
package/docs/content/processors.md +99 -0
package/docs/content/sandbox-adapters.md +134 -0
package/docs/content/template-plan.md +97 -21
package/package.json +10 -1
package/src/templates/default/.agents/skills/actions/SKILL.md +52 -1
package/src/templates/default/.agents/skills/security/SKILL.md +22 -0
package/src/templates/workspace-core/.agents/skills/actions/SKILL.md +52 -1
package/src/templates/workspace-core/.agents/skills/external-agents/SKILL.md +16 -4
package/src/templates/workspace-core/.agents/skills/harness-agents/SKILL.md +20 -0
package/src/templates/workspace-core/.agents/skills/observability/SKILL.md +31 -0
package/src/templates/workspace-core/.agents/skills/security/SKILL.md +22 -0

package/dist/agent/production-agent.js CHANGED Viewed

@@ -19,14 +19,17 @@ import { createToolSearchEntry, TOOL_SEARCH_ACTION_NAME, } from "./tool-search.j
 import { getDefaultMaxIterations, normalizeMaxIterations, readAgentLoopSettings, } from "./loop-settings.js";
 import { isReasoningEffort, normalizeReasoningEffortForModel, } from "../shared/reasoning-effort.js";
 import { isAgentActionStopError } from "../action.js";
-import { writeLedgerEntry, readLedgerEntry, clearLedgerForThread, } from "./run-store.js";
+import { writeLedgerEntry, readLedgerEntry, clearLedgerForThread, getCurrentTurnEventsForThread, } from "./run-store.js";
+import { classifyToolCallJournal, findCompletedJournalEntry, } from "./tool-call-journal.js";
 import { preUploadAttachments } from "../file-upload/pre-upload-attachments.js";
 import { extensionIdFromPathname } from "../extensions/path.js";
 import { applyContextDirectives } from "./context-xray/apply-directives.js";
+import { ProcessorChain, TripWire, toolCallsFromContent, } from "./processors.js";
 import { completeRun as completeProgressRun, startRun as startProgressRun, updateRunProgress, } from "../progress/registry.js";
 import { loadContextDirectives } from "./context-xray/directives-store.js";
 import { buildManifest, writeContextManifest, } from "./context-xray/manifest.js";
 import { computeProtectedSegmentIds } from "./context-xray/segments.js";
+import { maybeCompactThread, buildObservationalContext, hasObservationalMemory, serializeObservationalMemoryBlock, } from "./observational-memory/index.js";
 // Register built-in engines on first import
 registerBuiltinEngines();
 export { PROVIDER_TO_ENV };
@@ -1065,6 +1068,84 @@ function findCurrentTurnStartForContinuation(messages) {
     }
     return 0;
 }
+/**
+ * First message index that is safe to start a trimmed window on. A window must
+ * not begin with a tool-result-only user message — that would orphan it from
+ * the assistant tool-call turn it answers and break Anthropic's tool_use /
+ * tool_result pairing. We walk forward from `desiredStart` to the first
+ * non-orphaned boundary; if none exists we refuse to trim (return -1).
+ */
+function findSafeWindowStart(messages, desiredStart) {
+    for (let i = Math.max(0, desiredStart); i < messages.length; i++) {
+        if (!isToolResultOnlyUserMessage(messages[i]))
+            return i;
+    }
+    return -1;
+}
+/**
+ * Observational Memory consumer (threshold-gated, conservative).
+ *
+ * Builds the three-tier OM context for a thread and, ONLY when the thread has
+ * already crossed the compaction threshold (i.e. it has at least one persisted
+ * observation/reflection), returns a rewritten message list that:
+ *   - prepends a single system-role "Observational Memory" block holding the
+ *     reflections + observations, and
+ *   - replaces the raw older history with just the recent-raw-message window,
+ *     keeping the current user turn and any pending tool results intact.
+ *
+ * For threads with NO OM entries (every short thread) it returns the input
+ * array unchanged by reference, so the common path is byte-for-byte identical.
+ *
+ * Best-effort: any failure returns the input unchanged so OM can never break a
+ * normal turn.
+ */
+async function applyObservationalMemoryToContext(messages, opts) {
+    if (!opts.ownerEmail)
+        return messages;
+    try {
+        const context = await buildObservationalContext({
+            threadId: opts.threadId,
+            ownerEmail: opts.ownerEmail,
+            orgId: opts.orgId ?? null,
+            messages,
+        });
+        // No compacted memory yet → short thread, leave context untouched.
+        if (!hasObservationalMemory(context))
+            return messages;
+        const block = serializeObservationalMemoryBlock(context);
+        if (!block.trim())
+            return messages;
+        // EngineMessage has no "system" role; the framework injects auxiliary
+        // context as leading user messages (same convention as the continuation
+        // nudge and the resume journal note), and the serialized block is clearly
+        // self-labeled "[Observational Memory]".
+        const omMessage = {
+            role: "user",
+            content: [{ type: "text", text: block }],
+        };
+        // Trim the raw prefix to only the recent-raw window. The window is the tail
+        // of `messages`, so it always contains the latest user turn and any pending
+        // tool results. Guard the boundary so we never start mid tool_use/result
+        // pair; if a safe boundary can't be found, additively inject the memory
+        // block WITHOUT trimming (the conservative fallback) so we never drop a
+        // pending tool result.
+        const recentCount = context.recentMessages.length;
+        if (recentCount === 0 || recentCount >= messages.length) {
+            return [omMessage, ...messages];
+        }
+        const desiredStart = messages.length - recentCount;
+        const safeStart = findSafeWindowStart(messages, desiredStart);
+        if (safeStart < 0) {
+            // Whole tail is tool-result-only (degenerate) — don't trim.
+            return [omMessage, ...messages];
+        }
+        return [omMessage, ...messages.slice(safeStart)];
+    }
+    catch (err) {
+        console.warn("[observational-memory] context injection skipped:", err instanceof Error ? err.message : String(err));
+        return messages;
+    }
+}
 function seedReadOnlyToolResultsFromHistory(messages, actions) {
     const cache = new Map();
     if (!isInternalContinuationTurn(messages))
@@ -1398,6 +1479,11 @@ function toolInputSchemaErrorResult(toolName, input, error) {
  */
 export async function runAgentLoop(opts) {
     const { engine, model, systemPrompt, tools, messages, actions, send, signal, } = opts;
+    // Build the processor chain only when at least one processor is supplied so
+    // the common (no-processors) path is unchanged and carries zero overhead.
+    const processorChain = opts.processors && opts.processors.length > 0
+        ? new ProcessorChain(opts.processors)
+        : null;
     const usage = {
         inputTokens: 0,
         outputTokens: 0,
@@ -1421,9 +1507,46 @@ export async function runAgentLoop(opts) {
     const readOnlyToolResultCache = seedReadOnlyToolResultsFromHistory(messages, actions);
     const duplicateReadOnlyToolCalls = new Map();
     const writeToolInterruptions = seedWriteToolInterruptionsFromHistory(messages, actions);
+    // Tool-call journal hard-block (resume safety). Snapshot the per-turn journal
+    // ONCE here, before any tool runs in this chunk, so it reflects only PRIOR
+    // run chunks of this logical turn. A write tool whose exact call already
+    // completed in an earlier interrupted chunk must not re-fire its side effect;
+    // when matched, runToolCall returns the journaled result instead of executing.
+    // Loaded eagerly (not lazily mid-loop) so the current chunk's own
+    // asynchronously-persisted tool_done events can never leak in and make a
+    // same-chunk call wrongly short-circuit. Best-effort: any ledger failure
+    // leaves the journal empty and all calls run normally. Fresh first-turn calls
+    // see an empty journal and are unaffected.
+    let toolCallJournal = null;
+    const consumedJournalKeys = new Set();
+    if (opts.threadId) {
+        try {
+            const priorEvents = await getCurrentTurnEventsForThread(opts.threadId);
+            if (priorEvents.length > 0) {
+                toolCallJournal = classifyToolCallJournal(priorEvents);
+            }
+        }
+        catch {
+            // Journal is a hardening layer, never a gate — a failed ledger read just
+            // means no hard-block this turn.
+        }
+    }
     const bufferTextUntilFinalGuard = Boolean(opts.finalResponseGuard);
     let finalGuardRetries = 0;
     let iterations = 0;
+    // Set when an in-loop processor aborts via `abort()` / throws a `TripWire`.
+    // The loop emits the `tripwire` event, surfaces the reason as a final
+    // assistant message, and stops cleanly.
+    let tripwire = null;
+    const emitTripwire = (err) => {
+        tripwire = err;
+        send({
+            type: "tripwire",
+            reason: err.message,
+            ...(err.processor ? { processor: err.processor } : {}),
+        });
+        send({ type: "text", text: err.message });
+    };
     while (true) {
         if (signal.aborted)
             break;
@@ -1465,6 +1588,21 @@ export async function runAgentLoop(opts) {
             catch (err) {
                 console.warn("[context-xray] context transform skipped:", err instanceof Error ? err.message : String(err));
             }
+            // Observational Memory (consumer): for long threads that have already been
+            // compacted, fold the reflections+observations in as a leading context
+            // block and prefer the recent-raw-message window over the full raw
+            // history. No-op (returns the same array) for short threads with no OM
+            // entries, so the common path is unchanged. Runs after the context-xray
+            // transform so the two compose; best-effort inside the helper. Gated on an
+            // authenticated owner so anonymous threads never read OM scoped to a
+            // shared default identity.
+            if (opts.ownerEmail) {
+                contextMessages = await applyObservationalMemoryToContext(contextMessages, {
+                    threadId: opts.threadId,
+                    ownerEmail: opts.ownerEmail,
+                    orgId: opts.orgId ?? null,
+                });
+            }
         }
         for (let retry = 0;; retry++) {
             assistantContent = undefined;
@@ -1502,6 +1640,22 @@ export async function runAgentLoop(opts) {
                     });
                 };
                 for await (const event of eventStream) {
+                    // In-loop processor seam (stream hook). Each chunk is offered to every
+                    // processor's `processOutputStream` before the loop handles it. A
+                    // processor `abort()` throws a TripWire; catch it locally so it is not
+                    // mistaken for a retryable engine error, then break out cleanly.
+                    if (processorChain) {
+                        try {
+                            await processorChain.runStream(event);
+                        }
+                        catch (err) {
+                            if (err instanceof TripWire) {
+                                emitTripwire(err);
+                                break;
+                            }
+                            throw err;
+                        }
+                    }
                     if (event.type === "text-delta") {
                         if (bufferTextUntilFinalGuard) {
                             bufferedAssistantText += event.text;
@@ -1594,6 +1748,10 @@ export async function runAgentLoop(opts) {
                 throw err;
             }
         }
+        // A processor aborted mid-stream. The tripwire event + final message were
+        // already emitted; halt the loop without sending a normal `done`.
+        if (tripwire)
+            break;
         if (!assistantContent && toolCallErrors.size > 0) {
             assistantContent = [];
         }
@@ -1624,6 +1782,31 @@ export async function runAgentLoop(opts) {
             : part);
         messages.push({ role: "assistant", content: assistantContentForHistory });
         const toolCallParts = assistantContent.filter((p) => p.type === "tool-call");
+        // In-loop processor seam (step hook). Fires once per model response, around
+        // tool execution, with the tool calls the model just requested (empty for a
+        // final answer) plus the stop reason and cumulative usage. A coverage gate
+        // can inspect what the model is about to do and `abort()` before tools run.
+        if (processorChain) {
+            try {
+                await processorChain.runStep({
+                    toolCalls: toolCallsFromContent(assistantContent),
+                    ...(terminalStopReason ? { finishReason: terminalStopReason } : {}),
+                    usage: {
+                        inputTokens: usage.inputTokens,
+                        outputTokens: usage.outputTokens,
+                        cacheReadTokens: usage.cacheReadTokens,
+                        cacheWriteTokens: usage.cacheWriteTokens,
+                    },
+                });
+            }
+            catch (err) {
+                if (err instanceof TripWire) {
+                    emitTripwire(err);
+                    break;
+                }
+                throw err;
+            }
+        }
         const flushBufferedAssistantText = () => {
             if (!bufferTextUntilFinalGuard)
                 return;
@@ -1690,6 +1873,11 @@ export async function runAgentLoop(opts) {
         finalGuardRetries = 0;
         flushBufferedAssistantText();
         let requestedActionStop = null;
+        // Human-in-the-loop approvals granted by the user for this turn (opt-in;
+        // empty for the overwhelming majority of turns). Keyed by the stable
+        // tool-call approval key so a re-issued continuation can let an approved
+        // call run. The model cannot populate this — it comes from the request.
+        const approvedToolCallKeys = new Set(opts.approvedToolCalls ?? []);
         const runToolCall = async (toolCall) => {
             const wireToolInput = JSON.stringify(toolCall.input ?? {});
             const normalizedToolInput = normalizeToolCallInputForHistory(toolCall.input);
@@ -1774,6 +1962,60 @@ export async function runAgentLoop(opts) {
                     isError: true,
                 };
             }
+            // Human-in-the-loop approval gate (opt-in via defineAction
+            // `needsApproval`; default off). When an action requires approval and
+            // this specific call has NOT been approved by a human, pause the turn
+            // instead of executing. The action's side effect never happens until a
+            // human re-issues the turn approving this call's stable key.
+            const approvalKey = toolCallCacheKey(toolCall.name, toolCall.input);
+            if (actionEntry.needsApproval && !approvedToolCallKeys.has(approvalKey)) {
+                let mustApprove = false;
+                try {
+                    mustApprove =
+                        typeof actionEntry.needsApproval === "function"
+                            ? Boolean(await actionEntry.needsApproval(toolCall.input, {
+                                userEmail: getRequestUserEmail(),
+                                orgId: getRequestOrgId() ?? null,
+                                caller: "tool",
+                            }))
+                            : actionEntry.needsApproval === true;
+                }
+                catch {
+                    // Fail closed: a throwing predicate means we require approval rather
+                    // than silently running a high-consequence action.
+                    mustApprove = true;
+                }
+                if (mustApprove) {
+                    send({
+                        type: "tool_start",
+                        tool: toolCall.name,
+                        input: toolCall.input,
+                    });
+                    send({
+                        type: "approval_required",
+                        tool: toolCall.name,
+                        input: toolCall.input,
+                        approvalKey,
+                        ...(toolCall.id ? { toolCallId: toolCall.id } : {}),
+                    });
+                    const result = `Awaiting human approval to run "${toolCall.name}". This action did ` +
+                        `NOT execute — a human must approve this specific call before it ` +
+                        `can run. The turn is paused; do not retry.`;
+                    send({ type: "tool_done", tool: toolCall.name, result });
+                    recordToolResult(result, false);
+                    requestedActionStop ??= {
+                        message: `Waiting for your approval to run ${toolCall.name}.`,
+                        errorCode: "needs-approval",
+                    };
+                    return {
+                        type: "tool-result",
+                        toolCallId: toolCall.id,
+                        toolName: toolCall.name,
+                        toolInput: wireToolInput,
+                        content: result,
+                    };
+                }
+            }
             const cacheKey = actionEntry.readOnly === true
                 ? toolCallCacheKey(toolCall.name, toolCall.input)
                 : null;
@@ -1805,6 +2047,40 @@ export async function runAgentLoop(opts) {
                     content: result,
                 };
             }
+            // TOOL-CALL JOURNAL HARD-BLOCK (resume safety, tool-layer enforcement).
+            // The prompt-level resume journal already TELLS a resuming model not to
+            // re-run completed tool calls; this enforces it at the tool layer so a
+            // re-dispatched write call whose exact (tool name + input) already
+            // completed in an earlier interrupted chunk of this turn does NOT execute
+            // its side effect again — we return the journaled result instead and emit
+            // the normal tool_start/tool_done so the transcript stays coherent.
+            //
+            // Gated on a non-readOnly tool + an existing prior-chunk journal (so fresh
+            // calls with no completed journal entry are completely unaffected). The
+            // snapshot was taken before this chunk's tools ran, so it can only match a
+            // PRIOR completion, never one from the current chunk.
+            if (!actionEntry.readOnly && toolCallJournal) {
+                const journaled = findCompletedJournalEntry(toolCallJournal, toolCall.name, toolCall.input, consumedJournalKeys);
+                if (journaled) {
+                    const recordedResult = journaled.result ?? "";
+                    const result = `(Already completed in an earlier interrupted attempt - not re-run to avoid a duplicate side effect.)\n\n` +
+                        recordedResult;
+                    send({
+                        type: "tool_start",
+                        tool: toolCall.name,
+                        input: toolCall.input,
+                    });
+                    send({ type: "tool_done", tool: toolCall.name, result });
+                    recordToolResult(result, false);
+                    return {
+                        type: "tool-result",
+                        toolCallId: toolCall.id,
+                        toolName: toolCall.name,
+                        toolInput: wireToolInput,
+                        content: result,
+                    };
+                }
+            }
             // Guard against write tools that have been interrupted too many times in
             // this turn (connection drop mid-execution → agent retries → repeat).
             // A write tool that keeps failing likely has a timeout / large-payload
@@ -2117,13 +2393,60 @@ export async function runAgentLoop(opts) {
             break;
         }
     }
+    // A processor halted the run: the `tripwire` event and final message were
+    // already emitted at the abort site. Do NOT send the normal `done` — the run
+    // ended on a guardrail, not a clean turn. The result hook still fires below
+    // so processors can observe the (halted) final text.
+    if (tripwire) {
+        if (processorChain) {
+            try {
+                await processorChain.runResult(collectTextParts(messages.flatMap((m) => (m.role === "assistant" ? m.content : []))));
+            }
+            catch (err) {
+                if (!(err instanceof TripWire))
+                    throw err;
+                // A result-hook abort is a no-op: the run is already halting.
+            }
+        }
+        return usage;
+    }
     if (!signal.aborted) {
+        // In-loop processor seam (result hook). Fires once at clean run end with the
+        // final assistant text so processors (e.g. a proof-of-done gate) can record
+        // a verdict. A result-hook abort cannot un-finish a completed run, so a
+        // TripWire here is swallowed.
+        if (processorChain) {
+            try {
+                await processorChain.runResult(collectTextParts(messages.flatMap((m) => (m.role === "assistant" ? m.content : []))));
+            }
+            catch (err) {
+                if (!(err instanceof TripWire))
+                    throw err;
+            }
+        }
         send({ type: "done" });
         // Clean up any zombie-completion ledger entries for this thread now that
         // the turn completed normally. If the run was aborted the ledger must stay
         // intact so the next continuation chunk can still recover from it.
         if (opts.threadId) {
             void clearLedgerForThread(opts.threadId).catch(() => { });
+            // Observational Memory (producer): after a clean turn, run a best-effort
+            // compaction pass so long threads accrue observations/reflections that the
+            // consumer above will surface on later turns. Both the Observer and the
+            // Reflector no-op below their token thresholds, so this is cheap for short
+            // threads. Fire-and-forget; any failure is swallowed so OM never affects
+            // the user-visible turn.
+            if (opts.ownerEmail) {
+                const compactThreadId = opts.threadId;
+                void maybeCompactThread({
+                    threadId: compactThreadId,
+                    ownerEmail: opts.ownerEmail,
+                    orgId: opts.orgId ?? null,
+                    messages,
+                }).catch((err) => {
+                    console.warn("[observational-memory] post-turn compaction skipped:", err instanceof Error ? err.message : String(err));
+                });
+            }
         }
     }
     return usage;
@@ -2977,6 +3300,13 @@ export function createProductionAgentHandler(options) {
             catch {
                 // Experiments module unavailable — use default model
             }
+            // TODO(processor-seam): thread `processors` from ProductionAgentOptions
+            // through to runAgentLoop here once the handler exposes a way to
+            // configure them (e.g. a `processors` field on ProductionAgentOptions
+            // or a per-request resolver). The loop-level seam (runAgentLoop's
+            // `processors` opt + ProcessorChain/TripWire) is the deliverable and is
+            // already callable directly by sub-agents, A2A, MCP, and tests; this is
+            // only the HTTP-handler convenience plumbing.
             const agentLoopOpts = {
                 engine,
                 model: effectiveModel,
@@ -2998,6 +3328,16 @@ export function createProductionAgentHandler(options) {
                 ...(threadId
                     ? { threadId: effectiveThreadId, turnId: effectiveTurnId }
                     : {}),
+                // Human-in-the-loop approval grants for this turn (sanitized — the
+                // request is untrusted; accept only a bounded list of string keys).
+                ...(Array.isArray(body.approvedToolCalls) &&
+                    body.approvedToolCalls.length
+                    ? {
+                        approvedToolCalls: body.approvedToolCalls
+                            .filter((k) => typeof k === "string")
+                            .slice(0, 200),
+                    }
+                    : {}),
             };
             send({ type: "activity", label: "Contacting model" });
             // loopUsage is always assigned — either via instrumentAgentLoop or