npm - @vellumai/assistant - Versions diffs - 0.4.17 → 0.4.19 - Mend

@vellumai/assistant 0.4.17 → 0.4.19

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (528) hide show

package/docs/runbook-trusted-contacts.md +5 -3
package/eslint.config.mjs +2 -2
package/package.json +1 -1
package/src/__tests__/access-request-decision.test.ts +128 -120
package/src/__tests__/account-registry.test.ts +121 -110
package/src/__tests__/active-skill-tools.test.ts +200 -172
package/src/__tests__/actor-token-service.test.ts +341 -274
package/src/__tests__/agent-loop-thinking.test.ts +28 -19
package/src/__tests__/agent-loop.test.ts +798 -378
package/src/__tests__/anthropic-provider.test.ts +405 -247
package/src/__tests__/app-builder-tool-scripts.test.ts +97 -97
package/src/__tests__/app-bundler.test.ts +112 -79
package/src/__tests__/app-executors.test.ts +205 -178
package/src/__tests__/app-git-history.test.ts +90 -73
package/src/__tests__/app-git-service.test.ts +67 -53
package/src/__tests__/app-open-proxy.test.ts +29 -25
package/src/__tests__/approval-conversation-turn.test.ts +100 -81
package/src/__tests__/approval-hardcoded-copy-guard.test.ts +45 -17
package/src/__tests__/approval-message-composer.test.ts +119 -119
package/src/__tests__/approval-primitive.test.ts +264 -233
package/src/__tests__/approval-routes-http.test.ts +4 -3
package/src/__tests__/asset-materialize-tool.test.ts +250 -178
package/src/__tests__/asset-search-tool.test.ts +251 -191
package/src/__tests__/assistant-attachment-directive.test.ts +187 -142
package/src/__tests__/assistant-attachments.test.ts +254 -186
package/src/__tests__/assistant-event-hub.test.ts +105 -63
package/src/__tests__/assistant-event.test.ts +66 -58
package/src/__tests__/assistant-events-sse-hardening.test.ts +113 -73
package/src/__tests__/assistant-feature-flag-guard.test.ts +78 -52
package/src/__tests__/assistant-feature-flag-guardrails.test.ts +48 -45
package/src/__tests__/assistant-feature-flags-integration.test.ts +118 -77
package/src/__tests__/assistant-id-boundary-guard.test.ts +158 -104
package/src/__tests__/attachments-store.test.ts +240 -183
package/src/__tests__/attachments.test.ts +70 -62
package/src/__tests__/audit-log-rotation.test.ts +50 -35
package/src/__tests__/browser-fill-credential.test.ts +169 -101
package/src/__tests__/browser-manager.test.ts +97 -75
package/src/__tests__/browser-runtime-check.test.ts +16 -15
package/src/__tests__/browser-skill-baseline-tool-payload.test.ts +12 -10
package/src/__tests__/browser-skill-endstate.test.ts +97 -72
package/src/__tests__/bundle-scanner.test.ts +47 -22
package/src/__tests__/bundled-asset.test.ts +74 -47
package/src/__tests__/call-constants.test.ts +19 -19
package/src/__tests__/call-controller.test.ts +0 -1
package/src/__tests__/call-conversation-messages.test.ts +90 -65
package/src/__tests__/call-domain.test.ts +149 -121
package/src/__tests__/call-pointer-message-composer.test.ts +113 -83
package/src/__tests__/call-pointer-messages.test.ts +213 -154
package/src/__tests__/call-pointer-no-hardcoded-copy.guard.test.ts +9 -10
package/src/__tests__/call-recovery.test.ts +232 -212
package/src/__tests__/call-routes-http.test.ts +0 -1
package/src/__tests__/call-start-guardian-guard.test.ts +32 -30
package/src/__tests__/call-state-machine.test.ts +62 -51
package/src/__tests__/call-state.test.ts +89 -75
package/src/__tests__/call-store.test.ts +387 -316
package/src/__tests__/callback-handoff-copy.test.ts +84 -82
package/src/__tests__/canonical-guardian-store.test.ts +331 -280
package/src/__tests__/channel-approval-routes.test.ts +1643 -1115
package/src/__tests__/channel-approval.test.ts +139 -137
package/src/__tests__/channel-approvals.test.ts +7 -2
package/src/__tests__/channel-delivery-store.test.ts +232 -194
package/src/__tests__/channel-guardian.test.ts +5 -3
package/src/__tests__/channel-invite-transport.test.ts +107 -92
package/src/__tests__/channel-policy.test.ts +42 -38
package/src/__tests__/channel-readiness-service.test.ts +119 -102
package/src/__tests__/channel-reply-delivery.test.ts +147 -118
package/src/__tests__/channel-retry-sweep.test.ts +153 -110
package/src/__tests__/checker.test.ts +3309 -1850
package/src/__tests__/clarification-resolver.test.ts +91 -79
package/src/__tests__/classifier.test.ts +64 -54
package/src/__tests__/claude-code-skill-regression.test.ts +42 -37
package/src/__tests__/claude-code-tool-profiles.test.ts +31 -29
package/src/__tests__/clawhub.test.ts +92 -82
package/src/__tests__/cli.test.ts +30 -30
package/src/__tests__/clipboard.test.ts +53 -46
package/src/__tests__/commit-guarantee.test.ts +59 -52
package/src/__tests__/commit-message-enrichment-service.test.ts +203 -75
package/src/__tests__/compaction.benchmark.test.ts +33 -31
package/src/__tests__/computer-use-session-compaction.test.ts +60 -50
package/src/__tests__/computer-use-session-lifecycle.test.ts +145 -117
package/src/__tests__/computer-use-session-working-dir.test.ts +62 -48
package/src/__tests__/computer-use-skill-baseline.test.ts +22 -19
package/src/__tests__/computer-use-skill-endstate.test.ts +45 -31
package/src/__tests__/computer-use-skill-lifecycle-cleanup.test.ts +121 -88
package/src/__tests__/computer-use-skill-manifest-regression.test.ts +65 -42
package/src/__tests__/computer-use-skill-proxy-bridge.test.ts +33 -18
package/src/__tests__/computer-use-tools.test.ts +121 -98
package/src/__tests__/config-schema.test.ts +443 -347
package/src/__tests__/config-watcher.test.ts +96 -81
package/src/__tests__/confirmation-request-guardian-bridge.test.ts +148 -133
package/src/__tests__/conflict-intent-tokenization.test.ts +96 -78
package/src/__tests__/conflict-policy.test.ts +151 -80
package/src/__tests__/conflict-store.test.ts +203 -157
package/src/__tests__/connection-policy.test.ts +89 -59
package/src/__tests__/contacts-tools.test.ts +247 -178
package/src/__tests__/context-memory-e2e.test.ts +306 -214
package/src/__tests__/context-token-estimator.test.ts +114 -74
package/src/__tests__/context-window-manager.test.ts +269 -167
package/src/__tests__/contradiction-checker.test.ts +161 -135
package/src/__tests__/conversation-attention-store.test.ts +350 -290
package/src/__tests__/conversation-attention-telegram.test.ts +0 -1
package/src/__tests__/conversation-pairing.test.ts +220 -113
package/src/__tests__/conversation-routes-guardian-reply.test.ts +8 -0
package/src/__tests__/conversation-store.test.ts +390 -235
package/src/__tests__/credential-broker-browser-fill.test.ts +325 -250
package/src/__tests__/credential-broker-server-use.test.ts +283 -243
package/src/__tests__/credential-broker.test.ts +128 -74
package/src/__tests__/credential-host-pattern-match.test.ts +64 -44
package/src/__tests__/credential-metadata-store.test.ts +360 -311
package/src/__tests__/credential-policy-validate.test.ts +81 -65
package/src/__tests__/credential-resolve.test.ts +212 -145
package/src/__tests__/credential-security-e2e.test.ts +144 -103
package/src/__tests__/credential-security-invariants.test.ts +253 -208
package/src/__tests__/credential-selection.test.ts +254 -146
package/src/__tests__/credential-vault-unit.test.ts +531 -341
package/src/__tests__/credential-vault.test.ts +761 -484
package/src/__tests__/daemon-assistant-events.test.ts +91 -66
package/src/__tests__/daemon-lifecycle.test.ts +258 -190
package/src/__tests__/daemon-server-session-init.test.ts +2 -1
package/src/__tests__/date-context.test.ts +314 -249
package/src/__tests__/db-migration-rollback.test.ts +259 -130
package/src/__tests__/db-schedule-syntax-migration.test.ts +78 -41
package/src/__tests__/delete-managed-skill-tool.test.ts +77 -53
package/src/__tests__/deterministic-verification-control-plane.test.ts +0 -1
package/src/__tests__/dictation-mode-detection.test.ts +77 -55
package/src/__tests__/dictation-profile-store.test.ts +70 -56
package/src/__tests__/dictation-text-processing.test.ts +53 -35
package/src/__tests__/diff.test.ts +102 -98
package/src/__tests__/domain-normalize.test.ts +54 -54
package/src/__tests__/domain-policy.test.ts +71 -55
package/src/__tests__/dynamic-page-surface.test.ts +31 -33
package/src/__tests__/dynamic-skill-workflow-prompt.test.ts +69 -69
package/src/__tests__/edit-engine.test.ts +56 -56
package/src/__tests__/elevenlabs-client.test.ts +117 -91
package/src/__tests__/elevenlabs-config.test.ts +32 -31
package/src/__tests__/email-classifier.test.ts +15 -12
package/src/__tests__/email-cli.test.ts +121 -108
package/src/__tests__/emit-signal-routing-intent.test.ts +76 -69
package/src/__tests__/encrypted-store.test.ts +180 -154
package/src/__tests__/entity-extractor.test.ts +108 -87
package/src/__tests__/entity-search.test.ts +664 -258
package/src/__tests__/ephemeral-permissions.test.ts +224 -188
package/src/__tests__/event-bus.test.ts +81 -77
package/src/__tests__/extract-email.test.ts +29 -20
package/src/__tests__/file-edit-tool.test.ts +62 -44
package/src/__tests__/file-ops-service.test.ts +131 -114
package/src/__tests__/file-read-tool.test.ts +48 -31
package/src/__tests__/file-write-tool.test.ts +43 -37
package/src/__tests__/filesystem-tools.test.ts +238 -209
package/src/__tests__/followup-tools.test.ts +237 -162
package/src/__tests__/forbidden-legacy-symbols.test.ts +19 -20
package/src/__tests__/frontmatter.test.ts +96 -81
package/src/__tests__/fuzzy-match-property.test.ts +75 -81
package/src/__tests__/fuzzy-match.test.ts +71 -65
package/src/__tests__/gateway-client-managed-outbound.test.ts +76 -57
package/src/__tests__/gateway-only-enforcement.test.ts +0 -1
package/src/__tests__/gateway-only-guard.test.ts +0 -1
package/src/__tests__/gemini-image-service.test.ts +113 -100
package/src/__tests__/gemini-provider.test.ts +297 -220
package/src/__tests__/get-weather.test.ts +188 -114
package/src/__tests__/gmail-integration.test.ts +13 -5
package/src/__tests__/guardian-action-conversation-turn.test.ts +226 -171
package/src/__tests__/guardian-action-copy-generator.test.ts +111 -93
package/src/__tests__/guardian-action-followup-executor.test.ts +0 -1
package/src/__tests__/guardian-action-followup-store.test.ts +199 -167
package/src/__tests__/guardian-action-grant-mint-consume.test.ts +297 -250
package/src/__tests__/guardian-action-late-reply.test.ts +462 -316
package/src/__tests__/guardian-action-no-hardcoded-copy.test.ts +23 -18
package/src/__tests__/guardian-action-store.test.ts +158 -109
package/src/__tests__/guardian-action-sweep.test.ts +114 -100
package/src/__tests__/guardian-actions-endpoint.test.ts +440 -256
package/src/__tests__/guardian-control-plane-policy.test.ts +497 -331
package/src/__tests__/guardian-decision-primitive-canonical.test.ts +217 -215
package/src/__tests__/guardian-dispatch.test.ts +316 -256
package/src/__tests__/guardian-grant-minting.test.ts +247 -178
package/src/__tests__/guardian-outbound-http.test.ts +5 -3
package/src/__tests__/guardian-principal-id-roundtrip.test.ts +99 -96
package/src/__tests__/guardian-question-copy.test.ts +17 -17
package/src/__tests__/guardian-question-mode.test.ts +134 -100
package/src/__tests__/guardian-routing-invariants.test.ts +0 -1
package/src/__tests__/guardian-routing-state.test.ts +0 -1
package/src/__tests__/guardian-verification-intent-routing.test.ts +94 -88
package/src/__tests__/guardian-verification-voice-binding.test.ts +0 -1
package/src/__tests__/guardian-verify-setup-skill-regression.test.ts +0 -1
package/src/__tests__/handle-user-message-secret-resume.test.ts +7 -2
package/src/__tests__/handlers-add-trust-rule-metadata.test.ts +92 -76
package/src/__tests__/handlers-cu-observation-blob.test.ts +103 -70
package/src/__tests__/handlers-ipc-blob-probe.test.ts +77 -51
package/src/__tests__/handlers-slack-config.test.ts +63 -54
package/src/__tests__/handlers-task-submit-slash.test.ts +18 -18
package/src/__tests__/handlers-telegram-config.test.ts +662 -329
package/src/__tests__/handlers-twitter-config.test.ts +525 -298
package/src/__tests__/handlers-user-message-approval-consumption.test.ts +5 -2
package/src/__tests__/headless-browser-interactions.test.ts +444 -280
package/src/__tests__/headless-browser-navigate.test.ts +116 -79
package/src/__tests__/headless-browser-read-tools.test.ts +123 -86
package/src/__tests__/headless-browser-snapshot.test.ts +71 -56
package/src/__tests__/heartbeat-service.test.ts +76 -58
package/src/__tests__/history-repair-observability.test.ts +14 -14
package/src/__tests__/history-repair.test.ts +171 -167
package/src/__tests__/home-base-bootstrap.test.ts +30 -27
package/src/__tests__/hooks-blocking.test.ts +86 -37
package/src/__tests__/hooks-cli.test.ts +104 -68
package/src/__tests__/hooks-config.test.ts +81 -43
package/src/__tests__/hooks-discovery.test.ts +106 -96
package/src/__tests__/hooks-integration.test.ts +78 -72
package/src/__tests__/hooks-manager.test.ts +99 -61
package/src/__tests__/hooks-runner.test.ts +94 -71
package/src/__tests__/hooks-settings.test.ts +69 -64
package/src/__tests__/hooks-templates.test.ts +85 -54
package/src/__tests__/hooks-ts-runner.test.ts +82 -45
package/src/__tests__/hooks-watch.test.ts +32 -22
package/src/__tests__/host-file-edit-tool.test.ts +190 -148
package/src/__tests__/host-file-read-tool.test.ts +86 -63
package/src/__tests__/host-file-write-tool.test.ts +98 -64
package/src/__tests__/host-shell-tool.test.ts +342 -233
package/src/__tests__/inbound-invite-redemption.test.ts +0 -1
package/src/__tests__/ingress-member-store.test.ts +163 -159
package/src/__tests__/ingress-reconcile.test.ts +13 -6
package/src/__tests__/ingress-routes-http.test.ts +441 -356
package/src/__tests__/ingress-url-consistency.test.ts +125 -64
package/src/__tests__/integration-status.test.ts +93 -73
package/src/__tests__/intent-routing.test.ts +148 -118
package/src/__tests__/invite-redemption-service.test.ts +163 -121
package/src/__tests__/ipc-blob-store.test.ts +104 -91
package/src/__tests__/ipc-contract-inventory.test.ts +27 -15
package/src/__tests__/ipc-contract.test.ts +24 -23
package/src/__tests__/ipc-protocol.test.ts +52 -46
package/src/__tests__/ipc-roundtrip.benchmark.test.ts +61 -50
package/src/__tests__/ipc-snapshot.test.ts +1135 -1056
package/src/__tests__/ipc-validate.test.ts +240 -179
package/src/__tests__/key-migration.test.ts +123 -90
package/src/__tests__/keychain.test.ts +150 -123
package/src/__tests__/lifecycle-docs-guard.test.ts +65 -64
package/src/__tests__/llm-usage-store.test.ts +112 -87
package/src/__tests__/managed-skill-lifecycle.test.ts +147 -108
package/src/__tests__/managed-store.test.ts +411 -360
package/src/__tests__/mcp-cli.test.ts +190 -124
package/src/__tests__/mcp-health-check.test.ts +26 -21
package/src/__tests__/media-generate-image.test.ts +122 -99
package/src/__tests__/media-reuse-story.e2e.test.ts +282 -214
package/src/__tests__/media-visibility-policy.test.ts +86 -38
package/src/__tests__/memory-context-benchmark.benchmark.test.ts +146 -100
package/src/__tests__/memory-lifecycle-e2e.test.ts +385 -297
package/src/__tests__/memory-query-builder.test.ts +32 -33
package/src/__tests__/memory-recall-quality.test.ts +761 -407
package/src/__tests__/memory-regressions.experimental.test.ts +443 -380
package/src/__tests__/memory-regressions.test.ts +3725 -2642
package/src/__tests__/memory-retrieval-budget.test.ts +7 -8
package/src/__tests__/memory-retrieval.benchmark.test.ts +144 -109
package/src/__tests__/memory-upsert-concurrency.test.ts +292 -201
package/src/__tests__/messaging-send-tool.test.ts +36 -29
package/src/__tests__/migration-cli-flows.test.ts +69 -53
package/src/__tests__/migration-ordering.test.ts +103 -86
package/src/__tests__/mime-builder.test.ts +55 -32
package/src/__tests__/mock-signup-server.test.ts +384 -246
package/src/__tests__/model-intents.test.ts +61 -37
package/src/__tests__/no-direct-anthropic-sdk-imports.test.ts +9 -12
package/src/__tests__/no-is-trusted-guard.test.ts +24 -21
package/src/__tests__/non-member-access-request.test.ts +3 -2
package/src/__tests__/notification-broadcaster.test.ts +99 -81
package/src/__tests__/notification-decision-fallback.test.ts +223 -178
package/src/__tests__/notification-decision-strategy.test.ts +375 -337
package/src/__tests__/notification-deep-link.test.ts +67 -61
package/src/__tests__/notification-guardian-path.test.ts +248 -206
package/src/__tests__/notification-routing-intent.test.ts +166 -93
package/src/__tests__/notification-thread-candidate-validation.test.ts +78 -75
package/src/__tests__/notification-thread-candidates.test.ts +64 -61
package/src/__tests__/oauth-callback-registry.test.ts +40 -30
package/src/__tests__/oauth-connect-handler.test.ts +109 -89
package/src/__tests__/oauth-scope-policy.test.ts +63 -55
package/src/__tests__/oauth2-gateway-transport.test.ts +252 -174
package/src/__tests__/onboarding-starter-tasks.test.ts +93 -89
package/src/__tests__/onboarding-template-contract.test.ts +93 -94
package/src/__tests__/openai-provider.test.ts +366 -274
package/src/__tests__/pairing-concurrent.test.ts +18 -12
package/src/__tests__/pairing-routes.test.ts +45 -41
package/src/__tests__/parallel-tool.benchmark.test.ts +108 -58
package/src/__tests__/parser.test.ts +316 -226
package/src/__tests__/path-classifier.test.ts +24 -25
package/src/__tests__/path-policy.test.ts +187 -147
package/src/__tests__/phone.test.ts +36 -36
package/src/__tests__/platform-move-helper.test.ts +48 -40
package/src/__tests__/platform-socket-path.test.ts +23 -24
package/src/__tests__/platform-workspace-migration.test.ts +464 -414
package/src/__tests__/platform.test.ts +61 -53
package/src/__tests__/playbook-execution.test.ts +397 -265
package/src/__tests__/playbook-tools.test.ts +267 -196
package/src/__tests__/prebuilt-home-base-seed.test.ts +30 -27
package/src/__tests__/pricing.test.ts +316 -136
package/src/__tests__/profile-compiler.test.ts +206 -188
package/src/__tests__/provider-commit-message-generator.test.ts +114 -106
package/src/__tests__/provider-error-scenarios.test.ts +212 -158
package/src/__tests__/provider-fail-open-selection.test.ts +51 -44
package/src/__tests__/provider-registry-ollama.test.ts +13 -9
package/src/__tests__/provider-streaming.benchmark.test.ts +232 -183
package/src/__tests__/proxy-approval-callback.test.ts +180 -119
package/src/__tests__/public-ingress-urls.test.ts +112 -94
package/src/__tests__/qdrant-manager.test.ts +147 -98
package/src/__tests__/ratelimit.test.ts +152 -82
package/src/__tests__/recording-handler.test.ts +273 -151
package/src/__tests__/recording-intent-fallback.test.ts +94 -75
package/src/__tests__/recording-intent-handler.test.ts +9 -2
package/src/__tests__/recording-intent.test.ts +578 -379
package/src/__tests__/recording-state-machine.test.ts +530 -316
package/src/__tests__/recurrence-engine-rruleset.test.ts +150 -92
package/src/__tests__/recurrence-engine.test.ts +81 -41
package/src/__tests__/recurrence-types.test.ts +63 -44
package/src/__tests__/relay-server.test.ts +2131 -1602
package/src/__tests__/reminder-store.test.ts +158 -80
package/src/__tests__/reminder.test.ts +113 -109
package/src/__tests__/remote-skill-policy.test.ts +96 -72
package/src/__tests__/request-file-tool.test.ts +74 -67
package/src/__tests__/response-tier.test.ts +131 -74
package/src/__tests__/runtime-attachment-metadata.test.ts +0 -1
package/src/__tests__/runtime-events-sse-parity.test.ts +167 -145
package/src/__tests__/runtime-events-sse.test.ts +0 -1
package/src/__tests__/sandbox-diagnostics.test.ts +66 -56
package/src/__tests__/sandbox-host-parity.test.ts +377 -301
package/src/__tests__/scaffold-managed-skill-tool.test.ts +213 -161
package/src/__tests__/schedule-store.test.ts +268 -205
package/src/__tests__/schedule-tools.test.ts +702 -524
package/src/__tests__/scheduler-recurrence.test.ts +240 -130
package/src/__tests__/scoped-approval-grants.test.ts +258 -168
package/src/__tests__/scoped-grant-security-matrix.test.ts +160 -146
package/src/__tests__/script-proxy-certs.test.ts +38 -35
package/src/__tests__/script-proxy-connect-tunnel.test.ts +71 -46
package/src/__tests__/script-proxy-decision-trace.test.ts +161 -84
package/src/__tests__/script-proxy-http-forwarder.test.ts +146 -129
package/src/__tests__/script-proxy-injection-runtime.test.ts +139 -113
package/src/__tests__/script-proxy-mitm-handler.test.ts +226 -142
package/src/__tests__/script-proxy-policy-runtime.test.ts +126 -86
package/src/__tests__/script-proxy-policy.test.ts +308 -153
package/src/__tests__/script-proxy-rewrite-specificity.test.ts +74 -62
package/src/__tests__/script-proxy-router.test.ts +111 -77
package/src/__tests__/script-proxy-session-manager.test.ts +156 -113
package/src/__tests__/script-proxy-session-runtime.test.ts +28 -24
package/src/__tests__/secret-allowlist.test.ts +105 -90
package/src/__tests__/secret-ingress-handler.test.ts +41 -30
package/src/__tests__/secret-onetime-send.test.ts +67 -50
package/src/__tests__/secret-prompt-log-hygiene.test.ts +35 -31
package/src/__tests__/secret-response-routing.test.ts +50 -41
package/src/__tests__/secret-scanner-executor.test.ts +152 -111
package/src/__tests__/secret-scanner.test.ts +495 -413
package/src/__tests__/secure-keys.test.ts +132 -121
package/src/__tests__/send-endpoint-busy.test.ts +8 -3
package/src/__tests__/send-notification-tool.test.ts +43 -42
package/src/__tests__/sensitive-output-placeholders.test.ts +72 -64
package/src/__tests__/sequence-store.test.ts +335 -167
package/src/__tests__/server-history-render.test.ts +341 -202
package/src/__tests__/session-abort-tool-results.test.ts +133 -70
package/src/__tests__/session-confirmation-signals.test.ts +252 -160
package/src/__tests__/session-conflict-gate.test.ts +775 -585
package/src/__tests__/session-error.test.ts +222 -191
package/src/__tests__/session-evictor.test.ts +79 -62
package/src/__tests__/session-init.benchmark.test.ts +170 -108
package/src/__tests__/session-load-history-repair.test.ts +273 -139
package/src/__tests__/session-messaging-secret-redirect.test.ts +130 -90
package/src/__tests__/session-pre-run-repair.test.ts +106 -59
package/src/__tests__/session-profile-injection.test.ts +198 -130
package/src/__tests__/session-provider-retry-repair.test.ts +223 -141
package/src/__tests__/session-queue.test.ts +624 -321
package/src/__tests__/session-runtime-assembly.test.ts +425 -329
package/src/__tests__/session-runtime-workspace.test.ts +69 -61
package/src/__tests__/session-skill-tools.test.ts +973 -678
package/src/__tests__/session-slash-known.test.ts +185 -133
package/src/__tests__/session-slash-queue.test.ts +147 -81
package/src/__tests__/session-slash-unknown.test.ts +135 -90
package/src/__tests__/session-surfaces-task-progress.test.ts +122 -87
package/src/__tests__/session-tool-setup-app-refresh.test.ts +338 -177
package/src/__tests__/session-tool-setup-memory-scope.test.ts +63 -40
package/src/__tests__/session-tool-setup-side-effect-flag.test.ts +60 -37
package/src/__tests__/session-tool-setup-tools-disabled.test.ts +28 -26
package/src/__tests__/session-undo.test.ts +43 -30
package/src/__tests__/session-workspace-cache-state.test.ts +108 -67
package/src/__tests__/session-workspace-injection.test.ts +245 -117
package/src/__tests__/session-workspace-tool-tracking.test.ts +260 -93
package/src/__tests__/shared-filesystem-errors.test.ts +47 -47
package/src/__tests__/shell-credential-ref.test.ts +126 -90
package/src/__tests__/shell-identity.test.ts +134 -111
package/src/__tests__/shell-parser-fuzz.test.ts +263 -179
package/src/__tests__/shell-parser-property.test.ts +435 -288
package/src/__tests__/shell-tool-proxy-mode.test.ts +142 -70
package/src/__tests__/size-guard.test.ts +42 -44
package/src/__tests__/skill-feature-flags-integration.test.ts +79 -52
package/src/__tests__/skill-feature-flags.test.ts +75 -47
package/src/__tests__/skill-include-graph.test.ts +143 -148
package/src/__tests__/skill-load-feature-flag.test.ts +94 -59
package/src/__tests__/skill-load-tool.test.ts +371 -199
package/src/__tests__/skill-projection-feature-flag.test.ts +131 -88
package/src/__tests__/skill-projection.benchmark.test.ts +93 -65
package/src/__tests__/skill-script-runner-host.test.ts +460 -250
package/src/__tests__/skill-script-runner-sandbox.test.ts +168 -108
package/src/__tests__/skill-script-runner.test.ts +115 -74
package/src/__tests__/skill-tool-factory.test.ts +140 -96
package/src/__tests__/skill-tool-manifest.test.ts +306 -210
package/src/__tests__/skill-version-hash.test.ts +70 -56
package/src/__tests__/skills.test.ts +0 -1
package/src/__tests__/slack-channel-config.test.ts +127 -84
package/src/__tests__/slack-skill.test.ts +60 -47
package/src/__tests__/slash-commands-catalog.test.ts +37 -31
package/src/__tests__/slash-commands-parser.test.ts +71 -64
package/src/__tests__/slash-commands-resolver.test.ts +143 -107
package/src/__tests__/slash-commands-rewrite.test.ts +22 -22
package/src/__tests__/sms-messaging-provider.test.ts +4 -0
package/src/__tests__/speaker-identification.test.ts +28 -25
package/src/__tests__/starter-bundle.test.ts +27 -23
package/src/__tests__/starter-task-flow.test.ts +67 -52
package/src/__tests__/subagent-manager-notify.test.ts +154 -108
package/src/__tests__/subagent-tools.test.ts +311 -270
package/src/__tests__/subagent-types.test.ts +40 -40
package/src/__tests__/surface-mutex-cleanup.test.ts +42 -30
package/src/__tests__/swarm-dag-pathological.test.ts +122 -111
package/src/__tests__/swarm-orchestrator.test.ts +135 -101
package/src/__tests__/swarm-plan-validator.test.ts +125 -73
package/src/__tests__/swarm-recursion.test.ts +58 -46
package/src/__tests__/swarm-router-planner.test.ts +99 -74
package/src/__tests__/swarm-session-integration.test.ts +148 -91
package/src/__tests__/swarm-tool.test.ts +65 -45
package/src/__tests__/swarm-worker-backend.test.ts +59 -45
package/src/__tests__/swarm-worker-runner.test.ts +133 -118
package/src/__tests__/system-prompt.test.ts +311 -256
package/src/__tests__/task-compiler.test.ts +176 -120
package/src/__tests__/task-management-tools.test.ts +561 -456
package/src/__tests__/task-memory-cleanup.test.ts +627 -362
package/src/__tests__/task-runner.test.ts +117 -94
package/src/__tests__/task-scheduler.test.ts +113 -84
package/src/__tests__/task-tools.test.ts +349 -264
package/src/__tests__/terminal-sandbox.test.ts +138 -108
package/src/__tests__/terminal-tools.test.ts +350 -305
package/src/__tests__/thread-seed-composer.test.ts +307 -180
package/src/__tests__/tool-approval-handler.test.ts +238 -137
package/src/__tests__/tool-audit-listener.test.ts +69 -69
package/src/__tests__/tool-domain-event-publisher.test.ts +142 -132
package/src/__tests__/tool-execution-abort-cleanup.test.ts +155 -146
package/src/__tests__/tool-execution-pipeline.benchmark.test.ts +136 -105
package/src/__tests__/tool-executor-lifecycle-events.test.ts +355 -239
package/src/__tests__/tool-executor-redaction.test.ts +112 -109
package/src/__tests__/tool-executor-shell-integration.test.ts +130 -79
package/src/__tests__/tool-executor.test.ts +1274 -674
package/src/__tests__/tool-grant-request-escalation.test.ts +401 -283
package/src/__tests__/tool-metrics-listener.test.ts +97 -85
package/src/__tests__/tool-notification-listener.test.ts +42 -25
package/src/__tests__/tool-permission-simulate-handler.test.ts +137 -113
package/src/__tests__/tool-policy.test.ts +44 -25
package/src/__tests__/tool-profiling-listener.test.ts +99 -93
package/src/__tests__/tool-result-truncation.test.ts +5 -4
package/src/__tests__/tool-trace-listener.test.ts +131 -111
package/src/__tests__/top-level-renderer.test.ts +62 -58
package/src/__tests__/top-level-scanner.test.ts +68 -64
package/src/__tests__/trace-emitter.test.ts +56 -56
package/src/__tests__/trust-context-guards.test.ts +65 -65
package/src/__tests__/trust-store.test.ts +1239 -806
package/src/__tests__/trusted-contact-approval-notifier.test.ts +0 -1
package/src/__tests__/trusted-contact-inline-approval-integration.test.ts +0 -1
package/src/__tests__/trusted-contact-lifecycle-notifications.test.ts +3 -2
package/src/__tests__/trusted-contact-multichannel.test.ts +3 -2
package/src/__tests__/trusted-contact-verification.test.ts +251 -231
package/src/__tests__/turn-commit.test.ts +259 -200
package/src/__tests__/twilio-provider.test.ts +140 -126
package/src/__tests__/twilio-rest.test.ts +22 -18
package/src/__tests__/twilio-routes-elevenlabs.test.ts +0 -1
package/src/__tests__/twilio-routes-twiml.test.ts +55 -55
package/src/__tests__/twilio-routes.test.ts +0 -1
package/src/__tests__/twitter-auth-handler.test.ts +184 -139
package/src/__tests__/twitter-cli-error-shaping.test.ts +88 -73
package/src/__tests__/twitter-cli-routing.test.ts +146 -99
package/src/__tests__/twitter-oauth-client.test.ts +82 -65
package/src/__tests__/update-bulletin-format.test.ts +69 -66
package/src/__tests__/update-bulletin-state.test.ts +66 -60
package/src/__tests__/update-bulletin.test.ts +150 -114
package/src/__tests__/update-template-contract.test.ts +15 -10
package/src/__tests__/url-safety.test.ts +288 -265
package/src/__tests__/user-reference.test.ts +32 -32
package/src/__tests__/view-image-tool.test.ts +118 -96
package/src/__tests__/voice-invite-redemption.test.ts +111 -106
package/src/__tests__/voice-quality.test.ts +117 -102
package/src/__tests__/voice-scoped-grant-consumer.test.ts +204 -146
package/src/__tests__/voice-session-bridge.test.ts +351 -216
package/src/__tests__/weather-skill-regression.test.ts +170 -120
package/src/__tests__/web-fetch.test.ts +664 -526
package/src/__tests__/web-search.test.ts +379 -213
package/src/__tests__/work-item-output.test.ts +90 -53
package/src/__tests__/workspace-git-service.test.ts +437 -356
package/src/__tests__/workspace-heartbeat-service.test.ts +125 -91
package/src/__tests__/workspace-lifecycle.test.ts +98 -64
package/src/__tests__/workspace-policy.test.ts +139 -71
package/src/cli/mcp.ts +81 -28
package/src/commands/__tests__/cc-command-registry.test.ts +142 -134
package/src/config/__tests__/feature-flag-registry-guard.test.ts +48 -39
package/src/config/bundled-skills/chatgpt-import/tools/chatgpt-import.ts +25 -10
package/src/config/bundled-skills/doordash/__tests__/doordash-session.test.ts +0 -1
package/src/config/bundled-skills/guardian-verify-setup/SKILL.md +6 -11
package/src/config/bundled-skills/messaging/SKILL.md +4 -3
package/src/config/bundled-skills/messaging/tools/gmail-outreach-scan.ts +15 -5
package/src/config/bundled-skills/messaging/tools/gmail-sender-digest.ts +16 -5
package/src/config/bundled-skills/phone-calls/SKILL.md +1 -2
package/src/config/bundled-skills/slack/tools/slack-scan-digest.ts +34 -32
package/src/config/bundled-skills/sms-setup/SKILL.md +8 -16
package/src/config/bundled-skills/telegram-setup/SKILL.md +3 -3
package/src/config/bundled-skills/trusted-contacts/SKILL.md +13 -25
package/src/config/bundled-skills/twilio-setup/SKILL.md +13 -23
package/src/config/bundled-tool-registry.ts +2 -0
package/src/config/env.ts +3 -4
package/src/config/system-prompt.ts +32 -0
package/src/mcp/client.ts +2 -7
package/src/memory/db-connection.ts +16 -10
package/src/messaging/providers/gmail/adapter.ts +10 -3
package/src/messaging/providers/gmail/client.ts +280 -72
package/src/runtime/auth/__tests__/context.test.ts +75 -65
package/src/runtime/auth/__tests__/credential-service.test.ts +137 -114
package/src/runtime/auth/__tests__/guard-tests.test.ts +84 -90
package/src/runtime/auth/__tests__/ipc-auth-context.test.ts +40 -40
package/src/runtime/auth/__tests__/middleware.test.ts +80 -74
package/src/runtime/auth/__tests__/policy.test.ts +9 -9
package/src/runtime/auth/__tests__/route-policy.test.ts +76 -65
package/src/runtime/auth/__tests__/scopes.test.ts +68 -60
package/src/runtime/auth/__tests__/subject.test.ts +54 -54
package/src/runtime/auth/__tests__/token-service.test.ts +115 -108
package/src/runtime/auth/scopes.ts +3 -0
package/src/runtime/auth/token-service.ts +4 -1
package/src/runtime/auth/types.ts +2 -1
package/src/runtime/http-server.ts +2 -1
package/src/security/secure-keys.ts +120 -54
package/src/tools/browser/__tests__/auth-cache.test.ts +69 -63
package/src/tools/browser/__tests__/auth-detector.test.ts +218 -157
package/src/tools/browser/__tests__/jit-auth.test.ts +83 -99
package/src/tools/terminal/safe-env.ts +7 -0

package/src/__tests__/agent-loop.test.ts CHANGED Viewed

@@ -1,7 +1,11 @@
-import { describe, expect,test } from 'bun:test';
+import { describe, expect, test } from "bun:test";
-import type { AgentEvent, CheckpointDecision,CheckpointInfo } from '../agent/loop.js';
-import { AgentLoop } from '../agent/loop.js';
+import type {
+  AgentEvent,
+  CheckpointDecision,
+  CheckpointInfo,
+} from "../agent/loop.js";
+import { AgentLoop } from "../agent/loop.js";
 import type {
   ContentBlock,
   Message,
@@ -9,21 +13,30 @@ import type {
   ProviderResponse,
   SendMessageOptions,
   ToolDefinition,
-} from '../providers/types.js';
+} from "../providers/types.js";
 // ---------------------------------------------------------------------------
 // Helpers
 // ---------------------------------------------------------------------------
 /** A mock provider that returns pre-configured responses in sequence. */
-function createMockProvider(
-  responses: ProviderResponse[],
-): { provider: Provider; calls: { messages: Message[]; tools?: ToolDefinition[]; systemPrompt?: string }[] } {
-  const calls: { messages: Message[]; tools?: ToolDefinition[]; systemPrompt?: string }[] = [];
+function createMockProvider(responses: ProviderResponse[]): {
+  provider: Provider;
+  calls: {
+    messages: Message[];
+    tools?: ToolDefinition[];
+    systemPrompt?: string;
+  }[];
+} {
+  const calls: {
+    messages: Message[];
+    tools?: ToolDefinition[];
+    systemPrompt?: string;
+  }[] = [];
   let callIndex = 0;
   const provider: Provider = {
-    name: 'mock',
+    name: "mock",
     async sendMessage(
       messages: Message[],
       tools?: ToolDefinition[],
@@ -37,8 +50,8 @@ function createMockProvider(
       // Emit streaming events if the response has text blocks
       if (options?.onEvent) {
         for (const block of response.content) {
-          if (block.type === 'text') {
-            options.onEvent({ type: 'text_delta', text: block.text });
+          if (block.type === "text") {
+            options.onEvent({ type: "text_delta", text: block.text });
           }
         }
       }
@@ -52,29 +65,37 @@ function createMockProvider(
 function textResponse(text: string): ProviderResponse {
   return {
-    content: [{ type: 'text', text }],
-    model: 'mock-model',
+    content: [{ type: "text", text }],
+    model: "mock-model",
     usage: { inputTokens: 10, outputTokens: 5 },
-    stopReason: 'end_turn',
+    stopReason: "end_turn",
   };
 }
-function toolUseResponse(id: string, name: string, input: Record<string, unknown>): ProviderResponse {
+function toolUseResponse(
+  id: string,
+  name: string,
+  input: Record<string, unknown>,
+): ProviderResponse {
   return {
-    content: [{ type: 'tool_use', id, name, input }],
-    model: 'mock-model',
+    content: [{ type: "tool_use", id, name, input }],
+    model: "mock-model",
     usage: { inputTokens: 10, outputTokens: 5 },
-    stopReason: 'tool_use',
+    stopReason: "tool_use",
   };
 }
 const dummyTools: ToolDefinition[] = [
-  { name: 'read_file', description: 'Read a file', input_schema: { type: 'object', properties: { path: { type: 'string' } } } },
+  {
+    name: "read_file",
+    description: "Read a file",
+    input_schema: { type: "object", properties: { path: { type: "string" } } },
+  },
 ];
 const userMessage: Message = {
-  role: 'user',
-  content: [{ type: 'text', text: 'Hello' }],
+  role: "user",
+  content: [{ type: "text", text: "Hello" }],
 };
 function collectEvents(events: AgentEvent[]): (event: AgentEvent) => void {
@@ -85,11 +106,11 @@ function collectEvents(events: AgentEvent[]): (event: AgentEvent) => void {
 // Tests
 // ---------------------------------------------------------------------------
-describe('AgentLoop', () => {
+describe("AgentLoop", () => {
   // 1. Basic text response
-  test('returns history with assistant message for simple text response', async () => {
-    const { provider } = createMockProvider([textResponse('Hi there!')]);
-    const loop = new AgentLoop(provider, 'system prompt');
+  test("returns history with assistant message for simple text response", async () => {
+    const { provider } = createMockProvider([textResponse("Hi there!")]);
+    const loop = new AgentLoop(provider, "system prompt");
     const events: AgentEvent[] = [];
     const history = await loop.run([userMessage], collectEvents(events));
@@ -97,32 +118,41 @@ describe('AgentLoop', () => {
     // History should contain original user message + assistant response
     expect(history).toHaveLength(2);
     expect(history[0]).toEqual(userMessage);
-    expect(history[1].role).toBe('assistant');
-    expect(history[1].content).toEqual([{ type: 'text', text: 'Hi there!' }]);
+    expect(history[1].role).toBe("assistant");
+    expect(history[1].content).toEqual([{ type: "text", text: "Hi there!" }]);
   });
   // 2. Tool execution — provider returns tool_use, verify tool executor is called
-  test('executes tool and passes result back to provider', async () => {
-    const toolCallId = 'tool-1';
+  test("executes tool and passes result back to provider", async () => {
+    const toolCallId = "tool-1";
     const { provider, calls } = createMockProvider([
-      toolUseResponse(toolCallId, 'read_file', { path: '/tmp/test.txt' }),
-      textResponse('File contents received.'),
+      toolUseResponse(toolCallId, "read_file", { path: "/tmp/test.txt" }),
+      textResponse("File contents received."),
     ]);
     const toolCalls: { name: string; input: Record<string, unknown> }[] = [];
-    const toolExecutor = async (name: string, input: Record<string, unknown>) => {
+    const toolExecutor = async (
+      name: string,
+      input: Record<string, unknown>,
+    ) => {
       toolCalls.push({ name, input });
-      return { content: 'file data here', isError: false };
+      return { content: "file data here", isError: false };
     };
-    const loop = new AgentLoop(provider, 'system', {}, dummyTools, toolExecutor);
+    const loop = new AgentLoop(
+      provider,
+      "system",
+      {},
+      dummyTools,
+      toolExecutor,
+    );
     const events: AgentEvent[] = [];
     const history = await loop.run([userMessage], collectEvents(events));
     // Tool executor was called with correct args
     expect(toolCalls).toHaveLength(1);
-    expect(toolCalls[0].name).toBe('read_file');
-    expect(toolCalls[0].input).toEqual({ path: '/tmp/test.txt' });
+    expect(toolCalls[0].name).toBe("read_file");
+    expect(toolCalls[0].input).toEqual({ path: "/tmp/test.txt" });
     // Provider was called twice (initial + after tool result)
     expect(calls).toHaveLength(2);
@@ -130,35 +160,50 @@ describe('AgentLoop', () => {
     // Second call should include the tool result as a user message
     const secondCallMessages = calls[1].messages;
     const lastMsg = secondCallMessages[secondCallMessages.length - 1];
-    expect(lastMsg.role).toBe('user');
+    expect(lastMsg.role).toBe("user");
     const toolResultBlock = lastMsg.content.find(
-      (b): b is Extract<ContentBlock, { type: 'tool_result' }> => b.type === 'tool_result',
+      (b): b is Extract<ContentBlock, { type: "tool_result" }> =>
+        b.type === "tool_result",
     );
     expect(toolResultBlock).toBeDefined();
     expect(toolResultBlock!.tool_use_id).toBe(toolCallId);
-    expect(toolResultBlock!.content).toBe('file data here');
+    expect(toolResultBlock!.content).toBe("file data here");
     expect(toolResultBlock!.is_error).toBe(false);
     // Final history: user, assistant(tool_use), user(tool_result), assistant(text)
     expect(history).toHaveLength(4);
-    expect(history[3].role).toBe('assistant');
-    expect(history[3].content).toEqual([{ type: 'text', text: 'File contents received.' }]);
+    expect(history[3].role).toBe("assistant");
+    expect(history[3].content).toEqual([
+      { type: "text", text: "File contents received." },
+    ]);
   });
   // 3. Multi-turn tool loop
-  test('supports multi-turn tool execution', async () => {
+  test("supports multi-turn tool execution", async () => {
     const { provider, calls } = createMockProvider([
-      toolUseResponse('t1', 'read_file', { path: '/a.txt' }),
-      toolUseResponse('t2', 'read_file', { path: '/b.txt' }),
-      textResponse('Done reading both files.'),
+      toolUseResponse("t1", "read_file", { path: "/a.txt" }),
+      toolUseResponse("t2", "read_file", { path: "/b.txt" }),
+      textResponse("Done reading both files."),
     ]);
-    const toolExecutor = async (name: string, input: Record<string, unknown>) => {
-      return { content: `contents of ${(input as { path: string }).path}`, isError: false };
+    const toolExecutor = async (
+      name: string,
+      input: Record<string, unknown>,
+    ) => {
+      return {
+        content: `contents of ${(input as { path: string }).path}`,
+        isError: false,
+      };
     };
-    const loop = new AgentLoop(provider, 'system', {}, dummyTools, toolExecutor);
+    const loop = new AgentLoop(
+      provider,
+      "system",
+      {},
+      dummyTools,
+      toolExecutor,
+    );
     const history = await loop.run([userMessage], () => {});
     // Provider called 3 times (two tool rounds + final text)
@@ -166,35 +211,37 @@ describe('AgentLoop', () => {
     // History: user, assistant(t1), user(result1), assistant(t2), user(result2), assistant(text)
     expect(history).toHaveLength(6);
-    expect(history[5].content).toEqual([{ type: 'text', text: 'Done reading both files.' }]);
+    expect(history[5].content).toEqual([
+      { type: "text", text: "Done reading both files." },
+    ]);
   });
   // 4. Loop stops when provider returns tool_use but no executor is configured
-  test('stops when tool_use returned but no tool executor configured', async () => {
+  test("stops when tool_use returned but no tool executor configured", async () => {
     const { provider } = createMockProvider([
-      toolUseResponse('t1', 'read_file', { path: '/a.txt' }),
+      toolUseResponse("t1", "read_file", { path: "/a.txt" }),
     ]);
     // No tool executor provided
-    const loop = new AgentLoop(provider, 'system', {}, dummyTools);
+    const loop = new AgentLoop(provider, "system", {}, dummyTools);
     const history = await loop.run([userMessage], () => {});
     // Should stop after first response (no executor to handle tool use)
     expect(history).toHaveLength(2);
-    expect(history[1].role).toBe('assistant');
+    expect(history[1].role).toBe("assistant");
   });
   // 5. Error handling — provider throws, verify error event and loop stops
-  test('emits error event and stops when provider throws', async () => {
-    const error = new Error('API rate limit exceeded');
+  test("emits error event and stops when provider throws", async () => {
+    const error = new Error("API rate limit exceeded");
     const provider: Provider = {
-      name: 'mock',
+      name: "mock",
       async sendMessage(): Promise<ProviderResponse> {
         throw error;
       },
     };
-    const loop = new AgentLoop(provider, 'system');
+    const loop = new AgentLoop(provider, "system");
     const events: AgentEvent[] = [];
     const history = await loop.run([userMessage], collectEvents(events));
@@ -202,32 +249,34 @@ describe('AgentLoop', () => {
     expect(history).toHaveLength(1);
     // Error event was emitted
-    const errorEvents = events.filter((e) => e.type === 'error');
+    const errorEvents = events.filter((e) => e.type === "error");
     expect(errorEvents).toHaveLength(1);
-    expect((errorEvents[0] as { type: 'error'; error: Error }).error.message).toBe('API rate limit exceeded');
+    expect(
+      (errorEvents[0] as { type: "error"; error: Error }).error.message,
+    ).toBe("API rate limit exceeded");
   });
   // 6. Abort signal — verify the loop respects AbortSignal
-  test('stops when abort signal is triggered before provider call', async () => {
+  test("stops when abort signal is triggered before provider call", async () => {
     const controller = new AbortController();
     controller.abort(); // abort immediately
-    const { provider } = createMockProvider([textResponse('Should not reach')]);
-    const loop = new AgentLoop(provider, 'system');
+    const { provider } = createMockProvider([textResponse("Should not reach")]);
+    const loop = new AgentLoop(provider, "system");
     const history = await loop.run([userMessage], () => {}, controller.signal);
     // Loop should exit immediately, returning only original messages
     expect(history).toHaveLength(1);
   });
-  test('stops when abort signal is triggered between turns', async () => {
+  test("stops when abort signal is triggered between turns", async () => {
     const controller = new AbortController();
     let turnCount = 0;
     const { provider } = createMockProvider([
-      toolUseResponse('t1', 'read_file', { path: '/a.txt' }),
-      toolUseResponse('t2', 'read_file', { path: '/b.txt' }),
-      textResponse('Should not reach'),
+      toolUseResponse("t1", "read_file", { path: "/a.txt" }),
+      toolUseResponse("t2", "read_file", { path: "/b.txt" }),
+      textResponse("Should not reach"),
     ]);
     const toolExecutor = async () => {
@@ -236,10 +285,16 @@ describe('AgentLoop', () => {
         // Abort after the first tool turn completes
         controller.abort();
       }
-      return { content: 'data', isError: false };
+      return { content: "data", isError: false };
     };
-    const loop = new AgentLoop(provider, 'system', {}, dummyTools, toolExecutor);
+    const loop = new AgentLoop(
+      provider,
+      "system",
+      {},
+      dummyTools,
+      toolExecutor,
+    );
     const history = await loop.run([userMessage], () => {}, controller.signal);
     // After the first tool turn, abort fires. The while loop checks signal at the
@@ -250,20 +305,24 @@ describe('AgentLoop', () => {
     expect(history.length).toBeLessThanOrEqual(4);
     // Verify the loop didn't reach the final text response
-    const lastAssistant = [...history].reverse().find(m => m.role === 'assistant');
+    const lastAssistant = [...history]
+      .reverse()
+      .find((m) => m.role === "assistant");
     expect(lastAssistant).toBeDefined();
-    const hasToolUse = lastAssistant!.content.some(b => b.type === 'tool_use');
+    const hasToolUse = lastAssistant!.content.some(
+      (b) => b.type === "tool_use",
+    );
     // The last assistant message should be a tool_use, not the final text
     expect(hasToolUse).toBe(true);
   });
   // 6b. Abort signal during long-running tool execution — loop exits immediately
-  test('stops immediately when abort fires during a stuck tool execution', async () => {
+  test("stops immediately when abort fires during a stuck tool execution", async () => {
     const controller = new AbortController();
     const { provider } = createMockProvider([
-      toolUseResponse('t1', 'read_file', { path: '/stuck.txt' }),
-      textResponse('Should not reach'),
+      toolUseResponse("t1", "read_file", { path: "/stuck.txt" }),
+      textResponse("Should not reach"),
     ]);
     // Simulate a stuck tool that never resolves — abort fires while it's running
@@ -271,11 +330,17 @@ describe('AgentLoop', () => {
       // Abort from a timer while this tool is "stuck"
       setTimeout(() => controller.abort(), 50);
       // Simulate being stuck for a long time
-      await new Promise(resolve => setTimeout(resolve, 10_000));
-      return { content: 'should never return', isError: false };
+      await new Promise((resolve) => setTimeout(resolve, 10_000));
+      return { content: "should never return", isError: false };
     };
-    const loop = new AgentLoop(provider, 'system', {}, dummyTools, toolExecutor);
+    const loop = new AgentLoop(
+      provider,
+      "system",
+      {},
+      dummyTools,
+      toolExecutor,
+    );
     const start = Date.now();
     const history = await loop.run([userMessage], () => {}, controller.signal);
     const elapsed = Date.now() - start;
@@ -286,96 +351,142 @@ describe('AgentLoop', () => {
     // User message + assistant tool_use + synthesized cancellation tool_result
     expect(history).toHaveLength(3);
     const lastMsg = history[2];
-    expect(lastMsg.role).toBe('user');
+    expect(lastMsg.role).toBe("user");
     expect(lastMsg.content).toHaveLength(1);
-    expect(lastMsg.content[0].type).toBe('tool_result');
-    expect((lastMsg.content[0] as { type: 'tool_result'; tool_use_id: string; content: string; is_error: boolean }).content).toBe('Cancelled by user');
-    expect((lastMsg.content[0] as { type: 'tool_result'; tool_use_id: string; content: string; is_error: boolean }).is_error).toBe(true);
+    expect(lastMsg.content[0].type).toBe("tool_result");
+    expect(
+      (
+        lastMsg.content[0] as {
+          type: "tool_result";
+          tool_use_id: string;
+          content: string;
+          is_error: boolean;
+        }
+      ).content,
+    ).toBe("Cancelled by user");
+    expect(
+      (
+        lastMsg.content[0] as {
+          type: "tool_result";
+          tool_use_id: string;
+          content: string;
+          is_error: boolean;
+        }
+      ).is_error,
+    ).toBe(true);
   });
   // 7. Events — verify text_delta and other events are emitted
-  test('emits text_delta events during streaming', async () => {
-    const { provider } = createMockProvider([textResponse('Hello world')]);
-    const loop = new AgentLoop(provider, 'system');
+  test("emits text_delta events during streaming", async () => {
+    const { provider } = createMockProvider([textResponse("Hello world")]);
+    const loop = new AgentLoop(provider, "system");
     const events: AgentEvent[] = [];
     await loop.run([userMessage], collectEvents(events));
-    const textDeltas = events.filter((e) => e.type === 'text_delta');
+    const textDeltas = events.filter((e) => e.type === "text_delta");
     expect(textDeltas).toHaveLength(1);
-    expect((textDeltas[0] as { type: 'text_delta'; text: string }).text).toBe('Hello world');
+    expect((textDeltas[0] as { type: "text_delta"; text: string }).text).toBe(
+      "Hello world",
+    );
   });
-  test('emits usage events', async () => {
-    const { provider } = createMockProvider([textResponse('Hi')]);
-    const loop = new AgentLoop(provider, 'system');
+  test("emits usage events", async () => {
+    const { provider } = createMockProvider([textResponse("Hi")]);
+    const loop = new AgentLoop(provider, "system");
     const events: AgentEvent[] = [];
     await loop.run([userMessage], collectEvents(events));
-    const usageEvents = events.filter((e) => e.type === 'usage');
+    const usageEvents = events.filter((e) => e.type === "usage");
     expect(usageEvents).toHaveLength(1);
-    const usage = usageEvents[0] as Extract<AgentEvent, { type: 'usage' }>;
-    expect(usage.type).toBe('usage');
+    const usage = usageEvents[0] as Extract<AgentEvent, { type: "usage" }>;
+    expect(usage.type).toBe("usage");
     expect(usage.inputTokens).toBe(10);
     expect(usage.outputTokens).toBe(5);
-    expect(usage.model).toBe('mock-model');
-    expect(typeof usage.providerDurationMs).toBe('number');
+    expect(usage.model).toBe("mock-model");
+    expect(typeof usage.providerDurationMs).toBe("number");
     expect(usage.providerDurationMs).toBeGreaterThanOrEqual(0);
   });
-  test('emits message_complete events', async () => {
-    const { provider } = createMockProvider([textResponse('Done')]);
-    const loop = new AgentLoop(provider, 'system');
+  test("emits message_complete events", async () => {
+    const { provider } = createMockProvider([textResponse("Done")]);
+    const loop = new AgentLoop(provider, "system");
     const events: AgentEvent[] = [];
     await loop.run([userMessage], collectEvents(events));
-    const completeEvents = events.filter((e) => e.type === 'message_complete');
+    const completeEvents = events.filter((e) => e.type === "message_complete");
     expect(completeEvents).toHaveLength(1);
-    expect((completeEvents[0] as { type: 'message_complete'; message: Message }).message.role).toBe('assistant');
+    expect(
+      (completeEvents[0] as { type: "message_complete"; message: Message })
+        .message.role,
+    ).toBe("assistant");
   });
-  test('emits tool_use and tool_result events during tool execution', async () => {
+  test("emits tool_use and tool_result events during tool execution", async () => {
     const { provider } = createMockProvider([
-      toolUseResponse('t1', 'read_file', { path: '/test.txt' }),
-      textResponse('Done'),
+      toolUseResponse("t1", "read_file", { path: "/test.txt" }),
+      textResponse("Done"),
     ]);
-    const toolExecutor = async () => ({ content: 'file data', isError: false });
-    const loop = new AgentLoop(provider, 'system', {}, dummyTools, toolExecutor);
+    const toolExecutor = async () => ({ content: "file data", isError: false });
+    const loop = new AgentLoop(
+      provider,
+      "system",
+      {},
+      dummyTools,
+      toolExecutor,
+    );
     const events: AgentEvent[] = [];
     await loop.run([userMessage], collectEvents(events));
-    const toolUseEvents = events.filter((e) => e.type === 'tool_use');
+    const toolUseEvents = events.filter((e) => e.type === "tool_use");
     expect(toolUseEvents).toHaveLength(1);
     expect(toolUseEvents[0]).toEqual({
-      type: 'tool_use',
-      id: 't1',
-      name: 'read_file',
-      input: { path: '/test.txt' },
+      type: "tool_use",
+      id: "t1",
+      name: "read_file",
+      input: { path: "/test.txt" },
     });
-    const toolResultEvents = events.filter((e) => e.type === 'tool_result');
+    const toolResultEvents = events.filter((e) => e.type === "tool_result");
     expect(toolResultEvents).toHaveLength(1);
-    expect((toolResultEvents[0] as Extract<AgentEvent, { type: 'tool_result' }>).toolUseId).toBe('t1');
-    expect((toolResultEvents[0] as Extract<AgentEvent, { type: 'tool_result' }>).content).toBe('file data');
-    expect((toolResultEvents[0] as Extract<AgentEvent, { type: 'tool_result' }>).isError).toBe(false);
+    expect(
+      (toolResultEvents[0] as Extract<AgentEvent, { type: "tool_result" }>)
+        .toolUseId,
+    ).toBe("t1");
+    expect(
+      (toolResultEvents[0] as Extract<AgentEvent, { type: "tool_result" }>)
+        .content,
+    ).toBe("file data");
+    expect(
+      (toolResultEvents[0] as Extract<AgentEvent, { type: "tool_result" }>)
+        .isError,
+    ).toBe(false);
   });
   // 8. Progress reminder injection every 5 tool-use turns
-  test('injects progress reminder after every 5 tool-use turns', async () => {
+  test("injects progress reminder after every 5 tool-use turns", async () => {
     // Create 6 tool responses followed by a text response
     const responses: ProviderResponse[] = [];
     for (let i = 0; i < 6; i++) {
-      responses.push(toolUseResponse(`t${i}`, 'read_file', { path: `/file${i}.txt` }));
+      responses.push(
+        toolUseResponse(`t${i}`, "read_file", { path: `/file${i}.txt` }),
+      );
     }
-    responses.push(textResponse('Finally done'));
+    responses.push(textResponse("Finally done"));
     const { provider, calls } = createMockProvider(responses);
-    const toolExecutor = async () => ({ content: 'data', isError: false });
-    const loop = new AgentLoop(provider, 'system', {}, dummyTools, toolExecutor);
+    const toolExecutor = async () => ({ content: "data", isError: false });
+    const loop = new AgentLoop(
+      provider,
+      "system",
+      {},
+      dummyTools,
+      toolExecutor,
+    );
     await loop.run([userMessage], () => {});
@@ -383,24 +494,24 @@ describe('AgentLoop', () => {
     // calls[5] is the 6th provider call; its messages[-1] should have the reminder
     const fifthTurnResultMsg = calls[5].messages[calls[5].messages.length - 1];
     const reminderBlock = fifthTurnResultMsg.content.find(
-      (b): b is Extract<ContentBlock, { type: 'text' }> =>
-        b.type === 'text' && b.text.includes('making meaningful progress'),
+      (b): b is Extract<ContentBlock, { type: "text" }> =>
+        b.type === "text" && b.text.includes("making meaningful progress"),
     );
     expect(reminderBlock).toBeDefined();
   });
-  test('stops after configured maxToolUseTurns to prevent runaway loops', async () => {
+  test("stops after configured maxToolUseTurns to prevent runaway loops", async () => {
     const responses: ProviderResponse[] = [
-      toolUseResponse('t1', 'read_file', { path: '/one.txt' }),
-      toolUseResponse('t2', 'read_file', { path: '/two.txt' }),
-      toolUseResponse('t3', 'read_file', { path: '/three.txt' }),
-      textResponse('Should never be requested'),
+      toolUseResponse("t1", "read_file", { path: "/one.txt" }),
+      toolUseResponse("t2", "read_file", { path: "/two.txt" }),
+      toolUseResponse("t3", "read_file", { path: "/three.txt" }),
+      textResponse("Should never be requested"),
     ];
     const { provider, calls } = createMockProvider(responses);
-    const toolExecutor = async () => ({ content: 'data', isError: false });
+    const toolExecutor = async () => ({ content: "data", isError: false });
     const loop = new AgentLoop(
       provider,
-      'system',
+      "system",
       { maxToolUseTurns: 3 },
       dummyTools,
       toolExecutor,
@@ -413,32 +524,36 @@ describe('AgentLoop', () => {
     expect(calls).toHaveLength(3);
     const errorEvents = events.filter(
-      (e): e is Extract<AgentEvent, { type: 'error' }> => e.type === 'error',
+      (e): e is Extract<AgentEvent, { type: "error" }> => e.type === "error",
     );
     expect(errorEvents).toHaveLength(1);
-    expect(errorEvents[0].error.message).toContain('Tool-use turn limit reached (3)');
+    expect(errorEvents[0].error.message).toContain(
+      "Tool-use turn limit reached (3)",
+    );
     const lastMessage = history[history.length - 1];
-    expect(lastMessage.role).toBe('user');
+    expect(lastMessage.role).toBe("user");
     const limitText = lastMessage.content.find(
-      (b): b is Extract<ContentBlock, { type: 'text' }> =>
-        b.type === 'text' && b.text.includes('Tool-use turn limit reached (3)'),
+      (b): b is Extract<ContentBlock, { type: "text" }> =>
+        b.type === "text" && b.text.includes("Tool-use turn limit reached (3)"),
     );
     expect(limitText).toBeDefined();
   });
-  test('injects approaching-limit warning before the hard stop', async () => {
+  test("injects approaching-limit warning before the hard stop", async () => {
     // maxToolUseTurns: 8, soft warning at turn 3 (8 - 5 = 3)
     const responses: ProviderResponse[] = [];
     for (let i = 0; i < 8; i++) {
-      responses.push(toolUseResponse(`t${i}`, 'read_file', { path: `/${i}.txt` }));
+      responses.push(
+        toolUseResponse(`t${i}`, "read_file", { path: `/${i}.txt` }),
+      );
     }
-    responses.push(textResponse('done'));
+    responses.push(textResponse("done"));
     const { provider, calls } = createMockProvider(responses);
-    const toolExecutor = async () => ({ content: 'data', isError: false });
+    const toolExecutor = async () => ({ content: "data", isError: false });
     const loop = new AgentLoop(
       provider,
-      'system',
+      "system",
       { maxToolUseTurns: 8 },
       dummyTools,
       toolExecutor,
@@ -455,25 +570,28 @@ describe('AgentLoop', () => {
     const turn4Messages = calls[3].messages;
     const lastMsg = turn4Messages[turn4Messages.length - 1];
     const warningBlock = lastMsg.content.find(
-      (b): b is Extract<ContentBlock, { type: 'text' }> =>
-        b.type === 'text' && b.text.includes('approaching the tool-use turn limit'),
+      (b): b is Extract<ContentBlock, { type: "text" }> =>
+        b.type === "text" &&
+        b.text.includes("approaching the tool-use turn limit"),
     );
     expect(warningBlock).toBeDefined();
   });
-  test('runs without limit when maxToolUseTurns is 0', async () => {
+  test("runs without limit when maxToolUseTurns is 0", async () => {
     // Use 20 turns (beyond old default of 8 used in other tests) to verify no cap
     const turnCount = 20;
     const responses: ProviderResponse[] = [];
     for (let i = 0; i < turnCount; i++) {
-      responses.push(toolUseResponse(`t${i}`, 'read_file', { path: `/${i}.txt` }));
+      responses.push(
+        toolUseResponse(`t${i}`, "read_file", { path: `/${i}.txt` }),
+      );
     }
-    responses.push(textResponse('done'));
+    responses.push(textResponse("done"));
     const { provider, calls } = createMockProvider(responses);
-    const toolExecutor = async () => ({ content: 'data', isError: false });
+    const toolExecutor = async () => ({ content: "data", isError: false });
     const loop = new AgentLoop(
       provider,
-      'system',
+      "system",
       { maxToolUseTurns: 0, minTurnIntervalMs: 0 },
       dummyTools,
       toolExecutor,
@@ -487,7 +605,7 @@ describe('AgentLoop', () => {
     // No hard-limit error events should have been emitted
     const errorEvents = events.filter(
-      (e): e is Extract<AgentEvent, { type: 'error' }> => e.type === 'error',
+      (e): e is Extract<AgentEvent, { type: "error" }> => e.type === "error",
     );
     expect(errorEvents).toHaveLength(0);
@@ -495,8 +613,8 @@ describe('AgentLoop', () => {
     const progressChecks = calls.filter((call) => {
       const lastMsg = call.messages[call.messages.length - 1];
       return lastMsg.content.some(
-        (b): b is Extract<ContentBlock, { type: 'text' }> =>
-          b.type === 'text' && b.text.includes('making meaningful progress'),
+        (b): b is Extract<ContentBlock, { type: "text" }> =>
+          b.type === "text" && b.text.includes("making meaningful progress"),
       );
     });
     expect(progressChecks.length).toBeGreaterThanOrEqual(3);
@@ -505,40 +623,51 @@ describe('AgentLoop', () => {
     const limitWarnings = calls.filter((call) => {
       const lastMsg = call.messages[call.messages.length - 1];
       return lastMsg.content.some(
-        (b): b is Extract<ContentBlock, { type: 'text' }> =>
-          b.type === 'text' && b.text.includes('approaching the tool-use turn limit'),
+        (b): b is Extract<ContentBlock, { type: "text" }> =>
+          b.type === "text" &&
+          b.text.includes("approaching the tool-use turn limit"),
       );
     });
     expect(limitWarnings).toHaveLength(0);
   });
   // 9. Tool executor error results are forwarded correctly
-  test('forwards tool error results to provider', async () => {
+  test("forwards tool error results to provider", async () => {
     const { provider, calls } = createMockProvider([
-      toolUseResponse('t1', 'read_file', { path: '/nonexistent.txt' }),
-      textResponse('File not found, sorry.'),
+      toolUseResponse("t1", "read_file", { path: "/nonexistent.txt" }),
+      textResponse("File not found, sorry."),
     ]);
-    const toolExecutor = async () => ({ content: 'ENOENT: file not found', isError: true });
-    const loop = new AgentLoop(provider, 'system', {}, dummyTools, toolExecutor);
+    const toolExecutor = async () => ({
+      content: "ENOENT: file not found",
+      isError: true,
+    });
+    const loop = new AgentLoop(
+      provider,
+      "system",
+      {},
+      dummyTools,
+      toolExecutor,
+    );
     await loop.run([userMessage], () => {});
     const secondCallMessages = calls[1].messages;
     const lastMsg = secondCallMessages[secondCallMessages.length - 1];
     const toolResultBlock = lastMsg.content.find(
-      (b): b is Extract<ContentBlock, { type: 'tool_result' }> => b.type === 'tool_result',
+      (b): b is Extract<ContentBlock, { type: "tool_result" }> =>
+        b.type === "tool_result",
     );
     expect(toolResultBlock).toBeDefined();
     expect(toolResultBlock!.is_error).toBe(true);
-    expect(toolResultBlock!.content).toBe('ENOENT: file not found');
+    expect(toolResultBlock!.content).toBe("ENOENT: file not found");
   });
   // 10. Tool output chunks are forwarded via onEvent
-  test('emits tool_output_chunk events during tool execution', async () => {
+  test("emits tool_output_chunk events during tool execution", async () => {
     const { provider } = createMockProvider([
-      toolUseResponse('t1', 'read_file', { path: '/test.txt' }),
-      textResponse('Done'),
+      toolUseResponse("t1", "read_file", { path: "/test.txt" }),
+      textResponse("Done"),
     ]);
     const toolExecutor = async (
@@ -546,36 +675,48 @@ describe('AgentLoop', () => {
       _input: Record<string, unknown>,
       onOutput?: (chunk: string) => void,
     ) => {
-      onOutput?.('chunk1');
-      onOutput?.('chunk2');
-      return { content: 'full output', isError: false };
+      onOutput?.("chunk1");
+      onOutput?.("chunk2");
+      return { content: "full output", isError: false };
     };
-    const loop = new AgentLoop(provider, 'system', {}, dummyTools, toolExecutor);
+    const loop = new AgentLoop(
+      provider,
+      "system",
+      {},
+      dummyTools,
+      toolExecutor,
+    );
     const events: AgentEvent[] = [];
     await loop.run([userMessage], collectEvents(events));
-    const chunkEvents = events.filter((e) => e.type === 'tool_output_chunk');
+    const chunkEvents = events.filter((e) => e.type === "tool_output_chunk");
     expect(chunkEvents).toHaveLength(2);
-    expect((chunkEvents[0] as Extract<AgentEvent, { type: 'tool_output_chunk' }>).chunk).toBe('chunk1');
-    expect((chunkEvents[1] as Extract<AgentEvent, { type: 'tool_output_chunk' }>).chunk).toBe('chunk2');
+    expect(
+      (chunkEvents[0] as Extract<AgentEvent, { type: "tool_output_chunk" }>)
+        .chunk,
+    ).toBe("chunk1");
+    expect(
+      (chunkEvents[1] as Extract<AgentEvent, { type: "tool_output_chunk" }>)
+        .chunk,
+    ).toBe("chunk2");
   });
   // 11. System prompt and tools are passed to provider
-  test('passes system prompt and tools to provider', async () => {
-    const { provider, calls } = createMockProvider([textResponse('Hi')]);
-    const loop = new AgentLoop(provider, 'My system prompt', {}, dummyTools);
+  test("passes system prompt and tools to provider", async () => {
+    const { provider, calls } = createMockProvider([textResponse("Hi")]);
+    const loop = new AgentLoop(provider, "My system prompt", {}, dummyTools);
     await loop.run([userMessage], () => {});
-    expect(calls[0].systemPrompt).toBe('My system prompt');
+    expect(calls[0].systemPrompt).toBe("My system prompt");
     expect(calls[0].tools).toEqual(dummyTools);
   });
   // 12. No tools configured — tools are not passed to provider
-  test('does not pass tools to provider when none are configured', async () => {
-    const { provider, calls } = createMockProvider([textResponse('Hi')]);
-    const loop = new AgentLoop(provider, 'system');
+  test("does not pass tools to provider when none are configured", async () => {
+    const { provider, calls } = createMockProvider([textResponse("Hi")]);
+    const loop = new AgentLoop(provider, "system");
     await loop.run([userMessage], () => {});
@@ -583,33 +724,60 @@ describe('AgentLoop', () => {
   });
   // 13. Parallel tool execution — multiple tool_use blocks in a single response
-  test('executes multiple tools in parallel', async () => {
+  test("executes multiple tools in parallel", async () => {
     const { provider, calls } = createMockProvider([
       // Provider returns 3 tool_use blocks in a single response
       {
         content: [
-          { type: 'tool_use' as const, id: 't1', name: 'read_file', input: { path: '/a.txt' } },
-          { type: 'tool_use' as const, id: 't2', name: 'read_file', input: { path: '/b.txt' } },
-          { type: 'tool_use' as const, id: 't3', name: 'read_file', input: { path: '/c.txt' } },
+          {
+            type: "tool_use" as const,
+            id: "t1",
+            name: "read_file",
+            input: { path: "/a.txt" },
+          },
+          {
+            type: "tool_use" as const,
+            id: "t2",
+            name: "read_file",
+            input: { path: "/b.txt" },
+          },
+          {
+            type: "tool_use" as const,
+            id: "t3",
+            name: "read_file",
+            input: { path: "/c.txt" },
+          },
         ],
-        model: 'mock-model',
+        model: "mock-model",
         usage: { inputTokens: 10, outputTokens: 5 },
-        stopReason: 'tool_use' as const,
+        stopReason: "tool_use" as const,
       },
-      textResponse('Got all three files.'),
+      textResponse("Got all three files."),
     ]);
     const executionLog: { path: string; start: number; end: number }[] = [];
-    const toolExecutor = async (_name: string, input: Record<string, unknown>) => {
+    const toolExecutor = async (
+      _name: string,
+      input: Record<string, unknown>,
+    ) => {
       const start = Date.now();
       // Simulate async work — all tools should overlap in time
-      await new Promise(resolve => setTimeout(resolve, 50));
+      await new Promise((resolve) => setTimeout(resolve, 50));
       const end = Date.now();
       executionLog.push({ path: (input as { path: string }).path, start, end });
-      return { content: `contents of ${(input as { path: string }).path}`, isError: false };
+      return {
+        content: `contents of ${(input as { path: string }).path}`,
+        isError: false,
+      };
     };
-    const loop = new AgentLoop(provider, 'system', {}, dummyTools, toolExecutor);
+    const loop = new AgentLoop(
+      provider,
+      "system",
+      {},
+      dummyTools,
+      toolExecutor,
+    );
     const events: AgentEvent[] = [];
     const history = await loop.run([userMessage], collectEvents(events));
@@ -618,8 +786,8 @@ describe('AgentLoop', () => {
     // Verify parallel execution: all tools should start before any finishes
     // (with 50ms delay each, sequential would take 150ms+, parallel ~50ms)
-    const allStarts = executionLog.map(e => e.start);
-    const allEnds = executionLog.map(e => e.end);
+    const allStarts = executionLog.map((e) => e.start);
+    const allEnds = executionLog.map((e) => e.end);
     const firstEnd = Math.min(...allEnds);
     const lastStart = Math.max(...allStarts);
     // In parallel execution, the last tool starts before the first tool ends
@@ -632,19 +800,21 @@ describe('AgentLoop', () => {
     const secondCallMessages = calls[1].messages;
     const lastMsg = secondCallMessages[secondCallMessages.length - 1];
     const toolResultBlocks = lastMsg.content.filter(
-      (b): b is Extract<ContentBlock, { type: 'tool_result' }> => b.type === 'tool_result',
+      (b): b is Extract<ContentBlock, { type: "tool_result" }> =>
+        b.type === "tool_result",
     );
     expect(toolResultBlocks).toHaveLength(3);
-    expect(toolResultBlocks[0].tool_use_id).toBe('t1');
-    expect(toolResultBlocks[1].tool_use_id).toBe('t2');
-    expect(toolResultBlocks[2].tool_use_id).toBe('t3');
+    expect(toolResultBlocks[0].tool_use_id).toBe("t1");
+    expect(toolResultBlocks[1].tool_use_id).toBe("t2");
+    expect(toolResultBlocks[2].tool_use_id).toBe("t3");
     // All tool_use events should be emitted before any tool_result events
     let lastToolUseIdx = -1;
     let firstToolResultIdx = events.length;
     events.forEach((e, i) => {
-      if (e.type === 'tool_use') lastToolUseIdx = i;
-      if (e.type === 'tool_result' && i < firstToolResultIdx) firstToolResultIdx = i;
+      if (e.type === "tool_use") lastToolUseIdx = i;
+      if (e.type === "tool_result" && i < firstToolResultIdx)
+        firstToolResultIdx = i;
     });
     expect(lastToolUseIdx).toBeLessThan(firstToolResultIdx);
@@ -653,96 +823,151 @@ describe('AgentLoop', () => {
   });
   // 14. Abort before parallel tool execution synthesizes cancelled results
-  test('synthesizes cancelled results when aborted before tool execution', async () => {
+  test("synthesizes cancelled results when aborted before tool execution", async () => {
     const controller = new AbortController();
     const { provider } = createMockProvider([
       {
         content: [
-          { type: 'tool_use' as const, id: 't1', name: 'read_file', input: { path: '/a.txt' } },
-          { type: 'tool_use' as const, id: 't2', name: 'read_file', input: { path: '/b.txt' } },
+          {
+            type: "tool_use" as const,
+            id: "t1",
+            name: "read_file",
+            input: { path: "/a.txt" },
+          },
+          {
+            type: "tool_use" as const,
+            id: "t2",
+            name: "read_file",
+            input: { path: "/b.txt" },
+          },
         ],
-        model: 'mock-model',
+        model: "mock-model",
         usage: { inputTokens: 10, outputTokens: 5 },
-        stopReason: 'tool_use' as const,
+        stopReason: "tool_use" as const,
       },
     ]);
     // Abort during the provider call so the signal is already aborted
     // before tool execution begins
     const originalSendMessage = provider.sendMessage.bind(provider);
-    provider.sendMessage = async (...args: Parameters<typeof provider.sendMessage>) => {
+    provider.sendMessage = async (
+      ...args: Parameters<typeof provider.sendMessage>
+    ) => {
       const result = await originalSendMessage(...args);
       controller.abort();
       return result;
     };
     const toolCalls: string[] = [];
-    const toolExecutor = async (_name: string, input: Record<string, unknown>) => {
+    const toolExecutor = async (
+      _name: string,
+      input: Record<string, unknown>,
+    ) => {
       toolCalls.push((input as { path: string }).path);
-      return { content: 'data', isError: false };
+      return { content: "data", isError: false };
     };
-    const loop = new AgentLoop(provider, 'system', {}, dummyTools, toolExecutor);
+    const loop = new AgentLoop(
+      provider,
+      "system",
+      {},
+      dummyTools,
+      toolExecutor,
+    );
     const events: AgentEvent[] = [];
-    const history = await loop.run([userMessage], collectEvents(events), controller.signal);
+    const history = await loop.run(
+      [userMessage],
+      collectEvents(events),
+      controller.signal,
+    );
     // No tools should have been executed
     expect(toolCalls).toHaveLength(0);
     // History should contain cancelled tool_result blocks
     const lastMsg = history[history.length - 1];
-    expect(lastMsg.role).toBe('user');
+    expect(lastMsg.role).toBe("user");
     const toolResultBlocks = lastMsg.content.filter(
-      (b): b is Extract<ContentBlock, { type: 'tool_result' }> => b.type === 'tool_result',
+      (b): b is Extract<ContentBlock, { type: "tool_result" }> =>
+        b.type === "tool_result",
     );
     expect(toolResultBlocks).toHaveLength(2);
-    expect(toolResultBlocks[0].tool_use_id).toBe('t1');
-    expect(toolResultBlocks[0].content).toBe('Cancelled by user');
+    expect(toolResultBlocks[0].tool_use_id).toBe("t1");
+    expect(toolResultBlocks[0].content).toBe("Cancelled by user");
     expect(toolResultBlocks[0].is_error).toBe(true);
-    expect(toolResultBlocks[1].tool_use_id).toBe('t2');
-    expect(toolResultBlocks[1].content).toBe('Cancelled by user');
+    expect(toolResultBlocks[1].tool_use_id).toBe("t2");
+    expect(toolResultBlocks[1].content).toBe("Cancelled by user");
     expect(toolResultBlocks[1].is_error).toBe(true);
   });
   // 15. Parallel tool_result events are emitted in deterministic tool_use order
-  test('emits tool_result events in tool_use order regardless of completion timing', async () => {
+  test("emits tool_result events in tool_use order regardless of completion timing", async () => {
     const { provider } = createMockProvider([
       {
         content: [
-          { type: 'tool_use' as const, id: 't1', name: 'read_file', input: { path: '/slow.txt' } },
-          { type: 'tool_use' as const, id: 't2', name: 'read_file', input: { path: '/fast.txt' } },
-          { type: 'tool_use' as const, id: 't3', name: 'read_file', input: { path: '/medium.txt' } },
+          {
+            type: "tool_use" as const,
+            id: "t1",
+            name: "read_file",
+            input: { path: "/slow.txt" },
+          },
+          {
+            type: "tool_use" as const,
+            id: "t2",
+            name: "read_file",
+            input: { path: "/fast.txt" },
+          },
+          {
+            type: "tool_use" as const,
+            id: "t3",
+            name: "read_file",
+            input: { path: "/medium.txt" },
+          },
         ],
-        model: 'mock-model',
+        model: "mock-model",
         usage: { inputTokens: 10, outputTokens: 5 },
-        stopReason: 'tool_use' as const,
+        stopReason: "tool_use" as const,
       },
-      textResponse('Done'),
+      textResponse("Done"),
     ]);
     // Tools complete in different order than they were called: t2 first, t3 second, t1 last
-    const toolExecutor = async (_name: string, input: Record<string, unknown>) => {
+    const toolExecutor = async (
+      _name: string,
+      input: Record<string, unknown>,
+    ) => {
       const path = (input as { path: string }).path;
-      const delays: Record<string, number> = { '/slow.txt': 80, '/fast.txt': 10, '/medium.txt': 40 };
-      await new Promise(resolve => setTimeout(resolve, delays[path] ?? 10));
+      const delays: Record<string, number> = {
+        "/slow.txt": 80,
+        "/fast.txt": 10,
+        "/medium.txt": 40,
+      };
+      await new Promise((resolve) => setTimeout(resolve, delays[path] ?? 10));
       return { content: `contents of ${path}`, isError: false };
     };
-    const loop = new AgentLoop(provider, 'system', {}, dummyTools, toolExecutor);
+    const loop = new AgentLoop(
+      provider,
+      "system",
+      {},
+      dummyTools,
+      toolExecutor,
+    );
     const events: AgentEvent[] = [];
     await loop.run([userMessage], collectEvents(events));
     // Collect tool_result events in order
     const toolResultEvents = events.filter(
-      (e): e is Extract<AgentEvent, { type: 'tool_result' }> => e.type === 'tool_result',
+      (e): e is Extract<AgentEvent, { type: "tool_result" }> =>
+        e.type === "tool_result",
     );
     expect(toolResultEvents).toHaveLength(3);
     // Results must be in tool_use order (t1, t2, t3), NOT completion order (t2, t3, t1)
-    expect(toolResultEvents[0].toolUseId).toBe('t1');
-    expect(toolResultEvents[1].toolUseId).toBe('t2');
-    expect(toolResultEvents[2].toolUseId).toBe('t3');
+    expect(toolResultEvents[0].toolUseId).toBe("t1");
+    expect(toolResultEvents[1].toolUseId).toBe("t2");
+    expect(toolResultEvents[2].toolUseId).toBe("t3");
   });
   // ---------------------------------------------------------------------------
@@ -750,19 +975,25 @@ describe('AgentLoop', () => {
   // ---------------------------------------------------------------------------
   // 16. Checkpoint callback is called after tool results with correct info
-  test('checkpoint callback is called after tool results with correct info', async () => {
+  test("checkpoint callback is called after tool results with correct info", async () => {
     const { provider } = createMockProvider([
-      toolUseResponse('t1', 'read_file', { path: '/test.txt' }),
-      textResponse('Done'),
+      toolUseResponse("t1", "read_file", { path: "/test.txt" }),
+      textResponse("Done"),
     ]);
-    const toolExecutor = async () => ({ content: 'file data', isError: false });
-    const loop = new AgentLoop(provider, 'system', {}, dummyTools, toolExecutor);
+    const toolExecutor = async () => ({ content: "file data", isError: false });
+    const loop = new AgentLoop(
+      provider,
+      "system",
+      {},
+      dummyTools,
+      toolExecutor,
+    );
     const checkpoints: CheckpointInfo[] = [];
     const onCheckpoint = (checkpoint: CheckpointInfo): CheckpointDecision => {
       checkpoints.push(checkpoint);
-      return 'continue';
+      return "continue";
     };
     await loop.run([userMessage], () => {}, undefined, undefined, onCheckpoint);
@@ -776,84 +1007,120 @@ describe('AgentLoop', () => {
   });
   // 17. Returning 'continue' lets the loop proceed normally
-  test('checkpoint returning continue lets the loop proceed normally', async () => {
+  test("checkpoint returning continue lets the loop proceed normally", async () => {
     const { provider, calls } = createMockProvider([
-      toolUseResponse('t1', 'read_file', { path: '/a.txt' }),
-      toolUseResponse('t2', 'read_file', { path: '/b.txt' }),
-      textResponse('All done'),
+      toolUseResponse("t1", "read_file", { path: "/a.txt" }),
+      toolUseResponse("t2", "read_file", { path: "/b.txt" }),
+      textResponse("All done"),
     ]);
-    const toolExecutor = async () => ({ content: 'data', isError: false });
-    const loop = new AgentLoop(provider, 'system', {}, dummyTools, toolExecutor);
+    const toolExecutor = async () => ({ content: "data", isError: false });
+    const loop = new AgentLoop(
+      provider,
+      "system",
+      {},
+      dummyTools,
+      toolExecutor,
+    );
-    const onCheckpoint = (): CheckpointDecision => 'continue';
+    const onCheckpoint = (): CheckpointDecision => "continue";
-    const history = await loop.run([userMessage], () => {}, undefined, undefined, onCheckpoint);
+    const history = await loop.run(
+      [userMessage],
+      () => {},
+      undefined,
+      undefined,
+      onCheckpoint,
+    );
     // All 3 provider calls should happen (2 tool turns + final text)
     expect(calls).toHaveLength(3);
     // Full history: user, assistant(t1), user(result1), assistant(t2), user(result2), assistant(text)
     expect(history).toHaveLength(6);
-    expect(history[5].content).toEqual([{ type: 'text', text: 'All done' }]);
+    expect(history[5].content).toEqual([{ type: "text", text: "All done" }]);
   });
   // 18. Returning 'yield' causes the loop to stop after that turn
-  test('checkpoint returning yield causes the loop to stop', async () => {
+  test("checkpoint returning yield causes the loop to stop", async () => {
     const { provider, calls } = createMockProvider([
-      toolUseResponse('t1', 'read_file', { path: '/a.txt' }),
-      toolUseResponse('t2', 'read_file', { path: '/b.txt' }),
-      textResponse('Should not reach'),
+      toolUseResponse("t1", "read_file", { path: "/a.txt" }),
+      toolUseResponse("t2", "read_file", { path: "/b.txt" }),
+      textResponse("Should not reach"),
     ]);
-    const toolExecutor = async () => ({ content: 'data', isError: false });
-    const loop = new AgentLoop(provider, 'system', {}, dummyTools, toolExecutor);
+    const toolExecutor = async () => ({ content: "data", isError: false });
+    const loop = new AgentLoop(
+      provider,
+      "system",
+      {},
+      dummyTools,
+      toolExecutor,
+    );
-    const onCheckpoint = (): CheckpointDecision => 'yield';
+    const onCheckpoint = (): CheckpointDecision => "yield";
-    const history = await loop.run([userMessage], () => {}, undefined, undefined, onCheckpoint);
+    const history = await loop.run(
+      [userMessage],
+      () => {},
+      undefined,
+      undefined,
+      onCheckpoint,
+    );
     // Only 1 provider call should happen — loop yields after first tool turn
     expect(calls).toHaveLength(1);
     // History: user, assistant(t1), user(result1)
     expect(history).toHaveLength(3);
-    expect(history[1].role).toBe('assistant');
-    expect(history[2].role).toBe('user');
+    expect(history[1].role).toBe("assistant");
+    expect(history[2].role).toBe("user");
   });
   // 19. Without a checkpoint callback, behavior is unchanged
-  test('without checkpoint callback behavior is unchanged', async () => {
+  test("without checkpoint callback behavior is unchanged", async () => {
     const { provider, calls } = createMockProvider([
-      toolUseResponse('t1', 'read_file', { path: '/a.txt' }),
-      textResponse('Done'),
+      toolUseResponse("t1", "read_file", { path: "/a.txt" }),
+      textResponse("Done"),
     ]);
-    const toolExecutor = async () => ({ content: 'data', isError: false });
-    const loop = new AgentLoop(provider, 'system', {}, dummyTools, toolExecutor);
+    const toolExecutor = async () => ({ content: "data", isError: false });
+    const loop = new AgentLoop(
+      provider,
+      "system",
+      {},
+      dummyTools,
+      toolExecutor,
+    );
     const history = await loop.run([userMessage], () => {});
     // Normal behavior: 2 provider calls, full history
     expect(calls).toHaveLength(2);
     expect(history).toHaveLength(4);
-    expect(history[3].content).toEqual([{ type: 'text', text: 'Done' }]);
+    expect(history[3].content).toEqual([{ type: "text", text: "Done" }]);
   });
   // 20. turnIndex increments correctly across turns
-  test('turnIndex increments correctly across multiple turns', async () => {
+  test("turnIndex increments correctly across multiple turns", async () => {
     const { provider } = createMockProvider([
-      toolUseResponse('t1', 'read_file', { path: '/a.txt' }),
-      toolUseResponse('t2', 'read_file', { path: '/b.txt' }),
-      toolUseResponse('t3', 'read_file', { path: '/c.txt' }),
-      textResponse('Done'),
+      toolUseResponse("t1", "read_file", { path: "/a.txt" }),
+      toolUseResponse("t2", "read_file", { path: "/b.txt" }),
+      toolUseResponse("t3", "read_file", { path: "/c.txt" }),
+      textResponse("Done"),
     ]);
-    const toolExecutor = async () => ({ content: 'data', isError: false });
-    const loop = new AgentLoop(provider, 'system', {}, dummyTools, toolExecutor);
+    const toolExecutor = async () => ({ content: "data", isError: false });
+    const loop = new AgentLoop(
+      provider,
+      "system",
+      {},
+      dummyTools,
+      toolExecutor,
+    );
     const checkpoints: CheckpointInfo[] = [];
     const onCheckpoint = (checkpoint: CheckpointInfo): CheckpointDecision => {
       checkpoints.push(checkpoint);
-      return 'continue';
+      return "continue";
     };
     await loop.run([userMessage], () => {}, undefined, undefined, onCheckpoint);
@@ -865,48 +1132,79 @@ describe('AgentLoop', () => {
   });
   // 21. Checkpoint is NOT called when there's no tool use
-  test('checkpoint is not called when assistant responds with text only', async () => {
-    const { provider } = createMockProvider([textResponse('Just a text response')]);
-    const loop = new AgentLoop(provider, 'system', {}, dummyTools);
+  test("checkpoint is not called when assistant responds with text only", async () => {
+    const { provider } = createMockProvider([
+      textResponse("Just a text response"),
+    ]);
+    const loop = new AgentLoop(provider, "system", {}, dummyTools);
     const checkpoints: CheckpointInfo[] = [];
     const onCheckpoint = (checkpoint: CheckpointInfo): CheckpointDecision => {
       checkpoints.push(checkpoint);
-      return 'continue';
+      return "continue";
     };
-    const history = await loop.run([userMessage], () => {}, undefined, undefined, onCheckpoint);
+    const history = await loop.run(
+      [userMessage],
+      () => {},
+      undefined,
+      undefined,
+      onCheckpoint,
+    );
     // Checkpoint should never be called for a text-only response
     expect(checkpoints).toHaveLength(0);
     // Normal response
     expect(history).toHaveLength(2);
-    expect(history[1].content).toEqual([{ type: 'text', text: 'Just a text response' }]);
+    expect(history[1].content).toEqual([
+      { type: "text", text: "Just a text response" },
+    ]);
   });
   // 22. Checkpoint reports correct toolCount for parallel tool execution
-  test('checkpoint reports correct toolCount for parallel tools', async () => {
+  test("checkpoint reports correct toolCount for parallel tools", async () => {
     const { provider } = createMockProvider([
       {
         content: [
-          { type: 'tool_use' as const, id: 't1', name: 'read_file', input: { path: '/a.txt' } },
-          { type: 'tool_use' as const, id: 't2', name: 'read_file', input: { path: '/b.txt' } },
-          { type: 'tool_use' as const, id: 't3', name: 'read_file', input: { path: '/c.txt' } },
+          {
+            type: "tool_use" as const,
+            id: "t1",
+            name: "read_file",
+            input: { path: "/a.txt" },
+          },
+          {
+            type: "tool_use" as const,
+            id: "t2",
+            name: "read_file",
+            input: { path: "/b.txt" },
+          },
+          {
+            type: "tool_use" as const,
+            id: "t3",
+            name: "read_file",
+            input: { path: "/c.txt" },
+          },
         ],
-        model: 'mock-model',
+        model: "mock-model",
         usage: { inputTokens: 10, outputTokens: 5 },
-        stopReason: 'tool_use' as const,
+        stopReason: "tool_use" as const,
       },
-      textResponse('Got all three'),
+      textResponse("Got all three"),
     ]);
-    const toolExecutor = async () => ({ content: 'data', isError: false });
-    const loop = new AgentLoop(provider, 'system', {}, dummyTools, toolExecutor);
+    const toolExecutor = async () => ({ content: "data", isError: false });
+    const loop = new AgentLoop(
+      provider,
+      "system",
+      {},
+      dummyTools,
+      toolExecutor,
+    );
     const checkpoints: CheckpointInfo[] = [];
     const onCheckpoint = (checkpoint: CheckpointInfo): CheckpointDecision => {
       checkpoints.push(checkpoint);
-      return 'continue';
+      return "continue";
     };
     await loop.run([userMessage], () => {}, undefined, undefined, onCheckpoint);
@@ -917,27 +1215,41 @@ describe('AgentLoop', () => {
   });
   // 23. Multiple checkpoints across a multi-turn run with selective yield on turn 3
-  test('multiple checkpoints with selective yield — executes turns 0-2, yields at turn 3, never runs 4+', async () => {
+  test("multiple checkpoints with selective yield — executes turns 0-2, yields at turn 3, never runs 4+", async () => {
     // Mock provider to return tool_use for 5 turns, then text
     const responses: ProviderResponse[] = [];
     for (let i = 0; i < 5; i++) {
-      responses.push(toolUseResponse(`t${i}`, 'read_file', { path: `/file${i}.txt` }));
+      responses.push(
+        toolUseResponse(`t${i}`, "read_file", { path: `/file${i}.txt` }),
+      );
     }
-    responses.push(textResponse('Should never reach this'));
+    responses.push(textResponse("Should never reach this"));
     const { provider, calls } = createMockProvider(responses);
-    const toolExecutor = async () => ({ content: 'data', isError: false });
-    const loop = new AgentLoop(provider, 'system', {}, dummyTools, toolExecutor);
+    const toolExecutor = async () => ({ content: "data", isError: false });
+    const loop = new AgentLoop(
+      provider,
+      "system",
+      {},
+      dummyTools,
+      toolExecutor,
+    );
     const checkpoints: CheckpointInfo[] = [];
     const onCheckpoint = (checkpoint: CheckpointInfo): CheckpointDecision => {
       checkpoints.push(checkpoint);
       // Yield on turn 3 (0-indexed)
-      return checkpoint.turnIndex === 3 ? 'yield' : 'continue';
+      return checkpoint.turnIndex === 3 ? "yield" : "continue";
     };
     const events: AgentEvent[] = [];
-    const history = await loop.run([userMessage], collectEvents(events), undefined, undefined, onCheckpoint);
+    const history = await loop.run(
+      [userMessage],
+      collectEvents(events),
+      undefined,
+      undefined,
+      onCheckpoint,
+    );
     // Turns 0, 1, 2, 3 execute (4 provider calls). Turn 3 yields, so turns 4+ never execute.
     expect(calls).toHaveLength(4);
@@ -956,45 +1268,61 @@ describe('AgentLoop', () => {
     expect(history).toHaveLength(9);
     // Verify the last two messages are from turn 3
-    expect(history[7].role).toBe('assistant');
-    const lastAssistantToolUse = history[7].content.find((b) => b.type === 'tool_use');
+    expect(history[7].role).toBe("assistant");
+    const lastAssistantToolUse = history[7].content.find(
+      (b) => b.type === "tool_use",
+    );
     expect(lastAssistantToolUse).toBeDefined();
-    if (lastAssistantToolUse && lastAssistantToolUse.type === 'tool_use') {
-      expect(lastAssistantToolUse.id).toBe('t3');
+    if (lastAssistantToolUse && lastAssistantToolUse.type === "tool_use") {
+      expect(lastAssistantToolUse.id).toBe("t3");
     }
-    expect(history[8].role).toBe('user');
+    expect(history[8].role).toBe("user");
     const lastToolResult = history[8].content.find(
-      (b): b is Extract<ContentBlock, { type: 'tool_result' }> => b.type === 'tool_result',
+      (b): b is Extract<ContentBlock, { type: "tool_result" }> =>
+        b.type === "tool_result",
     );
     expect(lastToolResult).toBeDefined();
-    expect(lastToolResult!.tool_use_id).toBe('t3');
+    expect(lastToolResult!.tool_use_id).toBe("t3");
     // Verify turns 4+ never executed — no tool_use event for t4
     const toolUseEvents = events.filter(
-      (e): e is Extract<AgentEvent, { type: 'tool_use' }> => e.type === 'tool_use',
+      (e): e is Extract<AgentEvent, { type: "tool_use" }> =>
+        e.type === "tool_use",
     );
     const toolUseNames = toolUseEvents.map((e) => e.id);
-    expect(toolUseNames).toEqual(['t0', 't1', 't2', 't3']);
-    expect(toolUseNames).not.toContain('t4');
+    expect(toolUseNames).toEqual(["t0", "t1", "t2", "t3"]);
+    expect(toolUseNames).not.toContain("t4");
   });
   // 24. Yield on second turn — first turn proceeds, second stops
-  test('yield on second turn lets first turn proceed and stops on second', async () => {
+  test("yield on second turn lets first turn proceed and stops on second", async () => {
     const { provider, calls } = createMockProvider([
-      toolUseResponse('t1', 'read_file', { path: '/a.txt' }),
-      toolUseResponse('t2', 'read_file', { path: '/b.txt' }),
-      textResponse('Should not reach'),
+      toolUseResponse("t1", "read_file", { path: "/a.txt" }),
+      toolUseResponse("t2", "read_file", { path: "/b.txt" }),
+      textResponse("Should not reach"),
     ]);
-    const toolExecutor = async () => ({ content: 'data', isError: false });
-    const loop = new AgentLoop(provider, 'system', {}, dummyTools, toolExecutor);
+    const toolExecutor = async () => ({ content: "data", isError: false });
+    const loop = new AgentLoop(
+      provider,
+      "system",
+      {},
+      dummyTools,
+      toolExecutor,
+    );
     const onCheckpoint = (checkpoint: CheckpointInfo): CheckpointDecision => {
       // Yield on the second turn (turnIndex 1)
-      return checkpoint.turnIndex === 1 ? 'yield' : 'continue';
+      return checkpoint.turnIndex === 1 ? "yield" : "continue";
     };
-    const history = await loop.run([userMessage], () => {}, undefined, undefined, onCheckpoint);
+    const history = await loop.run(
+      [userMessage],
+      () => {},
+      undefined,
+      undefined,
+      onCheckpoint,
+    );
     // 2 provider calls: first tool turn + second tool turn (yield after second)
     expect(calls).toHaveLength(2);
@@ -1007,9 +1335,9 @@ describe('AgentLoop', () => {
   // ---------------------------------------------------------------------------
   // 25. Without resolveTools, static tools are used (backward compatible)
-  test('without resolveTools, static tools are passed to provider', async () => {
-    const { provider, calls } = createMockProvider([textResponse('Hi')]);
-    const loop = new AgentLoop(provider, 'system', {}, dummyTools);
+  test("without resolveTools, static tools are passed to provider", async () => {
+    const { provider, calls } = createMockProvider([textResponse("Hi")]);
+    const loop = new AgentLoop(provider, "system", {}, dummyTools);
     await loop.run([userMessage], () => {});
@@ -1017,25 +1345,39 @@ describe('AgentLoop', () => {
   });
   // 26. resolveTools callback is invoked before each provider call
-  test('resolveTools is invoked before each provider call', async () => {
+  test("resolveTools is invoked before each provider call", async () => {
     const resolverCalls: Message[][] = [];
     const resolvedTools: ToolDefinition[] = [
-      { name: 'search', description: 'Search files', input_schema: { type: 'object', properties: { query: { type: 'string' } } } },
+      {
+        name: "search",
+        description: "Search files",
+        input_schema: {
+          type: "object",
+          properties: { query: { type: "string" } },
+        },
+      },
     ];
     const { provider } = createMockProvider([
-      toolUseResponse('t1', 'search', { query: 'foo' }),
-      textResponse('Found it'),
+      toolUseResponse("t1", "search", { query: "foo" }),
+      textResponse("Found it"),
     ]);
-    const toolExecutor = async () => ({ content: 'result', isError: false });
+    const toolExecutor = async () => ({ content: "result", isError: false });
     const resolveTools = (history: Message[]): ToolDefinition[] => {
       resolverCalls.push([...history]);
       return resolvedTools;
     };
-    const loop = new AgentLoop(provider, 'system', {}, [], toolExecutor, resolveTools);
+    const loop = new AgentLoop(
+      provider,
+      "system",
+      {},
+      [],
+      toolExecutor,
+      resolveTools,
+    );
     await loop.run([userMessage], () => {});
     // resolveTools should be called once per provider turn (2 turns total)
@@ -1050,17 +1392,28 @@ describe('AgentLoop', () => {
   });
   // 27. Resolved tool list is passed to the provider
-  test('resolved tools are passed to the provider instead of static tools', async () => {
+  test("resolved tools are passed to the provider instead of static tools", async () => {
     const dynamicTools: ToolDefinition[] = [
-      { name: 'dynamic_tool', description: 'Dynamic', input_schema: { type: 'object' } },
+      {
+        name: "dynamic_tool",
+        description: "Dynamic",
+        input_schema: { type: "object" },
+      },
     ];
-    const { provider, calls } = createMockProvider([textResponse('Hi')]);
+    const { provider, calls } = createMockProvider([textResponse("Hi")]);
     const resolveTools = (): ToolDefinition[] => dynamicTools;
     // Pass different static tools to verify they are overridden
-    const loop = new AgentLoop(provider, 'system', {}, dummyTools, undefined, resolveTools);
+    const loop = new AgentLoop(
+      provider,
+      "system",
+      {},
+      dummyTools,
+      undefined,
+      resolveTools,
+    );
     await loop.run([userMessage], () => {});
     // Provider should receive the dynamically resolved tools, not the static ones
@@ -1069,31 +1422,59 @@ describe('AgentLoop', () => {
   });
   // 28. Tool list can change between turns
-  test('resolveTools can return different tools on each turn', async () => {
+  test("resolveTools can return different tools on each turn", async () => {
     const toolsPerTurn: ToolDefinition[][] = [
-      [{ name: 'tool_a', description: 'Tool A', input_schema: { type: 'object' } }],
       [
-        { name: 'tool_a', description: 'Tool A', input_schema: { type: 'object' } },
-        { name: 'tool_b', description: 'Tool B', input_schema: { type: 'object' } },
+        {
+          name: "tool_a",
+          description: "Tool A",
+          input_schema: { type: "object" },
+        },
+      ],
+      [
+        {
+          name: "tool_a",
+          description: "Tool A",
+          input_schema: { type: "object" },
+        },
+        {
+          name: "tool_b",
+          description: "Tool B",
+          input_schema: { type: "object" },
+        },
+      ],
+      [
+        {
+          name: "tool_c",
+          description: "Tool C",
+          input_schema: { type: "object" },
+        },
       ],
-      [{ name: 'tool_c', description: 'Tool C', input_schema: { type: 'object' } }],
     ];
     let turnIndex = 0;
     const resolveTools = (): ToolDefinition[] => {
-      const tools = toolsPerTurn[turnIndex] ?? toolsPerTurn[toolsPerTurn.length - 1];
+      const tools =
+        toolsPerTurn[turnIndex] ?? toolsPerTurn[toolsPerTurn.length - 1];
       turnIndex++;
       return tools;
     };
     const { provider, calls } = createMockProvider([
-      toolUseResponse('t1', 'tool_a', {}),
-      toolUseResponse('t2', 'tool_a', {}),
-      textResponse('Done'),
+      toolUseResponse("t1", "tool_a", {}),
+      toolUseResponse("t2", "tool_a", {}),
+      textResponse("Done"),
     ]);
-    const toolExecutor = async () => ({ content: 'ok', isError: false });
-    const loop = new AgentLoop(provider, 'system', {}, [], toolExecutor, resolveTools);
+    const toolExecutor = async () => ({ content: "ok", isError: false });
+    const loop = new AgentLoop(
+      provider,
+      "system",
+      {},
+      [],
+      toolExecutor,
+      resolveTools,
+    );
     await loop.run([userMessage], () => {});
     // Provider should have been called 3 times
@@ -1106,12 +1487,21 @@ describe('AgentLoop', () => {
   });
   // 29. resolveTools returning empty array means no tools passed to provider
-  test('resolveTools returning empty array sends no tools to provider', async () => {
+  test("resolveTools returning empty array sends no tools to provider", async () => {
     const resolveTools = (): ToolDefinition[] => [];
-    const { provider, calls } = createMockProvider([textResponse('No tools available')]);
+    const { provider, calls } = createMockProvider([
+      textResponse("No tools available"),
+    ]);
-    const loop = new AgentLoop(provider, 'system', {}, dummyTools, undefined, resolveTools);
+    const loop = new AgentLoop(
+      provider,
+      "system",
+      {},
+      dummyTools,
+      undefined,
+      resolveTools,
+    );
     await loop.run([userMessage], () => {});
     // Empty array should result in undefined tools (same as no-tools behavior)
@@ -1123,13 +1513,13 @@ describe('AgentLoop', () => {
   // ---------------------------------------------------------------------------
   // 30. Oversized tool results are truncated before entering history
-  test('truncates oversized tool results before adding to history', async () => {
-    const toolCallId = 'tool-large';
-    const largeContent = 'x'.repeat(500_000);
+  test("truncates oversized tool results before adding to history", async () => {
+    const toolCallId = "tool-large";
+    const largeContent = "x".repeat(500_000);
     const { provider, calls } = createMockProvider([
-      toolUseResponse(toolCallId, 'read_file', { path: '/huge.txt' }),
-      textResponse('Got it.'),
+      toolUseResponse(toolCallId, "read_file", { path: "/huge.txt" }),
+      textResponse("Got it."),
     ]);
     const toolExecutor = async () => {
@@ -1138,7 +1528,7 @@ describe('AgentLoop', () => {
     const loop = new AgentLoop(
       provider,
-      'system',
+      "system",
       { maxInputTokens: 180_000 },
       dummyTools,
       toolExecutor,
@@ -1148,10 +1538,11 @@ describe('AgentLoop', () => {
     // The tool result user message is at index 2 in history
     const toolResultMsg = history[2];
-    expect(toolResultMsg.role).toBe('user');
+    expect(toolResultMsg.role).toBe("user");
     const toolResultBlock = toolResultMsg.content.find(
-      (b): b is Extract<ContentBlock, { type: 'tool_result' }> => b.type === 'tool_result',
+      (b): b is Extract<ContentBlock, { type: "tool_result" }> =>
+        b.type === "tool_result",
     );
     expect(toolResultBlock).toBeDefined();
@@ -1159,28 +1550,27 @@ describe('AgentLoop', () => {
     expect(toolResultBlock!.content.length).toBeLessThan(500_000);
     // Content should end with the truncation suffix
-    expect(toolResultBlock!.content).toContain(
-      '[Content truncated',
-    );
+    expect(toolResultBlock!.content).toContain("[Content truncated");
     // The second provider call should also have the truncated content in messages
     const secondCallMessages = calls[1].messages;
     const lastMsg = secondCallMessages[secondCallMessages.length - 1];
     const sentBlock = lastMsg.content.find(
-      (b): b is Extract<ContentBlock, { type: 'tool_result' }> => b.type === 'tool_result',
+      (b): b is Extract<ContentBlock, { type: "tool_result" }> =>
+        b.type === "tool_result",
     );
     expect(sentBlock).toBeDefined();
     expect(sentBlock!.content.length).toBeLessThan(500_000);
   });
   // 31. Non-oversized tool results pass through unchanged
-  test('non-oversized tool results pass through unchanged', async () => {
-    const toolCallId = 'tool-small';
-    const smallContent = 'small content';
+  test("non-oversized tool results pass through unchanged", async () => {
+    const toolCallId = "tool-small";
+    const smallContent = "small content";
     const { provider, calls } = createMockProvider([
-      toolUseResponse(toolCallId, 'read_file', { path: '/small.txt' }),
-      textResponse('Got it.'),
+      toolUseResponse(toolCallId, "read_file", { path: "/small.txt" }),
+      textResponse("Got it."),
     ]);
     const toolExecutor = async () => {
@@ -1189,7 +1579,7 @@ describe('AgentLoop', () => {
     const loop = new AgentLoop(
       provider,
-      'system',
+      "system",
       { maxInputTokens: 180_000 },
       dummyTools,
       toolExecutor,
@@ -1199,10 +1589,11 @@ describe('AgentLoop', () => {
     // The tool result user message is at index 2 in history
     const toolResultMsg = history[2];
-    expect(toolResultMsg.role).toBe('user');
+    expect(toolResultMsg.role).toBe("user");
     const toolResultBlock = toolResultMsg.content.find(
-      (b): b is Extract<ContentBlock, { type: 'tool_result' }> => b.type === 'tool_result',
+      (b): b is Extract<ContentBlock, { type: "tool_result" }> =>
+        b.type === "tool_result",
     );
     expect(toolResultBlock).toBeDefined();
@@ -1213,7 +1604,8 @@ describe('AgentLoop', () => {
     const secondCallMessages = calls[1].messages;
     const lastMsg = secondCallMessages[secondCallMessages.length - 1];
     const sentBlock = lastMsg.content.find(
-      (b): b is Extract<ContentBlock, { type: 'tool_result' }> => b.type === 'tool_result',
+      (b): b is Extract<ContentBlock, { type: "tool_result" }> =>
+        b.type === "tool_result",
     );
     expect(sentBlock).toBeDefined();
     expect(sentBlock!.content).toBe(smallContent);
@@ -1225,32 +1617,42 @@ describe('AgentLoop', () => {
   // 32. Tool results with sensitiveBindings populate substitution map and
   //     final assistant message text is resolved with real values.
-  test('resolves sensitive output placeholders in final assistant message', async () => {
-    const placeholder = 'VELLUM_ASSISTANT_INVITE_CODE_TEST1234';
-    const realToken = 'realInviteToken999';
+  test("resolves sensitive output placeholders in final assistant message", async () => {
+    const placeholder = "VELLUM_ASSISTANT_INVITE_CODE_TEST1234";
+    const realToken = "realInviteToken999";
     const { provider, calls } = createMockProvider([
-      toolUseResponse('t1', 'bash', { command: 'create invite' }),
+      toolUseResponse("t1", "bash", { command: "create invite" }),
       // The LLM responds using the placeholder (it never saw the real token)
-      textResponse(`Here is your invite link: https://t.me/bot?start=iv_${placeholder}`),
+      textResponse(
+        `Here is your invite link: https://t.me/bot?start=iv_${placeholder}`,
+      ),
     ]);
     const toolExecutor = async () => ({
       content: `https://t.me/bot?start=iv_${placeholder}`,
       isError: false,
-      sensitiveBindings: [{ kind: 'invite_code' as const, placeholder, value: realToken }],
+      sensitiveBindings: [
+        { kind: "invite_code" as const, placeholder, value: realToken },
+      ],
     });
-    const loop = new AgentLoop(provider, 'system', {}, dummyTools, toolExecutor);
+    const loop = new AgentLoop(
+      provider,
+      "system",
+      {},
+      dummyTools,
+      toolExecutor,
+    );
     const events: AgentEvent[] = [];
     const history = await loop.run([userMessage], collectEvents(events));
     // The final assistant message in HISTORY should retain placeholders
     // (so the model never sees real values on subsequent turns)
     const lastAssistant = history[history.length - 1];
-    expect(lastAssistant.role).toBe('assistant');
+    expect(lastAssistant.role).toBe("assistant");
     const historyTextBlock = lastAssistant.content.find(
-      (b): b is Extract<ContentBlock, { type: 'text' }> => b.type === 'text',
+      (b): b is Extract<ContentBlock, { type: "text" }> => b.type === "text",
     );
     expect(historyTextBlock).toBeDefined();
     expect(historyTextBlock!.text).toContain(placeholder);
@@ -1259,11 +1661,12 @@ describe('AgentLoop', () => {
     // The message_complete EVENT should also retain placeholders (persisted
     // to conversation store; real values leak on session reload otherwise)
     const completeEvents = events.filter(
-      (e): e is Extract<AgentEvent, { type: 'message_complete' }> => e.type === 'message_complete',
+      (e): e is Extract<AgentEvent, { type: "message_complete" }> =>
+        e.type === "message_complete",
     );
     const lastComplete = completeEvents[completeEvents.length - 1];
     const completeText = lastComplete.message.content.find(
-      (b): b is Extract<ContentBlock, { type: 'text' }> => b.type === 'text',
+      (b): b is Extract<ContentBlock, { type: "text" }> => b.type === "text",
     );
     expect(completeText!.text).toContain(placeholder);
     expect(completeText!.text).not.toContain(realToken);
@@ -1272,23 +1675,25 @@ describe('AgentLoop', () => {
     // NOT the raw token (model never sees the real value)
     const secondCallMessages = calls[1].messages;
     const toolResultMsg = secondCallMessages.find(
-      (m) => m.role === 'user' && m.content.some((b) => b.type === 'tool_result'),
+      (m) =>
+        m.role === "user" && m.content.some((b) => b.type === "tool_result"),
     );
     expect(toolResultMsg).toBeDefined();
     const toolResultBlock = toolResultMsg!.content.find(
-      (b): b is Extract<ContentBlock, { type: 'tool_result' }> => b.type === 'tool_result',
+      (b): b is Extract<ContentBlock, { type: "tool_result" }> =>
+        b.type === "tool_result",
     );
     expect(toolResultBlock!.content).toContain(placeholder);
     expect(toolResultBlock!.content).not.toContain(realToken);
   });
   // 33. Streamed text_delta events have placeholders resolved to real values
-  test('resolves sensitive output placeholders in streamed text_delta events', async () => {
-    const placeholder = 'VELLUM_ASSISTANT_INVITE_CODE_STRM5678';
-    const realToken = 'streamedRealToken';
+  test("resolves sensitive output placeholders in streamed text_delta events", async () => {
+    const placeholder = "VELLUM_ASSISTANT_INVITE_CODE_STRM5678";
+    const realToken = "streamedRealToken";
     const { provider } = createMockProvider([
-      toolUseResponse('t1', 'bash', { command: 'invite' }),
+      toolUseResponse("t1", "bash", { command: "invite" }),
       // Response text includes the placeholder
       textResponse(`Link: https://t.me/bot?start=iv_${placeholder}`),
     ]);
@@ -1296,18 +1701,27 @@ describe('AgentLoop', () => {
     const toolExecutor = async () => ({
       content: `https://t.me/bot?start=iv_${placeholder}`,
       isError: false,
-      sensitiveBindings: [{ kind: 'invite_code' as const, placeholder, value: realToken }],
+      sensitiveBindings: [
+        { kind: "invite_code" as const, placeholder, value: realToken },
+      ],
     });
-    const loop = new AgentLoop(provider, 'system', {}, dummyTools, toolExecutor);
+    const loop = new AgentLoop(
+      provider,
+      "system",
+      {},
+      dummyTools,
+      toolExecutor,
+    );
     const events: AgentEvent[] = [];
     await loop.run([userMessage], collectEvents(events));
     // Collect all text_delta events from the final turn (after tool result)
     const textDeltas = events.filter(
-      (e): e is Extract<AgentEvent, { type: 'text_delta' }> => e.type === 'text_delta',
+      (e): e is Extract<AgentEvent, { type: "text_delta" }> =>
+        e.type === "text_delta",
     );
-    const allStreamedText = textDeltas.map((e) => e.text).join('');
+    const allStreamedText = textDeltas.map((e) => e.text).join("");
     // Streamed text should contain the real token, not the placeholder
     expect(allStreamedText).toContain(realToken);
@@ -1315,26 +1729,32 @@ describe('AgentLoop', () => {
   });
   // 34. Without sensitive bindings, text passes through unchanged
-  test('text passes through unchanged when no sensitive bindings exist', async () => {
+  test("text passes through unchanged when no sensitive bindings exist", async () => {
     const { provider } = createMockProvider([
-      toolUseResponse('t1', 'read_file', { path: '/test.txt' }),
-      textResponse('Normal response with no placeholders.'),
+      toolUseResponse("t1", "read_file", { path: "/test.txt" }),
+      textResponse("Normal response with no placeholders."),
     ]);
     const toolExecutor = async () => ({
-      content: 'file contents',
+      content: "file contents",
       isError: false,
       // No sensitiveBindings
     });
-    const loop = new AgentLoop(provider, 'system', {}, dummyTools, toolExecutor);
+    const loop = new AgentLoop(
+      provider,
+      "system",
+      {},
+      dummyTools,
+      toolExecutor,
+    );
     const events: AgentEvent[] = [];
     const history = await loop.run([userMessage], collectEvents(events));
     const lastAssistant = history[history.length - 1];
     const textBlock = lastAssistant.content.find(
-      (b): b is Extract<ContentBlock, { type: 'text' }> => b.type === 'text',
+      (b): b is Extract<ContentBlock, { type: "text" }> => b.type === "text",
     );
-    expect(textBlock!.text).toBe('Normal response with no placeholders.');
+    expect(textBlock!.text).toBe("Normal response with no placeholders.");
   });
 });