npm - @vellumai/assistant - Versions diffs - 0.6.3 → 0.6.4 - Mend

@vellumai/assistant 0.6.3 → 0.6.4

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (667) hide show

package/ARCHITECTURE.md +273 -10
package/Dockerfile +2 -3
package/bun.lock +5 -13
package/docs/backup-troubleshooting.md +52 -0
package/docs/browser-use-architecture-phase2.md +174 -0
package/docs/stt-provider-onboarding.md +120 -0
package/knip.json +12 -2
package/node_modules/@vellumai/ces-contracts/bun.lock +8 -6
package/node_modules/@vellumai/ces-contracts/package.json +3 -3
package/openapi.yaml +982 -72
package/package.json +4 -6
package/scripts/generate-openapi.ts +0 -1
package/scripts/test.sh +73 -18
package/src/__tests__/agent-image-optimize.test.ts +28 -0
package/src/__tests__/agent-loop.test.ts +123 -0
package/src/__tests__/anthropic-provider.test.ts +263 -10
package/src/__tests__/auto-analysis-end-to-end.test.ts +550 -0
package/src/__tests__/auto-analysis-prompt.test.ts +50 -0
package/src/__tests__/browser-fill-credential.test.ts +11 -0
package/src/__tests__/browser-skill-baseline-tool-payload.test.ts +2 -2
package/src/__tests__/browser-skill-endstate.test.ts +31 -7
package/src/__tests__/btw-routes.test.ts +7 -0
package/src/__tests__/call-controller.test.ts +581 -20
package/src/__tests__/catalog-files.test.ts +138 -0
package/src/__tests__/channel-invite-transport.test.ts +2 -2
package/src/__tests__/channel-readiness-routes.test.ts +16 -20
package/src/__tests__/channel-readiness-service.test.ts +12 -7
package/src/__tests__/checker.test.ts +157 -10
package/src/__tests__/clawhub-files.test.ts +347 -0
package/src/__tests__/commit-message-enrichment-service.test.ts +36 -19
package/src/__tests__/config-analysis.test.ts +100 -0
package/src/__tests__/config-schema.test.ts +1013 -66
package/src/__tests__/config-watcher-cleanup-throttle.test.ts +339 -0
package/src/__tests__/config-watcher.test.ts +43 -8
package/src/__tests__/contact-store-user-file.test.ts +512 -0
package/src/__tests__/contacts-write.test.ts +197 -0
package/src/__tests__/context-window-manager.test.ts +88 -0
package/src/__tests__/conversation-abort-tool-results.test.ts +2 -0
package/src/__tests__/conversation-agent-loop-overflow.test.ts +1 -0
package/src/__tests__/conversation-agent-loop.test.ts +98 -2
package/src/__tests__/conversation-confirmation-signals.test.ts +135 -0
package/src/__tests__/conversation-error.test.ts +70 -0
package/src/__tests__/conversation-history-web-search.test.ts +11 -4
package/src/__tests__/conversation-init.benchmark.test.ts +6 -1
package/src/__tests__/conversation-launcher-skill-regression.test.ts +51 -0
package/src/__tests__/conversation-list-source.test.ts +145 -0
package/src/__tests__/conversation-pre-run-repair.test.ts +2 -0
package/src/__tests__/conversation-provider-retry-repair.test.ts +2 -0
package/src/__tests__/conversation-queue.test.ts +901 -60
package/src/__tests__/conversation-routes-disk-view.test.ts +270 -0
package/src/__tests__/conversation-runtime-assembly.test.ts +55 -0
package/src/__tests__/conversation-skill-tools.test.ts +7 -4
package/src/__tests__/conversation-slash-commands.test.ts +33 -0
package/src/__tests__/conversation-slash-queue.test.ts +89 -18
package/src/__tests__/conversation-slash-unknown.test.ts +2 -0
package/src/__tests__/conversation-tool-setup-batch-authorized.test.ts +226 -0
package/src/__tests__/conversation-workspace-injection.test.ts +2 -0
package/src/__tests__/conversation-workspace-tool-tracking.test.ts +2 -0
package/src/__tests__/credential-health-service.test.ts +352 -0
package/src/__tests__/credential-security-invariants.test.ts +5 -3
package/src/__tests__/credential-vault-unit.test.ts +379 -3
package/src/__tests__/credentials-cli.test.ts +40 -16
package/src/__tests__/cross-provider-web-search.test.ts +146 -35
package/src/__tests__/deterministic-verification-control-plane.test.ts +10 -1
package/src/__tests__/device-id.test.ts +112 -0
package/src/__tests__/docker-signing-key-bootstrap.test.ts +167 -4
package/src/__tests__/dynamic-skill-workflow-prompt.test.ts +1 -3
package/src/__tests__/email-html-renderer.test.ts +71 -0
package/src/__tests__/email-invite-adapter.test.ts +36 -32
package/src/__tests__/emit-event-signal.test.ts +71 -0
package/src/__tests__/extension-id-sync-guard.test.ts +75 -8
package/src/__tests__/fixtures/mock-chrome-extension.ts +11 -0
package/src/__tests__/gateway-only-enforcement.test.ts +206 -1
package/src/__tests__/gateway-only-guard.test.ts +0 -1
package/src/__tests__/gemini-provider.test.ts +64 -0
package/src/__tests__/get-skill-detail-audit.test.ts +325 -0
package/src/__tests__/gmail-archive-fallback.test.ts +193 -0
package/src/__tests__/gmail-archive-gate.test.ts +246 -0
package/src/__tests__/gmail-preferences.test.ts +117 -0
package/src/__tests__/headless-browser-interactions.test.ts +43 -0
package/src/__tests__/headless-browser-mode.test.ts +614 -0
package/src/__tests__/headless-browser-navigate.test.ts +142 -5
package/src/__tests__/headless-browser-read-tools.test.ts +11 -0
package/src/__tests__/headless-browser-snapshot.test.ts +10 -0
package/src/__tests__/heartbeat-service.test.ts +70 -17
package/src/__tests__/home-state-routes.test.ts +162 -0
package/src/__tests__/host-bash-proxy.test.ts +0 -5
package/src/__tests__/host-browser-e2e-cloud.test.ts +138 -4
package/src/__tests__/host-browser-e2e-self-hosted.test.ts +4 -4
package/src/__tests__/host-browser-ws-events-e2e.test.ts +103 -0
package/src/__tests__/host-cu-proxy.test.ts +0 -5
package/src/__tests__/identity-intro-cache.test.ts +40 -10
package/src/__tests__/init-feature-flag-overrides.test.ts +38 -112
package/src/__tests__/jobs-store-upsert-debounced.test.ts +141 -0
package/src/__tests__/llm-context-normalization.test.ts +488 -0
package/src/__tests__/llm-context-route-provider.test.ts +86 -5
package/src/__tests__/llm-usage-store.test.ts +363 -0
package/src/__tests__/media-stream-output.test.ts +555 -0
package/src/__tests__/media-stream-parser.test.ts +374 -0
package/src/__tests__/media-stream-server-integration.test.ts +1234 -0
package/src/__tests__/media-stream-stt-session.test.ts +588 -0
package/src/__tests__/media-turn-detector.test.ts +440 -0
package/src/__tests__/message-queue.test.ts +125 -0
package/src/__tests__/migration-export-http.test.ts +6 -6
package/src/__tests__/migration-import-commit-http.test.ts +8 -6
package/src/__tests__/migration-import-preflight-http.test.ts +6 -5
package/src/__tests__/migration-validate-http.test.ts +3 -3
package/src/__tests__/mock-gateway-ipc.ts +151 -0
package/src/__tests__/model-intents.test.ts +2 -2
package/src/__tests__/oauth-apps-routes.test.ts +1 -0
package/src/__tests__/oauth-cli.test.ts +2 -0
package/src/__tests__/oauth-connect-orchestrator.test.ts +2 -0
package/src/__tests__/oauth-provider-serializer.test.ts +1 -0
package/src/__tests__/oauth-providers-routes.test.ts +2 -0
package/src/__tests__/oauth-store.test.ts +85 -0
package/src/__tests__/oauth2-gateway-transport.test.ts +249 -6
package/src/__tests__/onboarding-template-contract.test.ts +6 -13
package/src/__tests__/openai-provider.test.ts +176 -0
package/src/__tests__/openai-responses-cutover-guard.test.ts +184 -0
package/src/__tests__/openai-responses-provider.test.ts +1105 -0
package/src/__tests__/openrouter-token-estimation.test.ts +100 -0
package/src/__tests__/outlook-unsubscribe.test.ts +31 -2
package/src/__tests__/persona-resolver.test.ts +251 -0
package/src/__tests__/platform-bash-auto-approve.test.ts +4 -0
package/src/__tests__/platform.test.ts +92 -1
package/src/__tests__/post-turn-tool-result-truncation.test.ts +47 -0
package/src/__tests__/prechat-onboarding-contract.test.ts +267 -0
package/src/__tests__/pricing.test.ts +174 -0
package/src/__tests__/qdrant-manager.test.ts +29 -8
package/src/__tests__/regenerate-fire-and-forget-trace.test.ts +194 -0
package/src/__tests__/relationship-state-contract.test.ts +175 -0
package/src/__tests__/relay-server.test.ts +423 -5
package/src/__tests__/search-skills-unified.test.ts +118 -0
package/src/__tests__/secret-scanner-executor.test.ts +4 -0
package/src/__tests__/secure-keys.test.ts +107 -0
package/src/__tests__/send-endpoint-busy.test.ts +5 -1
package/src/__tests__/sequence-store.test.ts +1 -1
package/src/__tests__/server-history-render.test.ts +49 -0
package/src/__tests__/settings-routes.test.ts +201 -0
package/src/__tests__/skill-load-feature-flag.test.ts +1 -0
package/src/__tests__/skills-file-content-endpoint.test.ts +276 -145
package/src/__tests__/skills-files-catalog-fallback.test.ts +381 -93
package/src/__tests__/skills.test.ts +5 -2
package/src/__tests__/skillssh-files.test.ts +446 -0
package/src/__tests__/slack-block-formatting.test.ts +110 -0
package/src/__tests__/slack-channel-config.test.ts +564 -1
package/src/__tests__/stt-catalog-parity.test.ts +282 -0
package/src/__tests__/stt-stream-session.test.ts +535 -0
package/src/__tests__/system-prompt.test.ts +112 -26
package/src/__tests__/telephony-stt-routing.test.ts +329 -0
package/src/__tests__/terminal-tools.test.ts +18 -7
package/src/__tests__/test-preload.ts +18 -0
package/src/__tests__/test-support/browser-skill-harness.ts +4 -1
package/src/__tests__/tool-executor-lifecycle-events.test.ts +9 -5
package/src/__tests__/tool-executor-shell-integration.test.ts +4 -0
package/src/__tests__/tool-executor.test.ts +33 -24
package/src/__tests__/tool-result-truncation.test.ts +36 -0
package/src/__tests__/trust-store.test.ts +7 -1
package/src/__tests__/trusted-contact-approval-notifier.test.ts +1 -1
package/src/__tests__/tts-catalog-parity.test.ts +345 -0
package/src/__tests__/twilio-routes-twiml.test.ts +512 -114
package/src/__tests__/twilio-routes.test.ts +376 -0
package/src/__tests__/unicode.test.ts +293 -0
package/src/__tests__/update-bulletin-format.test.ts +59 -0
package/src/__tests__/update-bulletin.test.ts +206 -5
package/src/__tests__/usage-routes.test.ts +25 -4
package/src/__tests__/user-reference.test.ts +46 -61
package/src/__tests__/verification-control-plane-policy.test.ts +4 -0
package/src/__tests__/voice-config-update.test.ts +403 -0
package/src/__tests__/voice-quality.test.ts +434 -19
package/src/__tests__/workspace-heartbeat-service.test.ts +7 -0
package/src/__tests__/workspace-migration-033-stt-service-explicit-config.test.ts +547 -0
package/src/__tests__/workspace-migration-034-remove-calls-voice-transcription-provider.test.ts +596 -0
package/src/__tests__/workspace-migration-drop-user-md.test.ts +368 -0
package/src/__tests__/workspace-migration-meets.test.ts +244 -0
package/src/__tests__/workspace-migration-seed-device-id.test.ts +14 -20
package/src/__tests__/workspace-policy.test.ts +2 -0
package/src/agent/image-optimize.ts +24 -12
package/src/agent/loop.ts +43 -3
package/src/backup/__tests__/backup-key.test.ts +152 -0
package/src/backup/__tests__/backup-worker.test.ts +767 -0
package/src/backup/__tests__/list-snapshots.test.ts +87 -0
package/src/backup/__tests__/local-writer.test.ts +218 -0
package/src/backup/__tests__/offsite-writer.test.ts +641 -0
package/src/backup/__tests__/paths.test.ts +300 -0
package/src/backup/__tests__/restore.test.ts +498 -0
package/src/backup/__tests__/snapshot-lock.test.ts +352 -0
package/src/backup/__tests__/stream-crypt.test.ts +228 -0
package/src/backup/backup-key.ts +137 -0
package/src/backup/backup-worker.ts +459 -0
package/src/backup/list-snapshots.ts +147 -0
package/src/backup/local-writer.ts +133 -0
package/src/backup/offsite-writer.ts +222 -0
package/src/backup/paths.ts +226 -0
package/src/backup/restore.ts +322 -0
package/src/backup/snapshot-lock.ts +431 -0
package/src/backup/stream-crypt.ts +263 -0
package/src/bundler/package-resolver.ts +4 -0
package/src/calls/audio-store.ts +11 -5
package/src/calls/call-controller.ts +226 -71
package/src/calls/call-domain.ts +9 -0
package/src/calls/call-speech-output.ts +190 -0
package/src/calls/call-transport.ts +77 -0
package/src/calls/media-stream-audio-transcode.ts +173 -0
package/src/calls/media-stream-output.ts +660 -0
package/src/calls/media-stream-parser.ts +300 -0
package/src/calls/media-stream-protocol.ts +166 -0
package/src/calls/media-stream-server.ts +592 -0
package/src/calls/media-stream-stt-session.ts +460 -0
package/src/calls/media-turn-detector.ts +230 -0
package/src/calls/relay-server.ts +90 -75
package/src/calls/resolve-call-tts-provider.ts +136 -0
package/src/calls/telephony-stt-routing.ts +145 -0
package/src/calls/tts-call-strategy.ts +161 -0
package/src/calls/tts-text-sanitizer.ts +32 -16
package/src/calls/twilio-routes.ts +281 -17
package/src/calls/voice-quality.ts +78 -35
package/src/calls/voice-session-bridge.ts +8 -1
package/src/channels/types.ts +16 -0
package/src/cli/__tests__/run-assistant-command.ts +11 -1
package/src/cli/commands/__tests__/backup.test.ts +1165 -0
package/src/cli/commands/__tests__/domain-register.test.ts +234 -0
package/src/cli/commands/__tests__/domain-status.test.ts +132 -0
package/src/cli/commands/__tests__/email-attachment.test.ts +422 -0
package/src/cli/commands/__tests__/email-download.test.ts +16 -1
package/src/cli/commands/__tests__/email-list.test.ts +22 -4
package/src/cli/commands/__tests__/email-register.test.ts +4 -4
package/src/cli/commands/__tests__/email-send.test.ts +37 -4
package/src/cli/commands/__tests__/email-status.test.ts +5 -1
package/src/cli/commands/__tests__/email-unregister.test.ts +34 -5
package/src/cli/commands/backup.ts +993 -0
package/src/cli/commands/conversations.ts +77 -0
package/src/cli/commands/credentials.ts +0 -1
package/src/cli/commands/domain.ts +210 -0
package/src/cli/commands/email.ts +255 -3
package/src/cli/commands/oauth/__tests__/connect.test.ts +12 -0
package/src/cli/commands/oauth/__tests__/providers-delete.test.ts +1 -0
package/src/cli/commands/oauth/__tests__/providers-register.test.ts +1 -0
package/src/cli/commands/oauth/__tests__/providers-update.test.ts +1 -0
package/src/cli/commands/oauth/mode.ts +12 -3
package/src/cli/commands/oauth/providers.ts +15 -0
package/src/cli/commands/oauth/shared.ts +2 -1
package/src/cli/commands/platform/__tests__/callback-routes-list.test.ts +4 -9
package/src/cli/commands/platform/__tests__/connect.test.ts +6 -0
package/src/cli/commands/platform/__tests__/disconnect.test.ts +7 -1
package/src/cli/commands/platform/__tests__/status.test.ts +6 -0
package/src/cli/program.ts +30 -4
package/src/config/__tests__/backup-schema.test.ts +134 -0
package/src/config/assistant-feature-flags.ts +61 -62
package/src/config/bundled-skills/app-builder/references/CUSTOM_ROUTES.md +37 -1
package/src/config/bundled-skills/browser/SKILL.md +30 -5
package/src/config/bundled-skills/browser/TOOLS.json +123 -0
package/src/config/bundled-skills/browser/tools/browser-attach.ts +12 -0
package/src/config/bundled-skills/browser/tools/browser-detach.ts +12 -0
package/src/config/bundled-skills/browser/tools/browser-status.ts +12 -0
package/src/config/bundled-skills/browser/tools/browser-wait-for-download.ts +17 -0
package/src/config/bundled-skills/contacts/SKILL.md +2 -2
package/src/config/bundled-skills/gmail/SKILL.md +53 -7
package/src/config/bundled-skills/gmail/TOOLS.json +33 -3
package/src/config/bundled-skills/gmail/tools/gmail-archive.ts +116 -9
package/src/config/bundled-skills/gmail/tools/gmail-outreach-scan.ts +138 -11
package/src/config/bundled-skills/gmail/tools/gmail-preferences-tool.ts +59 -0
package/src/config/bundled-skills/gmail/tools/gmail-preferences.ts +82 -0
package/src/config/bundled-skills/gmail/tools/gmail-sender-digest.ts +113 -17
package/src/config/bundled-skills/gmail/tools/gmail-unsubscribe.ts +2 -2
package/src/config/bundled-skills/media-processing/SKILL.md +3 -9
package/src/config/bundled-skills/media-processing/TOOLS.json +1 -6
package/src/config/bundled-skills/media-processing/__tests__/audio-transcribe.test.ts +125 -0
package/src/config/bundled-skills/media-processing/__tests__/extract-keyframes.test.ts +181 -0
package/src/config/bundled-skills/media-processing/__tests__/preprocess-audio.test.ts +141 -0
package/src/config/bundled-skills/media-processing/services/audio-transcribe.ts +32 -87
package/src/config/bundled-skills/media-processing/services/preprocess.ts +8 -4
package/src/config/bundled-skills/media-processing/tools/extract-keyframes.ts +0 -10
package/src/config/bundled-skills/messaging/SKILL.md +3 -3
package/src/config/bundled-skills/messaging/tools/messaging-archive-by-sender.ts +2 -2
package/src/config/bundled-skills/outlook/SKILL.md +2 -2
package/src/config/bundled-skills/outlook/tools/outlook-unsubscribe.ts +2 -2
package/src/config/bundled-skills/phone-calls/SKILL.md +2 -2
package/src/config/bundled-skills/phone-calls/references/CONFIG.md +27 -18
package/src/config/bundled-skills/phone-calls/references/TROUBLESHOOTING.md +3 -3
package/src/config/bundled-skills/settings/TOOLS.json +3 -3
package/src/config/bundled-skills/settings/tools/voice-config-update.ts +26 -22
package/src/config/bundled-skills/slack/SKILL.md +1 -0
package/src/config/bundled-skills/transcribe/SKILL.md +9 -14
package/src/config/bundled-skills/transcribe/TOOLS.json +2 -7
package/src/config/bundled-skills/transcribe/tools/transcribe-media.test.ts +256 -0
package/src/config/bundled-skills/transcribe/tools/transcribe-media.ts +38 -188
package/src/config/bundled-tool-registry.ts +8 -0
package/src/config/env-registry.ts +24 -0
package/src/config/env.ts +34 -10
package/src/config/feature-flag-registry.json +46 -14
package/src/config/loader.ts +26 -12
package/src/config/schema.ts +35 -10
package/src/config/schemas/__tests__/stt.test.ts +43 -0
package/src/config/schemas/analysis.ts +51 -0
package/src/config/schemas/backup.ts +72 -0
package/src/config/schemas/calls.ts +1 -26
package/src/config/schemas/elevenlabs.ts +0 -59
package/src/config/schemas/filing.ts +47 -7
package/src/config/schemas/heartbeat.ts +27 -5
package/src/config/schemas/host-browser.ts +47 -1
package/src/config/schemas/inference.ts +1 -1
package/src/config/schemas/memory-lifecycle.ts +14 -2
package/src/config/schemas/services.ts +44 -0
package/src/config/schemas/stt.ts +59 -0
package/src/config/schemas/tts.ts +230 -0
package/src/config/schemas/updates.ts +14 -0
package/src/config/skills.ts +4 -0
package/src/config/types.ts +4 -0
package/src/contacts/contact-store.ts +56 -11
package/src/contacts/contacts-write.ts +38 -1
package/src/context/post-turn-tool-result-truncation.ts +3 -2
package/src/context/tool-result-truncation.ts +2 -1
package/src/context/window-manager.ts +45 -12
package/src/credential-execution/executable-discovery.ts +12 -2
package/src/credential-execution/process-manager.ts +33 -2
package/src/credential-health/credential-health-service.ts +366 -0
package/src/daemon/__tests__/conversation-lifecycle-auto-analyze.test.ts +324 -0
package/src/daemon/__tests__/conversation-surfaces-launch.test.ts +497 -0
package/src/daemon/__tests__/conversation-tool-setup.test.ts +17 -8
package/src/daemon/__tests__/lifecycle-startup-ordering.test.ts +127 -0
package/src/daemon/config-watcher.ts +99 -5
package/src/daemon/conversation-agent-loop-handlers.ts +6 -0
package/src/daemon/conversation-agent-loop.ts +101 -24
package/src/daemon/conversation-error.ts +11 -0
package/src/daemon/conversation-history.ts +40 -6
package/src/daemon/conversation-launch.ts +220 -0
package/src/daemon/conversation-lifecycle.ts +59 -9
package/src/daemon/conversation-messaging.ts +37 -3
package/src/daemon/conversation-notifiers.ts +5 -0
package/src/daemon/conversation-process.ts +581 -19
package/src/daemon/conversation-queue-manager.ts +24 -0
package/src/daemon/conversation-runtime-assembly.ts +11 -1
package/src/daemon/conversation-slash.ts +36 -0
package/src/daemon/conversation-surfaces.ts +94 -4
package/src/daemon/conversation-tool-setup.ts +25 -0
package/src/daemon/conversation-usage.ts +7 -4
package/src/daemon/conversation.ts +86 -28
package/src/daemon/handlers/config-slack-channel.ts +269 -94
package/src/daemon/handlers/conversations.ts +4 -1
package/src/daemon/handlers/shared.ts +22 -0
package/src/daemon/handlers/skills.ts +321 -77
package/src/daemon/host-browser-proxy.ts +2 -1
package/src/daemon/lifecycle.ts +122 -25
package/src/daemon/message-protocol.ts +6 -0
package/src/daemon/message-types/conversations.ts +34 -1
package/src/daemon/message-types/home.ts +40 -0
package/src/daemon/message-types/meet.ts +143 -0
package/src/daemon/message-types/messages.ts +14 -0
package/src/daemon/message-types/schedules.ts +34 -2
package/src/daemon/message-types/skills.ts +16 -0
package/src/daemon/message-types/surfaces.ts +2 -0
package/src/daemon/server.ts +347 -2
package/src/daemon/shutdown-handlers.ts +32 -4
package/src/daemon/shutdown-registry.ts +40 -0
package/src/daemon/tool-side-effects.ts +9 -0
package/src/email/html-renderer.ts +76 -0
package/src/heartbeat/heartbeat-service.ts +93 -7
package/src/home/__tests__/assistant-feed-authoring.test.ts +156 -0
package/src/home/__tests__/emit-feed-event.test.ts +169 -0
package/src/home/__tests__/feed-scheduler.test.ts +194 -0
package/src/home/__tests__/feed-types.test.ts +275 -0
package/src/home/__tests__/feed-writer.test.ts +688 -0
package/src/home/__tests__/phase5-exit-criteria.test.ts +212 -0
package/src/home/__tests__/platform-gmail-digest.test.ts +222 -0
package/src/home/__tests__/progress-formula.test.ts +213 -0
package/src/home/__tests__/relationship-state-writer.test.ts +740 -0
package/src/home/__tests__/rollup-producer.test.ts +398 -0
package/src/home/assistant-feed-authoring.ts +124 -0
package/src/home/emit-feed-event.ts +158 -0
package/src/home/feed-scheduler.ts +247 -0
package/src/home/feed-types.ts +181 -0
package/src/home/feed-writer.ts +469 -0
package/src/home/platform-gmail-digest.ts +163 -0
package/src/home/progress-formula.ts +86 -0
package/src/home/relationship-state-writer.ts +824 -0
package/src/home/relationship-state.ts +143 -0
package/src/home/rollup-producer.ts +384 -0
package/src/hooks/runner.ts +7 -0
package/src/inbound/platform-callback-registration.ts +12 -3
package/src/inbound/public-ingress-urls.ts +12 -0
package/src/instrument.ts +1 -1
package/src/ipc/__tests__/cli-ipc.test.ts +200 -0
package/src/ipc/cli-client.ts +151 -0
package/src/ipc/cli-server.ts +234 -0
package/src/ipc/gateway-client.ts +180 -0
package/src/ipc/routes/index.ts +5 -0
package/src/ipc/routes/wake-conversation.ts +19 -0
package/src/memory/__tests__/auto-analysis-enqueue.test.ts +356 -0
package/src/memory/__tests__/auto-analysis-guard.test.ts +57 -0
package/src/memory/__tests__/conversation-analyze-job.test.ts +232 -0
package/src/memory/__tests__/find-analysis-conversation.test.ts +196 -0
package/src/memory/app-store.ts +1 -1
package/src/memory/attachments-store.ts +70 -0
package/src/memory/auto-analysis-enqueue.ts +127 -0
package/src/memory/auto-analysis-guard.ts +27 -0
package/src/memory/cleanup-schedule-state.ts +37 -0
package/src/memory/conversation-analyze-job.ts +73 -0
package/src/memory/conversation-crud.ts +99 -0
package/src/memory/conversation-disk-view.ts +7 -0
package/src/memory/conversation-group-migration.ts +34 -2
package/src/memory/conversation-queries.ts +6 -5
package/src/memory/db-init.ts +6 -0
package/src/memory/db-maintenance.ts +108 -0
package/src/memory/db.ts +1 -0
package/src/memory/graph/conversation-graph-memory.ts +15 -0
package/src/memory/graph/extraction.test.ts +23 -0
package/src/memory/graph/extraction.ts +8 -0
package/src/memory/graph/retriever.ts +27 -18
package/src/memory/graph/scoring.test.ts +186 -0
package/src/memory/graph/scoring.ts +31 -1
package/src/memory/graph/tools.ts +1 -1
package/src/memory/group-crud.ts +6 -1
package/src/memory/indexer.ts +95 -16
package/src/memory/job-handlers/cleanup.ts +11 -8
package/src/memory/job-handlers/conversation-starters.ts +16 -10
package/src/memory/jobs-store.ts +64 -4
package/src/memory/jobs-worker.ts +22 -9
package/src/memory/llm-usage-store.ts +92 -56
package/src/memory/migrations/219-oauth-providers-token-exchange-body-format.ts +15 -0
package/src/memory/migrations/220-normalize-user-file-by-principal.ts +190 -0
package/src/memory/migrations/221-conversations-archived-at.ts +16 -0
package/src/memory/migrations/index.ts +6 -0
package/src/memory/migrations/registry.ts +8 -0
package/src/memory/qdrant-manager.ts +43 -16
package/src/memory/schema/conversations.ts +2 -0
package/src/memory/schema/oauth.ts +3 -0
package/src/memory/usage-buckets.ts +396 -0
package/src/messaging/providers/gmail/client.ts +57 -6
package/src/messaging/providers/slack/__tests__/adapter-token-routing.test.ts +282 -0
package/src/messaging/providers/slack/adapter.ts +143 -38
package/src/messaging/providers/slack/client.ts +16 -0
package/src/messaging/providers/slack/types.ts +4 -0
package/src/notifications/decision-engine.ts +3 -3
package/src/notifications/signal.ts +5 -0
package/src/oauth/__tests__/identity-verifier.test.ts +1 -0
package/src/oauth/byo-connection.test.ts +18 -1
package/src/oauth/byo-connection.ts +3 -1
package/src/oauth/connect-orchestrator.ts +2 -0
package/src/oauth/connection-resolver.ts +6 -2
package/src/oauth/connection.ts +2 -0
package/src/oauth/oauth-store.ts +9 -0
package/src/oauth/platform-connection.test.ts +98 -0
package/src/oauth/platform-connection.ts +52 -31
package/src/oauth/seed-providers.ts +7 -0
package/src/permissions/checker.ts +16 -6
package/src/permissions/defaults.ts +49 -1
package/src/permissions/trust-store.ts +3 -3
package/src/permissions/workspace-policy.ts +3 -0
package/src/platform/client.test.ts +10 -0
package/src/platform/sync-identity.ts +129 -0
package/src/prompts/persona-resolver.ts +126 -2
package/src/prompts/system-prompt.ts +59 -18
package/src/prompts/templates/BOOTSTRAP.md +5 -5
package/src/prompts/templates/SOUL.md +3 -1
package/src/prompts/templates/UPDATES.md +12 -0
package/src/prompts/templates/channels/slack.md +20 -0
package/src/prompts/update-bulletin-format.ts +26 -9
package/src/prompts/update-bulletin.ts +34 -23
package/src/prompts/user-reference.ts +20 -17
package/src/providers/__tests__/provider-secret-catalog.test.ts +42 -0
package/src/providers/anthropic/client.ts +157 -61
package/src/providers/fireworks/client.ts +2 -2
package/src/providers/gemini/client.ts +9 -1
package/src/providers/model-catalog.ts +6 -0
package/src/providers/model-intents.ts +4 -4
package/src/providers/ollama/client.ts +2 -2
package/src/providers/openai/chat-completions-provider.ts +474 -0
package/src/providers/openai/client.ts +25 -440
package/src/providers/openai/responses-provider.ts +502 -0
package/src/providers/openrouter/client.ts +101 -4
package/src/providers/provider-secret-catalog.ts +139 -0
package/src/providers/registry.ts +2 -2
package/src/providers/retry.ts +14 -3
package/src/providers/speech-to-text/__tests__/provider-catalog.test.ts +251 -0
package/src/providers/speech-to-text/__tests__/resolve.test.ts +828 -0
package/src/providers/speech-to-text/deepgram-realtime.test.ts +980 -0
package/src/providers/speech-to-text/deepgram-realtime.ts +767 -0
package/src/providers/speech-to-text/deepgram.test.ts +332 -0
package/src/providers/speech-to-text/deepgram.ts +115 -0
package/src/providers/speech-to-text/google-gemini-live-stream.test.ts +743 -0
package/src/providers/speech-to-text/google-gemini-live-stream.ts +625 -0
package/src/providers/speech-to-text/google-gemini.test.ts +226 -0
package/src/providers/speech-to-text/google-gemini.ts +101 -0
package/src/providers/speech-to-text/openai-whisper-stream.test.ts +564 -0
package/src/providers/speech-to-text/openai-whisper-stream.ts +381 -0
package/src/providers/speech-to-text/openai-whisper.test.ts +1 -37
package/src/providers/speech-to-text/openai-whisper.ts +63 -33
package/src/providers/speech-to-text/provider-catalog.ts +306 -0
package/src/providers/speech-to-text/resolve.ts +386 -6
package/src/providers/types.ts +9 -0
package/src/runtime/AGENTS.md +43 -1
package/src/runtime/__tests__/agent-wake.test.ts +831 -0
package/src/runtime/__tests__/runtime-mode.test.ts +62 -0
package/src/runtime/__tests__/slack-block-formatting.test.ts +481 -0
package/src/runtime/agent-wake.ts +512 -0
package/src/runtime/auth/__tests__/route-policy.test.ts +40 -0
package/src/runtime/auth/route-policy.ts +30 -5
package/src/runtime/auth/token-service.ts +56 -1
package/src/runtime/btw-sidechain.ts +2 -0
package/src/runtime/capability-tokens.ts +10 -10
package/src/runtime/channel-invite-transport.ts +1 -1
package/src/runtime/channel-invite-transports/email.ts +14 -6
package/src/runtime/channel-readiness-service.ts +12 -22
package/src/runtime/chrome-extension-registry.ts +38 -2
package/src/runtime/http-server.ts +395 -10
package/src/runtime/http-types.ts +6 -2
package/src/runtime/migrations/__tests__/vbundle-import-credentials.test.ts +36 -0
package/src/runtime/migrations/__tests__/vbundle-legacy-user-md.test.ts +360 -0
package/src/runtime/migrations/migration-transport.ts +1 -0
package/src/runtime/migrations/migration-wizard.ts +1 -0
package/src/runtime/migrations/vbundle-import-analyzer.ts +77 -1
package/src/runtime/migrations/vbundle-importer.ts +34 -0
package/src/runtime/pending-interactions.ts +0 -11
package/src/runtime/routes/__tests__/backup-routes.test.ts +967 -0
package/src/runtime/routes/__tests__/home-feed-routes.test.ts +507 -0
package/src/runtime/routes/__tests__/migration-import-credential-filter.test.ts +208 -0
package/src/runtime/routes/__tests__/stt-routes.test.ts +406 -0
package/src/runtime/routes/__tests__/tts-routes.test.ts +474 -0
package/src/runtime/routes/__tests__/user-route-dispatcher.test.ts +148 -17
package/src/runtime/routes/app-management-routes.ts +12 -18
package/src/runtime/routes/attachment-routes.test.ts +9 -3
package/src/runtime/routes/attachment-routes.ts +216 -17
package/src/runtime/routes/backup-routes.ts +519 -0
package/src/runtime/routes/browser-extension-pair-routes.ts +82 -23
package/src/runtime/routes/btw-routes.ts +8 -6
package/src/runtime/routes/contact-routes.test.ts +298 -0
package/src/runtime/routes/contact-routes.ts +132 -5
package/src/runtime/routes/conversation-analysis-routes.ts +22 -142
package/src/runtime/routes/conversation-management-routes.ts +115 -0
package/src/runtime/routes/conversation-routes.ts +367 -146
package/src/runtime/routes/filing-routes.ts +93 -0
package/src/runtime/routes/home-feed-routes.ts +334 -0
package/src/runtime/routes/home-state-routes.ts +138 -0
package/src/runtime/routes/host-browser-routes.ts +3 -14
package/src/runtime/routes/identity-intro-cache.ts +7 -3
package/src/runtime/routes/identity-routes.ts +3 -17
package/src/runtime/routes/inbound-stages/transcribe-audio.test.ts +46 -39
package/src/runtime/routes/inbound-stages/transcribe-audio.ts +15 -15
package/src/runtime/routes/integrations/slack/__tests__/channel.test.ts +137 -0
package/src/runtime/routes/integrations/slack/__tests__/share.test.ts +179 -0
package/src/runtime/routes/integrations/slack/channel.ts +11 -3
package/src/runtime/routes/integrations/slack/share.ts +45 -7
package/src/runtime/routes/llm-context-normalization.ts +303 -0
package/src/runtime/routes/memory-item-routes.test.ts +3 -2
package/src/runtime/routes/migration-routes.ts +40 -5
package/src/runtime/routes/settings-routes.ts +22 -5
package/src/runtime/routes/skills-routes.ts +76 -7
package/src/runtime/routes/stt-routes.ts +233 -0
package/src/runtime/routes/surface-action-routes.ts +41 -2
package/src/runtime/routes/tts-routes.ts +108 -24
package/src/runtime/routes/usage-routes.ts +30 -2
package/src/runtime/routes/user-route-dispatcher.ts +50 -5
package/src/runtime/routes/user-routes.ts +13 -1
package/src/runtime/routes/work-items-routes.ts +8 -1
package/src/runtime/runtime-mode.ts +33 -0
package/src/runtime/services/__tests__/analyze-conversation.test.ts +444 -0
package/src/runtime/services/__tests__/analyze-deps-singleton.test.ts +67 -0
package/src/runtime/services/__tests__/auto-analysis-prompt.test.ts +53 -0
package/src/runtime/services/__tests__/manual-analysis-prompt.test.ts +41 -0
package/src/runtime/services/analyze-conversation.ts +344 -0
package/src/runtime/services/analyze-deps-singleton.ts +32 -0
package/src/runtime/services/auto-analysis-prompt.ts +55 -0
package/src/runtime/skill-route-registry.ts +49 -0
package/src/runtime/slack-block-formatting.ts +437 -10
package/src/schedule/scheduler.ts +50 -0
package/src/security/oauth2.ts +26 -4
package/src/security/secure-keys.ts +25 -2
package/src/security/token-manager.ts +8 -0
package/src/sequence/engine.ts +23 -0
package/src/sequence/types.ts +1 -1
package/src/skills/catalog-files.ts +64 -2
package/src/skills/category-inference.ts +122 -0
package/src/skills/clawhub-files.ts +213 -0
package/src/skills/clawhub.ts +84 -23
package/src/skills/skill-file-provider.ts +40 -0
package/src/skills/skillssh-files.ts +395 -0
package/src/skills/skillssh-registry.ts +4 -4
package/src/stt/__tests__/daemon-batch-transcriber.test.ts +392 -0
package/src/stt/__tests__/types.test.ts +89 -0
package/src/stt/daemon-batch-transcriber.ts +195 -0
package/src/stt/stt-stream-session.ts +499 -0
package/src/stt/types.ts +330 -0
package/src/stt/wav-encoder.test.ts +373 -0
package/src/stt/wav-encoder.ts +175 -0
package/src/subagent/manager.ts +38 -14
package/src/tools/browser/__tests__/browser-mode.test.ts +119 -0
package/src/tools/browser/__tests__/browser-status.test.ts +123 -0
package/src/tools/browser/browser-execution.ts +1163 -23
package/src/tools/browser/browser-manager.ts +45 -0
package/src/tools/browser/browser-mode-constants.ts +12 -0
package/src/tools/browser/browser-mode.ts +92 -0
package/src/tools/browser/browser-status-constants.ts +33 -0
package/src/tools/browser/cdp-client/__tests__/cdp-inspect-client.test.ts +393 -0
package/src/tools/browser/cdp-client/__tests__/extension-cdp-client.test.ts +29 -0
package/src/tools/browser/cdp-client/__tests__/factory.test.ts +1648 -32
package/src/tools/browser/cdp-client/cdp-inspect/__tests__/discovery.test.ts +264 -0
package/src/tools/browser/cdp-client/cdp-inspect/discovery.ts +183 -17
package/src/tools/browser/cdp-client/cdp-inspect-client.ts +254 -21
package/src/tools/browser/cdp-client/errors.ts +15 -0
package/src/tools/browser/cdp-client/extension-cdp-client.ts +39 -16
package/src/tools/browser/cdp-client/factory.ts +797 -87
package/src/tools/browser/cdp-client/index.ts +16 -2
package/src/tools/browser/cdp-client/types.ts +68 -0
package/src/tools/credentials/vault.ts +35 -6
package/src/tools/network/web-fetch.ts +5 -2
package/src/tools/network/web-search.ts +5 -2
package/src/tools/shared/shell-output.ts +3 -1
package/src/tools/side-effects.ts +2 -0
package/src/tools/skills/sandbox-runner.ts +3 -2
package/src/tools/terminal/safe-env.ts +10 -2
package/src/tools/terminal/shell.ts +15 -4
package/src/tools/tool-manifest.ts +21 -0
package/src/tools/types.ts +17 -0
package/src/tools/ui-surface/definitions.ts +6 -1
package/src/tts/__tests__/provider-adapters.test.ts +834 -0
package/src/tts/__tests__/provider-catalog-consistency.test.ts +196 -0
package/src/tts/__tests__/provider-catalog.test.ts +183 -0
package/src/tts/__tests__/provider-registry.test.ts +90 -0
package/src/tts/provider-catalog.ts +201 -0
package/src/tts/provider-registry.ts +73 -0
package/src/tts/providers/deepgram-provider.ts +219 -0
package/src/tts/providers/elevenlabs-provider.ts +211 -0
package/src/tts/providers/fish-audio-provider.ts +183 -0
package/src/tts/providers/index.ts +42 -0
package/src/tts/providers/register-builtins.ts +130 -0
package/src/tts/synthesize-text.ts +110 -0
package/src/tts/tts-config-resolver.ts +78 -0
package/src/tts/types.ts +153 -0
package/src/types/onboarding-context.ts +7 -0
package/src/util/abort-reasons.ts +58 -0
package/src/util/device-id.ts +32 -16
package/src/util/errors.ts +9 -1
package/src/util/platform.ts +54 -10
package/src/util/pricing.ts +66 -3
package/src/util/spawn.ts +1 -1
package/src/util/truncate.ts +4 -2
package/src/util/unicode.ts +201 -0
package/src/version.ts +19 -24
package/src/watcher/engine.ts +23 -0
package/src/watcher/watcher-store.ts +31 -0
package/src/workspace/migrations/003-seed-device-id.ts +9 -3
package/src/workspace/migrations/017-seed-persona-dirs.ts +68 -4
package/src/workspace/migrations/029-seed-pkb.ts +1 -1
package/src/workspace/migrations/031-drop-user-md.ts +317 -0
package/src/workspace/migrations/031-llm-log-retention-zero-to-null.ts +73 -0
package/src/workspace/migrations/032-tts-provider-unification.ts +227 -0
package/src/workspace/migrations/033-stt-service-explicit-config.ts +122 -0
package/src/workspace/migrations/034-remove-calls-voice-transcription-provider.ts +215 -0
package/src/workspace/migrations/035-seed-slack-channel-persona.ts +50 -0
package/src/workspace/migrations/036-update-pkb-index-bar.ts +37 -0
package/src/workspace/migrations/037-create-meets-dir.ts +61 -0
package/src/workspace/migrations/registry.ts +16 -0
package/src/workspace/top-level-renderer.ts +13 -1
package/src/workspace/turn-commit.ts +31 -0
package/src/__tests__/email-cli.test.ts +0 -297
package/src/__tests__/email-service-config-fallback.test.ts +0 -102
package/src/cli/commands/browser-relay.ts +0 -466
package/src/email/guardrails.ts +0 -221
package/src/email/provider.ts +0 -117
package/src/email/providers/agentmail.ts +0 -361
package/src/email/providers/index.ts +0 -65
package/src/email/service.ts +0 -384
package/src/email/types.ts +0 -126
package/src/prompts/templates/USER.md +0 -13
package/src/providers/speech-to-text/types.ts +0 -17
package/src/runtime/routes/browser-cdp-routes.ts +0 -229

package/src/__tests__/conversation-queue.test.ts CHANGED Viewed

@@ -105,6 +105,20 @@ mock.module("../config/loader.js", () => ({
 const mockedConversationHostAccess = new Map<string, boolean>();
+const capturedAddMessages: Array<{
+  id: string;
+  role: string;
+  content: string;
+  metadata?: Record<string, unknown>;
+}> = [];
+/**
+ * Content substrings that should cause `addMessage` to throw — used to
+ * simulate a mid-batch persist failure (e.g. a DB error on a specific
+ * tail message while its siblings succeed).
+ */
+const addMessageShouldThrowForContent = new Set<string>();
 mock.module("../prompts/system-prompt.js", () => ({
   buildSystemPrompt: () => "system prompt",
 }));
@@ -133,6 +147,7 @@ mock.module("../security/secret-allowlist.js", () => ({
 mock.module("../memory/conversation-crud.js", () => ({
   getConversationType: () => "default",
   setConversationOriginChannelIfUnset: () => {},
+  setConversationOriginInterfaceIfUnset: () => {},
   updateConversationContextWindow: () => {},
   getConversationHostAccess: (conversationId: string) =>
     mockedConversationHostAccess.get(conversationId) ?? false,
@@ -159,11 +174,28 @@ mock.module("../memory/conversation-crud.js", () => ({
     totalEstimatedCost: 0,
   }),
   createConversation: () => ({ id: "conv-1" }),
-  addMessage: (_convId: string, _role: string, _content: string) => {
-    return { id: `msg-${Date.now()}` };
+  addMessage: (
+    _convId: string,
+    role: string,
+    content: string,
+    metadata?: Record<string, unknown>,
+  ) => {
+    // Simulate a persist failure for tests that need to exercise the
+    // tail-persist-failed path in drainBatch. Triggered by matching any
+    // registered substring against the serialized content payload.
+    for (const needle of addMessageShouldThrowForContent) {
+      if (content.includes(needle)) {
+        throw new Error(`Simulated addMessage failure for content: ${needle}`);
+      }
+    }
+    const id = `msg-${Date.now()}-${capturedAddMessages.length}`;
+    capturedAddMessages.push({ id, role, content, metadata });
+    return { id };
   },
   updateConversationUsage: () => {},
   updateConversationTitle: () => {},
+  getMessageById: () => null,
+  getLastUserTimestampBefore: () => 0,
 }));
 mock.module("../memory/conversation-queries.js", () => ({
@@ -456,6 +488,7 @@ beforeEach(() => {
   turnCommitCalls.length = 0;
   turnCommitHangForever = false;
   linkAttachmentShouldThrow = false;
+  addMessageShouldThrowForContent.clear();
 });
 afterAll(() => {
@@ -521,44 +554,73 @@ describe("Conversation message queue", () => {
     await new Promise((r) => setTimeout(r, 10));
   });
-  test("[experimental] queued messages are processed in FIFO order", async () => {
+  test("[experimental] queued passthrough siblings drain as a single batched run", async () => {
     const conversation = makeConversation();
     await conversation.loadFromDb();
-    const processedOrder: string[] = [];
-    const makeHandler = (label: string) => (e: ServerMessage) => {
-      if (e.type === "message_complete") processedOrder.push(label);
-    };
+    const events1: ServerMessage[] = [];
+    const events2: ServerMessage[] = [];
+    const events3: ServerMessage[] = [];
     // Start first message
     const p1 = conversation.processMessage(
       "msg-1",
       [],
-      makeHandler("msg-1"),
+      (e) => events1.push(e),
       "req-1",
     );
     await waitForPendingRun(1);
-    // Enqueue two more
-    conversation.enqueueMessage("msg-2", [], makeHandler("msg-2"), "req-2");
-    conversation.enqueueMessage("msg-3", [], makeHandler("msg-3"), "req-3");
+    // Enqueue two more sibling passthrough messages
+    conversation.enqueueMessage("msg-2", [], (e) => events2.push(e), "req-2");
+    conversation.enqueueMessage("msg-3", [], (e) => events3.push(e), "req-3");
     expect(conversation.getQueueDepth()).toBe(2);
-    // Complete first → triggers second
+    // Complete run 0 → drain pulls msg-2 and msg-3 into ONE batched run.
     resolveRun(0);
     await p1;
     await waitForPendingRun(2);
-    // Complete second → triggers third
-    resolveRun(1);
-    await waitForPendingRun(3);
+    // Exactly two runs total (not three): run 0 = msg-1, run 1 = batched [msg-2, msg-3]
+    expect(pendingRuns.length).toBe(2);
-    // Complete third
-    resolveRun(2);
+    // Each batched client saw its own message_dequeued tagged with its own requestId.
+    const dequeued2 = events2.filter((e) => e.type === "message_dequeued");
+    expect(dequeued2).toHaveLength(1);
+    expect(dequeued2[0]).toEqual({
+      type: "message_dequeued",
+      conversationId: "conv-1",
+      requestId: "req-2",
+    });
+    const dequeued3 = events3.filter((e) => e.type === "message_dequeued");
+    expect(dequeued3).toHaveLength(1);
+    expect(dequeued3[0]).toEqual({
+      type: "message_dequeued",
+      conversationId: "conv-1",
+      requestId: "req-3",
+    });
+    // The batched run's captured history carries both siblings. Either as
+    // separate user entries (raw history) or merged into one user entry
+    // (after history-repair's alternation enforcement — required by the
+    // Anthropic API). Either way, both msg-2 and msg-3 text must appear.
+    const batchedHistory = pendingRuns[1].messages;
+    const userMessages = batchedHistory.filter((m) => m.role === "user");
+    const textOf = (m: Message) =>
+      (Array.isArray(m.content) ? m.content : [])
+        .filter((b) => b.type === "text")
+        .map((b) => (b as { text: string }).text)
+        .join("\n");
+    const combinedUserText = userMessages.map(textOf).join("\n");
+    expect(combinedUserText).toContain("msg-2");
+    expect(combinedUserText).toContain("msg-3");
+    // Resolve the batched run; message_complete must fan out to both clients.
+    resolveRun(1);
     await new Promise((r) => setTimeout(r, 10));
-    expect(processedOrder).toEqual(["msg-1", "msg-2", "msg-3"]);
+    expect(events2.some((e) => e.type === "message_complete")).toBe(true);
+    expect(events3.some((e) => e.type === "message_complete")).toBe(true);
   });
   test("message_queued and message_dequeued events are emitted", async () => {
@@ -699,27 +761,17 @@ describe("Conversation message queue", () => {
     conversation.enqueueMessage("msg-4", [], () => {}, "req-4");
     expect(conversation.getQueueDepth()).toBe(3);
-    // Complete first → drains one from queue
+    // Complete first → drain pulls all three same-interface passthroughs
+    // into a single batched run (depth → 0, runs → 2 total).
     resolveRun(0);
     await p1;
     await waitForPendingRun(2);
-    expect(conversation.getQueueDepth()).toBe(2);
-    // Complete second → drains another
-    resolveRun(1);
-    await waitForPendingRun(3);
-    expect(conversation.getQueueDepth()).toBe(1);
-    // Complete third → drains last
-    resolveRun(2);
-    await waitForPendingRun(4);
     expect(conversation.getQueueDepth()).toBe(0);
+    expect(pendingRuns.length).toBe(2);
-    // Complete fourth (final queued message)
-    resolveRun(3);
+    // Complete the batched run; conversation finishes cleanly.
+    resolveRun(1);
     await new Promise((r) => setTimeout(r, 10));
   });
@@ -773,6 +825,763 @@ describe("Conversation message queue", () => {
   });
 });
+// ---------------------------------------------------------------------------
+// Batched drain — mixed-interface, slash-in-middle, attachments, byte budget
+// ---------------------------------------------------------------------------
+describe("Batched drain", () => {
+  beforeEach(() => {
+    pendingRuns = [];
+  });
+  test("mixed-interface queue splits into multiple batches at each interface boundary", async () => {
+    const conversation = makeConversation();
+    await conversation.loadFromDb();
+    const events2: ServerMessage[] = [];
+    const events3: ServerMessage[] = [];
+    const events4: ServerMessage[] = [];
+    const events5: ServerMessage[] = [];
+    // Start in-flight message (msg-1)
+    const p1 = conversation.processMessage("msg-1", [], () => {}, "req-1");
+    await waitForPendingRun(1);
+    // Enqueue 4 messages with interfaces [macos, macos, cli, macos].
+    // Expected drain: [macos batch of 2] → [cli single] → [macos single].
+    const meta = (iface: string) => ({
+      userMessageInterface: iface,
+      assistantMessageInterface: iface,
+    });
+    conversation.enqueueMessage(
+      "msg-2",
+      [],
+      (e) => events2.push(e),
+      "req-2",
+      undefined,
+      undefined,
+      meta("macos"),
+    );
+    conversation.enqueueMessage(
+      "msg-3",
+      [],
+      (e) => events3.push(e),
+      "req-3",
+      undefined,
+      undefined,
+      meta("macos"),
+    );
+    conversation.enqueueMessage(
+      "msg-4",
+      [],
+      (e) => events4.push(e),
+      "req-4",
+      undefined,
+      undefined,
+      meta("cli"),
+    );
+    conversation.enqueueMessage(
+      "msg-5",
+      [],
+      (e) => events5.push(e),
+      "req-5",
+      undefined,
+      undefined,
+      meta("macos"),
+    );
+    expect(conversation.getQueueDepth()).toBe(4);
+    // Resolve msg-1 → batched run pulls macos msg-2 + msg-3.
+    resolveRun(0);
+    await p1;
+    await waitForPendingRun(2);
+    // Batched run's history must contain both macos messages (either as
+    // separate user entries or merged into one after history-repair).
+    const macosBatchedHistory = pendingRuns[1].messages;
+    const macosUserMessages = macosBatchedHistory.filter(
+      (m) => m.role === "user",
+    );
+    const textOf = (m: Message) =>
+      (Array.isArray(m.content) ? m.content : [])
+        .filter((b) => b.type === "text")
+        .map((b) => (b as { text: string }).text)
+        .join("\n");
+    const combinedMacosText = macosUserMessages.map(textOf).join("\n");
+    expect(combinedMacosText).toContain("msg-2");
+    expect(combinedMacosText).toContain("msg-3");
+    // Both msg-2 and msg-3 received their own dequeue event.
+    expect(events2.filter((e) => e.type === "message_dequeued")).toHaveLength(
+      1,
+    );
+    expect(events3.filter((e) => e.type === "message_dequeued")).toHaveLength(
+      1,
+    );
+    // Resolve the batched run → drain pulls the cli single-message run.
+    resolveRun(1);
+    await waitForPendingRun(3);
+    // cli run contains msg-4 as a single-message run.
+    const cliHistory = pendingRuns[2].messages;
+    const cliUserText = cliHistory
+      .filter((m) => m.role === "user")
+      .map(textOf)
+      .join("\n");
+    expect(cliUserText).toContain("msg-4");
+    expect(events4.filter((e) => e.type === "message_dequeued")).toHaveLength(
+      1,
+    );
+    // Resolve the cli run → drain pulls the final macos single-message run.
+    resolveRun(2);
+    await waitForPendingRun(4);
+    const finalHistory = pendingRuns[3].messages;
+    const finalUserText = finalHistory
+      .filter((m) => m.role === "user")
+      .map(textOf)
+      .join("\n");
+    expect(finalUserText).toContain("msg-5");
+    expect(events5.filter((e) => e.type === "message_dequeued")).toHaveLength(
+      1,
+    );
+    // Four total runs: msg-1, batched [msg-2, msg-3], msg-4, msg-5.
+    expect(pendingRuns.length).toBe(4);
+    resolveRun(3);
+    await new Promise((r) => setTimeout(r, 10));
+  });
+  test("slash-in-middle splits the queue at the slash boundary", async () => {
+    const conversation = makeConversation();
+    await conversation.loadFromDb();
+    const eventsHello: ServerMessage[] = [];
+    const eventsSlash: ServerMessage[] = [];
+    const eventsWorld: ServerMessage[] = [];
+    // Start in-flight message
+    const p1 = conversation.processMessage("msg-1", [], () => {}, "req-1");
+    await waitForPendingRun(1);
+    // Enqueue ["hello", "/compact", "world"]. /compact resolves to a non-
+    // passthrough slash, so the batch builder stops at "hello" (length 1),
+    // then /compact takes the single-message /compact short-circuit path
+    // (no new runAgentLoop invocation), then "world" drains as its own run.
+    conversation.enqueueMessage(
+      "hello",
+      [],
+      (e) => eventsHello.push(e),
+      "req-hello",
+    );
+    conversation.enqueueMessage(
+      "/compact",
+      [],
+      (e) => eventsSlash.push(e),
+      "req-slash",
+    );
+    conversation.enqueueMessage(
+      "world",
+      [],
+      (e) => eventsWorld.push(e),
+      "req-world",
+    );
+    expect(conversation.getQueueDepth()).toBe(3);
+    // Resolve msg-1 → drain pulls "hello" as its own run (batch stops at
+    // /compact boundary).
+    resolveRun(0);
+    await p1;
+    await waitForPendingRun(2);
+    expect(pendingRuns.length).toBe(2);
+    expect(eventsHello.some((e) => e.type === "message_dequeued")).toBe(true);
+    // /compact and "world" are still queued.
+    expect(conversation.getQueueDepth()).toBe(2);
+    // Resolve "hello" → drain pops /compact via the builder-rejected path,
+    // runs its short-circuit (no new runAgentLoop), then drains "world".
+    resolveRun(1);
+    await waitForPendingRun(3);
+    // /compact should have emitted its own message_complete via the short-
+    // circuit path (not via a runAgentLoop run).
+    expect(eventsSlash.some((e) => e.type === "message_complete")).toBe(true);
+    expect(eventsWorld.some((e) => e.type === "message_dequeued")).toBe(true);
+    expect(pendingRuns.length).toBe(3);
+    resolveRun(2);
+    await new Promise((r) => setTimeout(r, 10));
+  });
+  test("unknown-slash in middle splits the queue at the unknown-slash boundary", async () => {
+    // Covers the `kind: "unknown"` short-circuit branch in drainSingleMessage
+    // specifically. The sibling /compact-in-middle test covers the `kind:
+    // "compact"` short-circuit (via a different code path), so this test
+    // exists to guarantee the batch builder also stops at unknown-kind
+    // boundaries and that the unknown-slash drain path does NOT invoke a new
+    // runAgentLoop run.
+    //
+    // We use `/status`, which the real `resolveSlash` returns as
+    // `{ kind: "unknown", message: <status report> }` when a SlashContext is
+    // present (always true for queued drains via buildSlashContext).
+    const conversation = makeConversation();
+    await conversation.loadFromDb();
+    const eventsPlainA: ServerMessage[] = [];
+    const eventsSlash: ServerMessage[] = [];
+    const eventsPlainB: ServerMessage[] = [];
+    // Start in-flight message
+    const p1 = conversation.processMessage("msg-1", [], () => {}, "req-1");
+    await waitForPendingRun(1);
+    // Enqueue ["plain-a", "/status", "plain-b"]. /status resolves to a non-
+    // passthrough slash (kind: "unknown"), so the batch builder stops at
+    // "plain-a" (length-1 batch → drainSingleMessage), then /status takes the
+    // unknown-slash short-circuit path (no new runAgentLoop invocation — it
+    // emits assistant_text_delta + message_complete inline), then "plain-b"
+    // drains as its own run.
+    conversation.enqueueMessage(
+      "plain-a",
+      [],
+      (e) => eventsPlainA.push(e),
+      "req-plain-a",
+    );
+    conversation.enqueueMessage(
+      "/status",
+      [],
+      (e) => eventsSlash.push(e),
+      "req-slash",
+    );
+    conversation.enqueueMessage(
+      "plain-b",
+      [],
+      (e) => eventsPlainB.push(e),
+      "req-plain-b",
+    );
+    expect(conversation.getQueueDepth()).toBe(3);
+    // Resolve msg-1 → drain pulls "plain-a" as its own run (batch stops at
+    // the /status boundary).
+    resolveRun(0);
+    await p1;
+    await waitForPendingRun(2);
+    expect(pendingRuns.length).toBe(2);
+    expect(eventsPlainA.some((e) => e.type === "message_dequeued")).toBe(true);
+    // /status and "plain-b" are still queued.
+    expect(conversation.getQueueDepth()).toBe(2);
+    // Resolve "plain-a" → drain pops /status via the builder-rejected path,
+    // runs its unknown-slash short-circuit (no new runAgentLoop, emits
+    // assistant_text_delta + message_complete inline), then drains "plain-b"
+    // as its own run.
+    resolveRun(1);
+    await waitForPendingRun(3);
+    // /status should have emitted its own assistant_text_delta + message_complete
+    // via the unknown-slash short-circuit path (not via a runAgentLoop run).
+    expect(eventsSlash.some((e) => e.type === "assistant_text_delta")).toBe(
+      true,
+    );
+    expect(eventsSlash.some((e) => e.type === "message_complete")).toBe(true);
+    expect(eventsPlainB.some((e) => e.type === "message_dequeued")).toBe(true);
+    // Only three runs total: msg-1, "plain-a", "plain-b". /status short-circuits
+    // without a runAgentLoop invocation.
+    expect(pendingRuns.length).toBe(3);
+    resolveRun(2);
+    await new Promise((r) => setTimeout(r, 10));
+  });
+  test("attachments are preserved across a batched drain", async () => {
+    capturedAddMessages.length = 0;
+    const conversation = makeConversation();
+    await conversation.loadFromDb();
+    // Start in-flight message
+    const p1 = conversation.processMessage("msg-1", [], () => {}, "req-1");
+    await waitForPendingRun(1);
+    // Two sibling messages, each with a distinct image attachment.
+    const attachA = [
+      {
+        id: "att-a",
+        filename: "a.png",
+        mimeType: "image/png",
+        data: Buffer.from("imageA").toString("base64"),
+        filePath: "/tmp/a.png",
+      },
+    ];
+    const attachB = [
+      {
+        id: "att-b",
+        filename: "b.png",
+        mimeType: "image/png",
+        data: Buffer.from("imageB").toString("base64"),
+        filePath: "/tmp/b.png",
+      },
+    ];
+    conversation.enqueueMessage("with-A", attachA, () => {}, "req-A");
+    conversation.enqueueMessage("with-B", attachB, () => {}, "req-B");
+    expect(conversation.getQueueDepth()).toBe(2);
+    resolveRun(0);
+    await p1;
+    await waitForPendingRun(2);
+    // Two persisted user rows in the DB (one per batched message), each with
+    // its own imageSourcePaths metadata keyed by the right filename.
+    const userRows = capturedAddMessages.filter(
+      (m) => m.role === "user" && m.content.includes('"image"'),
+    );
+    expect(userRows).toHaveLength(2);
+    const pathsA = (userRows[0].metadata as Record<string, unknown>)
+      ?.imageSourcePaths as Record<string, string> | undefined;
+    expect(pathsA).toBeDefined();
+    expect(pathsA!["0:a.png"]).toBe("/tmp/a.png");
+    const pathsB = (userRows[1].metadata as Record<string, unknown>)
+      ?.imageSourcePaths as Record<string, string> | undefined;
+    expect(pathsB).toBeDefined();
+    expect(pathsB!["0:b.png"]).toBe("/tmp/b.png");
+    // The batched run's in-memory history also reflects both image sources
+    // (enrichMessageWithSourcePaths injects file:// references for images).
+    const batchedHistory = pendingRuns[1].messages;
+    const userMessages = batchedHistory.filter((m) => m.role === "user");
+    const allText = userMessages
+      .map((m) =>
+        (Array.isArray(m.content) ? m.content : [])
+          .filter((b) => b.type === "text")
+          .map((b) => (b as { text: string }).text)
+          .join("\n"),
+      )
+      .join("\n");
+    expect(allText).toContain("a.png");
+    expect(allText).toContain("b.png");
+    resolveRun(1);
+    await new Promise((r) => setTimeout(r, 10));
+  });
+  test("byte-budget accounting is unchanged by shiftN-based batching", async () => {
+    // Uses a small budget so we can observe reclamation after drain.
+    // Each ~500-char message ≈ 1512 bytes.
+    const conversation = makeConversation();
+    await conversation.loadFromDb();
+    const budget = 4000;
+    (conversation as unknown as { queue: MessageQueue }).queue =
+      new MessageQueue(budget);
+    // Start in-flight so subsequent enqueues are queued (not processed).
+    const p1 = conversation.processMessage("msg-1", [], () => {}, "req-1");
+    await waitForPendingRun(1);
+    // Fill to just-under budget: two ~500-char messages (1512+1512 = 3024 bytes).
+    const accepted1 = conversation.enqueueMessage(
+      "x".repeat(500),
+      [],
+      () => {},
+      "req-big-1",
+    );
+    const accepted2 = conversation.enqueueMessage(
+      "y".repeat(500),
+      [],
+      () => {},
+      "req-big-2",
+    );
+    expect(accepted1.queued).toBe(true);
+    expect(accepted2.queued).toBe(true);
+    // A third would push the queue over budget → rejected. Capture its
+    // onEvent callback so we can verify the queue_full error event reaches
+    // the rejected caller (not just the synchronous return value).
+    const rejectedEvents: ServerMessage[] = [];
+    const rejected = conversation.enqueueMessage(
+      "z".repeat(500),
+      [],
+      (e) => rejectedEvents.push(e),
+      "req-over",
+    );
+    expect(rejected.queued).toBe(false);
+    expect(rejected.rejected).toBe(true);
+    expect(conversation.getQueueDepth()).toBe(2);
+    // The rejected caller must have received a `queue_full` error event on
+    // its own onEvent callback — event emission is part of the public
+    // contract, not just the return value.
+    const queueFullErr = rejectedEvents.find(
+      (e) => e.type === "error" && e.category === "queue_full",
+    );
+    expect(queueFullErr).toBeDefined();
+    if (queueFullErr && queueFullErr.type === "error") {
+      expect(queueFullErr.category).toBe("queue_full");
+      expect(typeof queueFullErr.message).toBe("string");
+      expect(queueFullErr.message.length).toBeGreaterThan(0);
+    }
+    // Complete in-flight → drain pulls both queued passthroughs as ONE batched run.
+    resolveRun(0);
+    await p1;
+    await waitForPendingRun(2);
+    expect(conversation.getQueueDepth()).toBe(0);
+    // Resolve the batched run.
+    resolveRun(1);
+    await new Promise((r) => setTimeout(r, 10));
+    // After the full drain, the byte budget must be fully reclaimed — a fresh
+    // round of enqueues up to the budget should succeed again. Spin up another
+    // in-flight message to reach the queueing state.
+    const p2 = conversation.processMessage("msg-2", [], () => {}, "req-2");
+    await waitForPendingRun(3);
+    expect(
+      conversation.enqueueMessage("a".repeat(500), [], () => {}, "req-a")
+        .queued,
+    ).toBe(true);
+    expect(
+      conversation.enqueueMessage("b".repeat(500), [], () => {}, "req-b")
+        .queued,
+    ).toBe(true);
+    resolveRun(2);
+    await p2;
+    await waitForPendingRun(4);
+    resolveRun(3);
+    await new Promise((r) => setTimeout(r, 10));
+  });
+});
+// ---------------------------------------------------------------------------
+// Batched drain — correctness fixes (surface exclusion, abort, last-successful
+// tracking, single activity-state emission)
+// ---------------------------------------------------------------------------
+describe("Batched drain correctness fixes", () => {
+  beforeEach(() => {
+    pendingRuns = [];
+    capturedAddMessages.length = 0;
+  });
+  test("surface-action messages are not batched with regular passthroughs", async () => {
+    const conversation = makeConversation();
+    await conversation.loadFromDb();
+    const eventsSurface: ServerMessage[] = [];
+    const eventsRegular: ServerMessage[] = [];
+    // Start in-flight message
+    const p1 = conversation.processMessage("msg-1", [], () => {}, "req-1");
+    await waitForPendingRun(1);
+    // Enqueue a surface-action message (activeSurfaceId set + tracked in
+    // surfaceActionRequestIds) followed by a regular passthrough from the
+    // same interface. The batch builder must reject the surface-action head
+    // so each drains as its own run.
+    conversation.surfaceActionRequestIds.add("req-surface");
+    conversation.enqueueMessage(
+      "surface action response",
+      [],
+      (e) => eventsSurface.push(e),
+      "req-surface",
+      "surface-1", // activeSurfaceId
+    );
+    conversation.enqueueMessage(
+      "regular follow-up",
+      [],
+      (e) => eventsRegular.push(e),
+      "req-regular",
+    );
+    expect(conversation.getQueueDepth()).toBe(2);
+    // Complete run 0 → drain must NOT batch the surface-action with the
+    // regular passthrough. Expect the surface-action to drain as a single
+    // run first.
+    resolveRun(0);
+    await p1;
+    await waitForPendingRun(2);
+    // The second run is the surface-action single-message run.
+    const surfaceUserRowsAfterRun2 = capturedAddMessages.filter(
+      (m) => m.role === "user" && m.content.includes("surface action response"),
+    );
+    expect(surfaceUserRowsAfterRun2).toHaveLength(1);
+    expect(eventsSurface.filter((e) => e.type === "message_dequeued")).toHaveLength(
+      1,
+    );
+    // Complete the surface-action run; drain pulls the regular passthrough
+    // as its own separate run.
+    resolveRun(1);
+    await waitForPendingRun(3);
+    expect(pendingRuns.length).toBe(3);
+    expect(eventsRegular.filter((e) => e.type === "message_dequeued")).toHaveLength(
+      1,
+    );
+    // Total runs = 3: msg-1, surface-action, regular — NOT 2 (would mean
+    // they were batched).
+    resolveRun(2);
+    await new Promise((r) => setTimeout(r, 10));
+  });
+  test("abort mid-batch stops tail persists", async () => {
+    const conversation = makeConversation();
+    await conversation.loadFromDb();
+    const events1: ServerMessage[] = [];
+    const events2: ServerMessage[] = [];
+    const events3: ServerMessage[] = [];
+    const events4: ServerMessage[] = [];
+    // Start in-flight message
+    const p1 = conversation.processMessage(
+      "msg-1",
+      [],
+      (e) => events1.push(e),
+      "req-1",
+    );
+    await waitForPendingRun(1);
+    // Enqueue three sibling passthroughs (msg-2 = head, msg-3 = mid,
+    // msg-4 = tail). We trigger abort from msg-3's dequeue callback —
+    // by the time that fires, msg-2 has already been persisted (which
+    // REPLACED the abortController, since persistUserMessage creates a
+    // fresh one). Calling abort() now aborts that fresh controller, and
+    // the drainBatch loop's abort check after msg-3's persist will break,
+    // so msg-4 never persists.
+    conversation.enqueueMessage("msg-2", [], (e) => events2.push(e), "req-2");
+    // Install a one-shot abort trigger on msg-3's dequeue event. We do
+    // this before enqueueing so the wrapped callback is what drainBatch
+    // invokes.
+    let aborted = false;
+    const onMsg3Event = (e: ServerMessage) => {
+      events3.push(e);
+      if (!aborted && e.type === "message_dequeued") {
+        aborted = true;
+        conversation.abort();
+      }
+    };
+    conversation.enqueueMessage("msg-3", [], onMsg3Event, "req-3");
+    conversation.enqueueMessage("msg-4", [], (e) => events4.push(e), "req-4");
+    expect(conversation.getQueueDepth()).toBe(3);
+    const persistedUserRowCountBefore = capturedAddMessages.filter(
+      (m) => m.role === "user",
+    ).length;
+    // Complete run 0 → drain pulls the sibling batch.
+    resolveRun(0);
+    await p1;
+    // Give the drain loop a chance to iterate. Abort happens on msg-3's
+    // dequeue (between msg-2's persist and msg-3's persist), so msg-3 may
+    // still persist before the abort check at the end of its iteration.
+    // Either way, msg-4 must NOT persist.
+    await new Promise((r) => setTimeout(r, 30));
+    const userRowsAfter = capturedAddMessages
+      .slice(persistedUserRowCountBefore)
+      .filter((m) => m.role === "user");
+    const contents = userRowsAfter.map((r) => r.content).join("||");
+    expect(contents).toContain("msg-2");
+    expect(contents).not.toContain("msg-4");
+    expect(
+      events4.filter((e) => e.type === "message_dequeued"),
+    ).toHaveLength(0);
+  });
+  test("failed tail persist uses last-successful requestId", async () => {
+    const conversation = makeConversation();
+    await conversation.loadFromDb();
+    const events1: ServerMessage[] = [];
+    const events2: ServerMessage[] = [];
+    const events3: ServerMessage[] = [];
+    const events4: ServerMessage[] = [];
+    // Start in-flight message
+    const p1 = conversation.processMessage(
+      "msg-1",
+      [],
+      (e) => events1.push(e),
+      "req-1",
+    );
+    await waitForPendingRun(1);
+    // Enqueue three siblings. Configure addMessage to throw for the second
+    // tail (msg-mid) but succeed for msg-head and msg-tail. This simulates
+    // a middle tail persist failure — currentRequestId should end up as
+    // msg-tail's requestId (the LAST successful persist), not msg-mid's.
+    addMessageShouldThrowForContent.add("msg-mid-unique-marker");
+    conversation.enqueueMessage(
+      "msg-head",
+      [],
+      (e) => events2.push(e),
+      "req-head",
+    );
+    conversation.enqueueMessage(
+      "msg-mid-unique-marker",
+      [],
+      (e) => events3.push(e),
+      "req-mid",
+    );
+    conversation.enqueueMessage(
+      "msg-tail",
+      [],
+      (e) => events4.push(e),
+      "req-tail",
+    );
+    expect(conversation.getQueueDepth()).toBe(3);
+    // Complete run 0 → batched drain.
+    resolveRun(0);
+    await p1;
+    await waitForPendingRun(2);
+    // mid should have emitted an error event via persist failure.
+    const errMid = events3.find((e) => e.type === "error");
+    expect(errMid).toBeDefined();
+    // The agent loop should have been invoked with the tail's userMessageId
+    // (last SUCCESSFUL persist), not the mid's. We check via currentRequestId
+    // on the conversation which drainBatch assigns after the loop.
+    expect(
+      (conversation as unknown as { currentRequestId?: string }).currentRequestId,
+    ).toBe("req-tail");
+    // Cleanup: resolve the batched run.
+    resolveRun(1);
+    await new Promise((r) => setTimeout(r, 20));
+  });
+  test("failed tail persist is excluded from fanOutOnEvent agent events", async () => {
+    const conversation = makeConversation();
+    await conversation.loadFromDb();
+    const events1: ServerMessage[] = [];
+    const events2: ServerMessage[] = [];
+    const events3: ServerMessage[] = [];
+    const events4: ServerMessage[] = [];
+    const p1 = conversation.processMessage(
+      "msg-1",
+      [],
+      (e) => events1.push(e),
+      "req-1",
+    );
+    await waitForPendingRun(1);
+    // Mid tail will fail to persist. After the batched run resolves,
+    // message_complete (broadcast via fanOutOnEvent) must NOT land on the
+    // failed mid tail — it already received an error event and persisting
+    // the assistant reply for a user message that has no DB row would
+    // desync the client.
+    addMessageShouldThrowForContent.add("fanout-mid-marker");
+    conversation.enqueueMessage(
+      "fanout-head",
+      [],
+      (e) => events2.push(e),
+      "req-fanout-head",
+    );
+    conversation.enqueueMessage(
+      "fanout-mid-marker",
+      [],
+      (e) => events3.push(e),
+      "req-fanout-mid",
+    );
+    conversation.enqueueMessage(
+      "fanout-tail",
+      [],
+      (e) => events4.push(e),
+      "req-fanout-tail",
+    );
+    resolveRun(0);
+    await p1;
+    await waitForPendingRun(2);
+    // Drive the batched run to emit message_complete via fanOutOnEvent.
+    resolveRun(1);
+    await new Promise((r) => setTimeout(r, 20));
+    expect(events3.find((e) => e.type === "error")).toBeDefined();
+    expect(events3.find((e) => e.type === "message_complete")).toBeUndefined();
+    expect(events2.find((e) => e.type === "message_complete")).toBeDefined();
+    expect(events4.find((e) => e.type === "message_complete")).toBeDefined();
+  });
+  test("drainBatch emits exactly one activity-state event for the whole batch", async () => {
+    const activityStates: ServerMessage[] = [];
+    const conversation = makeConversation((msg) => {
+      if ("type" in msg && msg.type === "assistant_activity_state") {
+        activityStates.push(msg);
+      }
+    });
+    await conversation.loadFromDb();
+    // Start in-flight message
+    const p1 = conversation.processMessage("msg-1", [], () => {}, "req-1");
+    await waitForPendingRun(1);
+    // Snapshot the count before drain so we only compare batch-emitted
+    // transitions (msg-1's processMessage already fired one).
+    const baseline = activityStates.length;
+    // Enqueue three sibling passthroughs.
+    conversation.enqueueMessage("msg-2", [], () => {}, "req-2");
+    conversation.enqueueMessage("msg-3", [], () => {}, "req-3");
+    conversation.enqueueMessage("msg-4", [], () => {}, "req-4");
+    // Complete run 0 → drain pulls the batched siblings as ONE run.
+    resolveRun(0);
+    await p1;
+    await waitForPendingRun(2);
+    // Filter for "message_dequeued" reasons emitted by the batched drain.
+    const batchEmissions = activityStates
+      .slice(baseline)
+      .filter(
+        (m) =>
+          "type" in m &&
+          m.type === "assistant_activity_state" &&
+          (m as { reason?: string }).reason === "message_dequeued",
+      );
+    expect(batchEmissions).toHaveLength(1);
+    expect(batchEmissions[0]).toMatchObject({
+      type: "assistant_activity_state",
+      reason: "message_dequeued",
+      requestId: "req-2", // head's requestId, per the fix
+    });
+    resolveRun(1);
+    await new Promise((r) => setTimeout(r, 10));
+  });
+  // Defensive recovery path: buildPassthroughBatch is designed to make
+  // the invariant throw unreachable in practice, so neither the head
+  // branch (re-dispatch batch.slice(1) to drainBatch/drainSingleMessage/
+  // drainQueue) nor the tail branch (skip + continue) can fire in normal
+  // operation. Left as a todo so the harness contract is documented
+  // without wedging mainline CI. Covering this would require either
+  // (a) reflecting into drainBatch to short-circuit resolveSlash for a
+  // specific batch entry, or (b) exposing a seam on SlashContext — both
+  // are more invasive than the safety-net value justifies.
+  test.todo(
+    "invariant violation in persist loop triggers error event + recovery, not stranded state",
+    async () => {
+      // no-op: see comment above.
+    },
+  );
+});
 // ---------------------------------------------------------------------------
 // Queue policy primitives
 // ---------------------------------------------------------------------------
@@ -962,32 +1771,31 @@ describe("Conversation checkpoint handoff", () => {
     await p1;
   });
-  test("[experimental] FIFO ordering is preserved through checkpoint handoff", async () => {
+  test("[experimental] checkpoint handoff pulls a batched run for all queued siblings", async () => {
     const conversation = makeConversation();
     await conversation.loadFromDb();
-    const processedOrder: string[] = [];
-    const makeHandler = (label: string) => (e: ServerMessage) => {
-      if (e.type === "message_complete" || e.type === "generation_handoff")
-        processedOrder.push(label);
-    };
+    const events1: ServerMessage[] = [];
+    const events2: ServerMessage[] = [];
+    const events3: ServerMessage[] = [];
+    const events4: ServerMessage[] = [];
-    // Start first message
+    // Start first message (mid-tool-use — will yield at the next checkpoint)
     const p1 = conversation.processMessage(
       "msg-1",
       [],
-      makeHandler("msg-1"),
+      (e) => events1.push(e),
       "req-1",
     );
     await waitForPendingRun(1);
-    // Enqueue two messages
-    conversation.enqueueMessage("msg-2", [], makeHandler("msg-2"), "req-2");
-    conversation.enqueueMessage("msg-3", [], makeHandler("msg-3"), "req-3");
-    expect(conversation.getQueueDepth()).toBe(2);
+    // Enqueue three sibling passthroughs while msg-1 is mid-turn
+    conversation.enqueueMessage("msg-2", [], (e) => events2.push(e), "req-2");
+    conversation.enqueueMessage("msg-3", [], (e) => events3.push(e), "req-3");
+    conversation.enqueueMessage("msg-4", [], (e) => events4.push(e), "req-4");
+    expect(conversation.getQueueDepth()).toBe(3);
-    // Simulate the agent loop yielding at the checkpoint (first run)
+    // Simulate the agent loop yielding at the checkpoint (first run is mid-tool-use)
     const run0 = pendingRuns[0];
     expect(run0.onCheckpoint).toBeDefined();
     const decision = run0.onCheckpoint!({
@@ -1002,19 +1810,23 @@ describe("Conversation checkpoint handoff", () => {
     resolveRun(0);
     await p1;
-    // msg-2 should be draining next
+    // The yielded drain pulls ALL THREE queued siblings as ONE batched run —
+    // not three separate runs.
     await waitForPendingRun(2);
+    expect(pendingRuns.length).toBe(2);
-    // Complete second run (msg-2)
-    resolveRun(1);
-    await waitForPendingRun(3);
+    // Each client saw its own message_dequeued tagged with its own requestId.
+    expect(events2.some((e) => e.type === "message_dequeued")).toBe(true);
+    expect(events3.some((e) => e.type === "message_dequeued")).toBe(true);
+    expect(events4.some((e) => e.type === "message_dequeued")).toBe(true);
-    // Complete third run (msg-3)
-    resolveRun(2);
+    // Resolve the batched run — message_complete fans out to all three clients.
+    resolveRun(1);
     await new Promise((r) => setTimeout(r, 10));
-    // FIFO order: msg-1 completes first, then msg-2, then msg-3
-    expect(processedOrder).toEqual(["msg-1", "msg-2", "msg-3"]);
+    expect(events2.some((e) => e.type === "message_complete")).toBe(true);
+    expect(events3.some((e) => e.type === "message_complete")).toBe(true);
+    expect(events4.some((e) => e.type === "message_complete")).toBe(true);
   });
   test("[experimental] active run with repeated tool turns + queued message triggers checkpoint handoff", async () => {
@@ -1100,10 +1912,39 @@ describe("Conversation checkpoint handoff", () => {
     );
     await waitForPendingRun(1);
-    // Enqueue messages B, C, D
-    conversation.enqueueMessage("msg-B", [], makeHandler("B"), "req-B");
-    conversation.enqueueMessage("msg-C", [], makeHandler("C"), "req-C");
-    conversation.enqueueMessage("msg-D", [], makeHandler("D"), "req-D");
+    // Enqueue messages B, C, D — each on a distinct userMessageInterface so the
+    // batch builder stops at each boundary and we see one run per message.
+    const meta = (iface: string) => ({
+      userMessageInterface: iface,
+      assistantMessageInterface: iface,
+    });
+    conversation.enqueueMessage(
+      "msg-B",
+      [],
+      makeHandler("B"),
+      "req-B",
+      undefined,
+      undefined,
+      meta("macos"),
+    );
+    conversation.enqueueMessage(
+      "msg-C",
+      [],
+      makeHandler("C"),
+      "req-C",
+      undefined,
+      undefined,
+      meta("cli"),
+    );
+    conversation.enqueueMessage(
+      "msg-D",
+      [],
+      makeHandler("D"),
+      "req-D",
+      undefined,
+      undefined,
+      meta("vellum"),
+    );
     expect(conversation.getQueueDepth()).toBe(3);
     // Handoff from A -> B