npm - @vellumai/assistant - Versions diffs - 0.3.4 → 0.3.6 - Mend

@vellumai/assistant 0.3.4 → 0.3.6

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (506) hide show

package/Dockerfile +2 -0
package/README.md +88 -2
package/eslint.config.mjs +31 -0
package/package.json +1 -1
package/scripts/ipc/check-swift-decoder-drift.ts +4 -1
package/scripts/ipc/generate-swift.ts +31 -2
package/src/__tests__/__snapshots__/ipc-snapshot.test.ts.snap +438 -1
package/src/__tests__/approval-conversation-turn.test.ts +214 -0
package/src/__tests__/approval-hardcoded-copy-guard.test.ts +41 -0
package/src/__tests__/approval-message-composer.test.ts +253 -0
package/src/__tests__/browser-manager.test.ts +1 -0
package/src/__tests__/call-conversation-messages.test.ts +130 -0
package/src/__tests__/call-domain.test.ts +12 -2
package/src/__tests__/call-orchestrator.test.ts +799 -249
package/src/__tests__/call-pointer-messages.test.ts +148 -0
package/src/__tests__/call-recovery.test.ts +3 -0
package/src/__tests__/call-routes-http.test.ts +32 -2
package/src/__tests__/call-store.test.ts +3 -0
package/src/__tests__/channel-approval-routes.test.ts +1277 -98
package/src/__tests__/channel-approval.test.ts +37 -0
package/src/__tests__/channel-approvals.test.ts +36 -50
package/src/__tests__/channel-guardian.test.ts +630 -22
package/src/__tests__/channel-readiness-service.test.ts +324 -0
package/src/__tests__/checker.test.ts +14 -7
package/src/__tests__/clarification-resolver.test.ts +44 -24
package/src/__tests__/commit-message-enrichment-service.test.ts +9 -4
package/src/__tests__/computer-use-session-working-dir.test.ts +8 -0
package/src/__tests__/config-schema.test.ts +14 -8
package/src/__tests__/context-window-manager.test.ts +30 -2
package/src/__tests__/contradiction-checker.test.ts +20 -5
package/src/__tests__/credential-security-invariants.test.ts +7 -2
package/src/__tests__/daemon-lifecycle.test.ts +13 -12
package/src/__tests__/db-migration-rollback.test.ts +752 -0
package/src/__tests__/dictation-mode-detection.test.ts +63 -0
package/src/__tests__/dynamic-skill-workflow-prompt.test.ts +2 -0
package/src/__tests__/entity-search.test.ts +615 -0
package/src/__tests__/fuzzy-match-property.test.ts +5 -5
package/src/__tests__/guardian-action-store.test.ts +123 -0
package/src/__tests__/guardian-action-sweep.test.ts +277 -0
package/src/__tests__/guardian-dispatch.test.ts +389 -0
package/src/__tests__/guardian-question-copy.test.ts +47 -0
package/src/__tests__/handlers-telegram-config.test.ts +4 -2
package/src/__tests__/handlers-twilio-config.test.ts +533 -0
package/src/__tests__/intent-routing.test.ts +2 -0
package/src/__tests__/ipc-snapshot.test.ts +291 -1
package/src/__tests__/memory-upsert-concurrency.test.ts +828 -0
package/src/__tests__/messaging-send-tool.test.ts +65 -0
package/src/__tests__/model-intents.test.ts +96 -0
package/src/__tests__/no-direct-anthropic-sdk-imports.test.ts +42 -0
package/src/__tests__/oauth2-gateway-transport.test.ts +130 -0
package/src/__tests__/onboarding-starter-tasks.test.ts +2 -0
package/src/__tests__/provider-commit-message-generator.test.ts +89 -13
package/src/__tests__/provider-error-scenarios.test.ts +621 -0
package/src/__tests__/provider-fail-open-selection.test.ts +119 -0
package/src/__tests__/qdrant-manager.test.ts +27 -20
package/src/__tests__/relay-server.test.ts +779 -40
package/src/__tests__/run-orchestrator-assistant-events.test.ts +6 -0
package/src/__tests__/run-orchestrator.test.ts +42 -4
package/src/__tests__/runtime-runs-http.test.ts +17 -1
package/src/__tests__/runtime-runs.test.ts +16 -0
package/src/__tests__/schedule-store.test.ts +18 -4
package/src/__tests__/scheduler-recurrence.test.ts +13 -4
package/src/__tests__/session-abort-tool-results.test.ts +6 -0
package/src/__tests__/session-agent-loop.test.ts +857 -0
package/src/__tests__/session-conflict-gate.test.ts +6 -0
package/src/__tests__/session-pre-run-repair.test.ts +6 -0
package/src/__tests__/session-profile-injection.test.ts +6 -0
package/src/__tests__/session-provider-retry-repair.test.ts +6 -0
package/src/__tests__/session-queue.test.ts +6 -0
package/src/__tests__/session-runtime-assembly.test.ts +321 -13
package/src/__tests__/session-slash-known.test.ts +6 -0
package/src/__tests__/session-slash-queue.test.ts +6 -0
package/src/__tests__/session-slash-unknown.test.ts +6 -0
package/src/__tests__/session-surfaces-task-progress.test.ts +2 -0
package/src/__tests__/session-tool-setup-app-refresh.test.ts +1 -0
package/src/__tests__/session-tool-setup-memory-scope.test.ts +1 -0
package/src/__tests__/session-tool-setup-side-effect-flag.test.ts +1 -0
package/src/__tests__/session-workspace-injection.test.ts +6 -0
package/src/__tests__/session-workspace-tool-tracking.test.ts +6 -0
package/src/__tests__/skills.test.ts +2 -0
package/src/__tests__/sms-messaging-provider.test.ts +126 -0
package/src/__tests__/starter-task-flow.test.ts +2 -0
package/src/__tests__/swarm-dag-pathological.test.ts +535 -0
package/src/__tests__/system-prompt.test.ts +2 -0
package/src/__tests__/task-management-tools.test.ts +2 -2
package/src/__tests__/task-runner.test.ts +14 -4
package/src/__tests__/terminal-tools.test.ts +25 -19
package/src/__tests__/tool-execution-abort-cleanup.test.ts +545 -0
package/src/__tests__/tool-executor-shell-integration.test.ts +11 -11
package/src/__tests__/tool-executor.test.ts +23 -24
package/src/__tests__/trust-store.test.ts +3 -3
package/src/__tests__/twilio-rest.test.ts +29 -0
package/src/__tests__/twilio-routes-elevenlabs.test.ts +3 -0
package/src/__tests__/twilio-routes-twiml.test.ts +11 -0
package/src/__tests__/twilio-routes.test.ts +167 -11
package/src/__tests__/twitter-cli-error-shaping.test.ts +2 -2
package/src/__tests__/user-reference.test.ts +2 -0
package/src/__tests__/voice-quality.test.ts +222 -0
package/src/__tests__/web-search.test.ts +46 -30
package/src/__tests__/work-item-output.test.ts +110 -0
package/src/agent/loop.ts +1 -1
package/src/agent-heartbeat/agent-heartbeat-service.ts +2 -10
package/src/amazon/client.ts +1418 -0
package/src/amazon/request-extractor.ts +135 -0
package/src/amazon/session.ts +109 -0
package/src/autonomy/autonomy-store.ts +5 -5
package/src/browser-extension-relay/client.ts +124 -0
package/src/browser-extension-relay/protocol.ts +63 -0
package/src/browser-extension-relay/server.ts +177 -0
package/src/bundler/app-bundler.ts +3 -3
package/src/bundler/bundle-signer.ts +1 -1
package/src/bundler/signature-verifier.ts +1 -1
package/src/calls/call-conversation-messages.ts +33 -0
package/src/calls/call-domain.ts +114 -10
package/src/calls/call-orchestrator.ts +268 -59
package/src/calls/call-pointer-messages.ts +53 -0
package/src/calls/call-recovery.ts +3 -8
package/src/calls/call-store.ts +69 -87
package/src/calls/elevenlabs-config.ts +3 -2
package/src/calls/guardian-action-sweep.ts +105 -0
package/src/calls/guardian-dispatch.ts +203 -0
package/src/calls/guardian-question-copy.ts +133 -0
package/src/calls/relay-server.ts +466 -8
package/src/calls/speaker-identification.ts +1 -1
package/src/calls/twilio-config.ts +22 -14
package/src/calls/twilio-provider.ts +6 -4
package/src/calls/twilio-rest.ts +308 -7
package/src/calls/twilio-routes.ts +65 -12
package/src/calls/types.ts +3 -1
package/src/channels/types.ts +25 -0
package/src/cli/amazon.ts +815 -0
package/src/cli/config-commands.ts +2 -2
package/src/cli/core-commands.ts +4 -3
package/src/cli/influencer.ts +244 -0
package/src/cli/map.ts +89 -6
package/src/cli.ts +1 -1
package/src/config/agent-schema.ts +171 -0
package/src/config/bundled-skills/amazon/SKILL.md +127 -0
package/src/config/bundled-skills/amazon/icon.svg +13 -0
package/src/config/bundled-skills/api-mapping/SKILL.md +78 -0
package/src/config/bundled-skills/browser/SKILL.md +1 -0
package/src/config/bundled-skills/browser/TOOLS.json +17 -0
package/src/config/bundled-skills/browser/tools/browser-wait-for-download.ts +25 -0
package/src/config/bundled-skills/doordash/SKILL.md +51 -51
package/src/config/bundled-skills/email-setup/SKILL.md +14 -5
package/src/config/bundled-skills/google-oauth-setup/SKILL.md +183 -0
package/src/config/bundled-skills/influencer/SKILL.md +144 -0
package/src/config/bundled-skills/knowledge-graph/SKILL.md +15 -0
package/src/config/bundled-skills/knowledge-graph/TOOLS.json +56 -0
package/src/config/bundled-skills/knowledge-graph/tools/graph-query.ts +185 -0
package/src/config/bundled-skills/macos-automation/icon.svg +12 -0
package/src/config/bundled-skills/media-processing/SKILL.md +176 -0
package/src/config/bundled-skills/media-processing/TOOLS.json +230 -0
package/src/config/bundled-skills/media-processing/__tests__/concurrency-pool.test.ts +77 -0
package/src/config/bundled-skills/media-processing/__tests__/cost-tracker.test.ts +69 -0
package/src/config/bundled-skills/media-processing/__tests__/preprocess.test.ts +303 -0
package/src/config/bundled-skills/media-processing/services/concurrency-pool.ts +55 -0
package/src/config/bundled-skills/media-processing/services/cost-tracker.ts +86 -0
package/src/config/bundled-skills/media-processing/services/gemini-map.ts +339 -0
package/src/config/bundled-skills/media-processing/services/preprocess.ts +551 -0
package/src/config/bundled-skills/media-processing/services/processing-pipeline.ts +259 -0
package/src/config/bundled-skills/media-processing/services/reduce.ts +197 -0
package/src/config/bundled-skills/media-processing/tools/analyze-keyframes.ts +136 -0
package/src/config/bundled-skills/media-processing/tools/extract-keyframes.ts +59 -0
package/src/config/bundled-skills/media-processing/tools/generate-clip.ts +195 -0
package/src/config/bundled-skills/media-processing/tools/ingest-media.ts +197 -0
package/src/config/bundled-skills/media-processing/tools/media-diagnostics.ts +143 -0
package/src/config/bundled-skills/media-processing/tools/media-status.ts +75 -0
package/src/config/bundled-skills/media-processing/tools/query-media-events.ts +65 -0
package/src/config/bundled-skills/messaging/SKILL.md +33 -8
package/src/config/bundled-skills/messaging/tools/messaging-analyze-style.ts +4 -7
package/src/config/bundled-skills/messaging/tools/messaging-reply.ts +2 -1
package/src/config/bundled-skills/messaging/tools/messaging-send.ts +5 -1
package/src/config/bundled-skills/phone-calls/SKILL.md +88 -23
package/src/config/bundled-skills/twitter/SKILL.md +19 -3
package/src/config/bundled-skills/twitter/icon.svg +14 -0
package/src/config/bundled-tool-registry.ts +310 -0
package/src/config/calls-schema.ts +181 -0
package/src/config/core-schema.ts +309 -0
package/src/config/defaults.ts +28 -3
package/src/config/env-registry.ts +162 -0
package/src/config/env.ts +175 -0
package/src/config/loader.ts +6 -6
package/src/config/memory-schema.ts +528 -0
package/src/config/sandbox-schema.ts +55 -0
package/src/config/schema.ts +158 -1133
package/src/config/skill-state.ts +1 -1
package/src/config/skills-schema.ts +32 -0
package/src/config/skills.ts +35 -24
package/src/config/system-prompt.ts +131 -56
package/src/config/templates/IDENTITY.md +2 -2
package/src/config/templates/SOUL.md +1 -1
package/src/config/types.ts +1 -0
package/src/config/user-reference.ts +4 -9
package/src/config/vellum-skills/catalog.json +6 -7
package/src/config/vellum-skills/chatgpt-import/tools/chatgpt-import.ts +5 -1
package/src/config/vellum-skills/slack-oauth-setup/SKILL.md +4 -3
package/src/config/vellum-skills/sms-setup/SKILL.md +216 -0
package/src/config/vellum-skills/twilio-setup/SKILL.md +40 -8
package/src/context/window-manager.ts +27 -7
package/src/daemon/approval-generators.ts +186 -0
package/src/daemon/approved-devices-store.ts +140 -0
package/src/daemon/assistant-attachments.ts +1 -1
package/src/daemon/classifier.ts +35 -32
package/src/daemon/config-watcher.ts +1 -1
package/src/daemon/daemon-control.ts +217 -0
package/src/daemon/handlers/apps.ts +2 -3
package/src/daemon/handlers/config-channels.ts +158 -0
package/src/daemon/handlers/config-inbox.ts +540 -0
package/src/daemon/handlers/config-ingress.ts +231 -0
package/src/daemon/handlers/config-integrations.ts +258 -0
package/src/daemon/handlers/config-model.ts +143 -0
package/src/daemon/handlers/config-parental.ts +163 -0
package/src/daemon/handlers/config-scheduling.ts +172 -0
package/src/daemon/handlers/config-slack.ts +92 -0
package/src/daemon/handlers/config-telegram.ts +301 -0
package/src/daemon/handlers/config-tools.ts +177 -0
package/src/daemon/handlers/config-trust.ts +104 -0
package/src/daemon/handlers/config-twilio.ts +1080 -0
package/src/daemon/handlers/config.ts +53 -1689
package/src/daemon/handlers/diagnostics.ts +1 -1
package/src/daemon/handlers/dictation.ts +180 -0
package/src/daemon/handlers/documents.ts +18 -32
package/src/daemon/handlers/identity.ts +14 -23
package/src/daemon/handlers/index.ts +11 -0
package/src/daemon/handlers/misc.ts +3 -5
package/src/daemon/handlers/pairing.ts +98 -0
package/src/daemon/handlers/sessions.ts +56 -5
package/src/daemon/handlers/shared.ts +6 -1
package/src/daemon/handlers/skills.ts +1 -1
package/src/daemon/handlers/twitter-auth.ts +2 -0
package/src/daemon/handlers/work-items.ts +17 -9
package/src/daemon/handlers/workspace-files.ts +4 -3
package/src/daemon/install-cli-launchers.ts +113 -0
package/src/daemon/ipc-contract/apps.ts +356 -0
package/src/daemon/ipc-contract/browser.ts +74 -0
package/src/daemon/ipc-contract/computer-use.ts +151 -0
package/src/daemon/ipc-contract/diagnostics.ts +56 -0
package/src/daemon/ipc-contract/documents.ts +74 -0
package/src/daemon/ipc-contract/inbox.ts +209 -0
package/src/daemon/ipc-contract/integrations.ts +284 -0
package/src/daemon/ipc-contract/memory.ts +48 -0
package/src/daemon/ipc-contract/messages.ts +211 -0
package/src/daemon/ipc-contract/pairing.ts +45 -0
package/src/daemon/ipc-contract/parental-control.ts +95 -0
package/src/daemon/ipc-contract/schedules.ts +97 -0
package/src/daemon/ipc-contract/sessions.ts +315 -0
package/src/daemon/ipc-contract/shared.ts +42 -0
package/src/daemon/ipc-contract/skills.ts +120 -0
package/src/daemon/ipc-contract/subagents.ts +58 -0
package/src/daemon/ipc-contract/surfaces.ts +250 -0
package/src/daemon/ipc-contract/trust.ts +60 -0
package/src/daemon/ipc-contract/work-items.ts +225 -0
package/src/daemon/ipc-contract/workspace.ts +113 -0
package/src/daemon/ipc-contract-inventory.json +70 -0
package/src/daemon/ipc-contract-inventory.ts +55 -29
package/src/daemon/ipc-contract.ts +229 -2426
package/src/daemon/ipc-protocol.ts +1 -1
package/src/daemon/ipc-validate.ts +7 -0
package/src/daemon/lifecycle.ts +97 -377
package/src/daemon/pairing-store.ts +177 -0
package/src/daemon/providers-setup.ts +43 -0
package/src/daemon/ride-shotgun-handler.ts +68 -3
package/src/daemon/server.ts +66 -46
package/src/daemon/session-agent-loop-handlers.ts +421 -0
package/src/daemon/session-agent-loop.ts +117 -275
package/src/daemon/session-dynamic-profile.ts +1 -1
package/src/daemon/session-history.ts +1 -1
package/src/daemon/session-media-retry.ts +1 -1
package/src/daemon/session-messaging.ts +37 -2
package/src/daemon/session-notifiers.ts +5 -25
package/src/daemon/session-process.ts +99 -59
package/src/daemon/session-queue-manager.ts +96 -4
package/src/daemon/session-runtime-assembly.ts +199 -10
package/src/daemon/session-surfaces.ts +19 -4
package/src/daemon/session-tool-setup.ts +30 -30
package/src/daemon/session-workspace.ts +1 -1
package/src/daemon/session.ts +35 -2
package/src/daemon/shutdown-handlers.ts +122 -0
package/src/daemon/trace-emitter.ts +1 -1
package/src/daemon/watch-handler.ts +36 -33
package/src/doordash/cart-queries.ts +787 -0
package/src/doordash/client.ts +144 -127
package/src/doordash/order-queries.ts +85 -0
package/src/doordash/queries.ts +10 -1308
package/src/doordash/search-queries.ts +203 -0
package/src/doordash/session.ts +3 -2
package/src/doordash/store-queries.ts +246 -0
package/src/doordash/types.ts +367 -0
package/src/email/providers/agentmail.ts +2 -1
package/src/email/providers/index.ts +3 -2
package/src/email/service.ts +3 -2
package/src/errors.ts +43 -0
package/src/home-base/prebuilt/seed.ts +1 -1
package/src/hooks/cli.ts +6 -5
package/src/hooks/config.ts +6 -8
package/src/hooks/discovery.ts +6 -5
package/src/hooks/manager.ts +4 -3
package/src/hooks/runner.ts +2 -2
package/src/hooks/templates.ts +5 -5
package/src/inbound/public-ingress-urls.ts +6 -4
package/src/index.ts +4 -2
package/src/influencer/client.ts +1104 -0
package/src/instrument.ts +4 -3
package/src/logfire.ts +4 -3
package/src/memory/admin.ts +25 -35
package/src/memory/attachments-store.ts +4 -7
package/src/memory/channel-delivery-store.ts +30 -1
package/src/memory/channel-guardian-store.ts +202 -2
package/src/memory/clarification-resolver.ts +37 -33
package/src/memory/conflict-store.ts +67 -61
package/src/memory/contradiction-checker.ts +141 -117
package/src/memory/conversation-store.ts +335 -51
package/src/memory/db-connection.ts +27 -4
package/src/memory/db-init.ts +265 -4
package/src/memory/db.ts +14 -1
package/src/memory/embedding-backend.ts +27 -5
package/src/memory/embedding-ollama.ts +2 -1
package/src/memory/entity-extractor.ts +38 -35
package/src/memory/guardian-action-store.ts +430 -0
package/src/memory/inbox-escalation-projection.ts +59 -0
package/src/memory/inbox-thread-store.ts +218 -0
package/src/memory/ingress-invite-store.ts +338 -0
package/src/memory/ingress-member-store.ts +350 -0
package/src/memory/items-extractor.ts +91 -97
package/src/memory/job-handlers/index-maintenance.ts +3 -3
package/src/memory/job-handlers/media-processing.ts +69 -0
package/src/memory/job-handlers/summarization.ts +32 -26
package/src/memory/job-utils.ts +3 -10
package/src/memory/jobs-store.ts +8 -10
package/src/memory/jobs-worker.ts +55 -36
package/src/memory/media-store.ts +759 -0
package/src/memory/migrations/001-job-deferrals.ts +45 -0
package/src/memory/migrations/002-tool-invocations-fk.ts +43 -0
package/src/memory/migrations/003-memory-fts-backfill.ts +24 -0
package/src/memory/migrations/004-entity-relation-dedup.ts +87 -0
package/src/memory/migrations/005-fingerprint-scope-unique.ts +80 -0
package/src/memory/migrations/006-scope-salted-fingerprints.ts +62 -0
package/src/memory/migrations/007-assistant-id-to-self.ts +254 -0
package/src/memory/migrations/008-remove-assistant-id-columns.ts +208 -0
package/src/memory/migrations/009-llm-usage-events-drop-assistant-id.ts +83 -0
package/src/memory/migrations/010-ext-conv-bindings-channel-chat-unique.ts +56 -0
package/src/memory/migrations/011-call-sessions-provider-sid-dedup.ts +63 -0
package/src/memory/migrations/012-call-sessions-add-initiated-from.ts +19 -0
package/src/memory/migrations/013-guardian-action-tables.ts +68 -0
package/src/memory/migrations/014-backfill-inbox-thread-state.ts +76 -0
package/src/memory/migrations/015-drop-active-search-index.ts +27 -0
package/src/memory/migrations/016-memory-segments-indexes.ts +11 -0
package/src/memory/migrations/017-memory-items-indexes.ts +10 -0
package/src/memory/migrations/018-remaining-table-indexes.ts +13 -0
package/src/memory/migrations/index.ts +24 -0
package/src/memory/migrations/registry.ts +79 -0
package/src/memory/migrations/validate-migration-state.ts +69 -0
package/src/memory/qdrant-manager.ts +49 -8
package/src/memory/query-builder.ts +1 -1
package/src/memory/raw-query.ts +119 -0
package/src/memory/recall-cache.ts +4 -1
package/src/memory/retriever.ts +165 -47
package/src/memory/schema-migration.ts +25 -984
package/src/memory/schema.ts +228 -7
package/src/memory/search/entity.ts +205 -31
package/src/memory/search/lexical.ts +81 -52
package/src/memory/search/ranking.ts +27 -23
package/src/memory/search/semantic.ts +157 -19
package/src/memory/search/types.ts +24 -0
package/src/memory/shared-app-links-store.ts +4 -5
package/src/memory/validation.ts +19 -0
package/src/messaging/draft-store.ts +5 -6
package/src/messaging/provider-types.ts +2 -0
package/src/messaging/providers/sms/adapter.ts +201 -0
package/src/messaging/providers/sms/client.ts +93 -0
package/src/messaging/providers/sms/types.ts +7 -0
package/src/messaging/providers/telegram-bot/adapter.ts +2 -5
package/src/messaging/providers/whatsapp/adapter.ts +136 -0
package/src/messaging/providers/whatsapp/client.ts +67 -0
package/src/messaging/style-analyzer.ts +5 -4
package/src/messaging/thread-summarizer.ts +61 -69
package/src/messaging/triage-engine.ts +62 -71
package/src/migrations/config-merge.ts +53 -0
package/src/migrations/data-layout.ts +68 -0
package/src/migrations/data-merge.ts +33 -0
package/src/migrations/hooks-merge.ts +90 -0
package/src/migrations/index.ts +6 -0
package/src/migrations/log.ts +23 -0
package/src/migrations/skills-merge.ts +33 -0
package/src/migrations/workspace-layout.ts +79 -0
package/src/permissions/checker.ts +133 -11
package/src/permissions/prompter.ts +14 -0
package/src/permissions/shell-identity.ts +31 -1
package/src/permissions/trust-store.ts +21 -1
package/src/providers/anthropic/client.ts +4 -4
package/src/providers/failover.ts +2 -2
package/src/providers/model-intents.ts +70 -0
package/src/providers/ollama/client.ts +2 -1
package/src/providers/provider-send-message.ts +176 -0
package/src/providers/registry.ts +71 -30
package/src/providers/retry.ts +35 -1
package/src/providers/types.ts +12 -1
package/src/runtime/approval-conversation-turn.ts +97 -0
package/src/runtime/approval-message-composer.ts +253 -0
package/src/runtime/channel-approval-parser.ts +36 -2
package/src/runtime/channel-approvals.ts +11 -24
package/src/runtime/channel-guardian-service.ts +88 -21
package/src/runtime/channel-readiness-service.ts +418 -0
package/src/runtime/channel-readiness-types.ts +35 -0
package/src/runtime/channel-retry-sweep.ts +184 -0
package/src/runtime/guardian-context-resolver.ts +108 -0
package/src/runtime/http-server.ts +275 -717
package/src/runtime/http-types.ts +59 -3
package/src/runtime/middleware/auth.ts +116 -0
package/src/runtime/middleware/error-handler.ts +33 -0
package/src/runtime/middleware/twilio-validation.ts +127 -0
package/src/runtime/routes/app-routes.ts +1 -1
package/src/runtime/routes/call-routes.ts +51 -7
package/src/runtime/routes/channel-delivery-routes.ts +170 -0
package/src/runtime/routes/channel-guardian-routes.ts +1191 -0
package/src/runtime/routes/channel-inbound-routes.ts +1152 -0
package/src/runtime/routes/channel-route-shared.ts +144 -0
package/src/runtime/routes/channel-routes.ts +32 -1588
package/src/runtime/routes/conversation-routes.ts +50 -7
package/src/runtime/routes/events-routes.ts +2 -2
package/src/runtime/routes/identity-routes.ts +126 -0
package/src/runtime/routes/pairing-routes.ts +143 -0
package/src/runtime/routes/run-routes.ts +15 -1
package/src/runtime/run-orchestrator.ts +86 -35
package/src/schedule/schedule-store.ts +36 -32
package/src/schedule/scheduler.ts +3 -3
package/src/security/encrypted-store.ts +5 -7
package/src/security/oauth2.ts +45 -15
package/src/security/parental-control-store.ts +183 -0
package/src/security/secret-allowlist.ts +4 -3
package/src/security/secret-scanner.ts +5 -5
package/src/security/secure-keys.ts +1 -1
package/src/security/token-manager.ts +3 -2
package/src/services/vercel-deploy.ts +6 -2
package/src/skills/tool-manifest.ts +3 -3
package/src/skills/vellum-catalog-remote.ts +75 -16
package/src/slack/slack-webhook.ts +2 -1
package/src/swarm/orchestrator.ts +92 -1
package/src/swarm/router-planner.ts +6 -9
package/src/swarm/worker-prompts.ts +9 -12
package/src/tasks/task-compiler.ts +19 -28
package/src/tasks/task-runner.ts +1 -1
package/src/tools/assets/materialize.ts +2 -2
package/src/tools/assets/search.ts +15 -14
package/src/tools/browser/__tests__/auth-detector.test.ts +1 -0
package/src/tools/browser/auto-navigate.ts +1 -0
package/src/tools/browser/browser-execution.ts +10 -1
package/src/tools/browser/browser-manager.ts +119 -4
package/src/tools/browser/network-recorder.ts +5 -0
package/src/tools/calls/call-start.ts +1 -0
package/src/tools/credentials/broker.ts +11 -2
package/src/tools/credentials/metadata-store.ts +18 -14
package/src/tools/credentials/post-connect-hooks.ts +61 -0
package/src/tools/credentials/vault.ts +49 -23
package/src/tools/execution-target.ts +11 -1
package/src/tools/executor.ts +68 -9
package/src/tools/host-terminal/cli-discover.ts +1 -1
package/src/tools/network/script-proxy/http-forwarder.ts +1 -1
package/src/tools/network/script-proxy/mitm-handler.ts +1 -1
package/src/tools/network/script-proxy/server.ts +1 -1
package/src/tools/network/script-proxy/session-manager.ts +6 -5
package/src/tools/network/web-fetch.ts +18 -2
package/src/tools/network/web-search.ts +8 -4
package/src/tools/reminder/reminder-store.ts +14 -15
package/src/tools/schedule/create.ts +1 -0
package/src/tools/schedule/list.ts +2 -1
package/src/tools/shared/filesystem/file-ops-service.ts +5 -7
package/src/tools/skills/skill-script-runner.ts +24 -9
package/src/tools/skills/skill-tool-factory.ts +1 -0
package/src/tools/tasks/work-item-enqueue.ts +2 -2
package/src/tools/terminal/evaluate-typescript.ts +21 -12
package/src/tools/terminal/parser.ts +50 -0
package/src/tools/types.ts +2 -0
package/src/tools/watcher/delete.ts +6 -0
package/src/tools/weather/service.ts +1 -1
package/src/twitter/client.ts +190 -24
package/src/twitter/router.ts +1 -1
package/src/twitter/session.ts +4 -3
package/src/util/clipboard.ts +1 -1
package/src/util/errors.ts +65 -8
package/src/util/fs.ts +40 -0
package/src/util/json.ts +10 -0
package/src/util/log-redact.ts +189 -0
package/src/util/logger.ts +19 -17
package/src/util/object.ts +3 -0
package/src/util/platform.ts +105 -363
package/src/util/pricing.ts +1 -1
package/src/util/promise-guard.ts +1 -1
package/src/util/retry.ts +19 -0
package/src/util/row-mapper.ts +79 -0
package/src/util/silently.ts +21 -0
package/src/watcher/engine.ts +5 -1
package/src/watcher/provider-types.ts +20 -0
package/src/watcher/providers/github.ts +156 -0
package/src/watcher/providers/gmail.ts +1 -0
package/src/watcher/providers/google-calendar.ts +1 -0
package/src/watcher/providers/linear.ts +460 -0
package/src/watcher/providers/slack.ts +1 -0
package/src/work-items/work-item-runner.ts +1 -1
package/src/workspace/git-service.ts +1 -1
package/src/workspace/provider-commit-message-generator.ts +51 -22
package/src/__tests__/call-bridge.test.ts +0 -517
package/src/__tests__/session-process-bridge.test.ts +0 -244
package/src/calls/call-bridge.ts +0 -168
package/src/config/vellum-skills/google-oauth-setup/SKILL.md +0 -199

package/src/__tests__/call-orchestrator.test.ts CHANGED Viewed

@@ -2,7 +2,6 @@ import { describe, test, expect, beforeEach, afterAll, mock, type Mock } from 'b
 import { mkdtempSync, rmSync } from 'node:fs';
 import { tmpdir } from 'node:os';
 import { join } from 'node:path';
-import { EventEmitter } from 'node:events';
 const testDir = mkdtempSync(join(tmpdir(), 'call-orchestrator-test-'));
@@ -18,6 +17,7 @@ mock.module('../util/platform.js', () => ({
   getDbPath: () => join(testDir, 'test.db'),
   getLogPath: () => join(testDir, 'test.log'),
   ensureDataDir: () => {},
+  readHttpToken: () => null,
 }));
 mock.module('../util/logger.js', () => ({
@@ -38,9 +38,12 @@ mock.module('../config/user-reference.js', () => ({
 // ── Config mock ─────────────────────────────────────────────────────
 let mockCallModel: string | undefined = undefined;
+let mockDisclosure: { enabled: boolean; text: string } = { enabled: false, text: '' };
 mock.module('../config/loader.js', () => ({
   getConfig: () => ({
+    provider: 'anthropic',
+    providerOrder: ['anthropic'],
     apiKeys: { anthropic: 'test-key' },
     calls: {
       enabled: true,
@@ -49,58 +52,84 @@ mock.module('../config/loader.js', () => ({
       userConsultTimeoutSeconds: 90,
       userConsultationTimeoutSeconds: 90,
       silenceTimeoutSeconds: 30,
-      disclosure: { enabled: false, text: '' },
+      disclosure: mockDisclosure,
       safety: { denyCategories: [] },
       model: mockCallModel,
     },
+    memory: { enabled: false },
   }),
 }));
-// ── Helpers for building mock streaming responses ───────────────────
+// ── Helpers for building mock provider responses ────────────────────
 /**
- * Creates a mock Anthropic stream object that emits 'text' events
- * for each token and resolves `finalMessage()` with the full response.
+ * Creates a mock provider sendMessage implementation that emits text_delta
+ * events for each token and resolves with the full response.
  */
-function createMockStream(tokens: string[]) {
-  const emitter = new EventEmitter();
+function createMockProviderResponse(tokens: string[]) {
   const fullText = tokens.join('');
-  const stream = {
-    on: (event: string, handler: (...args: unknown[]) => void) => {
-      emitter.on(event, handler);
-      return stream;
-    },
-    finalMessage: () => {
-      // Emit tokens synchronously so the on('text') handler has fired
-      // before finalMessage resolves.
-      for (const token of tokens) {
-        emitter.emit('text', token);
-      }
-      return Promise.resolve({
-        content: [{ type: 'text', text: fullText }],
-      });
-    },
+  return async (
+    _messages: unknown[],
+    _tools: unknown[],
+    _systemPrompt: string,
+    options?: { onEvent?: (event: { type: string; text?: string }) => void; signal?: AbortSignal },
+  ) => {
+    // Emit text_delta events for each token
+    for (const token of tokens) {
+      options?.onEvent?.({ type: 'text_delta', text: token });
+    }
+    return {
+      content: [{ type: 'text', text: fullText }],
+      model: 'claude-sonnet-4-20250514',
+      usage: { inputTokens: 100, outputTokens: 50 },
+      stopReason: 'end_turn',
+    };
   };
-  return stream;
 }
-// ── Anthropic SDK mock ──────────────────────────────────────────────
+// ── Provider registry mock ──────────────────────────────────────────
-let mockStreamFn: Mock<(...args: unknown[]) => unknown>;
+// eslint-disable-next-line @typescript-eslint/no-explicit-any
+let mockSendMessage: Mock<any>;
-mock.module('@anthropic-ai/sdk', () => {
-  mockStreamFn = mock((..._args: unknown[]) => createMockStream(['Hello', ' there']));
+mock.module('../providers/registry.js', () => {
+  mockSendMessage = mock(createMockProviderResponse(['Hello', ' there']));
   return {
-    default: class MockAnthropic {
-      messages = {
-        stream: (...args: unknown[]) => mockStreamFn(...args),
+    listProviders: () => ['anthropic'],
+    getFailoverProvider: () => ({
+      name: 'anthropic',
+      sendMessage: (...args: unknown[]) => mockSendMessage(...args),
+    }),
+    getDefaultModel: (providerName: string) => {
+      const defaults: Record<string, string> = {
+        anthropic: 'claude-opus-4-6',
+        openai: 'gpt-5.2',
+        gemini: 'gemini-3-flash',
+        ollama: 'llama3.2',
+        fireworks: 'accounts/fireworks/models/kimi-k2p5',
+        openrouter: 'x-ai/grok-4',
       };
+      return defaults[providerName] ?? defaults.anthropic;
     },
   };
 });
+mock.module('../providers/provider-send-message.js', () => ({
+  resolveConfiguredProvider: () => ({
+    provider: {
+      name: 'anthropic',
+      sendMessage: (...args: unknown[]) => mockSendMessage(...args),
+    },
+    configuredProviderName: 'anthropic',
+    selectedProviderName: 'anthropic',
+    usedFallbackPrimary: false,
+  }),
+  getConfiguredProvider: () => ({
+    name: 'anthropic',
+    sendMessage: (...args: unknown[]) => mockSendMessage(...args),
+  }),
+}));
 // ── Import source modules after all mocks are registered ────────────
 import { initializeDb, getDb, resetDb } from '../memory/db.js';
@@ -176,9 +205,13 @@ function ensureConversation(id: string): void {
 function resetTables() {
   const db = getDb();
+  db.run('DELETE FROM guardian_action_deliveries');
+  db.run('DELETE FROM guardian_action_requests');
   db.run('DELETE FROM call_pending_questions');
   db.run('DELETE FROM call_events');
   db.run('DELETE FROM call_sessions');
+  db.run('DELETE FROM tool_invocations');
+  db.run('DELETE FROM messages');
   db.run('DELETE FROM conversations');
   ensuredConvIds = new Set();
 }
@@ -206,14 +239,15 @@ describe('call-orchestrator', () => {
     resetTables();
     mockCallModel = undefined;
     mockUserReference = 'my human';
-    // Reset the stream mock to default behaviour
-    mockStreamFn.mockImplementation(() => createMockStream(['Hello', ' there']));
+    mockDisclosure = { enabled: false, text: '' };
+    // Reset the provider mock to default behaviour
+    mockSendMessage.mockImplementation(createMockProviderResponse(['Hello', ' there']));
   });
   // ── handleCallerUtterance ─────────────────────────────────────────
   test('handleCallerUtterance: streams tokens via sendTextToken', async () => {
-    mockStreamFn.mockImplementation(() => createMockStream(['Hi', ', how', ' are you?']));
+    mockSendMessage.mockImplementation(createMockProviderResponse(['Hi', ', how', ' are you?']));
     const { relay, orchestrator } = setupOrchestrator();
     await orchestrator.handleCallerUtterance('Hello');
@@ -229,7 +263,7 @@ describe('call-orchestrator', () => {
   });
   test('handleCallerUtterance: sends last=true at end of turn', async () => {
-    mockStreamFn.mockImplementation(() => createMockStream(['Simple response.']));
+    mockSendMessage.mockImplementation(createMockProviderResponse(['Simple response.']));
     const { relay, orchestrator } = setupOrchestrator();
     await orchestrator.handleCallerUtterance('Test');
@@ -242,12 +276,18 @@ describe('call-orchestrator', () => {
   });
   test('handleCallerUtterance: includes speaker context in model message', async () => {
-    mockStreamFn.mockImplementation((...args: unknown[]) => {
-      const firstArg = args[0] as { messages: Array<{ role: string; content: string }> };
-      const userMessage = firstArg.messages.find((m) => m.role === 'user');
-      expect(userMessage?.content).toContain('[SPEAKER id="speaker-1" label="Aaron" source="provider" confidence="0.91"]');
-      expect(userMessage?.content).toContain('Can you summarize this meeting?');
-      return createMockStream(['Sure, here is a summary.']);
+    mockSendMessage.mockImplementation(async (messages: unknown[], ..._rest: unknown[]) => {
+      const msgs = messages as Array<{ role: string; content: Array<{ type: string; text: string }> }>;
+      const userMessage = msgs.find((m) => m.role === 'user');
+      const userText = userMessage?.content?.[0]?.text ?? '';
+      expect(userText).toContain('[SPEAKER id="speaker-1" label="Aaron" source="provider" confidence="0.91"]');
+      expect(userText).toContain('Can you summarize this meeting?');
+      return {
+        content: [{ type: 'text', text: 'Sure, here is a summary.' }],
+        model: 'claude-sonnet-4-20250514',
+        usage: { inputTokens: 100, outputTokens: 50 },
+        stopReason: 'end_turn',
+      };
     });
     const { orchestrator } = setupOrchestrator();
@@ -262,12 +302,89 @@ describe('call-orchestrator', () => {
     orchestrator.destroy();
   });
-  // ── ASK_USER pattern ──────────────────────────────────────────────
+  test('startInitialGreeting: generates model-driven opening and strips control marker from speech', async () => {
+    mockSendMessage.mockImplementation(async (messages: unknown[], ..._rest: unknown[]) => {
+      const msgs = messages as Array<{ role: string; content: Array<{ type: string; text: string }> }>;
+      const firstUser = msgs.find((m) => m.role === 'user');
+      expect(firstUser?.content?.[0]?.text).toContain('[CALL_OPENING]');
+      const tokens = ['Hi, I am calling about your appointment request. Is now a good time to talk?'];
+      const opts = _rest[2] as { onEvent?: (event: { type: string; text?: string }) => void } | undefined;
+      for (const token of tokens) {
+        opts?.onEvent?.({ type: 'text_delta', text: token });
+      }
+      return {
+        content: [{ type: 'text', text: tokens.join('') }],
+        model: 'claude-sonnet-4-20250514',
+        usage: { inputTokens: 100, outputTokens: 50 },
+        stopReason: 'end_turn',
+      };
+    });
-  test('ASK_USER pattern: detects pattern, creates pending question, enters waiting_on_user', async () => {
-    mockStreamFn.mockImplementation(() =>
-      createMockStream(['Let me check on that. ', '[ASK_USER: What date works best?]']),
-    );
+    const { relay, orchestrator } = setupOrchestrator('Confirm appointment');
+    const callCountBefore = mockSendMessage.mock.calls.length;
+    await orchestrator.startInitialGreeting();
+    await orchestrator.startInitialGreeting();
+    const allText = relay.sentTokens.map((t) => t.token).join('');
+    expect(allText).toContain('appointment request');
+    expect(allText).toContain('good time to talk');
+    expect(allText).not.toContain('[CALL_OPENING]');
+    expect(mockSendMessage.mock.calls.length - callCountBefore).toBe(1);
+    orchestrator.destroy();
+  });
+  test('startInitialGreeting: tags only the first caller response with CALL_OPENING_ACK', async () => {
+    let callCount = 0;
+    mockSendMessage.mockImplementation(async (messages: unknown[], _tools: unknown[], _systemPrompt: unknown, options?: { onEvent?: (event: { type: string; text?: string }) => void }) => {
+      callCount++;
+      const msgs = messages as Array<{ role: string; content: Array<{ type: string; text: string }> }>;
+      const userMessages = msgs.filter((m) => m.role === 'user');
+      const lastUser = userMessages[userMessages.length - 1]?.content?.[0]?.text ?? '';
+      let tokens: string[];
+      if (callCount === 1) {
+        expect(lastUser).toContain('[CALL_OPENING]');
+        tokens = ['Hey Noa, it\'s Credence calling about your joke request. Is now okay for a quick one?'];
+      } else if (callCount === 2) {
+        expect(lastUser).toContain('[CALL_OPENING_ACK]');
+        expect(lastUser).toContain('Yeah. Sure. What\'s up?');
+        tokens = ['Great, here\'s one right away. Why did the scarecrow win an award?'];
+      } else {
+        expect(lastUser).not.toContain('[CALL_OPENING_ACK]');
+        expect(lastUser).toContain('Tell me the punchline');
+        tokens = ['Because he was outstanding in his field.'];
+      }
+      for (const token of tokens) {
+        options?.onEvent?.({ type: 'text_delta', text: token });
+      }
+      return {
+        content: [{ type: 'text', text: tokens.join('') }],
+        model: 'claude-sonnet-4-20250514',
+        usage: { inputTokens: 100, outputTokens: 50 },
+        stopReason: 'end_turn',
+      };
+    });
+    const { orchestrator } = setupOrchestrator('Tell a joke immediately');
+    await orchestrator.startInitialGreeting();
+    await orchestrator.handleCallerUtterance('Yeah. Sure. What\'s up?');
+    await orchestrator.handleCallerUtterance('Tell me the punchline');
+    expect(callCount).toBe(3);
+    orchestrator.destroy();
+  });
+  // ── ASK_GUARDIAN pattern ──────────────────────────────────────────
+  test('ASK_GUARDIAN pattern: detects pattern, creates pending question, enters waiting_on_user', async () => {
+    mockSendMessage.mockImplementation(createMockProviderResponse(
+      ['Let me check on that. ', '[ASK_GUARDIAN: What date works best?]'],
+    ));
     const { session, relay, orchestrator } = setupOrchestrator('Book appointment');
     await orchestrator.handleCallerUtterance('I need to schedule something');
@@ -282,9 +399,34 @@ describe('call-orchestrator', () => {
     const updatedSession = getCallSession(session.id);
     expect(updatedSession!.status).toBe('waiting_on_user');
-    // The ASK_USER marker text should NOT appear in the relay tokens
+    // The ASK_GUARDIAN marker text should NOT appear in the relay tokens
+    const allText = relay.sentTokens.map((t) => t.token).join('');
+    expect(allText).not.toContain('[ASK_GUARDIAN:');
+    orchestrator.destroy();
+  });
+  test('strips internal context markers from spoken output', async () => {
+    mockSendMessage.mockImplementation(createMockProviderResponse([
+      'Thanks for waiting. ',
+      '[USER_ANSWERED: The guardian said 3 PM works.] ',
+      '[USER_INSTRUCTION: Keep this short.] ',
+      '[CALL_OPENING_ACK] ',
+      'I can confirm 3 PM works.',
+    ]));
+    const { relay, orchestrator } = setupOrchestrator();
+    await orchestrator.handleCallerUtterance('Any update?');
     const allText = relay.sentTokens.map((t) => t.token).join('');
-    expect(allText).not.toContain('[ASK_USER:');
+    expect(allText).toContain('Thanks for waiting.');
+    expect(allText).toContain('I can confirm 3 PM works.');
+    expect(allText).not.toContain('[USER_ANSWERED:');
+    expect(allText).not.toContain('[USER_INSTRUCTION:');
+    expect(allText).not.toContain('[CALL_OPENING_ACK]');
+    expect(allText).not.toContain('USER_ANSWERED');
+    expect(allText).not.toContain('USER_INSTRUCTION');
+    expect(allText).not.toContain('CALL_OPENING_ACK');
     orchestrator.destroy();
   });
@@ -292,9 +434,9 @@ describe('call-orchestrator', () => {
   // ── END_CALL pattern ──────────────────────────────────────────────
   test('END_CALL pattern: detects marker, calls endSession, updates status to completed', async () => {
-    mockStreamFn.mockImplementation(() =>
-      createMockStream(['Thank you for calling, goodbye! ', '[END_CALL]']),
-    );
+    mockSendMessage.mockImplementation(createMockProviderResponse(
+      ['Thank you for calling, goodbye! ', '[END_CALL]'],
+    ));
     const { session, relay, orchestrator } = setupOrchestrator();
     await orchestrator.handleCallerUtterance('That is all, thanks');
@@ -317,21 +459,31 @@ describe('call-orchestrator', () => {
   // ── handleUserAnswer ──────────────────────────────────────────────
   test('handleUserAnswer: returns true immediately and fires LLM asynchronously', async () => {
-    // First utterance triggers ASK_USER
-    mockStreamFn.mockImplementation(() =>
-      createMockStream(['Hold on. [ASK_USER: Preferred time?]']),
-    );
+    // First utterance triggers ASK_GUARDIAN
+    mockSendMessage.mockImplementation(createMockProviderResponse(
+      ['Hold on. [ASK_GUARDIAN: Preferred time?]'],
+    ));
     const { relay, orchestrator } = setupOrchestrator();
     await orchestrator.handleCallerUtterance('I need an appointment');
     // Now provide the answer — reset mock for second LLM call
-    mockStreamFn.mockImplementation((...args: unknown[]) => {
+    mockSendMessage.mockImplementation(async (messages: unknown[], ..._rest: unknown[]) => {
       // Verify the messages include the USER_ANSWERED marker
-      const firstArg = args[0] as { messages: Array<{ role: string; content: string }> };
-      const lastUserMsg = firstArg.messages.filter((m: { role: string }) => m.role === 'user').pop();
-      expect(lastUserMsg?.content).toContain('[USER_ANSWERED: 3pm tomorrow]');
-      return createMockStream(['Great, I have scheduled for 3pm tomorrow.']);
+      const msgs = messages as Array<{ role: string; content: Array<{ type: string; text: string }> }>;
+      const lastUserMsg = msgs.filter((m) => m.role === 'user').pop();
+      expect(lastUserMsg?.content?.[0]?.text).toContain('[USER_ANSWERED: 3pm tomorrow]');
+      const tokens = ['Great, I have scheduled for 3pm tomorrow.'];
+      const opts = _rest[2] as { onEvent?: (event: { type: string; text?: string }) => void } | undefined;
+      for (const token of tokens) {
+        opts?.onEvent?.({ type: 'text_delta', text: token });
+      }
+      return {
+        content: [{ type: 'text', text: tokens.join('') }],
+        model: 'claude-sonnet-4-20250514',
+        usage: { inputTokens: 100, outputTokens: 50 },
+        stopReason: 'end_turn',
+      };
     });
     const accepted = await orchestrator.handleUserAnswer('3pm tomorrow');
@@ -352,9 +504,9 @@ describe('call-orchestrator', () => {
   test('mid-call question flow: unavailable time → ask user → user confirms → resumed call', async () => {
     // Step 1: Caller says "7:30" but it's unavailable. The LLM asks the user.
-    mockStreamFn.mockImplementation(() =>
-      createMockStream(['I\'m sorry, 7:30 is not available. ', '[ASK_USER: Is 8:00 okay instead?]']),
-    );
+    mockSendMessage.mockImplementation(createMockProviderResponse(
+      ['I\'m sorry, 7:30 is not available. ', '[ASK_GUARDIAN: Is 8:00 okay instead?]'],
+    ));
     const { session, relay, orchestrator } = setupOrchestrator('Schedule a haircut');
@@ -371,9 +523,9 @@ describe('call-orchestrator', () => {
     expect(midSession!.status).toBe('waiting_on_user');
     // Step 2: User answers "Yes, 8:00 works"
-    mockStreamFn.mockImplementation(() =>
-      createMockStream(['Great, I\'ve booked you for 8:00. See you then! ', '[END_CALL]']),
-    );
+    mockSendMessage.mockImplementation(createMockProviderResponse(
+      ['Great, I\'ve booked you for 8:00. See you then! ', '[END_CALL]'],
+    ));
     const accepted = await orchestrator.handleUserAnswer('Yes, 8:00 works for me');
     expect(accepted).toBe(true);
@@ -395,16 +547,9 @@ describe('call-orchestrator', () => {
   // ── Provider / LLM failure paths ───────────────────────────────
   test('LLM error: sends error message to caller and returns to idle', async () => {
-    // Make the stream throw an error on finalMessage
-    mockStreamFn.mockImplementation(() => {
-      const emitter = new EventEmitter();
-      return {
-        on: (event: string, handler: (...args: unknown[]) => void) => {
-          emitter.on(event, handler);
-          return { on: () => ({ on: () => ({}) }) };
-        },
-        finalMessage: () => Promise.reject(new Error('API rate limit exceeded')),
-      };
+    // Make sendMessage reject with an error
+    mockSendMessage.mockImplementation(async () => {
+      throw new Error('API rate limit exceeded');
     });
     const { relay, orchestrator } = setupOrchestrator();
@@ -424,19 +569,10 @@ describe('call-orchestrator', () => {
   });
   test('LLM APIUserAbortError: treats as expected abort without technical-issue fallback', async () => {
-    mockStreamFn.mockImplementation(() => {
-      const emitter = new EventEmitter();
-      return {
-        on: (event: string, handler: (...args: unknown[]) => void) => {
-          emitter.on(event, handler);
-          return { on: () => ({ on: () => ({}) }) };
-        },
-        finalMessage: () => {
-          const err = new Error('user abort');
-          err.name = 'APIUserAbortError';
-          return Promise.reject(err);
-        },
-      };
+    mockSendMessage.mockImplementation(async () => {
+      const err = new Error('user abort');
+      err.name = 'APIUserAbortError';
+      throw err;
     });
     const { relay, orchestrator } = setupOrchestrator();
@@ -451,22 +587,23 @@ describe('call-orchestrator', () => {
   test('stale superseded turn errors do not emit technical-issue fallback', async () => {
     let callCount = 0;
-    mockStreamFn.mockImplementation(() => {
+    mockSendMessage.mockImplementation(async (_messages: unknown[], _tools: unknown[], _systemPrompt: unknown, options?: { onEvent?: (event: { type: string; text?: string }) => void }) => {
       callCount++;
       if (callCount === 1) {
-        const emitter = new EventEmitter();
-        return {
-          on: (event: string, handler: (...args: unknown[]) => void) => {
-            emitter.on(event, handler);
-            return { on: () => ({ on: () => ({}) }) };
-          },
-          finalMessage: () =>
-            new Promise((_, reject) => {
-              setTimeout(() => reject(new Error('stale stream failure')), 20);
-            }),
-        };
+        return new Promise((_, reject) => {
+          setTimeout(() => reject(new Error('stale stream failure')), 20);
+        });
       }
-      return createMockStream(['Second turn response.']);
+      const tokens = ['Second turn response.'];
+      for (const token of tokens) {
+        options?.onEvent?.({ type: 'text_delta', text: token });
+      }
+      return {
+        content: [{ type: 'text', text: tokens.join('') }],
+        model: 'claude-sonnet-4-20250514',
+        usage: { inputTokens: 100, outputTokens: 50 },
+        stopReason: 'end_turn',
+      };
     });
     const { relay, orchestrator } = setupOrchestrator();
@@ -485,39 +622,102 @@ describe('call-orchestrator', () => {
     orchestrator.destroy();
   });
-  test('rapid caller barge-in coalesces contiguous user turns for role alternation', async () => {
+  test('barge-in cleanup never sends empty user turns to provider', async () => {
     let callCount = 0;
-    mockStreamFn.mockImplementation((...args: unknown[]) => {
+    mockSendMessage.mockImplementation(async (messages: unknown[], _tools: unknown[], _systemPrompt: unknown, options?: { onEvent?: (event: { type: string; text?: string }) => void; signal?: AbortSignal }) => {
       callCount++;
+      // Initial outbound opener
       if (callCount === 1) {
-        const emitter = new EventEmitter();
-        const options = args[1] as { signal?: AbortSignal } | undefined;
+        const tokens = ['Hey Noa, this is Credence calling.'];
+        for (const token of tokens) {
+          options?.onEvent?.({ type: 'text_delta', text: token });
+        }
         return {
-          on: (event: string, handler: (...evtArgs: unknown[]) => void) => {
-            emitter.on(event, handler);
-            return { on: () => ({ on: () => ({}) }) };
-          },
-          finalMessage: () =>
-            new Promise((_, reject) => {
-              options?.signal?.addEventListener('abort', () => {
-                const err = new Error('aborted');
-                err.name = 'AbortError';
-                reject(err);
-              }, { once: true });
-            }),
+          content: [{ type: 'text', text: tokens.join('') }],
+          model: 'claude-sonnet-4-20250514',
+          usage: { inputTokens: 100, outputTokens: 50 },
+          stopReason: 'end_turn',
         };
       }
-      const firstArg = args[0] as { messages: Array<{ role: string; content: string }> };
-      const roles = firstArg.messages.map((m) => m.role);
+      // First caller turn enters an in-flight LLM run that gets interrupted
+      if (callCount === 2) {
+        return new Promise((_, reject) => {
+          options?.signal?.addEventListener('abort', () => {
+            const err = new Error('aborted');
+            err.name = 'AbortError';
+            reject(err);
+          }, { once: true });
+        });
+      }
+      // Second caller turn should never include an empty user message.
+      const msgs = messages as Array<{ role: string; content: Array<{ type: string; text: string }> }>;
+      const userMessages = msgs.filter((m) => m.role === 'user');
+      expect(userMessages.length).toBeGreaterThan(0);
+      expect(userMessages.every((m) => m.content?.[0]?.text?.trim().length > 0)).toBe(true);
+      const tokens = ['Got it, thanks for clarifying.'];
+      for (const token of tokens) {
+        options?.onEvent?.({ type: 'text_delta', text: token });
+      }
+      return {
+        content: [{ type: 'text', text: tokens.join('') }],
+        model: 'claude-sonnet-4-20250514',
+        usage: { inputTokens: 100, outputTokens: 50 },
+        stopReason: 'end_turn',
+      };
+    });
+    const { relay, orchestrator } = setupOrchestrator('Quick check-in');
+    await orchestrator.startInitialGreeting();
+    const firstTurnPromise = orchestrator.handleCallerUtterance('Hello?');
+    await new Promise((r) => setTimeout(r, 5));
+    const secondTurnPromise = orchestrator.handleCallerUtterance('What have you been up to lately?');
+    await Promise.all([firstTurnPromise, secondTurnPromise]);
+    const allTokens = relay.sentTokens.map((t) => t.token).join('');
+    expect(allTokens).toContain('Got it, thanks for clarifying.');
+    expect(allTokens).not.toContain('technical issue');
+    orchestrator.destroy();
+  });
+  test('rapid caller barge-in coalesces contiguous user turns for role alternation', async () => {
+    let callCount = 0;
+    mockSendMessage.mockImplementation(async (messages: unknown[], _tools: unknown[], _systemPrompt: unknown, options?: { onEvent?: (event: { type: string; text?: string }) => void; signal?: AbortSignal }) => {
+      callCount++;
+      if (callCount === 1) {
+        return new Promise((_, reject) => {
+          options?.signal?.addEventListener('abort', () => {
+            const err = new Error('aborted');
+            err.name = 'AbortError';
+            reject(err);
+          }, { once: true });
+        });
+      }
+      const msgs = messages as Array<{ role: string; content: Array<{ type: string; text: string }> }>;
+      const roles = msgs.map((m) => m.role);
       for (let i = 1; i < roles.length; i++) {
         expect(!(roles[i - 1] === 'user' && roles[i] === 'user')).toBe(true);
       }
-      const userMessages = firstArg.messages.filter((m) => m.role === 'user');
+      const userMessages = msgs.filter((m) => m.role === 'user');
       const lastUser = userMessages[userMessages.length - 1];
-      expect(lastUser?.content).toContain('First caller utterance');
-      expect(lastUser?.content).toContain('Second caller utterance');
-      return createMockStream(['Merged turn handled.']);
+      expect(lastUser?.content?.[0]?.text).toContain('First caller utterance');
+      expect(lastUser?.content?.[0]?.text).toContain('Second caller utterance');
+      const tokens = ['Merged turn handled.'];
+      for (const token of tokens) {
+        options?.onEvent?.({ type: 'text_delta', text: token });
+      }
+      return {
+        content: [{ type: 'text', text: tokens.join('') }],
+        model: 'claude-sonnet-4-20250514',
+        usage: { inputTokens: 100, outputTokens: 50 },
+        stopReason: 'end_turn',
+      };
     });
     const { relay, orchestrator } = setupOrchestrator();
@@ -535,37 +735,37 @@ describe('call-orchestrator', () => {
   test('interrupt then next caller prompt still preserves role alternation', async () => {
     let callCount = 0;
-    mockStreamFn.mockImplementation((...args: unknown[]) => {
+    mockSendMessage.mockImplementation(async (messages: unknown[], _tools: unknown[], _systemPrompt: unknown, options?: { onEvent?: (event: { type: string; text?: string }) => void; signal?: AbortSignal }) => {
       callCount++;
       if (callCount === 1) {
-        const emitter = new EventEmitter();
-        const options = args[1] as { signal?: AbortSignal } | undefined;
-        return {
-          on: (event: string, handler: (...evtArgs: unknown[]) => void) => {
-            emitter.on(event, handler);
-            return { on: () => ({ on: () => ({}) }) };
-          },
-          finalMessage: () =>
-            new Promise((_, reject) => {
-              options?.signal?.addEventListener('abort', () => {
-                const err = new Error('aborted');
-                err.name = 'AbortError';
-                reject(err);
-              }, { once: true });
-            }),
-        };
+        return new Promise((_, reject) => {
+          options?.signal?.addEventListener('abort', () => {
+            const err = new Error('aborted');
+            err.name = 'AbortError';
+            reject(err);
+          }, { once: true });
+        });
       }
-      const firstArg = args[0] as { messages: Array<{ role: string; content: string }> };
-      const roles = firstArg.messages.map((m) => m.role);
+      const msgs = messages as Array<{ role: string; content: Array<{ type: string; text: string }> }>;
+      const roles = msgs.map((m) => m.role);
       for (let i = 1; i < roles.length; i++) {
         expect(!(roles[i - 1] === 'user' && roles[i] === 'user')).toBe(true);
       }
-      const userMessages = firstArg.messages.filter((m) => m.role === 'user');
+      const userMessages = msgs.filter((m) => m.role === 'user');
       const lastUser = userMessages[userMessages.length - 1];
-      expect(lastUser?.content).toContain('First caller utterance');
-      expect(lastUser?.content).toContain('Second caller utterance');
-      return createMockStream(['Post-interrupt response.']);
+      expect(lastUser?.content?.[0]?.text).toContain('First caller utterance');
+      expect(lastUser?.content?.[0]?.text).toContain('Second caller utterance');
+      const tokens = ['Post-interrupt response.'];
+      for (const token of tokens) {
+        options?.onEvent?.({ type: 'text_delta', text: token });
+      }
+      return {
+        content: [{ type: 'text', text: tokens.join('') }],
+        model: 'claude-sonnet-4-20250514',
+        usage: { inputTokens: 100, outputTokens: 50 },
+        stopReason: 'end_turn',
+      };
     });
     const { relay, orchestrator } = setupOrchestrator();
@@ -605,24 +805,18 @@ describe('call-orchestrator', () => {
   });
   test('handleInterrupt: increments llmRunVersion to suppress stale turn side effects', async () => {
-    // Use a stream whose finalMessage resolves immediately but whose
-    // continuation (the code after `await stream.finalMessage()`) will
-    // run asynchronously. This simulates the race where the promise
-    // microtask is queued right as handleInterrupt fires.
-    mockStreamFn.mockImplementation(() => {
-      const emitter = new EventEmitter();
+    // Use a sendMessage that resolves immediately but whose continuation
+    // (the code after `await provider.sendMessage()`) will run asynchronously.
+    // This simulates the race where the promise microtask is queued right
+    // as handleInterrupt fires.
+    mockSendMessage.mockImplementation(async (_messages: unknown[], _tools: unknown[], _systemPrompt: unknown, options?: { onEvent?: (event: { type: string; text?: string }) => void }) => {
+      // Emit some tokens synchronously
+      options?.onEvent?.({ type: 'text_delta', text: 'Stale response that should be suppressed.' });
       return {
-        on: (event: string, handler: (...args: unknown[]) => void) => {
-          emitter.on(event, handler);
-          return { on: () => ({ on: () => ({}) }) };
-        },
-        finalMessage: () => {
-          // Emit some tokens synchronously
-          emitter.emit('text', 'Stale response that should be suppressed.');
-          return Promise.resolve({
-            content: [{ type: 'text', text: 'Stale response that should be suppressed.' }],
-          });
-        },
+        content: [{ type: 'text', text: 'Stale response that should be suppressed.' }],
+        model: 'claude-sonnet-4-20250514',
+        usage: { inputTokens: 100, outputTokens: 50 },
+        stopReason: 'end_turn',
       };
     });
@@ -631,7 +825,7 @@ describe('call-orchestrator', () => {
     // Start an LLM turn (don't await — we want to interrupt mid-flight)
     const turnPromise = orchestrator.handleCallerUtterance('Hello');
-    // Interrupt immediately. Because finalMessage resolves as a microtask,
+    // Interrupt immediately. Because sendMessage resolves as a microtask,
     // its continuation hasn't run yet. handleInterrupt increments
     // llmRunVersion so the continuation's isCurrentRun check will fail.
     orchestrator.handleInterrupt();
@@ -654,23 +848,14 @@ describe('call-orchestrator', () => {
   });
   test('handleInterrupt: sends turn terminator when interrupting active speech', async () => {
-    mockStreamFn.mockImplementation((...args: unknown[]) => {
-      const emitter = new EventEmitter();
-      const options = args[1] as { signal?: AbortSignal } | undefined;
-      return {
-        on: (event: string, handler: (...evtArgs: unknown[]) => void) => {
-          emitter.on(event, handler);
-          return { on: () => ({ on: () => ({}) }) };
-        },
-        finalMessage: () =>
-          new Promise((_, reject) => {
-            options?.signal?.addEventListener('abort', () => {
-              const err = new Error('aborted');
-              err.name = 'AbortError';
-              reject(err);
-            }, { once: true });
-          }),
-      };
+    mockSendMessage.mockImplementation(async (_messages: unknown[], _tools: unknown[], _systemPrompt: unknown, options?: { onEvent?: (event: { type: string; text?: string }) => void; signal?: AbortSignal }) => {
+      return new Promise((_, reject) => {
+        options?.signal?.addEventListener('abort', () => {
+          const err = new Error('aborted');
+          err.name = 'AbortError';
+          reject(err);
+        }, { once: true });
+      });
     });
     const { relay, orchestrator } = setupOrchestrator();
@@ -709,12 +894,22 @@ describe('call-orchestrator', () => {
   // ── Model override from config ──────────────────────────────────────
-  test('uses default model when calls.model is not set', async () => {
+  test('does not override model when calls.model is not set (preserves cross-provider failover)', async () => {
     mockCallModel = undefined;
-    mockStreamFn.mockImplementation((...args: unknown[]) => {
-      const firstArg = args[0] as { model: string };
-      expect(firstArg.model).toBe('claude-sonnet-4-20250514');
-      return createMockStream(['Default model response.']);
+    mockSendMessage.mockImplementation(async (_messages: unknown[], _tools: unknown[], _systemPrompt: unknown, options?: { config?: { model?: string }; onEvent?: (event: { type: string; text?: string }) => void }) => {
+      // When calls.model is unset, no model override should be passed so each
+      // provider in the failover chain uses its own default model.
+      expect(options?.config?.model).toBeUndefined();
+      const tokens = ['Default model response.'];
+      for (const token of tokens) {
+        options?.onEvent?.({ type: 'text_delta', text: token });
+      }
+      return {
+        content: [{ type: 'text', text: tokens.join('') }],
+        model: 'claude-opus-4-6',
+        usage: { inputTokens: 100, outputTokens: 50 },
+        stopReason: 'end_turn',
+      };
     });
     const { orchestrator } = setupOrchestrator();
@@ -724,10 +919,18 @@ describe('call-orchestrator', () => {
   test('uses calls.model override from config when set', async () => {
     mockCallModel = 'claude-haiku-4-5-20251001';
-    mockStreamFn.mockImplementation((...args: unknown[]) => {
-      const firstArg = args[0] as { model: string };
-      expect(firstArg.model).toBe('claude-haiku-4-5-20251001');
-      return createMockStream(['Override model response.']);
+    mockSendMessage.mockImplementation(async (_messages: unknown[], _tools: unknown[], _systemPrompt: unknown, options?: { config?: { model: string }; onEvent?: (event: { type: string; text?: string }) => void }) => {
+      expect(options?.config?.model).toBe('claude-haiku-4-5-20251001');
+      const tokens = ['Override model response.'];
+      for (const token of tokens) {
+        options?.onEvent?.({ type: 'text_delta', text: token });
+      }
+      return {
+        content: [{ type: 'text', text: tokens.join('') }],
+        model: 'claude-haiku-4-5-20251001',
+        usage: { inputTokens: 100, outputTokens: 50 },
+        stopReason: 'end_turn',
+      };
     });
     const { orchestrator } = setupOrchestrator();
@@ -735,12 +938,21 @@ describe('call-orchestrator', () => {
     orchestrator.destroy();
   });
-  test('treats empty string calls.model as unset and falls back to default', async () => {
+  test('treats empty string calls.model as unset and omits model override', async () => {
     mockCallModel = '';
-    mockStreamFn.mockImplementation((...args: unknown[]) => {
-      const firstArg = args[0] as { model: string };
-      expect(firstArg.model).toBe('claude-sonnet-4-20250514');
-      return createMockStream(['Fallback model response.']);
+    mockSendMessage.mockImplementation(async (_messages: unknown[], _tools: unknown[], _systemPrompt: unknown, options?: { config?: { model?: string }; onEvent?: (event: { type: string; text?: string }) => void }) => {
+      // Empty string is treated as unset — no model override
+      expect(options?.config?.model).toBeUndefined();
+      const tokens = ['Fallback model response.'];
+      for (const token of tokens) {
+        options?.onEvent?.({ type: 'text_delta', text: token });
+      }
+      return {
+        content: [{ type: 'text', text: tokens.join('') }],
+        model: 'claude-opus-4-6',
+        usage: { inputTokens: 100, outputTokens: 50 },
+        stopReason: 'end_turn',
+      };
     });
     const { orchestrator } = setupOrchestrator();
@@ -748,12 +960,21 @@ describe('call-orchestrator', () => {
     orchestrator.destroy();
   });
-  test('treats whitespace-only calls.model as unset and falls back to default', async () => {
+  test('treats whitespace-only calls.model as unset and omits model override', async () => {
     mockCallModel = '   ';
-    mockStreamFn.mockImplementation((...args: unknown[]) => {
-      const firstArg = args[0] as { model: string };
-      expect(firstArg.model).toBe('claude-sonnet-4-20250514');
-      return createMockStream(['Fallback model response.']);
+    mockSendMessage.mockImplementation(async (_messages: unknown[], _tools: unknown[], _systemPrompt: unknown, options?: { config?: { model?: string }; onEvent?: (event: { type: string; text?: string }) => void }) => {
+      // Whitespace-only is treated as unset — no model override
+      expect(options?.config?.model).toBeUndefined();
+      const tokens = ['Fallback model response.'];
+      for (const token of tokens) {
+        options?.onEvent?.({ type: 'text_delta', text: token });
+      }
+      return {
+        content: [{ type: 'text', text: tokens.join('') }],
+        model: 'claude-opus-4-6',
+        usage: { inputTokens: 100, outputTokens: 50 },
+        stopReason: 'end_turn',
+      };
     });
     const { orchestrator } = setupOrchestrator();
@@ -764,14 +985,23 @@ describe('call-orchestrator', () => {
   // ── handleUserInstruction ─────────────────────────────────────────
   test('handleUserInstruction: injects instruction marker into conversation history and triggers LLM when idle', async () => {
-    mockStreamFn.mockImplementation((...args: unknown[]) => {
-      const firstArg = args[0] as { messages: Array<{ role: string; content: string }> };
-      const instructionMsg = firstArg.messages.find((m) =>
-        m.role === 'user' && m.content.includes('[USER_INSTRUCTION:'),
+    mockSendMessage.mockImplementation(async (messages: unknown[], _tools: unknown[], _systemPrompt: unknown, options?: { onEvent?: (event: { type: string; text?: string }) => void }) => {
+      const msgs = messages as Array<{ role: string; content: Array<{ type: string; text: string }> }>;
+      const instructionMsg = msgs.find((m) =>
+        m.role === 'user' && m.content?.[0]?.text?.includes('[USER_INSTRUCTION:'),
       );
       expect(instructionMsg).toBeDefined();
-      expect(instructionMsg!.content).toContain('[USER_INSTRUCTION: Ask about their weekend plans]');
-      return createMockStream(['Sure, do you have any weekend plans?']);
+      expect(instructionMsg!.content[0].text).toContain('[USER_INSTRUCTION: Ask about their weekend plans]');
+      const tokens = ['Sure, do you have any weekend plans?'];
+      for (const token of tokens) {
+        options?.onEvent?.({ type: 'text_delta', text: token });
+      }
+      return {
+        content: [{ type: 'text', text: tokens.join('') }],
+        model: 'claude-sonnet-4-20250514',
+        usage: { inputTokens: 100, outputTokens: 50 },
+        stopReason: 'end_turn',
+      };
     });
     const { relay, orchestrator } = setupOrchestrator();
@@ -787,30 +1017,38 @@ describe('call-orchestrator', () => {
   test('handleUserInstruction: does not break existing answer flow', async () => {
     // Step 1: Caller says something, LLM responds normally
-    mockStreamFn.mockImplementation(() => createMockStream(['Hello! How can I help you today?']));
+    mockSendMessage.mockImplementation(createMockProviderResponse(['Hello! How can I help you today?']));
     const { session: _session, relay, orchestrator } = setupOrchestrator('Book appointment');
     await orchestrator.handleCallerUtterance('Hi there');
     // Step 2: Inject an instruction while idle
-    mockStreamFn.mockImplementation((...args: unknown[]) => {
-      const firstArg = args[0] as { messages: Array<{ role: string; content: string }> };
+    mockSendMessage.mockImplementation(async (messages: unknown[], _tools: unknown[], _systemPrompt: unknown, options?: { onEvent?: (event: { type: string; text?: string }) => void }) => {
+      const msgs = messages as Array<{ role: string; content: Array<{ type: string; text: string }> }>;
       // Verify the history contains both the original exchange and the instruction
-      const messages = firstArg.messages;
-      expect(messages.length).toBeGreaterThanOrEqual(3); // user utterance + assistant response + instruction
-      const instructionMsg = messages.find((m) =>
-        m.role === 'user' && m.content.includes('[USER_INSTRUCTION:'),
+      expect(msgs.length).toBeGreaterThanOrEqual(3); // user utterance + assistant response + instruction
+      const instructionMsg = msgs.find((m) =>
+        m.role === 'user' && m.content?.[0]?.text?.includes('[USER_INSTRUCTION:'),
       );
       expect(instructionMsg).toBeDefined();
-      return createMockStream(['Of course, let me mention the weekend special.']);
+      const tokens = ['Of course, let me mention the weekend special.'];
+      for (const token of tokens) {
+        options?.onEvent?.({ type: 'text_delta', text: token });
+      }
+      return {
+        content: [{ type: 'text', text: tokens.join('') }],
+        model: 'claude-sonnet-4-20250514',
+        usage: { inputTokens: 100, outputTokens: 50 },
+        stopReason: 'end_turn',
+      };
     });
     await orchestrator.handleUserInstruction('Mention the weekend special');
     // Step 3: Caller speaks again — the flow should continue normally
-    mockStreamFn.mockImplementation(() =>
-      createMockStream(['Great choice! The weekend special is 20% off.']),
-    );
+    mockSendMessage.mockImplementation(createMockProviderResponse(
+      ['Great choice! The weekend special is 20% off.'],
+    ));
     await orchestrator.handleCallerUtterance('Tell me more about that');
@@ -826,7 +1064,7 @@ describe('call-orchestrator', () => {
   });
   test('handleUserInstruction: emits user_instruction_relayed event', async () => {
-    mockStreamFn.mockImplementation(() => createMockStream(['Understood, adjusting approach.']));
+    mockSendMessage.mockImplementation(createMockProviderResponse(['Understood, adjusting approach.']));
     const { session, orchestrator } = setupOrchestrator();
@@ -843,20 +1081,25 @@ describe('call-orchestrator', () => {
   });
   test('handleUserInstruction: does not trigger LLM when orchestrator is not idle', async () => {
-    // First, trigger ASK_USER so orchestrator enters waiting_on_user
-    mockStreamFn.mockImplementation(() =>
-      createMockStream(['Hold on. [ASK_USER: What time?]']),
-    );
+    // First, trigger ASK_GUARDIAN so orchestrator enters waiting_on_user
+    mockSendMessage.mockImplementation(createMockProviderResponse(
+      ['Hold on. [ASK_GUARDIAN: What time?]'],
+    ));
     const { session, orchestrator } = setupOrchestrator();
     await orchestrator.handleCallerUtterance('I need an appointment');
     expect(orchestrator.getState()).toBe('waiting_on_user');
-    // Track how many times the stream mock is called
+    // Track how many times the provider mock is called
     let streamCallCount = 0;
-    mockStreamFn.mockImplementation(() => {
+    mockSendMessage.mockImplementation(async () => {
       streamCallCount++;
-      return createMockStream(['Response after instruction.']);
+      return {
+        content: [{ type: 'text', text: 'Response after instruction.' }],
+        model: 'claude-sonnet-4-20250514',
+        usage: { inputTokens: 100, outputTokens: 50 },
+        stopReason: 'end_turn',
+      };
     });
     // Inject instruction while in waiting_on_user state
@@ -876,10 +1119,18 @@ describe('call-orchestrator', () => {
   // ── System prompt: identity phrasing ────────────────────────────────
   test('system prompt contains resolved user reference (default)', async () => {
-    mockStreamFn.mockImplementation((...args: unknown[]) => {
-      const firstArg = args[0] as { system: string };
-      expect(firstArg.system).toContain('on behalf of my human');
-      return createMockStream(['Hello.']);
+    mockSendMessage.mockImplementation(async (_messages: unknown[], _tools: unknown[], systemPrompt: unknown, options?: { onEvent?: (event: { type: string; text?: string }) => void }) => {
+      expect(systemPrompt as string).toContain('on behalf of my human');
+      const tokens = ['Hello.'];
+      for (const token of tokens) {
+        options?.onEvent?.({ type: 'text_delta', text: token });
+      }
+      return {
+        content: [{ type: 'text', text: tokens.join('') }],
+        model: 'claude-sonnet-4-20250514',
+        usage: { inputTokens: 100, outputTokens: 50 },
+        stopReason: 'end_turn',
+      };
     });
     const { orchestrator } = setupOrchestrator();
@@ -889,10 +1140,18 @@ describe('call-orchestrator', () => {
   test('system prompt contains resolved user reference when set to a name', async () => {
     mockUserReference = 'John';
-    mockStreamFn.mockImplementation((...args: unknown[]) => {
-      const firstArg = args[0] as { system: string };
-      expect(firstArg.system).toContain('on behalf of John');
-      return createMockStream(['Hello John\'s contact.']);
+    mockSendMessage.mockImplementation(async (_messages: unknown[], _tools: unknown[], systemPrompt: unknown, options?: { onEvent?: (event: { type: string; text?: string }) => void }) => {
+      expect(systemPrompt as string).toContain('on behalf of John');
+      const tokens = ['Hello John\'s contact.'];
+      for (const token of tokens) {
+        options?.onEvent?.({ type: 'text_delta', text: token });
+      }
+      return {
+        content: [{ type: 'text', text: tokens.join('') }],
+        model: 'claude-sonnet-4-20250514',
+        usage: { inputTokens: 100, outputTokens: 50 },
+        stopReason: 'end_turn',
+      };
     });
     const { orchestrator } = setupOrchestrator();
@@ -902,11 +1161,19 @@ describe('call-orchestrator', () => {
   test('system prompt does not hardcode "your user" in the opening line', async () => {
     mockUserReference = 'Alice';
-    mockStreamFn.mockImplementation((...args: unknown[]) => {
-      const firstArg = args[0] as { system: string };
-      expect(firstArg.system).not.toContain('on behalf of your user');
-      expect(firstArg.system).toContain('on behalf of Alice');
-      return createMockStream(['Hi there.']);
+    mockSendMessage.mockImplementation(async (_messages: unknown[], _tools: unknown[], systemPrompt: unknown, options?: { onEvent?: (event: { type: string; text?: string }) => void }) => {
+      expect(systemPrompt as string).not.toContain('on behalf of your user');
+      expect(systemPrompt as string).toContain('on behalf of Alice');
+      const tokens = ['Hi there.'];
+      for (const token of tokens) {
+        options?.onEvent?.({ type: 'text_delta', text: token });
+      }
+      return {
+        content: [{ type: 'text', text: tokens.join('') }],
+        model: 'claude-sonnet-4-20250514',
+        usage: { inputTokens: 100, outputTokens: 50 },
+        stopReason: 'end_turn',
+      };
     });
     const { orchestrator } = setupOrchestrator();
@@ -915,11 +1182,40 @@ describe('call-orchestrator', () => {
   });
   test('system prompt includes assistant identity bias rule', async () => {
-    mockStreamFn.mockImplementation((...args: unknown[]) => {
-      const firstArg = args[0] as { system: string };
-      expect(firstArg.system).toContain('refer to yourself as an assistant');
-      expect(firstArg.system).toContain('Avoid the phrase "AI assistant" unless directly asked');
-      return createMockStream(['Sure thing.']);
+    mockSendMessage.mockImplementation(async (_messages: unknown[], _tools: unknown[], systemPrompt: unknown, options?: { onEvent?: (event: { type: string; text?: string }) => void }) => {
+      expect(systemPrompt as string).toContain('refer to yourself as an assistant');
+      expect(systemPrompt as string).toContain('Avoid the phrase "AI assistant" unless directly asked');
+      const tokens = ['Sure thing.'];
+      for (const token of tokens) {
+        options?.onEvent?.({ type: 'text_delta', text: token });
+      }
+      return {
+        content: [{ type: 'text', text: tokens.join('') }],
+        model: 'claude-sonnet-4-20250514',
+        usage: { inputTokens: 100, outputTokens: 50 },
+        stopReason: 'end_turn',
+      };
+    });
+    const { orchestrator } = setupOrchestrator();
+    await orchestrator.handleCallerUtterance('Hi');
+    orchestrator.destroy();
+  });
+  test('system prompt includes opening-ack guidance to avoid duplicate introductions', async () => {
+    mockSendMessage.mockImplementation(async (_messages: unknown[], _tools: unknown[], systemPrompt: unknown, options?: { onEvent?: (event: { type: string; text?: string }) => void }) => {
+      expect(systemPrompt as string).toContain('[CALL_OPENING_ACK]');
+      expect(systemPrompt as string).toContain('without re-introducing yourself');
+      const tokens = ['Understood.'];
+      for (const token of tokens) {
+        options?.onEvent?.({ type: 'text_delta', text: token });
+      }
+      return {
+        content: [{ type: 'text', text: tokens.join('') }],
+        model: 'claude-sonnet-4-20250514',
+        usage: { inputTokens: 100, outputTokens: 50 },
+        stopReason: 'end_turn',
+      };
     });
     const { orchestrator } = setupOrchestrator();
@@ -928,19 +1224,273 @@ describe('call-orchestrator', () => {
   });
   test('assistant identity rule appears before disclosure rule in prompt', async () => {
-    mockStreamFn.mockImplementation((...args: unknown[]) => {
-      const firstArg = args[0] as { system: string };
-      const prompt = firstArg.system;
+    mockSendMessage.mockImplementation(async (_messages: unknown[], _tools: unknown[], systemPrompt: unknown, options?: { onEvent?: (event: { type: string; text?: string }) => void }) => {
+      const prompt = systemPrompt as string;
       const identityIdx = prompt.indexOf('refer to yourself as an assistant');
       const disclosureIdx = prompt.indexOf('Be concise');
       expect(identityIdx).toBeGreaterThan(-1);
       expect(disclosureIdx).toBeGreaterThan(-1);
       expect(identityIdx).toBeLessThan(disclosureIdx);
-      return createMockStream(['OK.']);
+      const tokens = ['OK.'];
+      for (const token of tokens) {
+        options?.onEvent?.({ type: 'text_delta', text: token });
+      }
+      return {
+        content: [{ type: 'text', text: tokens.join('') }],
+        model: 'claude-sonnet-4-20250514',
+        usage: { inputTokens: 100, outputTokens: 50 },
+        stopReason: 'end_turn',
+      };
     });
     const { orchestrator } = setupOrchestrator();
     await orchestrator.handleCallerUtterance('Test');
     orchestrator.destroy();
   });
+  test('system prompt uses disclosure text when disclosure is enabled', async () => {
+    mockDisclosure = {
+      enabled: true,
+      text: 'At the very beginning of the call, introduce yourself as an assistant calling on behalf of the person you represent. Do not say "AI assistant".',
+    };
+    mockSendMessage.mockImplementation(async (_messages: unknown[], _tools: unknown[], systemPrompt: unknown, options?: { onEvent?: (event: { type: string; text?: string }) => void }) => {
+      expect(systemPrompt as string).toContain('introduce yourself as an assistant calling on behalf of the person you represent');
+      expect(systemPrompt as string).toContain('Do not say "AI assistant"');
+      const tokens = ['Hello, I am calling on behalf of my human.'];
+      for (const token of tokens) {
+        options?.onEvent?.({ type: 'text_delta', text: token });
+      }
+      return {
+        content: [{ type: 'text', text: tokens.join('') }],
+        model: 'claude-sonnet-4-20250514',
+        usage: { inputTokens: 100, outputTokens: 50 },
+        stopReason: 'end_turn',
+      };
+    });
+    const { orchestrator } = setupOrchestrator();
+    await orchestrator.handleCallerUtterance('Who is this?');
+    orchestrator.destroy();
+  });
+  test('system prompt falls back to "Begin the conversation naturally" when disclosure is disabled', async () => {
+    mockDisclosure = { enabled: false, text: '' };
+    mockSendMessage.mockImplementation(async (_messages: unknown[], _tools: unknown[], systemPrompt: unknown, options?: { onEvent?: (event: { type: string; text?: string }) => void }) => {
+      expect(systemPrompt as string).toContain('Begin the conversation naturally');
+      expect(systemPrompt as string).not.toContain('introduce yourself as an assistant calling on behalf of the person');
+      const tokens = ['Hello there.'];
+      for (const token of tokens) {
+        options?.onEvent?.({ type: 'text_delta', text: token });
+      }
+      return {
+        content: [{ type: 'text', text: tokens.join('') }],
+        model: 'claude-sonnet-4-20250514',
+        usage: { inputTokens: 100, outputTokens: 50 },
+        stopReason: 'end_turn',
+      };
+    });
+    const { orchestrator } = setupOrchestrator();
+    await orchestrator.handleCallerUtterance('Hi');
+    orchestrator.destroy();
+  });
+  test('system prompt does not use "AI assistant" as a self-identity label', async () => {
+    mockSendMessage.mockImplementation(async (_messages: unknown[], _tools: unknown[], systemPrompt: unknown, options?: { onEvent?: (event: { type: string; text?: string }) => void }) => {
+      expect(systemPrompt as string).not.toMatch(/(?:you are|call yourself|introduce yourself as).*AI assistant/i);
+      const tokens = ['Got it.'];
+      for (const token of tokens) {
+        options?.onEvent?.({ type: 'text_delta', text: token });
+      }
+      return {
+        content: [{ type: 'text', text: tokens.join('') }],
+        model: 'claude-sonnet-4-20250514',
+        usage: { inputTokens: 100, outputTokens: 50 },
+        stopReason: 'end_turn',
+      };
+    });
+    const { orchestrator } = setupOrchestrator();
+    await orchestrator.handleCallerUtterance('Hello');
+    orchestrator.destroy();
+  });
+  // ── Inbound call orchestration ──────────────────────────────────────
+  test('inbound call (no task) uses receptionist-style system prompt', async () => {
+    mockSendMessage.mockImplementation(async (_messages: unknown[], _tools: unknown[], systemPrompt: unknown, options?: { onEvent?: (event: { type: string; text?: string }) => void }) => {
+      // Should contain inbound-specific language
+      expect(systemPrompt as string).toContain('answering an incoming call');
+      expect(systemPrompt as string).toContain('find out what they need');
+      // Should NOT contain outbound-specific language
+      expect(systemPrompt as string).not.toContain('state why you are calling');
+      expect(systemPrompt as string).not.toContain('Task:');
+      const tokens = ['Hello, how can I help you today?'];
+      for (const token of tokens) {
+        options?.onEvent?.({ type: 'text_delta', text: token });
+      }
+      return {
+        content: [{ type: 'text', text: tokens.join('') }],
+        model: 'claude-sonnet-4-20250514',
+        usage: { inputTokens: 100, outputTokens: 50 },
+        stopReason: 'end_turn',
+      };
+    });
+    // setupOrchestrator with no task creates an inbound-style session
+    const { orchestrator } = setupOrchestrator(undefined);
+    await orchestrator.handleCallerUtterance('Hi there');
+    orchestrator.destroy();
+  });
+  test('outbound call (with task) uses task-driven system prompt', async () => {
+    mockSendMessage.mockImplementation(async (_messages: unknown[], _tools: unknown[], systemPrompt: unknown, options?: { onEvent?: (event: { type: string; text?: string }) => void }) => {
+      expect(systemPrompt as string).toContain('Task: Confirm Friday appointment');
+      expect(systemPrompt as string).toContain('state why you are calling');
+      expect(systemPrompt as string).not.toContain('answering an incoming call');
+      const tokens = ['Hi, I am calling about your appointment.'];
+      for (const token of tokens) {
+        options?.onEvent?.({ type: 'text_delta', text: token });
+      }
+      return {
+        content: [{ type: 'text', text: tokens.join('') }],
+        model: 'claude-sonnet-4-20250514',
+        usage: { inputTokens: 100, outputTokens: 50 },
+        stopReason: 'end_turn',
+      };
+    });
+    const { orchestrator } = setupOrchestrator('Confirm Friday appointment');
+    await orchestrator.handleCallerUtterance('Hello?');
+    orchestrator.destroy();
+  });
+  test('inbound call initial greeting sends receptionist opener', async () => {
+    mockSendMessage.mockImplementation(async (messages: unknown[], _tools: unknown[], systemPrompt: unknown, options?: { onEvent?: (event: { type: string; text?: string }) => void }) => {
+      // The system prompt should use inbound framing
+      expect(systemPrompt as string).toContain('answering an incoming call');
+      // The opening marker should be present
+      const msgs = messages as Array<{ role: string; content: Array<{ type: string; text: string }> }>;
+      const userMsgs = msgs.filter((m) => m.role === 'user');
+      expect(userMsgs.some((m) => m.content?.[0]?.text?.includes('[CALL_OPENING]'))).toBe(true);
+      const tokens = ['Hello, this is my human\'s assistant. How can I help you?'];
+      for (const token of tokens) {
+        options?.onEvent?.({ type: 'text_delta', text: token });
+      }
+      return {
+        content: [{ type: 'text', text: tokens.join('') }],
+        model: 'claude-sonnet-4-20250514',
+        usage: { inputTokens: 100, outputTokens: 50 },
+        stopReason: 'end_turn',
+      };
+    });
+    const { relay, orchestrator } = setupOrchestrator(undefined);
+    await orchestrator.startInitialGreeting();
+    const allText = relay.sentTokens.map((t) => t.token).join('');
+    expect(allText).toContain('How can I help you');
+    orchestrator.destroy();
+  });
+  test('inbound call multi-turn conversation uses inbound prompt consistently', async () => {
+    let turnNumber = 0;
+    mockSendMessage.mockImplementation(async (_messages: unknown[], _tools: unknown[], systemPrompt: unknown, options?: { onEvent?: (event: { type: string; text?: string }) => void }) => {
+      turnNumber++;
+      // Every turn should use the inbound system prompt
+      expect(systemPrompt as string).toContain('answering an incoming call');
+      expect(systemPrompt as string).not.toContain('Task:');
+      let tokens: string[];
+      if (turnNumber === 1) tokens = ['Hello, how can I help you?'];
+      else if (turnNumber === 2) tokens = ['Sure, let me help with scheduling.'];
+      else tokens = ['Your meeting is set for 3pm.'];
+      for (const token of tokens) {
+        options?.onEvent?.({ type: 'text_delta', text: token });
+      }
+      return {
+        content: [{ type: 'text', text: tokens.join('') }],
+        model: 'claude-sonnet-4-20250514',
+        usage: { inputTokens: 100, outputTokens: 50 },
+        stopReason: 'end_turn',
+      };
+    });
+    const { orchestrator } = setupOrchestrator(undefined);
+    await orchestrator.startInitialGreeting();
+    await orchestrator.handleCallerUtterance('I need to schedule a meeting');
+    await orchestrator.handleCallerUtterance('How about 3pm?');
+    expect(turnNumber).toBe(3);
+    orchestrator.destroy();
+  });
+  test('inbound call system prompt includes greet-the-caller guidance for CALL_OPENING', async () => {
+    mockSendMessage.mockImplementation(async (_messages: unknown[], _tools: unknown[], systemPrompt: unknown, options?: { onEvent?: (event: { type: string; text?: string }) => void }) => {
+      // Should tell the model to greet warmly and ask how to help
+      expect(systemPrompt as string).toContain('greet the caller warmly');
+      expect(systemPrompt as string).toContain('how you can help');
+      const tokens = ['Hello!'];
+      for (const token of tokens) {
+        options?.onEvent?.({ type: 'text_delta', text: token });
+      }
+      return {
+        content: [{ type: 'text', text: tokens.join('') }],
+        model: 'claude-sonnet-4-20250514',
+        usage: { inputTokens: 100, outputTokens: 50 },
+        stopReason: 'end_turn',
+      };
+    });
+    const { orchestrator } = setupOrchestrator(undefined);
+    await orchestrator.handleCallerUtterance('Hi');
+    orchestrator.destroy();
+  });
+  test('inbound call system prompt respects disclosure setting', async () => {
+    mockDisclosure = {
+      enabled: true,
+      text: 'Disclose that you are an AI at the start.',
+    };
+    mockSendMessage.mockImplementation(async (_messages: unknown[], _tools: unknown[], systemPrompt: unknown, options?: { onEvent?: (event: { type: string; text?: string }) => void }) => {
+      expect(systemPrompt as string).toContain('answering an incoming call');
+      expect(systemPrompt as string).toContain('Disclose that you are an AI at the start.');
+      const tokens = ['Hello, I am an AI assistant.'];
+      for (const token of tokens) {
+        options?.onEvent?.({ type: 'text_delta', text: token });
+      }
+      return {
+        content: [{ type: 'text', text: tokens.join('') }],
+        model: 'claude-sonnet-4-20250514',
+        usage: { inputTokens: 100, outputTokens: 50 },
+        stopReason: 'end_turn',
+      };
+    });
+    const { orchestrator } = setupOrchestrator(undefined);
+    await orchestrator.handleCallerUtterance('Who is this?');
+    orchestrator.destroy();
+  });
+  test('inbound call persists assistant response to voice conversation', async () => {
+    mockSendMessage.mockImplementation(createMockProviderResponse(['I can definitely help you with that.']));
+    const { session, orchestrator } = setupOrchestrator(undefined);
+    await orchestrator.startInitialGreeting();
+    // Verify assistant transcript was persisted
+    const messages = (await import('../memory/conversation-store.js')).getMessages('conv-orch-test');
+    const assistantMsgs = messages.filter((m) => m.role === 'assistant');
+    expect(assistantMsgs.length).toBeGreaterThan(0);
+    const lastAssistant = assistantMsgs[assistantMsgs.length - 1];
+    expect(lastAssistant.content).toContain('I can definitely help you with that');
+    // Verify event was recorded
+    const events = getCallEvents(session.id).filter((e) => e.eventType === 'assistant_spoke');
+    expect(events.length).toBeGreaterThan(0);
+    orchestrator.destroy();
+  });
 });