npm - @vellumai/assistant - Versions diffs - 0.8.4 → 0.8.5 - Mend

@vellumai/assistant 0.8.4 → 0.8.5

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (438) hide show

package/ARCHITECTURE.md +2 -2
package/docs/browser-use-architecture-phase2.md +1 -1
package/knip.json +2 -1
package/openapi.yaml +809 -11
package/package.json +1 -1
package/src/__tests__/anthropic-provider.test.ts +34 -37
package/src/__tests__/assistant-event-hub-self-exclusion.test.ts +293 -0
package/src/__tests__/assistant-feature-flags-integration.test.ts +3 -3
package/src/__tests__/audit-log-rotation.test.ts +70 -16
package/src/__tests__/background-workers-disk-pressure.test.ts +3 -3
package/src/__tests__/btw-routes.test.ts +2 -3
package/src/__tests__/call-controller.test.ts +0 -1
package/src/__tests__/cancel-resolves-conversation-key.test.ts +1 -1
package/src/__tests__/channel-guardian.test.ts +3 -3
package/src/__tests__/checker.test.ts +6 -15
package/src/__tests__/compaction-events.test.ts +1 -0
package/src/__tests__/compactor-call-site-logging.test.ts +214 -0
package/src/__tests__/computer-use-skill-manifest-regression.test.ts +5 -11
package/src/__tests__/computer-use-tools.test.ts +2 -4
package/src/__tests__/confirmation-request-guardian-bridge.test.ts +0 -1
package/src/__tests__/conversation-agent-loop-disk-pressure.test.ts +1 -1
package/src/__tests__/conversation-agent-loop-inference-profile.test.ts +1 -1
package/src/__tests__/conversation-agent-loop-overflow.test.ts +197 -2
package/src/__tests__/conversation-agent-loop.test.ts +163 -122
package/src/__tests__/conversation-app-control-instantiation.test.ts +2 -5
package/src/__tests__/conversation-clear-safety.test.ts +25 -25
package/src/__tests__/conversation-delete-schedule-cleanup.test.ts +1 -1
package/src/__tests__/conversation-disk-view-integration.test.ts +2 -2
package/src/__tests__/conversation-error.test.ts +31 -0
package/src/__tests__/conversation-fork-crud.test.ts +178 -15
package/src/__tests__/conversation-lifecycle.test.ts +52 -11
package/src/__tests__/{conversation-load-cleaned-at.test.ts → conversation-load-history-stripped.test.ts} +13 -13
package/src/__tests__/conversation-provider-retry-repair.test.ts +1 -0
package/src/__tests__/conversation-routes-disk-view.test.ts +109 -0
package/src/__tests__/conversation-routes-slash-commands.test.ts +35 -0
package/src/__tests__/conversation-skill-tools.test.ts +2 -5
package/src/__tests__/conversation-store.test.ts +1 -1
package/src/__tests__/conversation-sync-tags.test.ts +99 -32
package/src/__tests__/conversation-workspace-cache-state.test.ts +1 -0
package/src/__tests__/conversation-workspace-injection.test.ts +1 -1
package/src/__tests__/conversation-workspace-tool-tracking.test.ts +1 -1
package/src/__tests__/credential-execution-feature-gates.test.ts +9 -7
package/src/__tests__/credential-execution-tools.test.ts +6 -6
package/src/__tests__/credential-security-invariants.test.ts +1 -0
package/src/__tests__/credential-vault-unit.test.ts +2 -2
package/src/__tests__/dynamic-page-surface.test.ts +2 -2
package/src/__tests__/email-html-renderer.test.ts +12 -0
package/src/__tests__/gateway-flag-listener.test.ts +237 -0
package/src/__tests__/gemini-provider.test.ts +78 -0
package/src/__tests__/guardian-dispatch.test.ts +0 -1
package/src/__tests__/guardian-outbound-http.test.ts +7 -5
package/src/__tests__/handlers-user-message-approval-consumption.test.ts +1 -1
package/src/__tests__/heartbeat-disk-pressure.test.ts +4 -0
package/src/__tests__/heartbeat-service.test.ts +4 -0
package/src/__tests__/host-shell-tool.test.ts +1 -1
package/src/__tests__/init-feature-flag-overrides.test.ts +5 -6
package/src/__tests__/list-messages-tool-merge.test.ts +70 -11
package/src/__tests__/llm-request-log-call-site.test.ts +136 -0
package/src/__tests__/llm-request-log-source-clickhouse.test.ts +26 -0
package/src/__tests__/llm-resolver.test.ts +77 -9
package/src/__tests__/llm-usage-store.test.ts +66 -0
package/src/__tests__/logger.test.ts +89 -0
package/src/__tests__/mcp-abort-signal.test.ts +2 -2
package/src/__tests__/media-generate-image.test.ts +31 -0
package/src/__tests__/memory-v2-static-injector.test.ts +7 -7
package/src/__tests__/model-intents.test.ts +2 -4
package/src/__tests__/notification-guardian-path.test.ts +0 -1
package/src/__tests__/onboarding-template-contract.test.ts +1 -1
package/src/__tests__/openai-provider.test.ts +46 -0
package/src/__tests__/openai-responses-provider.test.ts +114 -12
package/src/__tests__/pending-interactions-resolved-event.test.ts +0 -1
package/src/__tests__/platform-bash-auto-approve.test.ts +2 -2
package/src/__tests__/platform.test.ts +2 -2
package/src/__tests__/plugin-api-tool-definition.test.ts +92 -0
package/src/__tests__/plugin-bootstrap.test.ts +2 -2
package/src/__tests__/plugin-tool-contribution.test.ts +13 -6
package/src/__tests__/plugin-types.test.ts +3 -2
package/src/__tests__/prechat-onboarding-contract.test.ts +131 -98
package/src/__tests__/pricing.test.ts +12 -0
package/src/__tests__/prune-jobs-changes-parser.test.ts +61 -0
package/src/__tests__/registry.test.ts +2 -8
package/src/__tests__/require-fresh-approval.test.ts +2 -2
package/src/__tests__/runtime-events-sse-bilingual.test.ts +154 -0
package/src/__tests__/shell-tool-proxy-mode.test.ts +1 -1
package/src/__tests__/skill-feature-flags.test.ts +2 -2
package/src/__tests__/skill-projection-feature-flag.test.ts +4 -7
package/src/__tests__/skill-projection.benchmark.test.ts +2 -6
package/src/__tests__/skill-tool-factory.test.ts +1 -1
package/src/__tests__/subagent-notify-parent.test.ts +1 -1
package/src/__tests__/suggestion-routes.test.ts +1 -0
package/src/__tests__/sync-message-contract.test.ts +59 -0
package/src/__tests__/system-prompt.test.ts +145 -131
package/src/__tests__/terminal-tools.test.ts +1 -1
package/src/__tests__/tool-approval-handler.test.ts +1 -5
package/src/__tests__/tool-execute-pipeline.test.ts +2 -2
package/src/__tests__/tool-execution-pipeline.benchmark.test.ts +2 -5
package/src/__tests__/tool-executor-lifecycle-events.test.ts +15 -5
package/src/__tests__/tool-executor.test.ts +9 -62
package/src/__tests__/tool-grant-request-escalation.test.ts +1 -6
package/src/__tests__/trusted-contact-approval-notifier.test.ts +0 -1
package/src/__tests__/trusted-contact-inline-approval-integration.test.ts +1 -6
package/src/__tests__/trusted-contact-multichannel.test.ts +0 -1
package/src/__tests__/ui-file-upload-surface.test.ts +2 -2
package/src/__tests__/usage-routes.test.ts +3 -0
package/src/__tests__/verification-control-plane-policy.test.ts +2 -2
package/src/__tests__/workspace-git-service.test.ts +6 -5
package/src/__tests__/workspace-migration-089-move-memory-tree-out-of-v3.test.ts +86 -0
package/src/acp/__tests__/prepare-agent-env.test.ts +146 -0
package/src/acp/prepare-agent-env.ts +78 -0
package/src/acp/session-manager.ts +1 -1
package/src/agent/loop.ts +8 -0
package/src/api/README.md +5 -0
package/src/api/index.ts +4 -0
package/src/api/package.json +10 -0
package/src/background-wake/background-wake-routes.test.ts +233 -0
package/src/background-wake/runtime-registry.ts +24 -0
package/src/cli/commands/__tests__/browser.test.ts +23 -5
package/src/cli/commands/__tests__/domain-register.test.ts +110 -0
package/src/cli/commands/__tests__/domain-status.test.ts +33 -33
package/src/cli/commands/__tests__/inference-send.test.ts +108 -5
package/src/cli/commands/__tests__/memory-v2-compare-render.test.ts +98 -0
package/src/cli/commands/__tests__/memory-v2.test.ts +1 -0
package/src/cli/commands/__tests__/memory-v3-render.test.ts +340 -0
package/src/cli/commands/browser.ts +247 -0
package/src/cli/commands/domain.ts +91 -41
package/src/cli/commands/inference.ts +93 -40
package/src/cli/commands/memory-v2-compare-render.ts +115 -0
package/src/cli/commands/memory-v2.ts +176 -1
package/src/cli/commands/memory-v3-render.ts +344 -0
package/src/cli/commands/memory-v3.ts +316 -0
package/src/cli/program.ts +2 -0
package/src/config/assistant-feature-flags.ts +21 -9
package/src/config/bundled-skills/document-editor/SKILL.md +11 -2
package/src/config/bundled-skills/document-editor/TOOLS.json +18 -0
package/src/config/bundled-skills/document-editor/tools/document-open.ts +12 -0
package/src/config/bundled-skills/image-studio/SKILL.md +4 -0
package/src/config/bundled-skills/image-studio/tools/media-generate-image.ts +2 -2
package/src/config/bundled-skills/media-processing/tools/ingest-media.ts +13 -8
package/src/config/bundled-skills/messaging/tools/messaging-analyze-style.ts +10 -3
package/src/config/bundled-skills/phone-calls/references/TRANSCRIPTS.md +16 -14
package/src/config/bundled-skills/playbooks/tools/playbook-create.ts +7 -2
package/src/config/bundled-skills/playbooks/tools/playbook-update.ts +7 -2
package/src/config/bundled-tool-registry.ts +2 -0
package/src/config/call-site-defaults.ts +7 -6
package/src/config/feature-flag-registry.json +16 -0
package/src/config/schemas/__tests__/memory-v2.test.ts +213 -1
package/src/config/schemas/call-site-catalog.ts +21 -7
package/src/config/schemas/llm.ts +12 -1
package/src/config/schemas/memory-v2.ts +246 -0
package/src/config/schemas/memory.ts +2 -1
package/src/context/compactor.ts +52 -0
package/src/conversations/__tests__/message-consolidation.test.ts +350 -0
package/src/conversations/message-consolidation.ts +404 -0
package/src/daemon/__tests__/conversation-tool-setup-exclude.test.ts +1 -1
package/src/daemon/__tests__/meet-manifest-loader.test.ts +1 -1
package/src/daemon/conversation-agent-loop-handlers.ts +2 -13
package/src/daemon/conversation-agent-loop.ts +126 -76
package/src/daemon/conversation-error.ts +31 -1
package/src/daemon/conversation-lifecycle.ts +27 -22
package/src/daemon/conversation-runtime-assembly.ts +10 -9
package/src/daemon/conversation-tool-setup.ts +63 -3
package/src/daemon/conversation-usage.ts +2 -0
package/src/daemon/conversation.ts +14 -29
package/src/daemon/disk-pressure-guard.ts +14 -2
package/src/daemon/handlers/config-model.test.ts +1 -0
package/src/daemon/handlers/conversations.ts +11 -3
package/src/daemon/host-browser-proxy.ts +5 -5
package/src/daemon/host-cu-proxy.ts +4 -4
package/src/daemon/host-file-proxy.ts +4 -4
package/src/daemon/host-proxy-base.ts +4 -4
package/src/daemon/host-transfer-proxy.ts +10 -10
package/src/daemon/lifecycle.ts +23 -20
package/src/daemon/meet-manifest-loader.ts +1 -7
package/src/daemon/message-types/conversations.ts +6 -9
package/src/daemon/message-types/home.ts +1 -13
package/src/daemon/message-types/messages.ts +6 -14
package/src/daemon/message-types/sync.ts +14 -0
package/src/daemon/shutdown-handlers.ts +24 -5
package/src/daemon/switch-inference-profile-tool.ts +52 -0
package/src/daemon/tool-setup-types.ts +13 -0
package/src/events/relationship-state-updated.ts +25 -0
package/src/heartbeat/__tests__/heartbeat-service.test.ts +1 -1
package/src/home/home-greeting.ts +0 -9
package/src/home/suggested-prompts.ts +0 -9
package/src/ipc/gateway-flag-listener.ts +123 -0
package/src/ipc/skill-routes/registries.ts +8 -12
package/src/memory/__tests__/db-async-query.test.ts +165 -0
package/src/memory/__tests__/db-maintenance.test.ts +115 -0
package/src/memory/__tests__/jobs-store-enqueue-gate.test.ts +241 -0
package/src/memory/__tests__/jobs-store-job-classes.test.ts +28 -1
package/src/memory/__tests__/memory-retrospective-job.test.ts +7 -0
package/src/memory/auto-analysis-enqueue.ts +5 -1
package/src/memory/conversation-crud.ts +71 -70
package/src/memory/conversation-starters-cadence.ts +3 -1
package/src/memory/conversation-title-service.ts +19 -3
package/src/memory/db-async-query.ts +214 -0
package/src/memory/db-init.ts +10 -0
package/src/memory/db-maintenance.ts +30 -21
package/src/memory/graph/bootstrap.ts +8 -1
package/src/memory/graph/capability-seed.ts +7 -3
package/src/memory/graph/conversation-graph-memory.ts +100 -17
package/src/memory/graph/extraction.ts +1 -5
package/src/memory/graph/graph-search.ts +7 -1
package/src/memory/indexer.ts +28 -18
package/src/memory/job-handlers/cleanup.ts +76 -18
package/src/memory/job-handlers/conversation-starters.ts +1 -4
package/src/memory/jobs/embed-pkb-file.ts +6 -1
package/src/memory/jobs-store.ts +14 -0
package/src/memory/jobs-worker.ts +55 -22
package/src/memory/llm-request-log-source-clickhouse.ts +42 -2
package/src/memory/llm-request-log-source-local.ts +7 -0
package/src/memory/llm-request-log-source.ts +9 -2
package/src/memory/llm-request-log-store.ts +43 -1
package/src/memory/llm-usage-store.ts +24 -0
package/src/memory/memory-retrospective-enqueue.ts +8 -1
package/src/memory/memory-retrospective-job.ts +5 -0
package/src/memory/memory-v2-activation-log-store.ts +15 -6
package/src/memory/migrations/260-rename-cleaned-at.ts +44 -0
package/src/memory/migrations/261-llm-usage-add-raw-usage.ts +36 -0
package/src/memory/migrations/262-memory-v3-coactivation.ts +57 -0
package/src/memory/migrations/263-memory-v3-auto-edges.ts +50 -0
package/src/memory/migrations/264-llm-request-log-call-site.ts +29 -0
package/src/memory/migrations/index.ts +17 -0
package/src/memory/migrations/registry.ts +33 -0
package/src/memory/schema/conversations.ts +1 -1
package/src/memory/schema/infrastructure.ts +21 -0
package/src/memory/tool-usage-store.ts +36 -8
package/src/memory/v2/__tests__/consolidation-job.test.ts +1 -0
package/src/memory/v2/__tests__/harness-compare.test.ts +186 -0
package/src/memory/v2/__tests__/harness-metrics.test.ts +74 -0
package/src/memory/v2/__tests__/harness-oracle.test.ts +257 -0
package/src/memory/v2/__tests__/harness-replay-input.test.ts +225 -0
package/src/memory/v2/__tests__/harness-runner.test.ts +109 -0
package/src/memory/v2/__tests__/injection.test.ts +127 -98
package/src/memory/v2/__tests__/qdrant.test.ts +36 -0
package/src/memory/v2/__tests__/router.test.ts +171 -3
package/src/memory/v2/harness/compare.ts +57 -0
package/src/memory/v2/harness/metrics.ts +124 -0
package/src/memory/v2/harness/oracle.ts +145 -0
package/src/memory/v2/harness/replay-input.ts +224 -0
package/src/memory/v2/harness/retriever.ts +74 -0
package/src/memory/v2/harness/router-retriever.ts +43 -0
package/src/memory/v2/harness/runner.ts +106 -0
package/src/memory/v2/harness/trace.ts +58 -0
package/src/memory/v2/injection.ts +21 -15
package/src/memory/v2/prompts/router.ts +26 -1
package/src/memory/v2/qdrant.ts +14 -2
package/src/memory/v2/router.ts +171 -18
package/src/memory/v3/__tests__/coactivation-store.test.ts +422 -0
package/src/memory/v3/__tests__/consolidation-job.test.ts +468 -0
package/src/memory/v3/__tests__/edge-learning-job.test.ts +324 -0
package/src/memory/v3/__tests__/edges.test.ts +563 -0
package/src/memory/v3/__tests__/filter.test.ts +512 -0
package/src/memory/v3/__tests__/gate.test.ts +574 -0
package/src/memory/v3/__tests__/index-composition.test.ts +233 -0
package/src/memory/v3/__tests__/loop.test.ts +530 -0
package/src/memory/v3/__tests__/retriever.test.ts +226 -0
package/src/memory/v3/__tests__/scouts.test.ts +440 -0
package/src/memory/v3/__tests__/shadow-middleware.test.ts +312 -0
package/src/memory/v3/__tests__/system-prompts.test.ts +154 -0
package/src/memory/v3/__tests__/traversal.test.ts +469 -0
package/src/memory/v3/__tests__/tree-index.test.ts +280 -0
package/src/memory/v3/__tests__/tree-store.test.ts +529 -0
package/src/memory/v3/__tests__/tree-walk.test.ts +707 -0
package/src/memory/v3/__tests__/validate.test.ts +245 -0
package/src/memory/v3/auto-edges.ts +223 -0
package/src/memory/v3/coactivation-store.ts +124 -0
package/src/memory/v3/consolidation-job.ts +323 -0
package/src/memory/v3/edge-learning-job.ts +160 -0
package/src/memory/v3/edges.ts +249 -0
package/src/memory/v3/filter.ts +281 -0
package/src/memory/v3/gate.ts +334 -0
package/src/memory/v3/index-composition.ts +113 -0
package/src/memory/v3/llm-capture.ts +46 -0
package/src/memory/v3/loop.ts +382 -0
package/src/memory/v3/maintenance.ts +144 -0
package/src/memory/v3/prompt-context.ts +33 -0
package/src/memory/v3/prompts/consolidation.ts +458 -0
package/src/memory/v3/prompts/system-prompts.ts +196 -0
package/src/memory/v3/retriever.ts +33 -0
package/src/memory/v3/scouts.ts +420 -0
package/src/memory/v3/shadow-middleware.ts +305 -0
package/src/memory/v3/traversal.ts +206 -0
package/src/memory/v3/tree-index.ts +237 -0
package/src/memory/v3/tree-store.ts +394 -0
package/src/memory/v3/tree-walk.ts +351 -0
package/src/memory/v3/types.ts +65 -0
package/src/memory/v3/validate.ts +300 -0
package/src/notifications/adapters/macos.ts +18 -1
package/src/notifications/adapters/platform.ts +1 -1
package/src/notifications/decision-engine.ts +1 -4
package/src/notifications/emit-signal.ts +29 -49
package/src/permissions/prompter.ts +3 -3
package/src/permissions/question-prompter.ts +5 -2
package/src/permissions/secret-prompter.ts +2 -2
package/src/plugin-api/index.ts +4 -0
package/src/plugin-api/types.ts +7 -33
package/src/plugins/defaults/index.ts +6 -0
package/src/plugins/defaults/injectors.ts +18 -11
package/src/plugins/external-plugin-loader.ts +5 -68
package/src/plugins/types.ts +11 -16
package/src/proactive-artifact/aux-message-injector.ts +17 -4
package/src/prompts/__tests__/task-progress-hint-section.test.ts +3 -9
package/src/prompts/persona-resolver.ts +36 -21
package/src/prompts/sections.ts +39 -7
package/src/prompts/system-prompt.ts +50 -185
package/src/prompts/templates/BOOTSTRAP.md +2 -2
package/src/prompts/templates/system-sections.ts +230 -8
package/src/providers/__tests__/connection-model-compat.test.ts +234 -0
package/src/providers/__tests__/retry-callsite.test.ts +85 -5
package/src/providers/anthropic/client.ts +32 -66
package/src/providers/call-site-routing.ts +14 -2
package/src/providers/connection-model-compat.ts +38 -0
package/src/providers/connection-resolution.ts +16 -2
package/src/providers/gemini/client.ts +49 -6
package/src/providers/inference/adapter-factory.ts +3 -0
package/src/providers/minimax/client.ts +106 -0
package/src/providers/model-catalog.ts +43 -0
package/src/providers/model-intents.ts +1 -1
package/src/providers/openai/chat-completions-provider.ts +6 -3
package/src/providers/openai/codex-models.ts +18 -0
package/src/providers/openai/responses-provider.ts +78 -21
package/src/providers/provider-send-message.ts +7 -1
package/src/providers/retry.ts +34 -3
package/src/providers/thinking-config.ts +26 -1
package/src/providers/usage-tracking.ts +2 -0
package/src/runtime/AGENTS.md +2 -2
package/src/runtime/agent-wake.ts +1 -0
package/src/runtime/assistant-event-hub.ts +76 -6
package/src/runtime/auth/route-policy.ts +36 -0
package/src/runtime/btw-sidechain.ts +0 -6
package/src/runtime/http-types.ts +0 -2
package/src/runtime/migrations/vbundle-builder.ts +10 -3
package/src/runtime/pending-interactions.ts +0 -1
package/src/runtime/routes/__tests__/conversation-query-routes.test.ts +106 -0
package/src/runtime/routes/__tests__/memory-v2-simulate-route.test.ts +25 -6
package/src/runtime/routes/__tests__/plugins-routes.test.ts +512 -0
package/src/runtime/routes/acp-routes.test.ts +255 -6
package/src/runtime/routes/acp-routes.ts +8 -1
package/src/runtime/routes/avatar-routes.ts +10 -10
package/src/runtime/routes/background-wake-routes.ts +188 -0
package/src/runtime/routes/browser-tabs-routes.ts +200 -0
package/src/runtime/routes/btw-routes.ts +0 -6
package/src/runtime/routes/conversation-cli-routes.ts +1 -1
package/src/runtime/routes/conversation-list-routes.ts +12 -4
package/src/runtime/routes/conversation-management-routes.ts +77 -20
package/src/runtime/routes/conversation-query-routes.ts +142 -36
package/src/runtime/routes/conversation-routes.ts +252 -410
package/src/runtime/routes/conversation-starter-routes.ts +6 -3
package/src/runtime/routes/disk-pressure-routes.ts +1 -1
package/src/runtime/routes/domain-routes.ts +60 -10
package/src/runtime/routes/email-routes.ts +5 -2
package/src/runtime/routes/events-routes.ts +54 -10
package/src/runtime/routes/group-routes.ts +24 -8
package/src/runtime/routes/host-browser-routes.ts +10 -2
package/src/runtime/routes/host-cu-routes.ts +2 -2
package/src/runtime/routes/inbound-stages/acl-enforcement.ts +96 -3
package/src/runtime/routes/index.ts +8 -0
package/src/runtime/routes/inference-profile-session-handler.ts +22 -12
package/src/runtime/routes/inference-profile-session-routes.ts +7 -1
package/src/runtime/routes/llm-call-sites-routes.ts +32 -5
package/src/runtime/routes/memory-item-routes.ts +8 -3
package/src/runtime/routes/memory-v2-routes.ts +215 -5
package/src/runtime/routes/memory-v3-routes.ts +316 -0
package/src/runtime/routes/migration-routes.ts +21 -24
package/src/runtime/routes/plugins-routes.ts +337 -0
package/src/runtime/routes/rename-conversation-routes.ts +6 -2
package/src/runtime/routes/secret-routes.ts +25 -5
package/src/runtime/routes/settings-routes.ts +12 -11
package/src/runtime/routes/slack-channel-routes.ts +5 -4
package/src/runtime/routes/workspace-routes.ts +25 -10
package/src/runtime/sync/resource-sync-events.ts +106 -38
package/src/runtime/sync/sync-publisher.test.ts +49 -0
package/src/runtime/sync/sync-publisher.ts +2 -1
package/src/runtime/verification-outbound-actions.ts +73 -1
package/src/telemetry/types.ts +12 -0
package/src/telemetry/usage-telemetry-reporter.test.ts +48 -0
package/src/telemetry/usage-telemetry-reporter.ts +1 -0
package/src/tools/acp/spawn.test.ts +119 -0
package/src/tools/acp/spawn.ts +15 -2
package/src/tools/apps/definitions.ts +2 -8
package/src/tools/ask-question/ask-question-tool.test.ts +3 -3
package/src/tools/ask-question/ask-question-tool.ts +38 -45
package/src/tools/browser/__tests__/pinned-tabs.test.ts +70 -0
package/src/tools/browser/browser-execution.ts +16 -3
package/src/tools/browser/cdp-client/__tests__/browser-tabs-factory.test.ts +402 -0
package/src/tools/browser/cdp-client/__tests__/types.test.ts +3 -0
package/src/tools/browser/cdp-client/cdp-inspect-client.ts +12 -0
package/src/tools/browser/cdp-client/extension-cdp-client.ts +27 -1
package/src/tools/browser/cdp-client/factory.ts +100 -17
package/src/tools/browser/cdp-client/local-cdp-client.ts +12 -0
package/src/tools/browser/cdp-client/types.ts +65 -0
package/src/tools/browser/pinned-tabs.ts +96 -40
package/src/tools/computer-use/definitions.ts +22 -78
package/src/tools/credential-execution/make-authenticated-request.ts +3 -9
package/src/tools/credential-execution/manage-secure-command-tool.ts +3 -9
package/src/tools/credential-execution/run-authenticated-command.ts +3 -9
package/src/tools/credentials/vault.ts +3 -9
package/src/tools/document/document-tool.ts +59 -0
package/src/tools/execution-target.ts +21 -23
package/src/tools/executor.ts +6 -1
package/src/tools/filesystem/edit.ts +3 -9
package/src/tools/filesystem/list.ts +3 -9
package/src/tools/filesystem/read.ts +3 -9
package/src/tools/filesystem/write.ts +3 -9
package/src/tools/host-filesystem/edit.ts +3 -9
package/src/tools/host-filesystem/read.ts +3 -9
package/src/tools/host-filesystem/transfer.ts +3 -9
package/src/tools/host-filesystem/write.ts +3 -9
package/src/tools/host-terminal/host-shell.ts +3 -9
package/src/tools/mcp/mcp-tool-factory.ts +1 -8
package/src/tools/memory/register.test.ts +1 -1
package/src/tools/memory/register.ts +4 -9
package/src/tools/network/web-fetch.ts +3 -9
package/src/tools/network/web-search.ts +25 -32
package/src/tools/registry.ts +7 -23
package/src/tools/schema-transforms.ts +1 -1
package/src/tools/skills/execute.ts +3 -9
package/src/tools/skills/load.ts +3 -9
package/src/tools/skills/skill-tool-factory.ts +1 -8
package/src/tools/subagent/notify-parent.ts +3 -9
package/src/tools/system/request-permission.ts +3 -9
package/src/tools/terminal/shell.ts +3 -9
package/src/tools/tool-defaults.ts +94 -0
package/src/tools/types.ts +27 -98
package/src/tools/ui-surface/definitions.ts +6 -22
package/src/usage/pricing.ts +23 -0
package/src/usage/types.ts +12 -0
package/src/util/logger.ts +16 -7
package/src/util/platform.ts +7 -2
package/src/util/sqlite3-runtime.ts +65 -0
package/src/workspace/migrations/086-revert-stale-gemini-mis-rewrites.ts +1 -0
package/src/workspace/migrations/089-move-memory-tree-out-of-v3.ts +86 -0
package/src/workspace/migrations/registry.ts +2 -0
package/src/__tests__/compaction-strip-metadata-clear.test.ts +0 -206
package/src/__tests__/message-complete-display-id.test.ts +0 -175
package/src/daemon/query-complexity-router.ts +0 -75
package/src/prompts/cache-boundary.ts +0 -8

package/src/providers/__tests__/connection-model-compat.test.ts ADDED Viewed

@@ -0,0 +1,234 @@
+/**
+ * Tests for the Codex-subscription model-compatibility gate on auto-resolved
+ * provider connections.
+ *
+ * When a profile uses "Any active OpenAI connection" (no `provider_connection`
+ * pinned), the daemon auto-picks an active OpenAI connection. An
+ * `oauth_subscription` (ChatGPT Codex) connection hard-routes to the Codex
+ * endpoint, which rejects non-Codex models with HTTP 400. The gate skips such
+ * a connection during auto-resolution unless the model is Codex-compatible.
+ *
+ * Two layers are covered:
+ *   1. `isConnectionCompatibleWithModel` — the pure predicate.
+ *   2. `getConfiguredProvider` — the auto-resolution path that uses the
+ *      predicate as an additional `.find()` filter, plus the pinned-connection
+ *      path which bypasses the gate entirely.
+ */
+import { beforeEach, describe, expect, mock, test } from "bun:test";
+import { isConnectionCompatibleWithModel } from "../connection-model-compat.js";
+import type { Auth } from "../inference/auth.js";
+// ---------------------------------------------------------------------------
+// Pure predicate tests — no mocking required.
+// ---------------------------------------------------------------------------
+const apiKeyAuth: Auth = { type: "api_key", credential: "credential/x" };
+const platformAuth: Auth = { type: "platform" };
+const oauthAuth: Auth = {
+  type: "oauth_subscription",
+  credential: "credential/x",
+};
+describe("isConnectionCompatibleWithModel", () => {
+  test("api_key connection is compatible with any model", () => {
+    const conn = { auth: apiKeyAuth };
+    expect(isConnectionCompatibleWithModel(conn, "gpt-5")).toBe(true);
+    expect(isConnectionCompatibleWithModel(conn, "gpt-5.4")).toBe(true);
+  });
+  test("platform connection is compatible with any model", () => {
+    const conn = { auth: platformAuth };
+    expect(isConnectionCompatibleWithModel(conn, "gpt-5.4-nano")).toBe(true);
+  });
+  test("oauth_subscription connection is incompatible with a non-Codex model", () => {
+    const conn = { auth: oauthAuth };
+    expect(isConnectionCompatibleWithModel(conn, "gpt-5")).toBe(false);
+    expect(isConnectionCompatibleWithModel(conn, "gpt-5.5")).toBe(false);
+    expect(isConnectionCompatibleWithModel(conn, "gpt-5.4-nano")).toBe(false);
+  });
+  test("oauth_subscription connection is compatible with a Codex model", () => {
+    const conn = { auth: oauthAuth };
+    expect(isConnectionCompatibleWithModel(conn, "gpt-5.4")).toBe(true);
+    expect(isConnectionCompatibleWithModel(conn, "gpt-5.3-codex")).toBe(true);
+  });
+  test("undefined model applies no gating (compatible)", () => {
+    const conn = { auth: oauthAuth };
+    expect(isConnectionCompatibleWithModel(conn, undefined)).toBe(true);
+  });
+});
+// ---------------------------------------------------------------------------
+// Integration tests through `getConfiguredProvider` — module mocks below must
+// be declared before the import-under-test.
+// ---------------------------------------------------------------------------
+mock.module("../../util/logger.js", () => ({
+  getLogger: () =>
+    new Proxy({} as Record<string, unknown>, { get: () => () => {} }),
+}));
+let mockLlmConfig: Record<string, unknown> = {};
+mock.module("../../config/loader.js", () => ({
+  getConfig: () => ({
+    llm: mockLlmConfig,
+    services: { inference: { mode: "your-own" } },
+  }),
+}));
+const mockDbSentinel = { __mock: "db" };
+mock.module("../../memory/db-connection.js", () => ({
+  getDb: () => mockDbSentinel,
+}));
+type Connection = {
+  name: string;
+  provider: string;
+  status: string;
+  auth: { type: string; credential?: string };
+};
+// Ordered list the mocked `listConnections` returns. `.find()` walks it in
+// order, so insertion order is meaningful for these tests.
+let fakeConnectionList: Connection[] = [];
+const fakeConnectionsByName = new Map<string, Connection>();
+mock.module("../inference/connections.js", () => ({
+  getConnection: (_db: unknown, name: string) =>
+    fakeConnectionsByName.get(name) ?? null,
+  listConnections: (_db: unknown, filter?: { provider?: string }) =>
+    filter?.provider
+      ? fakeConnectionList.filter((c) => c.provider === filter.provider)
+      : fakeConnectionList,
+}));
+// Records the connection name handed to the resolver so tests can assert
+// which connection auto-resolution selected.
+const resolveProviderCalls: Connection[] = [];
+mock.module("../registry.js", () => ({
+  getProvider: (name: string) => {
+    throw new Error(`legacy getProvider should not be called: ${name}`);
+  },
+  initializeProviders: async () => {},
+  listProviders: () => [{ name: "stub" }],
+  resolveProviderFromConnection: async (connection: Connection) => {
+    resolveProviderCalls.push(connection);
+    return { name: connection.provider, tag: connection.name };
+  },
+}));
+import { getConfiguredProvider } from "../provider-send-message.js";
+function registerConnections(connections: Connection[]): void {
+  fakeConnectionList = connections;
+  for (const c of connections) fakeConnectionsByName.set(c.name, c);
+}
+function reset(): void {
+  resolveProviderCalls.length = 0;
+  fakeConnectionList = [];
+  fakeConnectionsByName.clear();
+  mockLlmConfig = {};
+}
+const OPENAI_KEY: Connection = {
+  name: "openai-key",
+  provider: "openai",
+  status: "active",
+  auth: { type: "api_key", credential: "credential/openai" },
+};
+const OPENAI_CODEX: Connection = {
+  name: "openai-codex",
+  provider: "openai",
+  status: "active",
+  auth: {
+    type: "oauth_subscription",
+    credential: "credential/openai-codex/access_token",
+  },
+};
+describe("auto-resolution skips oauth_subscription connections for non-Codex models", () => {
+  beforeEach(reset);
+  test("non-Codex model picks the api_key connection over a (first-listed) oauth_subscription one", async () => {
+    // oauth_subscription listed FIRST — without the gate, insertion order
+    // would have selected it and misrouted gpt-5 to the Codex endpoint.
+    registerConnections([OPENAI_CODEX, OPENAI_KEY]);
+    setOpenAiProfile("gpt-5");
+    const result = await getConfiguredProvider("mainAgent", {
+      overrideProfile: "openai-any",
+    });
+    expect(result).not.toBeNull();
+    expect(resolveProviderCalls.length).toBe(1);
+    expect(resolveProviderCalls[0].name).toBe("openai-key");
+  });
+  test("Codex model can select the oauth_subscription connection", async () => {
+    registerConnections([OPENAI_CODEX, OPENAI_KEY]);
+    setOpenAiProfile("gpt-5.4");
+    const result = await getConfiguredProvider("mainAgent", {
+      overrideProfile: "openai-any",
+    });
+    expect(result).not.toBeNull();
+    expect(resolveProviderCalls.length).toBe(1);
+    expect(resolveProviderCalls[0].name).toBe("openai-codex");
+  });
+  test("non-Codex model with only an oauth_subscription connection resolves to null (no misroute)", async () => {
+    // Pure-predicate gate: the lone oauth_subscription connection is filtered
+    // out, so auto-resolution finds nothing and the call site falls back
+    // gracefully rather than dispatching gpt-5 to the Codex endpoint.
+    registerConnections([OPENAI_CODEX]);
+    setOpenAiProfile("gpt-5");
+    const result = await getConfiguredProvider("mainAgent", {
+      overrideProfile: "openai-any",
+    });
+    expect(result).toBeNull();
+    expect(resolveProviderCalls.length).toBe(0);
+  });
+  test("explicitly pinned oauth_subscription connection is used regardless of model", async () => {
+    registerConnections([OPENAI_CODEX, OPENAI_KEY]);
+    mockLlmConfig = {
+      default: { provider: "anthropic", model: "claude-opus-4-7" },
+      profiles: {
+        "openai-pinned": {
+          provider: "openai",
+          model: "gpt-5",
+          provider_connection: "openai-codex",
+        },
+      },
+    };
+    const result = await getConfiguredProvider("mainAgent", {
+      overrideProfile: "openai-pinned",
+    });
+    // The pinned connection bypasses the auto-resolution gate entirely.
+    expect(result).not.toBeNull();
+    expect(resolveProviderCalls.length).toBe(1);
+    expect(resolveProviderCalls[0].name).toBe("openai-codex");
+  });
+});
+function setOpenAiProfile(model: string): void {
+  mockLlmConfig = {
+    default: { provider: "anthropic", model: "claude-opus-4-7" },
+    profiles: {
+      // "Any active OpenAI connection" — provider set, no provider_connection.
+      "openai-any": { provider: "openai", model },
+    },
+  };
+}

package/src/providers/__tests__/retry-callsite.test.ts CHANGED Viewed

@@ -425,7 +425,7 @@ describe("RetryProvider — callSite resolution", () => {
     expect(config.temperature).toBe(0.5);
   });
-  test("strips effort/speed/thinking for providers that don't support them", async () => {
+  test("strips effort/speed for providers that don't support them (e.g. fireworks)", async () => {
     setLlmConfig({
       default: {
         provider: "anthropic",
@@ -434,14 +434,14 @@ describe("RetryProvider — callSite resolution", () => {
         speed: "fast",
       },
       callSites: {
-        memoryRetrieval: { thinking: { enabled: true } },
+        memoryRetrieval: { thinking: { enabled: false } },
       },
     });
     let seen: SendMessageOptions | undefined;
-    // gemini does not support effort/speed/thinking — they must be stripped.
+    // fireworks does not support speed or thinking — they must be stripped.
     const wrapped = new RetryProvider(
-      makeProvider("gemini", (options) => {
+      makeProvider("fireworks", (options) => {
         seen = options;
       }),
     );
@@ -451,13 +451,93 @@ describe("RetryProvider — callSite resolution", () => {
     });
     const config = seen?.config as Record<string, unknown>;
-    expect(config.effort).toBeUndefined();
     expect(config.speed).toBeUndefined();
     expect(config.thinking).toBeUndefined();
     // Model still comes through.
     expect(config.model).toBe("claude-opus-4-7");
   });
+  test("preserves thinking + level for Gemini provider", async () => {
+    setLlmConfig({
+      default: {
+        provider: "gemini",
+        model: "gemini-3.5-flash",
+        thinking: { enabled: true, streamThinking: true, level: "high" },
+      },
+      callSites: { mainAgent: {} },
+    });
+    let seen: SendMessageOptions | undefined;
+    const wrapped = new RetryProvider(
+      makeProvider("gemini", (options) => {
+        seen = options;
+      }),
+    );
+    await wrapped.sendMessage(DUMMY_MESSAGES, undefined, undefined, {
+      config: { callSite: "mainAgent" },
+    });
+    const config = seen?.config as Record<string, unknown>;
+    expect(config.thinking).toEqual({
+      type: "adaptive",
+      level: "high",
+      streamThinking: true,
+    });
+  });
+  test("Gemini disabled thinking carries the wire `disabled` discriminator", async () => {
+    setLlmConfig({
+      default: {
+        provider: "gemini",
+        model: "gemini-3.5-flash",
+        thinking: { enabled: false, streamThinking: false },
+      },
+      callSites: { mainAgent: {} },
+    });
+    let seen: SendMessageOptions | undefined;
+    const wrapped = new RetryProvider(
+      makeProvider("gemini", (options) => {
+        seen = options;
+      }),
+    );
+    await wrapped.sendMessage(DUMMY_MESSAGES, undefined, undefined, {
+      config: { callSite: "mainAgent" },
+    });
+    const config = seen?.config as Record<string, unknown>;
+    expect(config.thinking).toEqual({ type: "disabled" });
+  });
+  test("scrubs Gemini-only thinking extras (level, streamThinking) for Anthropic", async () => {
+    setLlmConfig({
+      default: {
+        provider: "anthropic",
+        model: "claude-opus-4-7",
+        thinking: { enabled: true, streamThinking: true, level: "high" },
+      },
+      callSites: { mainAgent: {} },
+    });
+    let seen: SendMessageOptions | undefined;
+    const wrapped = new RetryProvider(
+      makeProvider("anthropic", (options) => {
+        seen = options;
+      }),
+    );
+    await wrapped.sendMessage(DUMMY_MESSAGES, undefined, undefined, {
+      config: { callSite: "mainAgent" },
+    });
+    const config = seen?.config as Record<string, unknown>;
+    // Anthropic's SDK rejects unknown keys inside the `thinking` object with
+    // "Extra inputs are not permitted" — must be exactly `{ type }`.
+    expect(config.thinking).toEqual({ type: "adaptive" });
+  });
   test("explicit per-call config.model wins over resolved callSite model", async () => {
     setLlmConfig({
       default: { provider: "anthropic", model: "resolved-model" },

package/src/providers/anthropic/client.ts CHANGED Viewed

@@ -1,6 +1,5 @@
 import Anthropic from "@anthropic-ai/sdk";
-import { SYSTEM_PROMPT_CACHE_BOUNDARY } from "../../prompts/system-prompt.js";
 import { isAbortReason } from "../../util/abort-reasons.js";
 import { ProviderError } from "../../util/errors.js";
 import { getLogger } from "../../util/logger.js";
@@ -819,6 +818,15 @@ export class AnthropicProvider implements Provider {
       ((config as Record<string, unknown> | undefined)?.cacheTtl as
         | "5m"
         | "1h") ?? "1h";
+    // Opt-out for callers (e.g. the memory router) that send a single
+    // user message per call with content that changes every time. The
+    // turn-start cache breakpoint below is only useful when the same
+    // prefix is re-sent on a subsequent call (typical for the main agent
+    // loop's tool-use iterations); one-shot callers pay cache_creation
+    // cost without a future hit.
+    const disableTurnStartCache =
+      (config as Record<string, unknown> | undefined)?.disableTurnStartCache ===
+      true;
     let sentMessages: Anthropic.MessageParam[] | undefined;
     const startedAt = Date.now();
     // Hoisted so the catch block can distinguish our inner stream timeout
@@ -980,14 +988,11 @@ export class AnthropicProvider implements Provider {
       // followed by user tool_result). Replaying stale thinking blocks from
       // earlier turns causes 400 errors when the signature is no longer
       // valid (e.g. after a provider/model/profile switch).
-      const activeToolUseStart =
-        findActiveToolUseContinuationStart(formatted);
+      const activeToolUseStart = findActiveToolUseContinuationStart(formatted);
       for (let i = 0; i < activeToolUseStart; i++) {
         const msg = formatted[i];
         if (msg.role !== "assistant" || !Array.isArray(msg.content)) continue;
-        const stripped = (
-          msg.content as Anthropic.ContentBlockParam[]
-        ).filter(
+        const stripped = (msg.content as Anthropic.ContentBlockParam[]).filter(
           (b) =>
             typeof b === "string" ||
             (b.type !== "thinking" && b.type !== "redacted_thinking"),
@@ -1009,6 +1014,7 @@ export class AnthropicProvider implements Provider {
         speed,
         output_config,
         cacheTtl: _cacheTtl,
+        disableTurnStartCache: _disableTurnStartCache,
         max_tokens: callerMaxTokens,
         usageAttributionHeaders,
         ...restConfig
@@ -1065,38 +1071,17 @@ export class AnthropicProvider implements Provider {
       };
       if (systemPrompt) {
-        const boundaryIdx = systemPrompt.indexOf(SYSTEM_PROMPT_CACHE_BOUNDARY);
-        if (boundaryIdx >= 0) {
-          // Split into two cache blocks: static instructions (stable across
-          // turns) and dynamic workspace content (changes when files are
-          // edited).  The static prefix stays cached even when workspace
-          // files change, saving ~8-10K tokens of cache creation per turn.
-          // Both blocks use 1-hour cache TTL to avoid repeated cache misses
-          // for conversations with turn gaps exceeding the default 5-minute
-          // window.
-          const staticBlock = systemPrompt.slice(0, boundaryIdx);
-          const dynamicBlock = systemPrompt.slice(
-            boundaryIdx + SYSTEM_PROMPT_CACHE_BOUNDARY.length,
-          );
-          const systemBlocks = [staticBlock, dynamicBlock]
-            .filter((text) => text.length > 0)
-            .map((text) => ({
-              type: "text" as const,
-              text,
-              cache_control: cacheControl,
-            }));
-          if (systemBlocks.length > 0) {
-            params.system = systemBlocks;
-          }
-        } else {
-          params.system = [
-            {
-              type: "text" as const,
-              text: systemPrompt,
-              cache_control: cacheControl,
-            },
-          ];
-        }
+        // The whole system prompt is rendered as a single cached
+        // block.  A 1-hour cache TTL is used (when supported by the
+        // model) so the breakpoint survives turn gaps that exceed the
+        // default 5-minute window.
+        params.system = [
+          {
+            type: "text" as const,
+            text: systemPrompt,
+            cache_control: cacheControl,
+          },
+        ];
       }
       if (tools && tools.length > 0) {
@@ -1160,7 +1145,9 @@ export class AnthropicProvider implements Provider {
         }
       };
       const turnStartIdx = findUserTextMsgIdx(msgs.length - 1);
-      if (turnStartIdx >= 0) applyCacheControlToLastBlock(turnStartIdx);
+      if (turnStartIdx >= 0 && !disableTurnStartCache) {
+        applyCacheControlToLastBlock(turnStartIdx);
+      }
       // Previous-turn anchor: when this request is the first of a new turn
       // (turn-start is the very last message — no tool-use loop yet), also
@@ -1172,9 +1159,8 @@ export class AnthropicProvider implements Provider {
       // cache_creation tokens per new turn). Skipped during tool-use loops
       // where the current turn-start already covers the same prefix and a
       // second anchor would blow the 4-breakpoint budget.
-      let prevTurnAnchorIdx = -1;
       if (turnStartIdx === msgs.length - 1 && turnStartIdx > 0) {
-        prevTurnAnchorIdx = findUserTextMsgIdx(turnStartIdx - 1);
+        const prevTurnAnchorIdx = findUserTextMsgIdx(turnStartIdx - 1);
         if (prevTurnAnchorIdx >= 0)
           applyCacheControlToLastBlock(prevTurnAnchorIdx);
       }
@@ -1185,7 +1171,6 @@ export class AnthropicProvider implements Provider {
       // cheaply without conflicting with the 1h breakpoints above.
       // Skip thinking/redacted_thinking blocks — Anthropic doesn't allow
       // cache_control on those types.
-      let tailBreakpointApplied = false;
       if (turnStartIdx >= 0 && turnStartIdx < sentMessages.length - 1) {
         const lastMsg = sentMessages[sentMessages.length - 1];
         if (Array.isArray(lastMsg.content) && lastMsg.content.length > 0) {
@@ -1207,34 +1192,15 @@ export class AnthropicProvider implements Provider {
           if (tailBlock && typeof tailBlock !== "string") {
             (tailBlock as unknown as Record<string, unknown>).cache_control =
               tailCacheControl;
-            tailBreakpointApplied = true;
           }
         }
       }
-      // Enforce Anthropic API maximum of 4 cache_control blocks.
-      // With the system prompt boundary split into 2 cached blocks AND
-      // tools + turn-start + (tail OR prev-turn-anchor), we'd have 5.
-      // Drop the static system block's breakpoint — it's small (<1K
-      // tokens) so the re-read cost is negligible, while the dynamic
-      // block (workspace context) rarely changes mid-session and
-      // benefits more from caching. Tail and prev-turn-anchor are
-      // mutually exclusive (prev-turn-anchor only fires when turn-start
-      // is the last message, which is the exact condition that suppresses
-      // the tail), so we never exceed 5.
-      const hasToolCacheBreakpoint =
-        params.tools?.some(
-          (t) => "cache_control" in t && t.cache_control != null,
-        ) ?? false;
-      if (
-        (tailBreakpointApplied || prevTurnAnchorIdx >= 0) &&
-        Array.isArray(params.system) &&
-        params.system.length === 2 &&
-        hasToolCacheBreakpoint
-      ) {
-        delete (params.system[0] as unknown as Record<string, unknown>)
-          .cache_control;
-      }
+      // Cache-breakpoint accounting: system(1) + tools(1) + turn-start(1) +
+      // (tail OR prev-turn-anchor)(1) = 4 — exactly Anthropic's per-request
+      // cap.  Tail and prev-turn-anchor are mutually exclusive (the latter
+      // only fires when turn-start is the last message, which suppresses
+      // the tail), so the total can't drift past 4.
       // Strip orphaned UTF-16 surrogates so the Anthropic JSON parser never
       // sees invalid strings produced by upstream surrogate-splitting `.slice()` calls.

package/src/providers/call-site-routing.ts CHANGED Viewed

@@ -24,6 +24,7 @@ import { AsyncLocalStorage } from "node:async_hooks";
 import { resolveCallSiteConfig } from "../config/llm-resolver.js";
 import { getConfig } from "../config/loader.js";
 import { getDb } from "../memory/db-connection.js";
+import { isConnectionCompatibleWithModel } from "./connection-model-compat.js";
 import {
   ConnectionResolutionError,
   tryResolveProviderForConnectionName,
@@ -73,10 +74,15 @@ export class CallSiteRoutingProvider implements Provider {
      * `expectedProvider` is the provider name the resolved profile
      * declared. The hook verifies the connection's provider matches
      * and throws on mismatch.
+     *
+     * `model` is the resolved call-site model, threaded through so the
+     * connection lookup can gate `oauth_subscription` (Codex) connections
+     * by model compatibility.
      */
     private readonly resolveByConnection: (
       connectionName: string,
       expectedProvider: string,
+      model: string | undefined,
     ) => Promise<Provider | null>,
   ) {
     this.tokenEstimationProvider = defaultProvider.tokenEstimationProvider;
@@ -155,7 +161,11 @@ export class CallSiteRoutingProvider implements Provider {
         const candidates = listConnections(getDb(), {
           provider: resolved.provider,
         });
-        const active = candidates.find((c) => c.status === "active");
+        const active = candidates.find(
+          (c) =>
+            c.status === "active" &&
+            isConnectionCompatibleWithModel(c, resolved.model),
+        );
         if (active) {
           connectionName = active.name;
         }
@@ -168,6 +178,7 @@ export class CallSiteRoutingProvider implements Provider {
       const connectionProvider = await this.resolveByConnection(
         connectionName,
         resolved.provider,
+        resolved.model,
       );
       if (connectionProvider) return connectionProvider;
       return this.defaultProvider;
@@ -200,11 +211,12 @@ export function wrapWithCallSiteRouting(
 ): Provider {
   return new CallSiteRoutingProvider(
     base,
-    (connectionName, expectedProvider) =>
+    (connectionName, expectedProvider, model) =>
       tryResolveProviderForConnectionName(
         connectionName,
         config,
         expectedProvider,
+        model,
       ),
   );
 }

package/src/providers/connection-model-compat.ts ADDED Viewed

@@ -0,0 +1,38 @@
+/**
+ * Model-compatibility gate for auto-resolved provider connections.
+ *
+ * When a profile uses "Any active <provider> connection" (no
+ * `provider_connection` pinned), the daemon auto-picks an active connection
+ * for the provider. `oauth_subscription` connections (ChatGPT Codex) hard-
+ * route every request to the Codex endpoint, which rejects non-Codex models
+ * with HTTP 400. This helper lets the auto-resolution sites skip such a
+ * connection when the requested model is not Codex-compatible.
+ */
+import type { ProviderConnection } from "./inference/auth.js";
+import { isCodexSubscriptionModel } from "./openai/codex-models.js";
+/**
+ * Whether `connection` can serve a request for `model` during
+ * auto-resolution.
+ *
+ * `oauth_subscription` connections route through the ChatGPT Codex endpoint,
+ * so they are only compatible with Codex models. Every other auth type
+ * imposes no model restriction and is always compatible.
+ *
+ * `model` may be undefined when the call site has no resolved model; in that
+ * case no model gating is applied (returns true) so resolution behaviour is
+ * unchanged.
+ *
+ * This gate applies to auto-resolution only — an explicitly pinned
+ * `provider_connection` bypasses connection selection entirely and is used
+ * regardless of model.
+ */
+export function isConnectionCompatibleWithModel(
+  connection: Pick<ProviderConnection, "auth">,
+  model: string | undefined,
+): boolean {
+  if (connection.auth.type !== "oauth_subscription") return true;
+  if (!model) return true;
+  return isCodexSubscriptionModel(model);
+}

package/src/providers/connection-resolution.ts CHANGED Viewed

@@ -30,6 +30,7 @@
 import { resolveCallSiteConfig } from "../config/llm-resolver.js";
 import { getDb } from "../memory/db-connection.js";
 import { getLogger } from "../util/logger.js";
+import { isConnectionCompatibleWithModel } from "./connection-model-compat.js";
 import { getConnection, listConnections } from "./inference/connections.js";
 import type { ProvidersConfig } from "./registry.js";
 import { resolveProviderFromConnection } from "./registry.js";
@@ -79,11 +80,16 @@ export class ConnectionResolutionError extends Error {
  * `expectedProvider` is the provider name the resolving profile declared.
  * Pass `undefined` to skip the mismatch check (callers that don't yet
  * know the expected provider).
+ *
+ * `model` is the resolved call-site model. It gates the `provider_mismatch`
+ * auto-recovery below so a non-Codex model is never rerouted onto an
+ * `oauth_subscription` (ChatGPT Codex) connection.
  */
 export async function tryResolveProviderForConnectionName(
   connectionName: string,
   config: ProvidersConfig,
   expectedProvider?: string,
+  model?: string,
 ): Promise<Provider | null> {
   let connection;
   try {
@@ -113,7 +119,10 @@ export async function tryResolveProviderForConnectionName(
     try {
       const db = getDb();
       const candidates = listConnections(db, { provider: expectedProvider });
-      const active = candidates.find((c) => c.status === "active");
+      const active = candidates.find(
+        (c) =>
+          c.status === "active" && isConnectionCompatibleWithModel(c, model),
+      );
       if (active) {
         log.info(
           {
@@ -192,7 +201,11 @@ export async function resolveDefaultProvider(
         const candidates = listConnections(getDb(), {
           provider: resolved.provider,
         });
-        const active = candidates.find((c) => c.status === "active");
+        const active = candidates.find(
+          (c) =>
+            c.status === "active" &&
+            isConnectionCompatibleWithModel(c, resolved.model),
+        );
         if (active) {
           log.info(
             { provider: resolved.provider, resolvedConnection: active.name },
@@ -216,5 +229,6 @@ export async function resolveDefaultProvider(
     connectionName,
     config,
     resolved.provider,
+    resolved.model,
   );
 }