npm - @oh-my-pi/pi-coding-agent - Versions diffs - 15.10.9 → 15.10.11 - Mend

@oh-my-pi/pi-coding-agent 15.10.9 → 15.10.11

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (352) hide show

package/CHANGELOG.md +117 -0
package/dist/cli.js +23087 -0
package/dist/tokenizers.linux-x64-gnu-xcjh3jwk.node +0 -0
package/dist/types/async/job-manager.d.ts +18 -0
package/dist/types/cli/args.d.ts +1 -1
package/dist/types/cli/dry-balance-cli.d.ts +1 -1
package/dist/types/cli/gallery-cli.d.ts +1 -1
package/dist/types/cli/gallery-fixtures/types.d.ts +1 -1
package/dist/types/cli/usage-cli.d.ts +72 -0
package/dist/types/commands/launch.d.ts +1 -1
package/dist/types/commands/read.d.ts +1 -1
package/dist/types/commands/usage.d.ts +25 -0
package/dist/types/config/append-only-context-mode.d.ts +2 -1
package/dist/types/config/model-discovery.d.ts +55 -0
package/dist/types/config/model-registry.d.ts +20 -219
package/dist/types/config/model-resolver.d.ts +16 -10
package/dist/types/config/model-roles.d.ts +28 -0
package/dist/types/config/models-config-schema.d.ts +523 -42
package/dist/types/config/models-config.d.ts +385 -0
package/dist/types/config/settings-schema.d.ts +12 -16
package/dist/types/config/settings.d.ts +1 -1
package/dist/types/debug/log-viewer.d.ts +1 -1
package/dist/types/debug/raw-sse.d.ts +1 -1
package/dist/types/debug/terminal-info.d.ts +0 -1
package/dist/types/eval/backend.d.ts +0 -2
package/dist/types/eval/idle-timeout.d.ts +0 -4
package/dist/types/eval/js/shared/rewrite-imports.d.ts +6 -6
package/dist/types/export/html/template.generated.d.ts +1 -1
package/dist/types/extensibility/extensions/types.d.ts +3 -3
package/dist/types/hindsight/mental-models.d.ts +17 -8
package/dist/types/internal-urls/artifact-protocol.d.ts +2 -2
package/dist/types/internal-urls/types.d.ts +1 -1
package/dist/types/lsp/edits.d.ts +9 -0
package/dist/types/lsp/index.d.ts +2 -2
package/dist/types/lsp/types.d.ts +2 -0
package/dist/types/lsp/utils.d.ts +3 -0
package/dist/types/mcp/json-rpc.d.ts +5 -0
package/dist/types/mnemopi/state.d.ts +11 -1
package/dist/types/modes/components/agent-dashboard.d.ts +1 -1
package/dist/types/modes/components/assistant-message.d.ts +3 -1
package/dist/types/modes/components/bash-execution.d.ts +1 -1
package/dist/types/modes/components/copy-selector.d.ts +1 -1
package/dist/types/modes/components/dynamic-border.d.ts +1 -1
package/dist/types/modes/components/extensions/extension-dashboard.d.ts +1 -1
package/dist/types/modes/components/extensions/extension-list.d.ts +1 -1
package/dist/types/modes/components/extensions/inspector-panel.d.ts +1 -1
package/dist/types/modes/components/footer.d.ts +1 -1
package/dist/types/modes/components/hook-editor.d.ts +5 -0
package/dist/types/modes/components/hook-input.d.ts +4 -0
package/dist/types/modes/components/hook-selector.d.ts +1 -1
package/dist/types/modes/components/model-selector.d.ts +1 -1
package/dist/types/modes/components/plan-review-overlay.d.ts +1 -1
package/dist/types/modes/components/session-observer-overlay.d.ts +1 -1
package/dist/types/modes/components/session-selector.d.ts +1 -1
package/dist/types/modes/components/status-line/component.d.ts +1 -1
package/dist/types/modes/components/tiny-title-download-progress.d.ts +1 -1
package/dist/types/modes/components/transcript-container.d.ts +31 -26
package/dist/types/modes/components/tree-selector.d.ts +1 -1
package/dist/types/modes/components/user-message-selector.d.ts +1 -1
package/dist/types/modes/components/user-message.d.ts +2 -1
package/dist/types/modes/components/visual-truncate.d.ts +1 -1
package/dist/types/modes/components/welcome.d.ts +19 -3
package/dist/types/modes/controllers/mcp-command-controller.d.ts +1 -1
package/dist/types/modes/controllers/streaming-reveal.d.ts +1 -1
package/dist/types/modes/interactive-mode.d.ts +1 -1
package/dist/types/modes/setup-wizard/scenes/sign-in.d.ts +1 -1
package/dist/types/modes/setup-wizard/scenes/types.d.ts +1 -1
package/dist/types/modes/setup-wizard/scenes/web-search.d.ts +1 -1
package/dist/types/modes/setup-wizard/wizard-overlay.d.ts +1 -1
package/dist/types/modes/types.d.ts +2 -1
package/dist/types/session/agent-session.d.ts +1 -1
package/dist/types/session/auth-broker-config.d.ts +4 -0
package/dist/types/session/session-manager.d.ts +1 -1
package/dist/types/slash-commands/helpers/stats-dashboard.d.ts +13 -0
package/dist/types/ssh/connection-manager.d.ts +8 -0
package/dist/types/task/discovery.d.ts +1 -2
package/dist/types/task/parallel.d.ts +2 -2
package/dist/types/task/worktree.d.ts +2 -0
package/dist/types/tiny/title-client.d.ts +1 -1
package/dist/types/tools/ask.d.ts +4 -0
package/dist/types/tools/conflict-detect.d.ts +16 -0
package/dist/types/tools/github-cache.d.ts +7 -0
package/dist/types/tools/sqlite-reader.d.ts +3 -0
package/dist/types/tools/todo.d.ts +2 -0
package/dist/types/tui/output-block.d.ts +3 -3
package/dist/types/utils/changelog.d.ts +8 -0
package/dist/types/web/scrapers/readthedocs.d.ts +3 -0
package/dist/types/web/scrapers/types.d.ts +12 -0
package/dist/types/web/search/providers/codex.d.ts +1 -1
package/dist/types/web/search/providers/gemini.d.ts +1 -1
package/examples/extensions/tools.ts +5 -4
package/package.json +14 -11
package/scripts/build-binary.ts +18 -23
package/scripts/bundle-dist.ts +81 -0
package/scripts/{dev-launch → omp} +1 -1
package/scripts/{dev-launch-preload.ts → omp.ts} +1 -1
package/src/async/job-manager.ts +57 -3
package/src/autoresearch/dashboard.ts +1 -1
package/src/autoresearch/prompt-setup.md +6 -6
package/src/autoresearch/prompt.md +6 -6
package/src/capability/fs.ts +10 -0
package/src/cli/args.ts +1 -1
package/src/cli/auth-gateway-cli.ts +1 -3
package/src/cli/dry-balance-cli.ts +1 -1
package/src/cli/gallery-cli.ts +1 -1
package/src/cli/gallery-fixtures/fs.ts +1 -1
package/src/cli/gallery-fixtures/types.ts +5 -1
package/src/cli/list-models.ts +7 -12
package/src/cli/usage-cli.ts +603 -0
package/src/cli-commands.ts +1 -0
package/src/cli.ts +69 -5
package/src/commands/complete.ts +1 -1
package/src/commands/launch.ts +1 -1
package/src/commands/read.ts +6 -3
package/src/commands/usage.ts +35 -0
package/src/commit/agentic/agent.ts +1 -1
package/src/commit/model-selection.ts +1 -1
package/src/config/append-only-context-mode.ts +6 -12
package/src/config/model-discovery.ts +554 -0
package/src/config/model-registry.ts +308 -1025
package/src/config/model-resolver.ts +113 -156
package/src/config/model-roles.ts +74 -0
package/src/config/models-config-schema.ts +57 -8
package/src/config/models-config.ts +129 -0
package/src/config/settings-schema.ts +18 -14
package/src/config/settings.ts +37 -1
package/src/dap/client.ts +124 -37
package/src/dap/session.ts +259 -158
package/src/debug/log-viewer.ts +1 -1
package/src/debug/raw-sse.ts +1 -1
package/src/debug/terminal-info.ts +0 -3
package/src/edit/diff.ts +95 -18
package/src/edit/hashline/block-resolver.ts +20 -1
package/src/edit/hashline/diff.ts +36 -1
package/src/edit/hashline/execute.ts +8 -2
package/src/edit/index.ts +16 -1
package/src/edit/modes/patch.ts +52 -0
package/src/edit/modes/replace.ts +56 -22
package/src/edit/notebook.ts +22 -2
package/src/edit/renderer.ts +36 -10
package/src/eval/__tests__/completion-bridge.test.ts +1 -1
package/src/eval/backend.ts +0 -2
package/src/eval/completion-bridge.ts +2 -1
package/src/eval/idle-timeout.ts +2 -9
package/src/eval/js/context-manager.ts +6 -8
package/src/eval/js/executor.ts +6 -2
package/src/eval/js/index.ts +0 -2
package/src/eval/js/shared/helpers.ts +5 -6
package/src/eval/js/shared/local-module-loader.ts +1 -1
package/src/eval/js/shared/prelude.txt +62 -1
package/src/eval/js/shared/rewrite-imports.ts +49 -23
package/src/eval/js/shared/runtime.ts +1 -1
package/src/eval/py/index.ts +0 -2
package/src/eval/py/kernel.ts +19 -0
package/src/eval/py/runner.py +107 -3
package/src/exec/bash-executor.ts +3 -1
package/src/export/html/template.generated.ts +1 -1
package/src/export/html/template.js +3 -1
package/src/extensibility/extensions/types.ts +3 -2
package/src/extensibility/plugins/legacy-pi-compat.ts +20 -3
package/src/hindsight/mental-models.ts +59 -12
package/src/hindsight/state.ts +6 -1
package/src/internal-urls/artifact-protocol.ts +11 -2
package/src/internal-urls/docs-index.generated.ts +10 -10
package/src/internal-urls/issue-pr-protocol.ts +12 -5
package/src/internal-urls/router.ts +1 -1
package/src/internal-urls/types.ts +1 -1
package/src/lib/xai-http.ts +1 -1
package/src/lsp/client.ts +118 -38
package/src/lsp/clients/biome-client.ts +101 -39
package/src/lsp/edits.ts +143 -95
package/src/lsp/index.ts +31 -22
package/src/lsp/render.ts +1 -1
package/src/lsp/types.ts +2 -0
package/src/lsp/utils.ts +28 -10
package/src/main.ts +165 -17
package/src/mcp/json-rpc.ts +35 -5
package/src/mcp/transports/stdio.ts +7 -1
package/src/memories/index.ts +2 -1
package/src/mnemopi/backend.ts +25 -3
package/src/mnemopi/state.ts +38 -2
package/src/modes/components/agent-dashboard.ts +10 -7
package/src/modes/components/assistant-message.ts +19 -13
package/src/modes/components/bash-execution.ts +1 -1
package/src/modes/components/copy-selector.ts +1 -1
package/src/modes/components/diff.ts +13 -2
package/src/modes/components/dynamic-border.ts +12 -3
package/src/modes/components/extensions/extension-dashboard.ts +8 -5
package/src/modes/components/extensions/extension-list.ts +1 -1
package/src/modes/components/extensions/inspector-panel.ts +1 -1
package/src/modes/components/footer.ts +1 -1
package/src/modes/components/history-search.ts +1 -1
package/src/modes/components/hook-editor.ts +8 -0
package/src/modes/components/hook-input.ts +8 -0
package/src/modes/components/hook-selector.ts +2 -2
package/src/modes/components/model-selector.ts +66 -54
package/src/modes/components/plan-review-overlay.ts +1 -1
package/src/modes/components/session-observer-overlay.ts +2 -2
package/src/modes/components/session-selector.ts +1 -1
package/src/modes/components/settings-selector.ts +5 -1
package/src/modes/components/status-line/component.ts +1 -1
package/src/modes/components/tiny-title-download-progress.ts +1 -1
package/src/modes/components/transcript-container.ts +373 -141
package/src/modes/components/tree-selector.ts +3 -3
package/src/modes/components/user-message-selector.ts +1 -1
package/src/modes/components/user-message.ts +17 -5
package/src/modes/components/visual-truncate.ts +1 -1
package/src/modes/components/welcome.ts +108 -26
package/src/modes/controllers/command-controller.ts +10 -3
package/src/modes/controllers/event-controller.ts +73 -49
package/src/modes/controllers/input-controller.ts +5 -5
package/src/modes/controllers/mcp-command-controller.ts +1 -1
package/src/modes/controllers/selector-controller.ts +1 -5
package/src/modes/controllers/streaming-reveal.ts +85 -18
package/src/modes/interactive-mode.ts +5 -19
package/src/modes/setup-wizard/scenes/glyph.ts +1 -1
package/src/modes/setup-wizard/scenes/providers.ts +1 -1
package/src/modes/setup-wizard/scenes/sign-in.ts +1 -1
package/src/modes/setup-wizard/scenes/theme.ts +1 -1
package/src/modes/setup-wizard/scenes/types.ts +1 -1
package/src/modes/setup-wizard/scenes/web-search.ts +1 -1
package/src/modes/setup-wizard/wizard-overlay.ts +1 -1
package/src/modes/types.ts +2 -1
package/src/prompts/agents/explore.md +2 -2
package/src/prompts/agents/librarian.md +1 -2
package/src/prompts/agents/oracle.md +1 -1
package/src/prompts/agents/plan.md +5 -5
package/src/prompts/agents/task.md +5 -5
package/src/prompts/ci-green-request.md +5 -7
package/src/prompts/goals/goal-budget-limit.md +2 -2
package/src/prompts/goals/goal-continuation.md +4 -4
package/src/prompts/goals/goal-mode-active.md +1 -1
package/src/prompts/memories/read-path.md +1 -1
package/src/prompts/memories/stage_one_system.md +2 -2
package/src/prompts/review-custom-request.md +1 -1
package/src/prompts/system/agent-creation-architect.md +2 -2
package/src/prompts/system/auto-continue.md +1 -1
package/src/prompts/system/background-tan-dispatch.md +1 -1
package/src/prompts/system/btw-user.md +2 -2
package/src/prompts/system/commit-message-system.md +13 -1
package/src/prompts/system/custom-system-prompt.md +1 -1
package/src/prompts/system/eager-todo.md +2 -2
package/src/prompts/system/irc-incoming.md +1 -1
package/src/prompts/system/manual-continue.md +1 -1
package/src/prompts/system/omfg-user.md +3 -4
package/src/prompts/system/orchestrate-notice.md +9 -9
package/src/prompts/system/plan-mode-active.md +4 -4
package/src/prompts/system/plan-mode-subagent.md +4 -5
package/src/prompts/system/plan-mode-tool-decision-reminder.md +1 -1
package/src/prompts/system/project-prompt.md +2 -2
package/src/prompts/system/subagent-system-prompt.md +4 -4
package/src/prompts/system/system-prompt.md +15 -26
package/src/prompts/system/title-system.md +2 -2
package/src/prompts/system/ttsr-tool-reminder.md +1 -1
package/src/prompts/system/workflow-notice.md +1 -1
package/src/prompts/tools/ast-edit.md +1 -1
package/src/prompts/tools/ast-grep.md +2 -2
package/src/prompts/tools/bash.md +8 -10
package/src/prompts/tools/browser.md +7 -7
package/src/prompts/tools/debug.md +1 -1
package/src/prompts/tools/eval.md +3 -3
package/src/prompts/tools/find.md +0 -1
package/src/prompts/tools/github.md +8 -7
package/src/prompts/tools/goal.md +1 -1
package/src/prompts/tools/image-gen.md +1 -1
package/src/prompts/tools/inspect-image-system.md +1 -1
package/src/prompts/tools/irc.md +15 -15
package/src/prompts/tools/lsp.md +2 -2
package/src/prompts/tools/patch.md +2 -2
package/src/prompts/tools/read.md +3 -4
package/src/prompts/tools/recall.md +1 -1
package/src/prompts/tools/reflect.md +1 -1
package/src/prompts/tools/render-mermaid.md +2 -2
package/src/prompts/tools/replace.md +4 -10
package/src/prompts/tools/rewind.md +2 -2
package/src/prompts/tools/search-tool-bm25.md +1 -9
package/src/prompts/tools/search.md +0 -1
package/src/prompts/tools/ssh.md +0 -4
package/src/prompts/tools/task.md +2 -3
package/src/prompts/tools/todo.md +6 -2
package/src/sdk.ts +23 -10
package/src/session/agent-session.ts +44 -10
package/src/session/auth-broker-config.ts +30 -1
package/src/session/session-manager.ts +2 -2
package/src/session/streaming-output.ts +23 -2
package/src/slash-commands/builtin-registry.ts +20 -0
package/src/slash-commands/helpers/stats-dashboard.ts +85 -0
package/src/ssh/connection-manager.ts +27 -0
package/src/task/commands.ts +2 -1
package/src/task/discovery.ts +17 -24
package/src/task/executor.ts +61 -53
package/src/task/index.ts +137 -60
package/src/task/parallel.ts +3 -3
package/src/task/render.ts +2 -2
package/src/task/worktree.ts +64 -56
package/src/thinking.ts +2 -1
package/src/tiny/title-client.ts +32 -14
package/src/tools/archive-reader.ts +30 -2
package/src/tools/ask.ts +104 -21
package/src/tools/ast-edit.ts +25 -5
package/src/tools/auto-generated-guard.ts +20 -3
package/src/tools/bash-interactive.ts +27 -7
package/src/tools/bash.ts +54 -13
package/src/tools/browser/launch.ts +11 -2
package/src/tools/browser/readable.ts +19 -2
package/src/tools/browser/registry.ts +4 -1
package/src/tools/browser/render.ts +2 -2
package/src/tools/browser/tab-supervisor.ts +55 -16
package/src/tools/conflict-detect.ts +50 -4
package/src/tools/debug.ts +1 -1
package/src/tools/eval-render.ts +5 -5
package/src/tools/eval.ts +0 -2
package/src/tools/fetch.ts +33 -10
package/src/tools/gh-cache-invalidation.ts +63 -8
package/src/tools/gh-renderer.ts +1 -1
package/src/tools/gh.ts +172 -29
package/src/tools/github-cache.ts +70 -6
package/src/tools/image-gen.ts +3 -9
package/src/tools/irc.ts +5 -1
package/src/tools/job.ts +1 -1
package/src/tools/read.ts +202 -61
package/src/tools/render-utils.ts +3 -3
package/src/tools/resolve.ts +1 -1
package/src/tools/search.ts +92 -29
package/src/tools/sqlite-reader.ts +17 -5
package/src/tools/ssh.ts +8 -8
package/src/tools/todo.ts +51 -12
package/src/tools/write.ts +118 -18
package/src/tui/output-block.ts +4 -4
package/src/utils/changelog.ts +27 -1
package/src/utils/file-mentions.ts +2 -1
package/src/web/scrapers/arxiv.ts +1 -1
package/src/web/scrapers/go-pkg.ts +1 -1
package/src/web/scrapers/iacr.ts +1 -1
package/src/web/scrapers/readthedocs.ts +1 -1
package/src/web/scrapers/twitter.ts +2 -1
package/src/web/scrapers/types.ts +87 -8
package/src/web/scrapers/wikipedia.ts +1 -1
package/src/web/scrapers/youtube.ts +6 -1
package/src/web/search/index.ts +1 -1
package/src/web/search/providers/anthropic.ts +8 -2
package/src/web/search/providers/codex.ts +2 -1
package/src/web/search/providers/gemini.ts +2 -3
package/src/web/search/render.ts +8 -6
package/dist/types/config/model-equivalence.d.ts +0 -24
package/dist/types/config/model-id-affixes.d.ts +0 -12
package/dist/types/config/model-provider-priority.d.ts +0 -1
package/dist/types/exec/idle-timeout-watchdog.d.ts +0 -18
package/src/config/model-equivalence.ts +0 -875
package/src/config/model-id-affixes.ts +0 -81
package/src/config/model-provider-priority.ts +0 -56
package/src/exec/idle-timeout-watchdog.ts +0 -126

package/src/config/model-registry.ts CHANGED Viewed

@@ -1,9 +1,16 @@
 import * as path from "node:path";
 import { registerCustomApi, unregisterCustomApis } from "@oh-my-pi/pi-ai/api-registry";
-import { readModelCache } from "@oh-my-pi/pi-ai/model-cache";
-import { createModelManager, type ModelManagerOptions, type ModelRefreshStrategy } from "@oh-my-pi/pi-ai/model-manager";
-import { enrichModelThinking } from "@oh-my-pi/pi-ai/model-thinking";
-import { getBundledModels, getBundledProviders } from "@oh-my-pi/pi-ai/models";
+import type { Api, Context, Model, ModelSpec, SimpleStreamOptions, ThinkingConfig } from "@oh-my-pi/pi-ai/types";
+import type { AssistantMessageEventStream } from "@oh-my-pi/pi-ai/utils/event-stream";
+import { buildModel } from "@oh-my-pi/pi-catalog/build";
+import { isVertexExpressOpenAIUrl } from "@oh-my-pi/pi-catalog/hosts";
+import { readModelCache } from "@oh-my-pi/pi-catalog/model-cache";
+import {
+	createModelManager,
+	type ModelManagerOptions,
+	type ModelRefreshStrategy,
+} from "@oh-my-pi/pi-catalog/model-manager";
+import { getBundledModels, getBundledProviders } from "@oh-my-pi/pi-catalog/models";
 import {
 	googleAntigravityModelManagerOptions,
 	googleGeminiCliModelManagerOptions,
@@ -11,79 +18,12 @@ import {
 	PROVIDER_DESCRIPTORS,
 	UNK_CONTEXT_WINDOW,
 	UNK_MAX_TOKENS,
-} from "@oh-my-pi/pi-ai/provider-models";
-import type { Api, Context, Model, SimpleStreamOptions, ThinkingConfig } from "@oh-my-pi/pi-ai/types";
-import type { AssistantMessageEventStream } from "@oh-my-pi/pi-ai/utils/event-stream";
+} from "@oh-my-pi/pi-catalog/provider-models";
 // Sentinel for local-only OAuth token (LM Studio, vLLM) — declared inline to avoid loading
 // any provider module at startup. Must match `DEFAULT_LOCAL_TOKEN` in oauth/lm-studio.ts.
 const DEFAULT_LOCAL_TOKEN = "lm-studio-local";
-// Default cap on `max_tokens` for auto-discovered models that do not advertise
-// their own output limit (OpenAI-models-list, Ollama, llama.cpp, new-api/
-// one-api proxies). 32K matches the upper end of what mainstream
-// OpenAI-compatible providers (DeepSeek, MiMo, OpenRouter, etc.) actually
-// accept and keeps `min(contextWindow, …)` honoring smaller local windows.
-// Conservative caps below this caused providers to drop the connection
-// mid-stream when models hit the cap on legitimate large tool calls (see
-// issue #1528: `write` payloads >~5KB on deepseek-v4-pro surfaced as
-// "socket connection was closed unexpectedly").
-const DISCOVERY_DEFAULT_MAX_TOKENS = 32_768;
-const DEFAULT_OLLAMA_BASE_URL = "http://127.0.0.1:11434";
-const OLLAMA_HOST_DEFAULT_PORT = "11434";
-function normalizeOllamaHostEnv(value: string | undefined): string | undefined {
-	const trimmed = value?.trim();
-	if (!trimmed) return undefined;
-	const candidate = trimmed.includes("://")
-		? trimmed
-		: trimmed.startsWith("//")
-			? `http:${trimmed}`
-			: trimmed.startsWith(":")
-				? `http://127.0.0.1${trimmed}`
-				: `http://${trimmed}`;
-	try {
-		const parsed = new URL(candidate);
-		if (!parsed.hostname || (parsed.protocol !== "http:" && parsed.protocol !== "https:")) {
-			return undefined;
-		}
-		if (!parsed.port && parsed.protocol === "http:") {
-			parsed.port = OLLAMA_HOST_DEFAULT_PORT;
-		}
-		return `${parsed.protocol}//${parsed.host}`;
-	} catch {
-		return undefined;
-	}
-}
-function getImplicitOllamaBaseUrl(): string {
-	const baseUrl = Bun.env.OLLAMA_BASE_URL?.trim();
-	return baseUrl || normalizeOllamaHostEnv(Bun.env.OLLAMA_HOST) || DEFAULT_OLLAMA_BASE_URL;
-}
-function getOllamaContextLengthOverride(): number | undefined {
-	const value = Bun.env.OLLAMA_CONTEXT_LENGTH?.trim();
-	if (!value) return undefined;
-	const parsed = Number(value);
-	return Number.isSafeInteger(parsed) && parsed > 0 ? parsed : undefined;
-}
-// Anthropic-safe variant of the discovery cap. The Anthropic stream converter
-// in `packages/ai/src/providers/anthropic.ts` derives the request limit as
-// `(model.maxTokens / 3) | 0`, so the 32K default would surface as 10,922
-// requested output tokens — above the 8,192 hard cap on classic Claude 3.x
-// Sonnet/Haiku/Opus endpoints. Discovered models routed through
-// `anthropic-messages` (proxy `supported_endpoint_types: ["anthropic"]` or a
-// custom provider with `api: anthropic-messages` + openai-models-list
-// discovery) fall back to this conservative value.
-const DISCOVERY_DEFAULT_MAX_TOKENS_ANTHROPIC = 8_192;
-/** Routes discovered-model `maxTokens` defaults around Anthropic's 3× output divisor. */
-function discoveryDefaultMaxTokens(api: Api | undefined): number {
-	return api === "anthropic-messages" ? DISCOVERY_DEFAULT_MAX_TOKENS_ANTHROPIC : DISCOVERY_DEFAULT_MAX_TOKENS;
-}
 const SPECIAL_MODEL_MANAGER_PROVIDER_IDS: readonly string[] = [
 	"google-antigravity",
 	"google-gemini-cli",
@@ -98,35 +38,37 @@ const STARTUP_MODEL_CACHE_PROVIDER_IDS: readonly string[] = [
 import type { ApiKeyResolver, FetchImpl } from "@oh-my-pi/pi-ai";
 import { registerOAuthProvider, unregisterOAuthProviders } from "@oh-my-pi/pi-ai/oauth";
 import type { OAuthCredentials, OAuthLoginCallbacks } from "@oh-my-pi/pi-ai/oauth/types";
-import { isRecord, logger } from "@oh-my-pi/pi-utils";
-import { parseModelString, resolveProviderModelReference } from "../config/model-resolver";
-import { isValidThemeColor, type ThemeColor } from "../modes/theme/theme";
-import type { AuthStorage, OAuthCredential } from "../session/auth-storage";
-import { type ApiKeyResolverOptions, createApiKeyResolver } from "./api-key-resolver";
-import { type ConfigError, ConfigFile } from "./config-file";
 import {
 	buildCanonicalModelIndex,
+	buildCanonicalModelOrder,
+	buildModelProviderPriorityRank,
 	type CanonicalModelIndex,
 	type CanonicalModelRecord,
 	type CanonicalModelVariant,
+	type CanonicalVariantPreferences,
 	formatCanonicalVariantSelector,
+	getBundledCanonicalReferenceData,
+	getBundledModelReferenceIndex,
 	type ModelEquivalenceConfig,
-} from "./model-equivalence";
-import {
-	getBracketStrippedModelIdCandidates,
-	getLongestModelLikeIdSegment,
-	getModelLikeIdSegments,
-	stripBracketedModelIdAffixes,
-} from "./model-id-affixes";
-import { buildModelProviderPriorityRank } from "./model-provider-priority";
+	resolveCanonicalVariant,
+	resolveModelReference,
+} from "@oh-my-pi/pi-catalog/identity";
+import { isRecord, logger } from "@oh-my-pi/pi-utils";
+import { parseModelString, resolveProviderModelReference } from "../config/model-resolver";
+import type { AuthStorage, OAuthCredential } from "../session/auth-storage";
+import { type ApiKeyResolverOptions, createApiKeyResolver } from "./api-key-resolver";
+import type { ConfigError, ConfigFile } from "./config-file";
 import {
-	type ModelOverride,
-	type ModelsConfig,
-	ModelsConfigSchema,
-	type ProviderAuthMode,
-	type ProviderDiscovery,
-} from "./models-config-schema";
-import { type Settings, settings } from "./settings";
+	DISCOVERY_DEFAULT_MAX_TOKENS,
+	type DiscoveryContext,
+	type DiscoveryProviderConfig,
+	discoverModelsByProviderType,
+	getImplicitOllamaBaseUrl,
+	getOllamaContextLengthOverride,
+} from "./model-discovery";
+import { ModelsConfigFile, type ProviderValidationModel, validateProviderConfiguration } from "./models-config";
+import type { ModelOverride, ModelsConfig, ProviderAuthMode } from "./models-config-schema";
+import { settings } from "./settings";
 export type { CanonicalModelIndex, CanonicalModelRecord, CanonicalModelVariant, ModelEquivalenceConfig };
@@ -136,196 +78,13 @@ export function isAuthenticated(apiKey: string | undefined | null): apiKey is st
 	return Boolean(apiKey) && apiKey !== kNoAuth;
 }
-export type ModelRole = "default" | "smol" | "slow" | "vision" | "plan" | "designer" | "commit" | "task";
-export interface ModelRoleInfo {
-	tag?: string;
-	name: string;
-	color?: ThemeColor;
-}
-export const MODEL_ROLES: Record<ModelRole, ModelRoleInfo> = {
-	default: { tag: "DEFAULT", name: "Default", color: "success" },
-	smol: { tag: "SMOL", name: "Fast", color: "warning" },
-	slow: { tag: "SLOW", name: "Thinking", color: "accent" },
-	vision: { tag: "VISION", name: "Vision", color: "error" },
-	plan: { tag: "PLAN", name: "Architect", color: "muted" },
-	designer: { tag: "DESIGNER", name: "Designer", color: "muted" },
-	commit: { tag: "COMMIT", name: "Commit", color: "dim" },
-	task: { tag: "TASK", name: "Subtask", color: "muted" },
-};
-export const MODEL_ROLE_IDS: ModelRole[] = ["default", "smol", "slow", "vision", "plan", "designer", "commit", "task"];
-/** Alias for ModelRoleInfo - used for both built-in and custom roles */
-export type RoleInfo = ModelRoleInfo;
-/**
- * Return the canonical set of known roles for selector/carousel UI.
- *
- * Built-ins always come first. Configured cycle order, model assignments, and
- * tag metadata can introduce additional custom roles without requiring duplicate
- * entries across settings.
- */
-export function getKnownRoleIds(settings: Settings): string[] {
-	const roles = [...MODEL_ROLE_IDS] as string[];
-	const seen = new Set<string>(roles);
-	const addRole = (role: string) => {
-		if (seen.has(role)) return;
-		seen.add(role);
-		roles.push(role);
-	};
-	for (const role of settings.get("cycleOrder")) addRole(role);
-	for (const role of Object.keys(settings.getModelRoles())) addRole(role);
-	for (const role of Object.keys(settings.get("modelTags"))) addRole(role);
-	return roles;
-}
-/**
- * Get role info for a role name (built-in or custom).
- * Configured metadata overrides built-in defaults when present.
- */
-export function getRoleInfo(role: string, settings: Settings): RoleInfo {
-	const builtIn = role in MODEL_ROLES ? MODEL_ROLES[role as ModelRole] : undefined;
-	const configured = settings.get("modelTags")[role];
-	if (configured) {
-		return {
-			tag: builtIn?.tag,
-			name: configured.name || builtIn?.name || role,
-			color: configured.color && isValidThemeColor(configured.color) ? configured.color : builtIn?.color,
-		};
-	}
-	if (builtIn) return builtIn;
-	return { name: role, color: "muted" };
-}
-type ProviderValidationMode = "models-config" | "runtime-register";
-interface ProviderValidationModel {
-	id: string;
-	api?: Api;
-	contextWindow?: number;
-	maxTokens?: number;
-}
-interface ProviderValidationConfig {
-	baseUrl?: string;
-	headers?: Record<string, string>;
-	apiKey?: string;
-	api?: Api;
-	auth?: ProviderAuthMode;
-	oauthConfigured?: boolean;
-	discovery?: ProviderDiscovery;
-	compat?: Model<Api>["compat"];
-	disableStrictTools?: boolean;
-	modelOverrides?: Record<string, unknown>;
-	models: ProviderValidationModel[];
-}
-function validateProviderConfiguration(
-	providerName: string,
-	config: ProviderValidationConfig,
-	mode: ProviderValidationMode,
-): void {
-	const hasProviderApi = !!config.api;
-	const models = config.models;
-	if (models.length === 0) {
-		if (mode === "models-config") {
-			const hasModelOverrides = config.modelOverrides && Object.keys(config.modelOverrides).length > 0;
-			if (
-				!config.baseUrl &&
-				!config.headers &&
-				!config.compat &&
-				!config.apiKey &&
-				!config.disableStrictTools &&
-				!hasModelOverrides &&
-				!config.discovery
-			) {
-				throw new Error(
-					`Provider ${providerName}: must specify "baseUrl", "headers", "apiKey", "compat", "disableStrictTools", "modelOverrides", "discovery", or "models"`,
-				);
-			}
-		}
-	} else {
-		if (!config.baseUrl) {
-			throw new Error(`Provider ${providerName}: "baseUrl" is required when defining custom models.`);
-		}
-		const requiresAuth =
-			mode === "runtime-register"
-				? !config.apiKey && !config.oauthConfigured
-				: !config.apiKey && (config.auth ?? "apiKey") !== "none";
-		if (requiresAuth) {
-			throw new Error(
-				mode === "runtime-register"
-					? `Provider ${providerName}: "apiKey" or "oauth" is required when defining models.`
-					: `Provider ${providerName}: "apiKey" is required when defining custom models unless auth is "none".`,
-			);
-		}
-	}
-	if (mode === "models-config" && config.discovery && !config.api && config.discovery.type !== "proxy") {
-		throw new Error(`Provider ${providerName}: "api" is required when discovery is enabled at provider level.`);
-	}
-	for (const modelDef of models) {
-		if (!hasProviderApi && !modelDef.api) {
-			throw new Error(
-				mode === "runtime-register"
-					? `Provider ${providerName}, model ${modelDef.id}: no "api" specified.`
-					: `Provider ${providerName}, model ${modelDef.id}: no "api" specified. Set at provider or model level.`,
-			);
-		}
-		if (!modelDef.id) {
-			throw new Error(`Provider ${providerName}: model missing "id"`);
-		}
-		if (mode === "models-config") {
-			if (modelDef.contextWindow !== undefined && modelDef.contextWindow <= 0) {
-				throw new Error(`Provider ${providerName}, model ${modelDef.id}: invalid contextWindow`);
-			}
-			if (modelDef.maxTokens !== undefined && modelDef.maxTokens <= 0) {
-				throw new Error(`Provider ${providerName}, model ${modelDef.id}: invalid maxTokens`);
-			}
-		}
-	}
-}
-export const ModelsConfigFile = new ConfigFile<ModelsConfig>("models", ModelsConfigSchema).withValidation(
-	"models",
-	config => {
-		for (const [providerName, providerConfig] of Object.entries(config.providers ?? {})) {
-			validateProviderConfiguration(
-				providerName,
-				{
-					baseUrl: providerConfig.baseUrl,
-					headers: providerConfig.headers,
-					apiKey: providerConfig.apiKey,
-					api: providerConfig.api as Api | undefined,
-					auth: (providerConfig.auth ?? "apiKey") as ProviderAuthMode,
-					discovery: providerConfig.discovery as ProviderDiscovery | undefined,
-					compat: providerConfig.compat,
-					disableStrictTools: providerConfig.disableStrictTools,
-					modelOverrides: providerConfig.modelOverrides,
-					models: (providerConfig.models ?? []) as ProviderValidationModel[],
-				},
-				"models-config",
-			);
-		}
-	},
-);
 /** Provider override config (baseUrl, headers, apiKey, compat, transport) without custom models */
 interface ProviderOverride {
 	baseUrl?: string;
 	headers?: Record<string, string>;
 	apiKey?: string;
 	authHeader?: boolean;
-	compat?: Model<Api>["compat"];
+	compat?: ModelSpec<Api>["compat"];
 	transport?: Model<Api>["transport"];
 }
@@ -351,19 +110,21 @@ export function mergeDiscoveredModel<TApi extends Api>(
 	providerOverride?: Pick<ProviderOverride, "baseUrl" | "headers" | "transport">,
 ): Model<TApi> {
 	if (existing) {
-		return {
+		return buildModel({
 			...model,
 			baseUrl: providerOverride?.baseUrl ?? model.baseUrl ?? existing.baseUrl,
 			headers: existing.headers ? { ...existing.headers, ...model.headers } : model.headers,
-		};
+			compat: model.compatConfig,
+		} as ModelSpec<TApi>);
 	}
 	if (providerOverride) {
-		return {
+		return buildModel({
 			...model,
 			baseUrl: providerOverride.baseUrl ?? model.baseUrl,
 			headers: providerOverride.headers ? { ...model.headers, ...providerOverride.headers } : model.headers,
 			...(providerOverride.transport !== undefined ? { transport: providerOverride.transport } : {}),
-		};
+			compat: model.compatConfig,
+		} as ModelSpec<TApi>);
 	}
 	return model;
 }
@@ -378,7 +139,7 @@ function isAuthoritativeProjectCatalogModel(model: Model<Api>): boolean {
 	return (
 		model.provider === "google-vertex" &&
 		model.api === "openai-completions" &&
-		model.baseUrl.includes("/endpoints/openapi")
+		isVertexExpressOpenAIUrl(model.baseUrl)
 	);
 }
@@ -396,14 +157,32 @@ function dropProviderModels(models: readonly Model<Api>[], providers: ReadonlySe
 	return models.filter(model => !providers.has(model.provider));
 }
-interface DiscoveryProviderConfig {
-	provider: string;
-	api: Api;
-	baseUrl?: string;
-	headers?: Record<string, string>;
-	compat?: Model<Api>["compat"];
-	discovery: ProviderDiscovery;
-	optional?: boolean;
+/**
+ * Merge `incoming` entries into a copy of `base`, keyed by `provider`+`id`.
+ * Matches are replaced with `combine(existing, entry)`; new entries are
+ * appended as `combine(undefined, entry)`.
+ */
+function mergeByModelKey<T extends { provider: string; id: string }>(
+	base: readonly Model<Api>[],
+	incoming: readonly T[],
+	combine: (existing: Model<Api> | undefined, entry: T) => Model<Api>,
+): Model<Api>[] {
+	const merged = [...base];
+	const indexByKey = new Map<string, number>();
+	for (let i = 0; i < merged.length; i += 1) {
+		indexByKey.set(`${merged[i].provider}\u0000${merged[i].id}`, i);
+	}
+	for (const entry of incoming) {
+		const key = `${entry.provider}\u0000${entry.id}`;
+		const existingIndex = indexByKey.get(key);
+		if (existingIndex !== undefined) {
+			merged[existingIndex] = combine(merged[existingIndex], entry);
+		} else {
+			merged.push(combine(undefined, entry));
+			indexByKey.set(key, merged.length - 1);
+		}
+	}
+	return merged;
 }
 interface BuiltInDiscoveryResult {
@@ -428,6 +207,12 @@ export interface CanonicalModelQueryOptions {
 	candidates?: readonly Model<Api>[];
 }
+/** A canonical record (with query-filtered variants) plus the variant model selected for it. */
+export interface CanonicalModelSelection {
+	record: CanonicalModelRecord;
+	model: Model<Api>;
+}
 /** Result of loading custom models from models.json */
 interface CustomModelsResult {
 	models?: CustomModelOverlay[];
@@ -441,17 +226,6 @@ interface CustomModelsResult {
 	found: boolean;
 }
-type OllamaDiscoveredModelMetadata = {
-	reasoning: boolean;
-	input: ("text" | "image")[];
-	contextWindow?: number;
-};
-type LlamaCppDiscoveredServerMetadata = {
-	contextWindow?: number;
-	input?: ("text" | "image")[];
-};
 /**
  * Resolve an API key config value to an actual key.
  * Checks environment variable first, then treats as literal.
@@ -462,59 +236,6 @@ function resolveApiKeyConfig(keyConfig: string): string | undefined {
 	return keyConfig;
 }
-function toPositiveNumberOrUndefined(value: unknown): number | undefined {
-	if (typeof value === "number" && Number.isFinite(value) && value > 0) {
-		return value;
-	}
-	if (typeof value === "string" && value.trim()) {
-		const parsed = Number(value);
-		if (Number.isFinite(parsed) && parsed > 0) {
-			return parsed;
-		}
-	}
-	return undefined;
-}
-function extractOllamaContextWindow(payload: Record<string, unknown>): number | undefined {
-	const modelInfo = payload.model_info;
-	if (isRecord(modelInfo)) {
-		for (const [key, value] of Object.entries(modelInfo)) {
-			if (key === "context_length" || key.endsWith(".context_length")) {
-				const contextWindow = toPositiveNumberOrUndefined(value);
-				if (contextWindow !== undefined) {
-					return contextWindow;
-				}
-			}
-		}
-	}
-	const parameters = payload.parameters;
-	if (typeof parameters !== "string") {
-		return undefined;
-	}
-	const match = parameters.match(/(?:^|\n)\s*num_ctx\s+(\d+)\s*(?:$|\n)/m);
-	return match ? toPositiveNumberOrUndefined(match[1]) : undefined;
-}
-function extractLlamaCppContextWindow(payload: Record<string, unknown>): number | undefined {
-	const generationSettings = payload.default_generation_settings;
-	if (isRecord(generationSettings)) {
-		const contextWindow = toPositiveNumberOrUndefined(generationSettings.n_ctx);
-		if (contextWindow !== undefined) {
-			return contextWindow;
-		}
-	}
-	return toPositiveNumberOrUndefined(payload.n_ctx);
-}
-function extractLlamaCppInputCapabilities(payload: Record<string, unknown>): ("text" | "image")[] | undefined {
-	const modalities = payload.modalities;
-	if (!isRecord(modalities)) {
-		return undefined;
-	}
-	return modalities.vision === true ? ["text", "image"] : ["text"];
-}
 function extractGoogleOAuthToken(value: string | undefined): string | undefined {
 	if (!isAuthenticated(value)) return undefined;
 	try {
@@ -573,73 +294,99 @@ function mergeCompat<TBase extends object, TOverride extends object>(
 	return merged as TBase & TOverride;
 }
-function applyModelOverride(model: Model<Api>, override: ModelOverride): Model<Api> {
-	const result = { ...model };
-	if (override.name !== undefined) result.name = override.name;
-	if (override.reasoning !== undefined) result.reasoning = override.reasoning;
-	if (override.thinking !== undefined) result.thinking = override.thinking as ThinkingConfig;
-	if (override.input !== undefined) result.input = override.input as ("text" | "image")[];
-	if (override.contextWindow !== undefined) result.contextWindow = override.contextWindow;
-	if (override.maxTokens !== undefined) result.maxTokens = override.maxTokens;
-	if (override.omitMaxOutputTokens !== undefined) result.omitMaxOutputTokens = override.omitMaxOutputTokens;
-	if (override.contextPromotionTarget !== undefined) result.contextPromotionTarget = override.contextPromotionTarget;
-	if (override.premiumMultiplier !== undefined) result.premiumMultiplier = override.premiumMultiplier;
-	if (override.cost) {
-		result.cost = {
-			input: override.cost.input ?? model.cost.input,
-			output: override.cost.output ?? model.cost.output,
-			cacheRead: override.cost.cacheRead ?? model.cost.cacheRead,
-			cacheWrite: override.cost.cacheWrite ?? model.cost.cacheWrite,
-		};
-	}
-	if (override.headers) {
-		result.headers = { ...model.headers, ...override.headers };
-	}
-	result.compat = mergeCompat(model.compat, override.compat);
-	return enrichModelThinking(result);
+/**
+ * Project a built model back to spec shape for the model-manager/cache
+ * boundary: sparse compat comes from `compatConfig`, never from the resolved
+ * record.
+ */
+function toModelSpec<TApi extends Api>(model: Model<TApi>): ModelSpec<TApi> {
+	return { ...model, compat: model.compatConfig } as ModelSpec<TApi>;
 }
-interface CustomModelDefinitionLike {
-	id: string;
+/**
+ * The patchable subset of `Model` fields shared by `modelOverrides` entries,
+ * custom model definitions, and parsed custom-model overlays. `undefined`
+ * always means "leave the base value alone".
+ */
+interface ModelPatch {
 	name?: string;
-	api?: Api;
-	baseUrl?: string;
 	reasoning?: boolean;
 	thinking?: ThinkingConfig;
 	input?: ("text" | "image")[];
-	cost?: { input: number; output: number; cacheRead: number; cacheWrite: number };
+	cost?: Partial<Model<Api>["cost"]>;
 	contextWindow?: number;
 	maxTokens?: number;
 	omitMaxOutputTokens?: boolean;
 	headers?: Record<string, string>;
-	compat?: Model<Api>["compat"];
+	compat?: ModelSpec<Api>["compat"];
 	contextPromotionTarget?: string;
 	premiumMultiplier?: number;
 }
+/**
+ * How a patch treats the base model's transport metadata (headers/compat):
+ * - `merge`: fold the patch into the base's (modelOverrides semantics).
+ * - `replace`: the patch owns transport wholesale — same-id custom definitions
+ *   already folded provider-level headers/compat in during parsing, so bundled
+ *   transport metadata must not be re-merged (see `#mergeCustomModels`).
+ */
+type ModelTransportPolicy = "merge" | "replace";
+function applyModelPatch(base: Model<Api>, patch: ModelPatch, transport: ModelTransportPolicy): Model<Api> {
+	const result = { ...base };
+	if (patch.name !== undefined) result.name = patch.name;
+	if (patch.reasoning !== undefined) result.reasoning = patch.reasoning;
+	if (patch.thinking !== undefined) result.thinking = patch.thinking;
+	if (patch.input !== undefined) result.input = patch.input;
+	if (patch.contextWindow !== undefined) result.contextWindow = patch.contextWindow;
+	if (patch.maxTokens !== undefined) result.maxTokens = patch.maxTokens;
+	if (patch.omitMaxOutputTokens !== undefined) result.omitMaxOutputTokens = patch.omitMaxOutputTokens;
+	if (patch.contextPromotionTarget !== undefined) result.contextPromotionTarget = patch.contextPromotionTarget;
+	if (patch.premiumMultiplier !== undefined) result.premiumMultiplier = patch.premiumMultiplier;
+	if (patch.cost) {
+		result.cost = {
+			input: patch.cost.input ?? base.cost.input,
+			output: patch.cost.output ?? base.cost.output,
+			cacheRead: patch.cost.cacheRead ?? base.cost.cacheRead,
+			cacheWrite: patch.cost.cacheWrite ?? base.cost.cacheWrite,
+		};
+	}
+	let compat: ModelSpec<Api>["compat"];
+	if (transport === "merge") {
+		if (patch.headers) {
+			result.headers = { ...base.headers, ...patch.headers };
+		}
+		compat = mergeCompat(base.compatConfig, patch.compat);
+	} else {
+		result.headers = patch.headers;
+		compat = patch.compat;
+	}
+	return buildModel({ ...result, compat } as ModelSpec<Api>);
+}
+function applyModelOverride(model: Model<Api>, override: ModelOverride): Model<Api> {
+	return applyModelPatch(model, override as ModelPatch, "merge");
+}
+interface CustomModelDefinitionLike extends ModelPatch {
+	id: string;
+	api?: Api;
+	baseUrl?: string;
+	cost?: Model<Api>["cost"];
+}
 interface CustomModelBuildOptions {
 	useDefaults: boolean;
 }
-type CustomModelOverlay = {
+interface CustomModelOverlay extends ModelPatch {
 	id: string;
 	provider: string;
 	api: Api;
 	baseUrl: string;
-	name?: string;
-	reasoning?: boolean;
-	thinking?: ThinkingConfig;
-	input?: ("text" | "image")[];
-	cost?: { input: number; output: number; cacheRead: number; cacheWrite: number };
-	contextWindow?: number;
-	maxTokens?: number;
-	omitMaxOutputTokens?: boolean;
-	headers?: Record<string, string>;
-	compat?: Model<Api>["compat"];
-	contextPromotionTarget?: string;
-	premiumMultiplier?: number;
+	cost?: Model<Api>["cost"];
 	isOAuth?: boolean;
-};
+}
 function mergeCustomModelHeaders(
 	providerHeaders: Record<string, string> | undefined,
@@ -686,7 +433,7 @@ function buildCustomModelOverlay(
 	providerHeaders: Record<string, string> | undefined,
 	providerApiKey: string | undefined,
 	authHeader: boolean | undefined,
-	providerCompat: Model<Api>["compat"] | undefined,
+	providerCompat: ModelSpec<Api>["compat"] | undefined,
 	providerAuth: ProviderAuthMode | undefined,
 	modelDef: CustomModelDefinitionLike,
 ): CustomModelOverlay | undefined {
@@ -699,8 +446,8 @@ function buildCustomModelOverlay(
 		baseUrl: modelDef.baseUrl ?? providerBaseUrl,
 		name: modelDef.name,
 		reasoning: modelDef.reasoning,
-		thinking: modelDef.thinking as ThinkingConfig | undefined,
-		input: modelDef.input as ("text" | "image")[] | undefined,
+		thinking: modelDef.thinking,
+		input: modelDef.input,
 		cost: modelDef.cost,
 		contextWindow: modelDef.contextWindow,
 		maxTokens: modelDef.maxTokens,
@@ -713,125 +460,6 @@ function buildCustomModelOverlay(
 	};
 }
-// Custom provider entries often front a known upstream model through a local proxy.
-// Use bundled metadata for missing pricing/capability fields, but keep the custom transport.
-function shouldReplaceCustomReference(existing: Model<Api> | undefined, candidate: Model<Api>): boolean {
-	if (!existing) return true;
-	if (candidate.contextWindow !== existing.contextWindow) {
-		return candidate.contextWindow > existing.contextWindow;
-	}
-	if (candidate.maxTokens !== existing.maxTokens) {
-		return candidate.maxTokens > existing.maxTokens;
-	}
-	const existingHasCachePricing = existing.cost.cacheRead > 0 || existing.cost.cacheWrite > 0;
-	const candidateHasCachePricing = candidate.cost.cacheRead > 0 || candidate.cost.cacheWrite > 0;
-	if (candidateHasCachePricing !== existingHasCachePricing) {
-		return candidateHasCachePricing;
-	}
-	return existing.provider !== "openai" && candidate.provider === "openai";
-}
-function normalizeCustomReferenceKey(value: string): string {
-	return value.trim().toLowerCase();
-}
-function buildCustomReferenceMap(): Map<string, Model<Api>> {
-	const references = new Map<string, Model<Api>>();
-	for (const provider of getBundledProviders()) {
-		for (const model of getBundledModels(provider as Parameters<typeof getBundledModels>[0])) {
-			const candidate = model as Model<Api>;
-			const key = normalizeCustomReferenceKey(candidate.id);
-			if (shouldReplaceCustomReference(references.get(key), candidate)) {
-				references.set(key, candidate);
-			}
-		}
-	}
-	return references;
-}
-function buildCustomReferenceSuffixAliasMap(exactReferences: ReadonlyMap<string, Model<Api>>): Map<string, Model<Api>> {
-	const aliases = new Map<string, Model<Api>>();
-	for (const reference of exactReferences.values()) {
-		const slashIndex = reference.id.lastIndexOf("/");
-		if (slashIndex === -1) {
-			continue;
-		}
-		const suffix = reference.id.slice(slashIndex + 1);
-		const alias = getLongestModelLikeIdSegment(suffix);
-		if (!alias) {
-			continue;
-		}
-		if (shouldReplaceCustomReference(aliases.get(alias), reference)) {
-			aliases.set(alias, reference);
-		}
-	}
-	return aliases;
-}
-const customReferenceMap = buildCustomReferenceMap();
-const customReferenceSuffixAliasMap = buildCustomReferenceSuffixAliasMap(customReferenceMap);
-const CUSTOM_REFERENCE_TRAILING_MARKER_PATTERN =
-	/[-:](?:thinking|customtools|high|low|medium|minimal|xhigh|free|cloud|exacto|nitro|original|optimized|nvfp4|fp8|fp4|bf16|int8|int4|search)$/i;
-function stripCustomReferenceTrailingMarker(candidate: string): string | undefined {
-	const match = CUSTOM_REFERENCE_TRAILING_MARKER_PATTERN.exec(candidate);
-	return match ? candidate.slice(0, match.index) : undefined;
-}
-function getCustomReferenceCandidateIds(modelId: string): string[] {
-	const candidates = new Set<string>();
-	const queue = [modelId];
-	for (let index = 0; index < queue.length; index += 1) {
-		const candidate = queue[index]?.trim();
-		if (!candidate || candidates.has(candidate)) continue;
-		candidates.add(candidate);
-		for (const stripped of getBracketStrippedModelIdCandidates(candidate)) {
-			queue.push(stripped);
-		}
-		for (const segment of getModelLikeIdSegments(candidate)) {
-			queue.push(segment);
-		}
-		for (const suffix of [":cloud", "-cloud"] as const) {
-			if (candidate.toLowerCase().endsWith(suffix)) {
-				queue.push(candidate.slice(0, -suffix.length));
-			}
-		}
-		const slashIndex = candidate.lastIndexOf("/");
-		if (slashIndex !== -1) {
-			queue.push(candidate.slice(slashIndex + 1));
-		}
-		const colonToDash = candidate.replace(/:/g, "-");
-		if (colonToDash !== candidate) {
-			queue.push(colonToDash);
-		}
-		const lowercased = candidate.toLowerCase();
-		if (lowercased !== candidate) {
-			queue.push(lowercased);
-		}
-		const strippedMarker = stripCustomReferenceTrailingMarker(candidate);
-		if (strippedMarker) {
-			queue.push(strippedMarker);
-		}
-	}
-	return [...candidates];
-}
-function resolveCustomModelReference(modelId: string): Model<Api> | undefined {
-	for (const candidate of getCustomReferenceCandidateIds(modelId)) {
-		const key = normalizeCustomReferenceKey(candidate);
-		const reference = customReferenceMap.get(key) ?? customReferenceSuffixAliasMap.get(key);
-		if (reference) return reference;
-	}
-	return undefined;
-}
 function applyStandaloneCustomModelPolicies(model: CustomModelOverlay): CustomModelOverlay {
 	if (model.id !== "gpt-5.4" || model.provider === "github-copilot" || model.contextWindow !== undefined) {
 		return model;
@@ -841,13 +469,15 @@ function applyStandaloneCustomModelPolicies(model: CustomModelOverlay): CustomMo
 function finalizeCustomModel(model: CustomModelOverlay, options: CustomModelBuildOptions): Model<Api> {
 	const resolvedModel = options.useDefaults ? applyStandaloneCustomModelPolicies(model) : model;
-	const reference = options.useDefaults ? resolveCustomModelReference(resolvedModel.id) : undefined;
+	const reference = options.useDefaults
+		? resolveModelReference(resolvedModel.id, getBundledModelReferenceIndex())
+		: undefined;
 	const cost =
 		resolvedModel.cost ??
 		reference?.cost ??
 		(options.useDefaults ? { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 } : undefined);
 	const input = resolvedModel.input ?? reference?.input ?? (options.useDefaults ? ["text"] : undefined);
-	return enrichModelThinking({
+	return buildModel({
 		id: resolvedModel.id,
 		name: resolvedModel.name ?? (options.useDefaults ? resolvedModel.id : undefined),
 		api: resolvedModel.api,
@@ -862,11 +492,11 @@ function finalizeCustomModel(model: CustomModelOverlay, options: CustomModelBuil
 		maxTokens: resolvedModel.maxTokens ?? reference?.maxTokens ?? (options.useDefaults ? 16384 : undefined),
 		headers: resolvedModel.headers,
 		omitMaxOutputTokens: resolvedModel.omitMaxOutputTokens ?? reference?.omitMaxOutputTokens,
-		compat: mergeCompat(reference?.compat, resolvedModel.compat),
+		compat: mergeCompat(reference?.compatConfig, resolvedModel.compat),
 		contextPromotionTarget: resolvedModel.contextPromotionTarget,
 		premiumMultiplier: resolvedModel.premiumMultiplier,
 		isOAuth: resolvedModel.isOAuth,
-	} as Model<Api>);
+	} as ModelSpec<Api>);
 }
 function normalizeSuppressedSelector(selector: string): string {
@@ -1127,84 +757,46 @@ export class ModelRegistry {
 			return models.map(m => {
 				if (!providerOverride) return m;
 				const withTransportOverride = this.#applyProviderTransportOverride(m, providerOverride);
-				return {
+				return buildModel({
 					...withTransportOverride,
-					compat: mergeCompat(m.compat, providerOverride.compat),
-				};
+					compat: mergeCompat(m.compatConfig, providerOverride.compat),
+				} as ModelSpec<Api>);
 			});
 		});
 	}
 	#mergeResolvedModels(baseModels: Model<Api>[], replacementModels: Model<Api>[]): Model<Api>[] {
-		const merged = [...baseModels];
-		const indexByKey = new Map<string, number>();
-		for (let i = 0; i < merged.length; i += 1) {
-			const m = merged[i];
-			indexByKey.set(`${m.provider}\u0000${m.id}`, i);
-		}
-		for (const replacementModel of replacementModels) {
-			const key = `${replacementModel.provider}\u0000${replacementModel.id}`;
-			const existingIndex = indexByKey.get(key);
-			if (existingIndex !== undefined) {
-				const existing = merged[existingIndex];
-				merged[existingIndex] = {
-					...replacementModel,
-					contextWindow:
-						replacementModel.contextWindow === UNK_CONTEXT_WINDOW
-							? existing.contextWindow
-							: replacementModel.contextWindow,
-					maxTokens:
-						replacementModel.maxTokens === UNK_MAX_TOKENS ? existing.maxTokens : replacementModel.maxTokens,
-				};
-			} else {
-				merged.push(replacementModel);
-				indexByKey.set(key, merged.length - 1);
-			}
-		}
-		return merged;
+		return mergeByModelKey(baseModels, replacementModels, (existing, replacementModel) => {
+			if (!existing) return replacementModel;
+			return {
+				...replacementModel,
+				contextWindow:
+					replacementModel.contextWindow === UNK_CONTEXT_WINDOW
+						? existing.contextWindow
+						: replacementModel.contextWindow,
+				maxTokens: replacementModel.maxTokens === UNK_MAX_TOKENS ? existing.maxTokens : replacementModel.maxTokens,
+			};
+		});
 	}
 	/** Merge custom models with built-in, replacing by provider+id match */
 	#mergeCustomModels(builtInModels: Model<Api>[], customModels: CustomModelOverlay[]): Model<Api>[] {
-		const merged = [...builtInModels];
-		const indexByKey = new Map<string, number>();
-		for (let i = 0; i < merged.length; i += 1) {
-			const m = merged[i];
-			indexByKey.set(`${m.provider}\u0000${m.id}`, i);
-		}
-		for (const customModel of customModels) {
-			const key = `${customModel.provider}\u0000${customModel.id}`;
-			const existingIndex = indexByKey.get(key);
-			if (existingIndex !== undefined) {
-				const existingModel = merged[existingIndex];
-				merged[existingIndex] = enrichModelThinking({
+		return mergeByModelKey(builtInModels, customModels, (existingModel, customModel) => {
+			if (!existingModel) return finalizeCustomModel(customModel, { useDefaults: true });
+			// Same-id custom definitions replace bundled transport behavior, so the
+			// patch is applied with the `replace` transport policy.
+			return applyModelPatch(
+				{
 					...existingModel,
 					id: customModel.id,
 					provider: customModel.provider,
 					api: customModel.api,
 					baseUrl: customModel.baseUrl,
-					name: customModel.name ?? existingModel.name,
-					reasoning: customModel.reasoning ?? existingModel.reasoning,
-					thinking: customModel.thinking ?? existingModel.thinking,
-					input: customModel.input ?? existingModel.input,
-					cost: customModel.cost ?? existingModel.cost,
-					contextWindow: customModel.contextWindow ?? existingModel.contextWindow,
-					maxTokens: customModel.maxTokens ?? existingModel.maxTokens,
-					omitMaxOutputTokens: customModel.omitMaxOutputTokens ?? existingModel.omitMaxOutputTokens,
-					// Same-id custom definitions replace bundled transport behavior. Provider-level
-					// headers/compat were already folded into customModel during parsing; do not
-					// re-merge bundled transport metadata here.
-					headers: customModel.headers,
-					compat: customModel.compat,
-					contextPromotionTarget: customModel.contextPromotionTarget ?? existingModel.contextPromotionTarget,
-					premiumMultiplier: customModel.premiumMultiplier ?? existingModel.premiumMultiplier,
-				} as Model<Api>);
-			} else {
-				merged.push(finalizeCustomModel(customModel, { useDefaults: true }));
-				indexByKey.set(key, merged.length - 1);
-			}
-		}
-		return merged;
+				},
+				customModel,
+				"replace",
+			);
+		});
 	}
 	#loadCachedStandardProviderModels(): { models: Model<Api>[]; authoritativeFreshProviders: Set<string> } {
@@ -1230,8 +822,13 @@ export class ModelRegistry {
 				? models.map(model => this.#applyProviderTransportOverride(model, providerOverride))
 				: models;
 			const withCompat = providerOverride?.compat
-				? withTransport.map(model => ({ ...model, compat: mergeCompat(model.compat, providerOverride.compat) }))
-				: withTransport;
+				? withTransport.map(model =>
+						buildModel({
+							...model,
+							compat: mergeCompat(model.compat, providerOverride.compat),
+						} as ModelSpec<Api>),
+					)
+				: withTransport.map(model => buildModel(model));
 			cachedModels.push(...this.#applyProviderModelOverrides(providerId, withCompat));
 		}
 		return { models: cachedModels, authoritativeFreshProviders };
@@ -1255,7 +852,10 @@ export class ModelRegistry {
 				providerConfig.provider,
 				this.#normalizeDiscoverableModels(
 					providerConfig,
-					this.#applyProviderCompat(providerConfig.compat, cache.models),
+					this.#applyProviderCompat(
+						providerConfig.compat,
+						cache.models.map(model => buildModel(model)),
+					),
 				),
 			);
 			cachedModels.push(...models);
@@ -1271,9 +871,11 @@ export class ModelRegistry {
 		return cachedModels;
 	}
-	#applyProviderCompat(compat: Model<Api>["compat"] | undefined, models: Model<Api>[]): Model<Api>[] {
+	#applyProviderCompat(compat: ModelSpec<Api>["compat"] | undefined, models: Model<Api>[]): Model<Api>[] {
 		if (!compat) return models;
-		return models.map(model => ({ ...model, compat: mergeCompat(model.compat, compat) }));
+		return models.map(model =>
+			buildModel({ ...model, compat: mergeCompat(model.compatConfig, compat) } as ModelSpec<Api>),
+		);
 	}
 	#normalizeDiscoverableModels(providerConfig: DiscoveryProviderConfig, models: Model<Api>[]): Model<Api>[] {
@@ -1283,7 +885,14 @@ export class ModelRegistry {
 		const contextLengthOverride = getOllamaContextLengthOverride();
 		return models.map(model => {
-			const normalized = model.api === "openai-completions" ? { ...model, api: "openai-responses" as const } : model;
+			const normalized =
+				model.api === "openai-completions"
+					? buildModel({
+							...model,
+							api: "openai-responses" as const,
+							compat: model.compatConfig,
+						} as ModelSpec<Api>)
+					: model;
 			if (contextLengthOverride === undefined) {
 				return normalized;
 			}
@@ -1506,17 +1115,20 @@ export class ModelRegistry {
 					models: cached?.models.map(model => model.id) ?? [],
 				});
 				this.#lastDiscoveryWarnings.delete(providerConfig.provider);
-				return cached?.models ?? [];
+				return cached ? cached.models.map(model => buildModel(model)) : [];
 			}
 		}
 		const providerId = providerConfig.provider;
 		let discoveryError: string | undefined;
-		const fetchDynamicModels = async (): Promise<readonly Model<Api>[] | null> => {
+		const fetchDynamicModels = async (): Promise<readonly ModelSpec<Api>[] | null> => {
 			try {
-				const models = await this.#discoverModelsByProviderType(providerConfig);
+				const models = this.#applyProviderModelOverrides(
+					providerId,
+					await discoverModelsByProviderType(providerConfig, this.#discoveryContext()),
+				);
 				this.#lastDiscoveryWarnings.delete(providerId);
-				return models;
+				return models.map(toModelSpec);
 			} catch (error) {
 				discoveryError = error instanceof Error ? error.message : String(error);
 				return null;
@@ -1563,18 +1175,14 @@ export class ModelRegistry {
 		);
 	}
-	#discoverModelsByProviderType(providerConfig: DiscoveryProviderConfig): Promise<Model<Api>[]> {
-		switch (providerConfig.discovery.type) {
-			case "ollama":
-				return this.#discoverOllamaModels(providerConfig);
-			case "llama.cpp":
-				return this.#discoverLlamaCppModels(providerConfig);
-			case "lm-studio":
-			case "openai-models-list":
-				return this.#discoverOpenAIModelsList(providerConfig);
-			case "proxy":
-				return this.#discoverProxyModels(providerConfig);
-		}
+	#discoveryContext(): DiscoveryContext {
+		return {
+			fetch: this.#fetch,
+			getBearerApiKey: async provider => {
+				const apiKey = await this.authStorage.getApiKey(provider);
+				return apiKey && apiKey !== DEFAULT_LOCAL_TOKEN && apiKey !== kNoAuth ? apiKey : undefined;
+			},
+		};
 	}
 	#warnProviderDiscoveryFailure(providerConfig: DiscoveryProviderConfig, error: string): void {
@@ -1726,361 +1334,6 @@ export class ModelRegistry {
 		}
 	}
-	async #discoverOllamaModelMetadata(
-		endpoint: string,
-		modelId: string,
-		headers: Record<string, string> | undefined,
-	): Promise<OllamaDiscoveredModelMetadata | null> {
-		const showUrl = `${endpoint}/api/show`;
-		try {
-			const response = await this.#fetch(showUrl, {
-				method: "POST",
-				headers: { ...(headers ?? {}), "Content-Type": "application/json" },
-				body: JSON.stringify({ model: modelId }),
-				signal: AbortSignal.timeout(150),
-			});
-			if (!response.ok) {
-				return null;
-			}
-			const payload = (await response.json()) as unknown;
-			if (!isRecord(payload)) {
-				return null;
-			}
-			const contextWindow = extractOllamaContextWindow(payload);
-			const capabilities = payload.capabilities;
-			if (Array.isArray(capabilities)) {
-				const normalized = new Set(
-					capabilities.flatMap(capability => (typeof capability === "string" ? [capability.toLowerCase()] : [])),
-				);
-				const supportsVision = normalized.has("vision") || normalized.has("image");
-				return {
-					reasoning: normalized.has("thinking"),
-					input: supportsVision ? ["text", "image"] : ["text"],
-					contextWindow,
-				};
-			}
-			if (!isRecord(capabilities)) {
-				return {
-					reasoning: false,
-					input: ["text"],
-					contextWindow,
-				};
-			}
-			const supportsVision = capabilities.vision === true || capabilities.image === true;
-			return {
-				reasoning: capabilities.thinking === true,
-				input: supportsVision ? ["text", "image"] : ["text"],
-				contextWindow,
-			};
-		} catch {
-			return null;
-		}
-	}
-	async #discoverOllamaModels(providerConfig: DiscoveryProviderConfig): Promise<Model<Api>[]> {
-		const endpoint = this.#normalizeOllamaBaseUrl(providerConfig.baseUrl);
-		const tagsUrl = `${endpoint}/api/tags`;
-		const headers = { ...(providerConfig.headers ?? {}) };
-		const response = await this.#fetch(tagsUrl, {
-			headers,
-			signal: AbortSignal.timeout(250),
-		});
-		if (!response.ok) {
-			throw new Error(`HTTP ${response.status} from ${tagsUrl}`);
-		}
-		const payload = (await response.json()) as { models?: Array<{ name?: string; model?: string }> };
-		const entries = (payload.models ?? []).flatMap(item => {
-			const id = item.model || item.name;
-			return id ? [{ id, name: item.name || id }] : [];
-		});
-		const metadataById = new Map(
-			await Promise.all(
-				entries.map(
-					async entry => [entry.id, await this.#discoverOllamaModelMetadata(endpoint, entry.id, headers)] as const,
-				),
-			),
-		);
-		const discovered = entries.map(entry => {
-			const metadata = metadataById.get(entry.id);
-			return enrichModelThinking({
-				id: entry.id,
-				name: entry.name,
-				api: providerConfig.api,
-				provider: providerConfig.provider,
-				baseUrl: `${endpoint}/v1`,
-				reasoning: metadata?.reasoning ?? false,
-				input: metadata?.input ?? ["text"],
-				cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
-				contextWindow: metadata?.contextWindow ?? 128000,
-				maxTokens: Math.min(metadata?.contextWindow ?? Number.POSITIVE_INFINITY, DISCOVERY_DEFAULT_MAX_TOKENS),
-				headers: providerConfig.headers,
-			});
-		});
-		return this.#applyProviderModelOverrides(providerConfig.provider, discovered);
-	}
-	async #discoverLlamaCppServerMetadata(
-		baseUrl: string,
-		headers: Record<string, string> | undefined,
-	): Promise<LlamaCppDiscoveredServerMetadata | null> {
-		const propsUrl = `${this.#toLlamaCppNativeBaseUrl(baseUrl)}/props`;
-		try {
-			const response = await this.#fetch(propsUrl, {
-				headers,
-				signal: AbortSignal.timeout(150),
-			});
-			if (!response.ok) {
-				return null;
-			}
-			const payload = (await response.json()) as unknown;
-			if (!isRecord(payload)) {
-				return null;
-			}
-			return {
-				contextWindow: extractLlamaCppContextWindow(payload),
-				input: extractLlamaCppInputCapabilities(payload),
-			};
-		} catch {
-			return null;
-		}
-	}
-	async #discoverLlamaCppModels(providerConfig: DiscoveryProviderConfig): Promise<Model<Api>[]> {
-		const baseUrl = this.#normalizeLlamaCppBaseUrl(providerConfig.baseUrl);
-		const modelsUrl = `${baseUrl}/models`;
-		const headers: Record<string, string> = { ...(providerConfig.headers ?? {}) };
-		const apiKey = await this.authStorage.getApiKey(providerConfig.provider);
-		if (apiKey && apiKey !== DEFAULT_LOCAL_TOKEN && apiKey !== kNoAuth) {
-			headers.Authorization = `Bearer ${apiKey}`;
-		}
-		const [response, serverMetadata] = await Promise.all([
-			this.#fetch(modelsUrl, {
-				headers,
-				signal: AbortSignal.timeout(250),
-			}),
-			this.#discoverLlamaCppServerMetadata(baseUrl, headers),
-		]);
-		if (!response.ok) {
-			throw new Error(`HTTP ${response.status} from ${modelsUrl}`);
-		}
-		const payload = (await response.json()) as { data?: Array<{ id: string }> };
-		const models = payload.data ?? [];
-		const discovered: Model<Api>[] = [];
-		for (const item of models) {
-			const id = item.id;
-			if (!id) continue;
-			discovered.push(
-				enrichModelThinking({
-					id,
-					name: id,
-					api: providerConfig.api,
-					provider: providerConfig.provider,
-					baseUrl,
-					reasoning: false,
-					input: serverMetadata?.input ?? ["text"],
-					cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
-					contextWindow: serverMetadata?.contextWindow ?? 128000,
-					maxTokens: Math.min(
-						serverMetadata?.contextWindow ?? Number.POSITIVE_INFINITY,
-						DISCOVERY_DEFAULT_MAX_TOKENS,
-					),
-					headers,
-					compat: {
-						supportsStore: false,
-						supportsDeveloperRole: false,
-						supportsReasoningEffort: false,
-					},
-				}),
-			);
-		}
-		return this.#applyProviderModelOverrides(providerConfig.provider, discovered);
-	}
-	async #discoverOpenAIModelsList(providerConfig: DiscoveryProviderConfig): Promise<Model<Api>[]> {
-		const baseUrl = this.#normalizeOpenAIModelsListBaseUrl(providerConfig.baseUrl);
-		const modelsUrl = `${baseUrl}/models`;
-		const headers: Record<string, string> = { ...(providerConfig.headers ?? {}) };
-		const apiKey = await this.authStorage.getApiKey(providerConfig.provider);
-		if (apiKey && apiKey !== DEFAULT_LOCAL_TOKEN && apiKey !== kNoAuth) {
-			headers.Authorization = `Bearer ${apiKey}`;
-		}
-		const response = await this.#fetch(modelsUrl, {
-			headers,
-			signal: AbortSignal.timeout(10_000),
-		});
-		if (!response.ok) {
-			throw new Error(`HTTP ${response.status} from ${modelsUrl}`);
-		}
-		const payload = (await response.json()) as { data?: Array<{ id: string }> };
-		const models = payload.data ?? [];
-		const discovered: Model<Api>[] = [];
-		for (const item of models) {
-			const id = item.id;
-			if (!id) continue;
-			discovered.push(
-				enrichModelThinking({
-					id,
-					name: id,
-					api: providerConfig.api,
-					provider: providerConfig.provider,
-					baseUrl,
-					reasoning: false,
-					input: ["text"],
-					cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
-					contextWindow: 128000,
-					maxTokens: discoveryDefaultMaxTokens(providerConfig.api),
-					headers,
-					compat: {
-						supportsStore: false,
-						supportsDeveloperRole: false,
-						supportsReasoningEffort: false,
-					},
-				}),
-			);
-		}
-		return this.#applyProviderModelOverrides(providerConfig.provider, discovered);
-	}
-	/**
-	 * Discover models from an Anthropic+OpenAI-compatible reseller proxy that
-	 * exposes both `/v1/messages` and `/v1/chat/completions`, advertising each
-	 * model's wire capabilities through `supported_endpoint_types` on
-	 * `GET /v1/models` (new-api / one-api-style proxies).
-	 *
-	 * Routing per model:
-	 *   supported_endpoint_types: ["anthropic", ...] -> api: "anthropic-messages"
-	 *   supported_endpoint_types: ["openai"]         -> api: "openai-completions"
-	 *   missing / neither                            -> provider-level api fallback
-	 *
-	 * Anthropic models share the same baseUrl; the Anthropic SDK strips a
-	 * trailing `/v1` itself before appending `/v1/messages`, so the discovery
-	 * URL (which ends in `/v1`) round-trips correctly.
-	 */
-	async #discoverProxyModels(providerConfig: DiscoveryProviderConfig): Promise<Model<Api>[]> {
-		const baseUrl = this.#normalizeOpenAIModelsListBaseUrl(providerConfig.baseUrl);
-		const modelsUrl = `${baseUrl}/models`;
-		const headers: Record<string, string> = { ...(providerConfig.headers ?? {}) };
-		const apiKey = await this.authStorage.getApiKey(providerConfig.provider);
-		if (apiKey && apiKey !== DEFAULT_LOCAL_TOKEN && apiKey !== kNoAuth) {
-			headers.Authorization = `Bearer ${apiKey}`;
-		}
-		const response = await this.#fetch(modelsUrl, {
-			headers,
-			signal: AbortSignal.timeout(10_000),
-		});
-		if (!response.ok) {
-			throw new Error(`HTTP ${response.status} from ${modelsUrl}`);
-		}
-		const payload = (await response.json()) as {
-			data?: Array<{ id?: string; name?: string; supported_endpoint_types?: string[] }>;
-		};
-		const items = payload.data ?? [];
-		const discovered: Model<Api>[] = [];
-		for (const item of items) {
-			const id = item.id;
-			if (!id) continue;
-			const endpoints = item.supported_endpoint_types ?? [];
-			const api: Api | undefined = endpoints.includes("anthropic")
-				? "anthropic-messages"
-				: endpoints.includes("openai")
-					? "openai-completions"
-					: providerConfig.api;
-			if (!api) continue;
-			const isAnthropic = api === "anthropic-messages";
-			const reference = resolveCustomModelReference(id);
-			const discoveryName = typeof item.name === "string" ? item.name.trim() : "";
-			const displayName =
-				reference?.name ??
-				(discoveryName && discoveryName !== id ? discoveryName : undefined) ??
-				stripBracketedModelIdAffixes(id) ??
-				id;
-			discovered.push(
-				enrichModelThinking({
-					id,
-					name: displayName,
-					api,
-					provider: providerConfig.provider,
-					baseUrl,
-					reasoning: reference?.reasoning ?? false,
-					thinking: reference?.thinking,
-					input: reference?.input ?? ["text"],
-					// Proxy pricing is provider-specific and usually does not match
-					// upstream bundled catalogs, so keep costs local-unknown even when
-					// we successfully recover the upstream model identity.
-					cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
-					contextWindow: reference?.contextWindow ?? 128000,
-					maxTokens: reference?.maxTokens ?? discoveryDefaultMaxTokens(api),
-					headers,
-					// OpenAI-compat fields are no-ops on anthropic models; the
-					// Anthropic SDK ignores them. Provider-level disableStrictTools
-					// flows in via #applyProviderCompat for the third-party-Anthropic
-					// path. Cross-wire bundled compat is intentionally not copied:
-					// request-shaping fields are provider-wire specific.
-					compat: isAnthropic
-						? undefined
-						: {
-								supportsStore: false,
-								supportsDeveloperRole: false,
-								supportsReasoningEffort: false,
-							},
-				}),
-			);
-		}
-		return this.#applyProviderModelOverrides(providerConfig.provider, discovered);
-	}
-	#normalizeLlamaCppBaseUrl(baseUrl?: string): string {
-		const defaultBaseUrl = "http://127.0.0.1:8080";
-		const raw = baseUrl || defaultBaseUrl;
-		try {
-			const parsed = new URL(raw);
-			const trimmedPath = parsed.pathname.replace(/\/+$/g, "");
-			return `${parsed.protocol}//${parsed.host}${trimmedPath}`;
-		} catch {
-			return raw;
-		}
-	}
-	#toLlamaCppNativeBaseUrl(baseUrl: string): string {
-		try {
-			const parsed = new URL(baseUrl);
-			const trimmedPath = parsed.pathname.replace(/\/+$/g, "");
-			parsed.pathname = trimmedPath.endsWith("/v1") ? trimmedPath.slice(0, -3) || "/" : trimmedPath || "/";
-			const normalized = `${parsed.protocol}//${parsed.host}${parsed.pathname}`;
-			return normalized.endsWith("/") ? normalized.slice(0, -1) : normalized;
-		} catch {
-			return baseUrl.endsWith("/v1") ? baseUrl.slice(0, -3) : baseUrl;
-		}
-	}
-	#normalizeOpenAIModelsListBaseUrl(baseUrl?: string): string {
-		const defaultBaseUrl = "http://127.0.0.1:1234/v1";
-		const raw = baseUrl || defaultBaseUrl;
-		try {
-			const parsed = new URL(raw);
-			const trimmedPath = parsed.pathname.replace(/\/+$/g, "");
-			parsed.pathname = trimmedPath.endsWith("/v1") ? trimmedPath || "/v1" : `${trimmedPath}/v1`;
-			return `${parsed.protocol}//${parsed.host}${parsed.pathname}`;
-		} catch {
-			return raw;
-		}
-	}
-	#normalizeOllamaBaseUrl(baseUrl?: string): string {
-		const raw = baseUrl || DEFAULT_OLLAMA_BASE_URL;
-		try {
-			const parsed = new URL(raw);
-			return `${parsed.protocol}//${parsed.host}`;
-		} catch {
-			return DEFAULT_OLLAMA_BASE_URL;
-		}
-	}
 	#applyProviderModelOverrides(provider: string, models: Model<Api>[]): Model<Api>[] {
 		const overrides = this.#modelOverrides.get(provider);
 		if (!overrides || overrides.size === 0) return models;
@@ -2158,7 +1411,11 @@ export class ModelRegistry {
 			this.#rebuildPending = true;
 			return;
 		}
-		this.#canonicalIndex = buildCanonicalModelIndex(this.#models, this.#equivalenceConfig);
+		this.#canonicalIndex = buildCanonicalModelIndex(
+			this.#models,
+			getBundledCanonicalReferenceData(),
+			this.#equivalenceConfig,
+		);
 		this.#rebuildPending = false;
 	}
@@ -2172,7 +1429,11 @@ export class ModelRegistry {
 		}
 		if (this.#rebuildSuspended === 0 && this.#rebuildPending) {
 			this.#rebuildPending = false;
-			this.#canonicalIndex = buildCanonicalModelIndex(this.#models, this.#equivalenceConfig);
+			this.#canonicalIndex = buildCanonicalModelIndex(
+				this.#models,
+				getBundledCanonicalReferenceData(),
+				this.#equivalenceConfig,
+			);
 		}
 	}
@@ -2217,81 +1478,73 @@ export class ModelRegistry {
 		return this.#models;
 	}
-	#isModelAvailable(model: Model<Api>): boolean {
+	/**
+	 * Availability predicate with per-provider memoization. Auth lookups
+	 * (`authStorage.hasAuth`) and the disabled-provider set are resolved once
+	 * per provider instead of once per model, which matters when filtering the
+	 * full bundled catalog (thousands of models, ~50 providers).
+	 */
+	#createAvailabilityCheck(): (model: Model<Api>) => boolean {
 		const disabledProviders = getDisabledProviderIdsFromSettings();
-		return (
-			!disabledProviders.has(model.provider) &&
-			(this.#keylessProviders.has(model.provider) || this.authStorage.hasAuth(model.provider))
-		);
+		const byProvider = new Map<string, boolean>();
+		return model => {
+			let available = byProvider.get(model.provider);
+			if (available === undefined) {
+				available =
+					!disabledProviders.has(model.provider) &&
+					(this.#keylessProviders.has(model.provider) || this.authStorage.hasAuth(model.provider));
+				byProvider.set(model.provider, available);
+			}
+			return available;
+		};
+	}
+	/**
+	 * Build the shared per-query filter state for canonical model queries.
+	 * Hoisted out of the per-record loop: building the candidate-selector set
+	 * and availability memo once per query instead of once per record is what
+	 * keeps `getCanonicalModelSelections` linear instead of O(records × candidates).
+	 */
+	#canonicalQueryFilters(options: CanonicalModelQueryOptions | undefined): {
+		candidateKeys: Set<string> | undefined;
+		isAvailable: ((model: Model<Api>) => boolean) | undefined;
+	} {
+		return {
+			candidateKeys: options?.candidates
+				? new Set(options.candidates.map(candidate => formatCanonicalVariantSelector(candidate)))
+				: undefined,
+			isAvailable: options?.availableOnly ? this.#createAvailabilityCheck() : undefined,
+		};
 	}
 	#filterCanonicalVariants(
 		record: CanonicalModelRecord,
-		options: CanonicalModelQueryOptions | undefined,
+		candidateKeys: ReadonlySet<string> | undefined,
+		isAvailable: ((model: Model<Api>) => boolean) | undefined,
 	): CanonicalModelVariant[] {
-		const candidateKeys = options?.candidates
-			? new Set(options.candidates.map(candidate => formatCanonicalVariantSelector(candidate)))
-			: undefined;
 		return record.variants.filter(variant => {
 			if (candidateKeys && !candidateKeys.has(variant.selector)) {
 				return false;
 			}
-			if (options?.availableOnly && !this.#isModelAvailable(variant.model)) {
+			if (isAvailable && !isAvailable(variant.model)) {
 				return false;
 			}
 			return true;
 		});
 	}
-	#providerRank(): Map<string, number> {
-		return buildModelProviderPriorityRank(getConfiguredProviderOrderFromSettings());
-	}
-	#resolveCanonicalVariant(
-		variants: readonly CanonicalModelVariant[],
-		allCandidates: readonly Model<Api>[],
-	): CanonicalModelVariant | undefined {
-		if (variants.length === 0) {
-			return undefined;
-		}
-		const providerRank = this.#providerRank();
-		const modelOrder = new Map<string, number>();
-		for (let index = 0; index < allCandidates.length; index += 1) {
-			modelOrder.set(formatCanonicalVariantSelector(allCandidates[index]!), index);
-		}
-		const sourceRank: Record<CanonicalModelVariant["source"], number> = {
-			override: 1,
-			bundled: 1,
-			heuristic: 2,
-			fallback: 3,
+	#variantPreferences(candidates: readonly Model<Api>[]): CanonicalVariantPreferences {
+		return {
+			modelOrder: buildCanonicalModelOrder(candidates),
+			providerRank: buildModelProviderPriorityRank(getConfiguredProviderOrderFromSettings()),
 		};
-		return [...variants].sort((left, right) => {
-			const leftProviderRank = providerRank.get(left.model.provider.toLowerCase()) ?? Number.MAX_SAFE_INTEGER;
-			const rightProviderRank = providerRank.get(right.model.provider.toLowerCase()) ?? Number.MAX_SAFE_INTEGER;
-			if (leftProviderRank !== rightProviderRank) {
-				return leftProviderRank - rightProviderRank;
-			}
-			const leftExact = left.model.id === left.canonicalId ? 0 : 1;
-			const rightExact = right.model.id === right.canonicalId ? 0 : 1;
-			if (leftExact !== rightExact) {
-				return leftExact - rightExact;
-			}
-			if (sourceRank[left.source] !== sourceRank[right.source]) {
-				return sourceRank[left.source] - sourceRank[right.source];
-			}
-			if (left.model.id.length !== right.model.id.length) {
-				return left.model.id.length - right.model.id.length;
-			}
-			const leftOrder = modelOrder.get(left.selector) ?? Number.MAX_SAFE_INTEGER;
-			const rightOrder = modelOrder.get(right.selector) ?? Number.MAX_SAFE_INTEGER;
-			return leftOrder - rightOrder;
-		})[0];
 	}
 	getCanonicalModels(options?: CanonicalModelQueryOptions): CanonicalModelRecord[] {
+		const { candidateKeys, isAvailable } = this.#canonicalQueryFilters(options);
 		const records: CanonicalModelRecord[] = [];
 		for (const record of this.#canonicalIndex.records) {
-			const variants = this.#filterCanonicalVariants(record, options);
+			const variants = this.#filterCanonicalVariants(record, candidateKeys, isAvailable);
 			if (variants.length === 0) {
 				continue;
 			}
@@ -2304,12 +1557,42 @@ export class ModelRegistry {
 		return records;
 	}
+	/**
+	 * One-pass equivalent of `getCanonicalModels` + `resolveCanonicalModel` per
+	 * record. The per-query state (candidate-selector set, availability memo,
+	 * provider rank, candidate order) is built once, so the whole catalog
+	 * resolves in O(records + candidates) instead of O(records × candidates).
+	 * This is the path the model selector hydrates from synchronously on open.
+	 */
+	getCanonicalModelSelections(options?: CanonicalModelQueryOptions): CanonicalModelSelection[] {
+		const { candidateKeys, isAvailable } = this.#canonicalQueryFilters(options);
+		const candidates = options?.candidates ?? (options?.availableOnly ? this.getAvailable() : this.getAll());
+		const preferences = this.#variantPreferences(candidates);
+		const selections: CanonicalModelSelection[] = [];
+		for (const record of this.#canonicalIndex.records) {
+			const variants = this.#filterCanonicalVariants(record, candidateKeys, isAvailable);
+			if (variants.length === 0) {
+				continue;
+			}
+			const resolved = resolveCanonicalVariant(variants, preferences);
+			if (!resolved) {
+				continue;
+			}
+			selections.push({
+				record: { id: record.id, name: record.name, variants },
+				model: resolved.model,
+			});
+		}
+		return selections;
+	}
 	getCanonicalVariants(canonicalId: string, options?: CanonicalModelQueryOptions): CanonicalModelVariant[] {
 		const record = this.#canonicalIndex.byId.get(canonicalId.trim().toLowerCase());
 		if (!record) {
 			return [];
 		}
-		return this.#filterCanonicalVariants(record, options);
+		const { candidateKeys, isAvailable } = this.#canonicalQueryFilters(options);
+		return this.#filterCanonicalVariants(record, candidateKeys, isAvailable);
 	}
 	resolveCanonicalModel(canonicalId: string, options?: CanonicalModelQueryOptions): Model<Api> | undefined {
@@ -2318,7 +1601,7 @@ export class ModelRegistry {
 			return undefined;
 		}
 		const candidates = options?.candidates ?? (options?.availableOnly ? this.getAvailable() : this.getAll());
-		return this.#resolveCanonicalVariant(variants, candidates)?.model;
+		return resolveCanonicalVariant(variants, this.#variantPreferences(candidates))?.model;
 	}
 	getCanonicalId(model: Model<Api>): string | undefined {
@@ -2330,7 +1613,7 @@ export class ModelRegistry {
 	 * This is a fast check that doesn't refresh OAuth tokens.
 	 */
 	getAvailable(): Model<Api>[] {
-		return this.#models.filter(model => this.#isModelAvailable(model));
+		return this.#models.filter(this.#createAvailabilityCheck());
 	}
 	/**
@@ -2627,7 +1910,7 @@ export class ModelRegistry {
 						);
 						if (overlay) results.push(finalizeCustomModel(overlay, { useDefaults: true }));
 					}
-					return results;
+					return results.map(toModelSpec);
 				},
 			};
 			this.#runtimeModelManagers.set(providerName, { options: managerOptions, sourceId: sourceId ?? "" });
@@ -2701,7 +1984,7 @@ export interface ProviderConfigInput {
 	api?: Api;
 	streamSimple?: (model: Model<Api>, context: Context, options?: SimpleStreamOptions) => AssistantMessageEventStream;
 	headers?: Record<string, string>;
-	compat?: Model<Api>["compat"];
+	compat?: ModelSpec<Api>["compat"];
 	authHeader?: boolean;
 	/** Streaming transport override — see {@link Model.transport}. */
 	transport?: Model<Api>["transport"];
@@ -2733,7 +2016,7 @@ export interface ProviderConfigInput {
 		contextWindow: number;
 		maxTokens: number;
 		headers?: Record<string, string>;
-		compat?: Model<Api>["compat"];
+		compat?: ModelSpec<Api>["compat"];
 		contextPromotionTarget?: string;
 		premiumMultiplier?: number;
 	}>;