npm - @oh-my-pi/pi-coding-agent - Versions diffs - 13.11.0 → 13.12.0 - Mend

@oh-my-pi/pi-coding-agent 13.11.0 → 13.12.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (74) hide show

package/CHANGELOG.md +86 -0
package/package.json +7 -7
package/src/capability/rule.ts +4 -0
package/src/cli/commands/init-xdg.ts +27 -0
package/src/cli/config-cli.ts +8 -3
package/src/cli/shell-cli.ts +1 -1
package/src/commands/config.ts +1 -1
package/src/config/model-registry.ts +160 -26
package/src/config/model-resolver.ts +84 -21
package/src/config/settings-schema.ts +812 -647
package/src/discovery/helpers.ts +11 -2
package/src/exa/index.ts +1 -11
package/src/exa/search.ts +1 -122
package/src/exec/bash-executor.ts +62 -25
package/src/extensibility/custom-tools/types.ts +2 -3
package/src/extensibility/extensions/types.ts +2 -0
package/src/extensibility/hooks/types.ts +2 -0
package/src/index.ts +6 -6
package/src/internal-urls/docs-index.generated.ts +3 -3
package/src/lsp/config.ts +1 -0
package/src/lsp/defaults.json +3 -3
package/src/memories/index.ts +20 -7
package/src/memories/storage.ts +46 -32
package/src/modes/components/agent-dashboard.ts +23 -35
package/src/modes/components/assistant-message.ts +25 -2
package/src/modes/components/btw-panel.ts +104 -0
package/src/modes/components/settings-defs.ts +5 -1
package/src/modes/components/settings-selector.ts +6 -6
package/src/modes/controllers/btw-controller.ts +193 -0
package/src/modes/controllers/command-controller.ts +3 -1
package/src/modes/controllers/event-controller.ts +4 -0
package/src/modes/controllers/extension-ui-controller.ts +6 -0
package/src/modes/controllers/input-controller.ts +10 -1
package/src/modes/controllers/selector-controller.ts +18 -17
package/src/modes/interactive-mode.ts +22 -0
package/src/modes/prompt-action-autocomplete.ts +17 -3
package/src/modes/rpc/rpc-client.ts +30 -19
package/src/modes/theme/theme.ts +28 -36
package/src/modes/types.ts +4 -0
package/src/modes/utils/ui-helpers.ts +3 -0
package/src/patch/hashline.ts +120 -16
package/src/prompts/system/btw-user.md +8 -0
package/src/prompts/system/custom-system-prompt.md +1 -1
package/src/prompts/system/system-prompt.md +1 -0
package/src/prompts/tools/code-search.md +45 -0
package/src/prompts/tools/hashline.md +3 -0
package/src/prompts/tools/read.md +2 -2
package/src/sdk.ts +36 -40
package/src/session/agent-session.ts +65 -37
package/src/session/blob-store.ts +32 -0
package/src/session/compaction/compaction.ts +27 -6
package/src/session/history-storage.ts +2 -2
package/src/session/session-manager.ts +116 -44
package/src/session/streaming-output.ts +17 -54
package/src/slash-commands/builtin-registry.ts +11 -0
package/src/system-prompt.ts +4 -17
package/src/task/agents.ts +1 -1
package/src/task/executor.ts +1 -1
package/src/task/index.ts +9 -8
package/src/tools/browser.ts +11 -0
package/src/tools/exit-plan-mode.ts +6 -0
package/src/tools/fetch.ts +1 -1
package/src/tools/output-meta.ts +104 -9
package/src/tools/read.ts +13 -26
package/src/utils/title-generator.ts +70 -92
package/src/utils/tools-manager.ts +1 -1
package/src/web/scrapers/index.ts +7 -7
package/src/web/scrapers/utils.ts +1 -0
package/src/web/search/code-search.ts +385 -0
package/src/web/search/index.ts +25 -280
package/src/web/search/provider.ts +1 -1
package/src/web/search/types.ts +28 -0
package/src/exa/company.ts +0 -26
package/src/exa/linkedin.ts +0 -26

package/CHANGELOG.md CHANGED Viewed

@@ -2,6 +2,91 @@
 ## [Unreleased]
+## [13.12.0] - 2026-03-14
+### Added
+- Added per-rule TTSR interrupt mode override via `interruptMode` field in rule frontmatter to allow fine-grained control over when TTSR interrupts stream processing
+- Added `task` model role to allow configuring a dedicated model for subtask execution via `modelRoles.task` setting
+- Added `moveCursorToMessageEnd` and `moveCursorToMessageStart` prompt actions to navigate to the beginning and end of the entire message
+- Added support for provider-level `compat` configuration to apply OpenAI compatibility settings across all models from a provider
+- Added `reasoningEffortMap` configuration option to map reasoning effort levels to provider-specific values
+- Added support for `supportsUsageInStreaming`, `requiresToolResultName`, `requiresAssistantAfterToolResult`, `requiresThinkingAsText`, `thinkingFormat`, and `supportsStrictMode` OpenAI compatibility options
+- Added support for provider-configurable `OpenAICompat.extraBody` to inject request-body fields for custom gateway/proxy routing
+- Added `close()` method to SessionManager for properly closing persistent writers after flushing pending data
+- Added `omp config init-xdg` command to initialize XDG Base Directory structure on Linux
+- Added `getHistoryDbPath()`, `getModelDbPath()`, `getMemoriesDir()`, `getTerminalSessionsDir()` path helpers
+### Changed
+- Path resolution on Linux redirects to XDG locations when `XDG_DATA_HOME` / `XDG_STATE_HOME` / `XDG_CACHE_HOME` environment variables are set
+### Changed
+- Changed TTSR interrupt logic to respect per-rule `interruptMode` settings, falling back to global `ttsr.interruptMode` when rule-level override is not specified
+- Reorganized settings tabs from 12 tabs (display, agent, input, tools, config, services, bash, lsp, ttsr, status) to 8 focused tabs (appearance, model, interaction, context, editing, tools, tasks, providers) for improved discoverability
+- Consolidated status line settings into the Appearance tab instead of a separate Status tab
+- Reorganized sampling parameters (temperature, topP, topK, minP, presencePenalty, repetitionPenalty) into the Model tab
+- Moved edit tool settings (mode, fuzzyMatch, fuzzyThreshold, streamingAbort) to the Editing tab
+- Moved read tool settings (readLineNumbers, readHashLines, read.defaultLimit) to the Editing tab
+- Moved LSP settings (lsp.enabled, lsp.formatOnWrite, lsp.diagnosticsOnWrite, lsp.diagnosticsOnEdit) to the Editing tab
+- Moved bash interceptor settings to the Editing tab
+- Moved Python settings (python.toolMode, python.kernelMode, python.sharedGateway) to the Editing tab
+- Moved task delegation settings (task.isolation.*, task.eager, task.maxConcurrency, task.maxRecursionDepth) to the Tasks tab
+- Moved skill and command settings to the Tasks tab
+- Moved provider selection settings (providers.webSearch, providers.codeSearch, providers.image, etc.) to the Providers tab
+- Moved Exa settings to the Providers tab
+- Moved secret handling settings to the Providers tab
+- Moved speech-to-text settings to the Interaction tab
+- Moved context promotion, compaction, branch summary, memories, and TTSR settings to the Context tab
+- Updated tab icon symbols across unicode, nerd, and ASCII presets to match new tab structure
+- Changed default agent model from `default` to `pi/task` to enable independent model configuration for subtasks
+- Changed agent model resolution to support single-pattern inheritance fallback, allowing `pi/task` agents to inherit the active session model when the task role is unconfigured
+- Changed system prompt to use ISO 8601 date format (YYYY-MM-DD) instead of locale-specific formatting
+- Changed system prompt template to use `{{date}}` instead of `{{dateTime}}` for current date display
+- Changed tool download timeout from 15 seconds to 120 seconds to accommodate slower network conditions
+- Changed working directory paths in system prompt to use forward slashes for consistency across platforms
+- Modified bash executor to fall back to one-shot shell execution after a persistent session hard timeout, preventing subsequent commands from hanging
+### Removed
+- Removed bash executor hard timeout recovery test file (functionality already documented in existing entries)
+### Fixed
+- Fixed bash execution to fall back to one-shot shell runs after a persistent session hard timeout, preventing later commands from hanging until restart
+- Fixed timeout handling in RpcClient to properly clear timeouts and prevent resource leaks
+- Fixed AgentSession disposal to call SessionManager's `close()` method when available, ensuring proper cleanup of persistent writers
+- Removed redundant `path.join()` call wrapping `getHistoryDbPath()` in history-storage.ts
+## [13.11.1] - 2026-03-13
+### Added
+- Added `llama.cpp` as local provider
+- Added `code_search` tool supporting both Exa and grep.app providers for code snippet and documentation search
+- Added `providers.codeSearch` setting to configure code search provider (exa or grep)
+- Added grep.app integration for public code search with result ranking by context relevance
+### Changed
+- Updated compact diff preview to include line hashes for visibility and integrity verification of unchanged and added lines
+- Modified compact diff preview to track line number synchronization between old and new files when processing insertions and deletions
+- Simplified web search tools: removed `web_search_deep`, `web_search_crawl`, `web_search_linkedin`, and `web_search_company` tools
+- Removed `exa.enableLinkedin` and `exa.enableCompany` settings; LinkedIn and company research are no longer available
+- Refactored code search to use pluggable provider system instead of Exa-only implementation
+### Removed
+- Removed Exa LinkedIn search tool (`exa_linkedin`)
+- Removed Exa company research tool (`exa_company`)
+- Removed Exa deep search tool (`exa_search_deep`)
+- Removed Exa URL crawl tool (`exa_crawl`)
+### Fixed
+- Fixed line number parsing in compact diff preview to handle variable-width line number fields with leading whitespace
 ## [13.11.0] - 2026-03-12
 ### Added
@@ -18,6 +103,7 @@
 - Added `buildNamedToolChoice` utility function to build provider-aware tool choice constraints for named tools
 - Support for comma/space-separated path lists in `find`, `grep`, `ast_grep`, and `ast_edit` tools (e.g., `apps/,packages/,phases/` or `apps/ packages/ phases/`)
 - New `resolveMultiSearchPath` and `resolveMultiFindPattern` functions to handle multi-path search inputs with automatic common base path detection
+- Added `display.showTokenUsage` setting to show per-turn token usage (input, output, cache) on assistant messages
 ### Changed

package/package.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
 	"type": "module",
 	"name": "@oh-my-pi/pi-coding-agent",
-	"version": "13.11.0",
+	"version": "13.12.0",
 	"description": "Coding agent CLI with read, bash, edit, write tools and session management",
 	"homepage": "https://github.com/can1357/oh-my-pi",
 	"author": "Can Boluk",
@@ -41,12 +41,12 @@
 	},
 	"dependencies": {
 		"@mozilla/readability": "^0.6",
-		"@oh-my-pi/omp-stats": "13.11.0",
-		"@oh-my-pi/pi-agent-core": "13.11.0",
-		"@oh-my-pi/pi-ai": "13.11.0",
-		"@oh-my-pi/pi-natives": "13.11.0",
-		"@oh-my-pi/pi-tui": "13.11.0",
-		"@oh-my-pi/pi-utils": "13.11.0",
+		"@oh-my-pi/omp-stats": "13.12.0",
+		"@oh-my-pi/pi-agent-core": "13.12.0",
+		"@oh-my-pi/pi-ai": "13.12.0",
+		"@oh-my-pi/pi-natives": "13.12.0",
+		"@oh-my-pi/pi-tui": "13.12.0",
+		"@oh-my-pi/pi-utils": "13.12.0",
 		"@sinclair/typebox": "^0.34",
 		"@xterm/headless": "^6.0",
 		"ajv": "^8.18",

package/src/capability/rule.ts CHANGED Viewed

@@ -20,6 +20,8 @@ export interface RuleFrontmatter {
 	condition?: string | string[];
 	/** New key for TTSR stream scope. */
 	scope?: string | string[];
+	/** Per-rule TTSR interrupt mode override. */
+	interruptMode?: "never" | "prose-only" | "tool-only" | "always";
 	[key: string]: unknown;
 }
@@ -43,6 +45,8 @@ export interface Rule {
 	condition?: string[];
 	/** Optional stream scope tokens (for example: text, thinking, tool:edit(*.ts)). */
 	scope?: string[];
+	/** Per-rule TTSR interrupt mode override (falls back to global ttsr.interruptMode). */
+	interruptMode?: "never" | "prose-only" | "tool-only" | "always";
 	/** Source metadata */
 	_source: SourceMeta;
 }

package/src/cli/commands/init-xdg.ts ADDED Viewed

@@ -0,0 +1,27 @@
+import * as fs from "node:fs/promises";
+import * as os from "node:os";
+import * as path from "node:path";
+const APP_NAME = "omp";
+export async function initXdg(): Promise<void> {
+	if (process.platform !== "linux") {
+		console.error("XDG directory setup is only supported on Linux.");
+		process.exit(1);
+	}
+	const dataHome = process.env.XDG_DATA_HOME || path.join(os.homedir(), ".local/share");
+	const stateHome = process.env.XDG_STATE_HOME || path.join(os.homedir(), ".local/state");
+	const cacheHome = process.env.XDG_CACHE_HOME || path.join(os.homedir(), ".cache");
+	const dirs = [path.join(dataHome, APP_NAME), path.join(stateHome, APP_NAME), path.join(cacheHome, APP_NAME)];
+	for (const dir of dirs) {
+		await fs.mkdir(dir, { recursive: true });
+		console.log(`Created ${dir.replace(os.homedir(), "~")}`);
+	}
+	console.log("\nXDG directories initialized.");
+	console.log("Ensure XDG_DATA_HOME, XDG_STATE_HOME, and XDG_CACHE_HOME");
+	console.log("are set in your shell profile for omp to use them.");
+}

package/src/cli/config-cli.ts CHANGED Viewed

@@ -19,12 +19,13 @@ import {
 } from "../config/settings";
 import { SETTINGS_SCHEMA } from "../config/settings-schema";
 import { theme } from "../modes/theme/theme";
+import { initXdg } from "./commands/init-xdg";
 // =============================================================================
 // Types
 // =============================================================================
-export type ConfigAction = "list" | "get" | "set" | "reset" | "path";
+export type ConfigAction = "list" | "get" | "set" | "reset" | "path" | "init-xdg";
 export interface ConfigCommandArgs {
 	action: ConfigAction;
@@ -34,7 +35,6 @@ export interface ConfigCommandArgs {
 		json?: boolean;
 	};
 }
 // =============================================================================
 // Setting Filtering
 // =============================================================================
@@ -73,7 +73,7 @@ function getSettingValues(def: CliSettingDef): readonly string[] | undefined {
 // Argument Parser
 // =============================================================================
-const VALID_ACTIONS: ConfigAction[] = ["list", "get", "set", "reset", "path"];
+const VALID_ACTIONS: ConfigAction[] = ["list", "get", "set", "reset", "path", "init-xdg"];
 /**
  * Parse config subcommand arguments.
@@ -251,6 +251,9 @@ export async function runConfigCommand(cmd: ConfigCommandArgs): Promise<void> {
 		case "path":
 			handlePath();
 			break;
+		case "init-xdg":
+			await initXdg();
+			break;
 	}
 }
@@ -394,6 +397,7 @@ ${chalk.bold("Commands:")}
   set <key> <value>  Set a setting value
   reset <key>        Reset a setting to its default value
   path               Print the config directory path
+  init-xdg           Initialize XDG Base Directory structure (Linux only)
 ${chalk.bold("Options:")}
   --json             Output as JSON
@@ -406,6 +410,7 @@ ${chalk.bold("Examples:")}
   ${APP_NAME} config set defaultThinkingLevel medium
   ${APP_NAME} config reset steeringMode
   ${APP_NAME} config list --json
+  ${APP_NAME} config init-xdg
 ${chalk.bold("Boolean Values:")}
   true, false, yes, no, on, off, 1, 0

package/src/cli/shell-cli.ts CHANGED Viewed

@@ -85,7 +85,7 @@ export async function runShellCommand(cmd: ShellCommandArgs): Promise<void> {
 	const interruptHandler = () => {
 		if (active) {
-			shellSession.abort();
+			void shellSession.abort();
 			return;
 		}
 		rl.close();

package/src/commands/config.ts CHANGED Viewed

@@ -5,7 +5,7 @@ import { Args, Command, Flags } from "@oh-my-pi/pi-utils/cli";
 import { type ConfigAction, type ConfigCommandArgs, runConfigCommand } from "../cli/config-cli";
 import { initTheme } from "../modes/theme/theme";
-const ACTIONS: ConfigAction[] = ["list", "get", "set", "reset", "path"];
+const ACTIONS: ConfigAction[] = ["list", "get", "set", "reset", "path", "init-xdg"];
 export default class Config extends Command {
 	static description = "Manage configuration settings";

package/src/config/model-registry.ts CHANGED Viewed

@@ -37,7 +37,7 @@ export function isAuthenticated(apiKey: string | undefined | null): apiKey is st
 	return Boolean(apiKey) && apiKey !== kNoAuth;
 }
-export type ModelRole = "default" | "smol" | "slow" | "vision" | "plan" | "commit";
+export type ModelRole = "default" | "smol" | "slow" | "vision" | "plan" | "commit" | "task";
 export interface ModelRoleInfo {
 	tag?: string;
@@ -52,9 +52,10 @@ export const MODEL_ROLES: Record<ModelRole, ModelRoleInfo> = {
 	vision: { tag: "VISION", name: "Vision", color: "error" },
 	plan: { tag: "PLAN", name: "Architect", color: "muted" },
 	commit: { tag: "COMMIT", name: "Commit", color: "dim" },
+	task: { tag: "TASK", name: "Subtask", color: "muted" },
 };
-export const MODEL_ROLE_IDS: ModelRole[] = ["default", "smol", "slow", "vision", "plan", "commit"];
+export const MODEL_ROLE_IDS: ModelRole[] = ["default", "smol", "slow", "vision", "plan", "commit", "task"];
 const OpenRouterRoutingSchema = Type.Object({
 	only: Type.Optional(Type.Array(Type.String())),
@@ -68,13 +69,36 @@ const VercelGatewayRoutingSchema = Type.Object({
 });
 // Schema for OpenAI compatibility settings
+const ReasoningEffortMapSchema = Type.Object({
+	minimal: Type.Optional(Type.String()),
+	low: Type.Optional(Type.String()),
+	medium: Type.Optional(Type.String()),
+	high: Type.Optional(Type.String()),
+	xhigh: Type.Optional(Type.String()),
+});
 const OpenAICompatSchema = Type.Object({
 	supportsStore: Type.Optional(Type.Boolean()),
 	supportsDeveloperRole: Type.Optional(Type.Boolean()),
 	supportsReasoningEffort: Type.Optional(Type.Boolean()),
+	reasoningEffortMap: Type.Optional(ReasoningEffortMapSchema),
 	maxTokensField: Type.Optional(Type.Union([Type.Literal("max_completion_tokens"), Type.Literal("max_tokens")])),
+	supportsUsageInStreaming: Type.Optional(Type.Boolean()),
+	requiresToolResultName: Type.Optional(Type.Boolean()),
+	requiresAssistantAfterToolResult: Type.Optional(Type.Boolean()),
+	requiresThinkingAsText: Type.Optional(Type.Boolean()),
+	thinkingFormat: Type.Optional(
+		Type.Union([
+			Type.Literal("openai"),
+			Type.Literal("zai"),
+			Type.Literal("qwen"),
+			Type.Literal("qwen-chat-template"),
+		]),
+	),
 	openRouterRouting: Type.Optional(OpenRouterRoutingSchema),
 	vercelGatewayRouting: Type.Optional(VercelGatewayRoutingSchema),
+	extraBody: Type.Optional(Type.Record(Type.String(), Type.Unknown())),
+	supportsStrictMode: Type.Optional(Type.Boolean()),
 });
 const EffortSchema = Type.Union([
@@ -160,7 +184,7 @@ const ModelOverrideSchema = Type.Object({
 type ModelOverride = Static<typeof ModelOverrideSchema>;
 const ProviderDiscoverySchema = Type.Object({
-	type: Type.Union([Type.Literal("ollama"), Type.Literal("lm-studio")]),
+	type: Type.Union([Type.Literal("ollama"), Type.Literal("llama.cpp"), Type.Literal("lm-studio")]),
 });
 const ProviderAuthSchema = Type.Union([Type.Literal("apiKey"), Type.Literal("none")]);
@@ -180,6 +204,7 @@ const ProviderConfigSchema = Type.Object({
 		]),
 	),
 	headers: Type.Optional(Type.Record(Type.String(), Type.String())),
+	compat: Type.Optional(OpenAICompatSchema),
 	authHeader: Type.Optional(Type.Boolean()),
 	auth: Type.Optional(ProviderAuthSchema),
 	discovery: Type.Optional(ProviderDiscoverySchema),
@@ -212,6 +237,7 @@ interface ProviderValidationConfig {
 	auth?: ProviderAuthMode;
 	oauthConfigured?: boolean;
 	discovery?: ProviderDiscovery;
+	compat?: Model<Api>["compat"];
 	modelOverrides?: Record<string, unknown>;
 	models: ProviderValidationModel[];
 }
@@ -227,9 +253,9 @@ function validateProviderConfiguration(
 	if (models.length === 0) {
 		if (mode === "models-config") {
 			const hasModelOverrides = config.modelOverrides && Object.keys(config.modelOverrides).length > 0;
-			if (!config.baseUrl && !hasModelOverrides && !config.discovery) {
+			if (!config.baseUrl && !config.compat && !hasModelOverrides && !config.discovery) {
 				throw new Error(
-					`Provider ${providerName}: must specify "baseUrl", "modelOverrides", "discovery", or "models".`,
+					`Provider ${providerName}: must specify "baseUrl", "compat", "modelOverrides", "discovery", or "models"`,
 				);
 			}
 		}
@@ -288,6 +314,7 @@ export const ModelsConfigFile = new ConfigFile<ModelsConfig>("models", ModelsCon
 					api: providerConfig.api as Api | undefined,
 					auth: (providerConfig.auth ?? "apiKey") as ProviderAuthMode,
 					discovery: providerConfig.discovery as ProviderDiscovery | undefined,
+					compat: providerConfig.compat,
 					modelOverrides: providerConfig.modelOverrides,
 					models: (providerConfig.models ?? []) as ProviderValidationModel[],
 				},
@@ -297,11 +324,12 @@ export const ModelsConfigFile = new ConfigFile<ModelsConfig>("models", ModelsCon
 	},
 );
-/** Provider override config (baseUrl, headers, apiKey) without custom models */
+/** Provider override config (baseUrl, headers, apiKey, compat) without custom models */
 interface ProviderOverride {
 	baseUrl?: string;
 	headers?: Record<string, string>;
 	apiKey?: string;
+	compat?: Model<Api>["compat"];
 }
 interface DiscoveryProviderConfig {
@@ -309,6 +337,7 @@ interface DiscoveryProviderConfig {
 	api: Api;
 	baseUrl?: string;
 	headers?: Record<string, string>;
+	compat?: Model<Api>["compat"];
 	discovery: ProviderDiscovery;
 	optional?: boolean;
 }
@@ -397,12 +426,18 @@ function mergeCompat(
 	const base = baseCompat ?? {};
 	const override = overrideCompat;
 	const merged: NonNullable<Model<Api>["compat"]> = { ...base, ...override };
+	if (baseCompat?.reasoningEffortMap || overrideCompat.reasoningEffortMap) {
+		merged.reasoningEffortMap = { ...baseCompat?.reasoningEffortMap, ...overrideCompat.reasoningEffortMap };
+	}
 	if (baseCompat?.openRouterRouting || overrideCompat.openRouterRouting) {
 		merged.openRouterRouting = { ...baseCompat?.openRouterRouting, ...overrideCompat.openRouterRouting };
 	}
 	if (baseCompat?.vercelGatewayRouting || overrideCompat.vercelGatewayRouting) {
 		merged.vercelGatewayRouting = { ...baseCompat?.vercelGatewayRouting, ...overrideCompat.vercelGatewayRouting };
 	}
+	if (baseCompat?.extraBody || overrideCompat.extraBody) {
+		merged.extraBody = { ...baseCompat?.extraBody, ...overrideCompat.extraBody };
+	}
 	return merged;
 }
@@ -475,6 +510,7 @@ function buildCustomModel(
 	providerHeaders: Record<string, string> | undefined,
 	providerApiKey: string | undefined,
 	authHeader: boolean | undefined,
+	providerCompat: Model<Api>["compat"] | undefined,
 	modelDef: CustomModelDefinitionLike,
 	options: CustomModelBuildOptions,
 ): Model<Api> | undefined {
@@ -496,7 +532,7 @@ function buildCustomModel(
 		contextWindow: modelDef.contextWindow ?? (withDefaults ? 128000 : undefined),
 		maxTokens: modelDef.maxTokens ?? (withDefaults ? 16384 : undefined),
 		headers: mergeCustomModelHeaders(providerHeaders, modelDef.headers, authHeader, providerApiKey),
-		compat: modelDef.compat,
+		compat: mergeCompat(providerCompat, modelDef.compat),
 		contextPromotionTarget: modelDef.contextPromotionTarget,
 		premiumMultiplier: modelDef.premiumMultiplier,
 	} as Model<Api>);
@@ -630,6 +666,7 @@ export class ModelRegistry {
 						...model,
 						baseUrl: providerOverride.baseUrl ?? model.baseUrl,
 						headers: providerOverride.headers ? { ...model.headers, ...providerOverride.headers } : model.headers,
+						compat: mergeCompat(model.compat, providerOverride.compat),
 					};
 				}
 				const modelOverride = perModelOverrides?.get(m.id);
@@ -669,7 +706,10 @@ export class ModelRegistry {
 				});
 				continue;
 			}
-			const models = this.#applyProviderModelOverrides(providerConfig.provider, cache.models);
+			const models = this.#applyProviderModelOverrides(
+				providerConfig.provider,
+				this.#applyProviderCompat(providerConfig.compat, cache.models),
+			);
 			cachedModels.push(...models);
 			this.#providerDiscoveryStates.set(providerConfig.provider, {
 				provider: providerConfig.provider,
@@ -683,6 +723,11 @@ export class ModelRegistry {
 		return cachedModels;
 	}
+	#applyProviderCompat(compat: Model<Api>["compat"] | undefined, models: Model<Api>[]): Model<Api>[] {
+		if (!compat) return models;
+		return models.map(model => ({ ...model, compat: mergeCompat(model.compat, compat) }));
+	}
 	#addImplicitDiscoverableProviders(configuredProviders: Set<string>): void {
 		if (!configuredProviders.has("ollama")) {
 			this.#discoverableProviders.push({
@@ -694,6 +739,19 @@ export class ModelRegistry {
 			});
 			this.#keylessProviders.add("ollama");
 		}
+		if (!configuredProviders.has("llama.cpp")) {
+			this.#discoverableProviders.push({
+				provider: "llama.cpp",
+				api: "openai-responses",
+				baseUrl: Bun.env.LLAMA_CPP_BASE_URL || "http://127.0.0.1:8080",
+				discovery: { type: "llama.cpp" },
+				optional: true,
+			});
+			// Only mark as keyless if no API key is configured
+			if (!this.authStorage.hasAuth("llama.cpp")) {
+				this.#keylessProviders.add("llama.cpp");
+			}
+		}
 		if (!configuredProviders.has("lm-studio")) {
 			this.#discoverableProviders.push({
 				provider: "lm-studio",
@@ -739,12 +797,13 @@ export class ModelRegistry {
 		const configuredProviders = new Set(Object.keys(value.providers));
 		for (const [providerName, providerConfig] of Object.entries(value.providers)) {
-			// Always set overrides when baseUrl/headers present
-			if (providerConfig.baseUrl || providerConfig.headers || providerConfig.apiKey) {
+			// Always set overrides when baseUrl/headers/apiKey/compat are present
+			if (providerConfig.baseUrl || providerConfig.headers || providerConfig.apiKey || providerConfig.compat) {
 				overrides.set(providerName, {
 					baseUrl: providerConfig.baseUrl,
 					headers: providerConfig.headers,
 					apiKey: providerConfig.apiKey,
+					compat: providerConfig.compat,
 				});
 			}
@@ -759,6 +818,7 @@ export class ModelRegistry {
 					api: providerConfig.api as Api,
 					baseUrl: providerConfig.baseUrl,
 					headers: providerConfig.headers,
+					compat: providerConfig.compat,
 					discovery: providerConfig.discovery,
 					optional: false,
 				});
@@ -851,30 +911,28 @@ export class ModelRegistry {
 			}
 		}
-		let fetchError: string | undefined;
+		const providerId = providerConfig.provider;
+		let discoveryError: string | undefined;
 		const fetchDynamicModels = async (): Promise<readonly Model<Api>[] | null> => {
 			try {
-				const models =
-					providerConfig.discovery.type === "ollama"
-						? await this.#discoverOllamaModels(providerConfig)
-						: await this.#discoverLmStudioModels(providerConfig);
-				this.#lastDiscoveryWarnings.delete(providerConfig.provider);
+				const models = await this.#discoverModelsByProviderType(providerConfig);
+				this.#lastDiscoveryWarnings.delete(providerId);
 				return models;
 			} catch (error) {
-				fetchError = error instanceof Error ? error.message : String(error);
+				discoveryError = error instanceof Error ? error.message : String(error);
 				return null;
 			}
 		};
 		const manager = createModelManager<Api>({
-			providerId: providerConfig.provider,
+			providerId,
 			staticModels: [],
 			cacheDbPath: this.#cacheDbPath,
 			cacheTtlMs: 24 * 60 * 60 * 1000,
 			fetchDynamicModels,
 		});
 		const result = await manager.refresh(strategy);
-		const status = fetchError
+		const status = discoveryError
 			? result.models.length > 0
 				? "cached"
 				: "unavailable"
@@ -883,19 +941,33 @@ export class ModelRegistry {
 				: cached
 					? "cached"
 					: "idle";
-		this.#providerDiscoveryStates.set(providerConfig.provider, {
-			provider: providerConfig.provider,
+		this.#providerDiscoveryStates.set(providerId, {
+			provider: providerId,
 			status,
 			optional: providerConfig.optional ?? false,
 			stale: result.stale || status === "cached",
-			fetchedAt: fetchError ? cached?.updatedAt : Date.now(),
+			fetchedAt: discoveryError ? cached?.updatedAt : Date.now(),
 			models: result.models.map(model => model.id),
-			error: fetchError,
+			error: discoveryError,
 		});
-		if (fetchError) {
-			this.#warnProviderDiscoveryFailure(providerConfig, fetchError);
+		if (discoveryError) {
+			this.#warnProviderDiscoveryFailure(providerConfig, discoveryError);
+		}
+		return this.#applyProviderModelOverrides(
+			providerId,
+			this.#applyProviderCompat(providerConfig.compat, result.models),
+		);
+	}
+	#discoverModelsByProviderType(providerConfig: DiscoveryProviderConfig): Promise<Model<Api>[]> {
+		switch (providerConfig.discovery.type) {
+			case "ollama":
+				return this.#discoverOllamaModels(providerConfig);
+			case "llama.cpp":
+				return this.#discoverLlamaCppModels(providerConfig);
+			case "lm-studio":
+				return this.#discoverLmStudioModels(providerConfig);
 		}
-		return this.#applyProviderModelOverrides(providerConfig.provider, result.models);
 	}
 	#warnProviderDiscoveryFailure(providerConfig: DiscoveryProviderConfig, error: string): void {
@@ -1106,6 +1178,53 @@ export class ModelRegistry {
 		return this.#applyProviderModelOverrides(providerConfig.provider, discovered);
 	}
+	async #discoverLlamaCppModels(providerConfig: DiscoveryProviderConfig): Promise<Model<Api>[]> {
+		const baseUrl = this.#normalizeLlamaCppBaseUrl(providerConfig.baseUrl);
+		const modelsUrl = `${baseUrl}/models`;
+		const headers: Record<string, string> = { ...(providerConfig.headers ?? {}) };
+		const apiKey = await this.authStorage.getApiKey(providerConfig.provider);
+		if (apiKey && apiKey !== DEFAULT_LOCAL_TOKEN && apiKey !== kNoAuth) {
+			headers.Authorization = `Bearer ${apiKey}`;
+		}
+		const response = await fetch(modelsUrl, {
+			headers,
+			signal: AbortSignal.timeout(250),
+		});
+		if (!response.ok) {
+			throw new Error(`HTTP ${response.status} from ${modelsUrl}`);
+		}
+		const payload = (await response.json()) as { data?: Array<{ id: string }> };
+		const models = payload.data ?? [];
+		const discovered: Model<Api>[] = [];
+		for (const item of models) {
+			const id = item.id;
+			if (!id) continue;
+			discovered.push(
+				enrichModelThinking({
+					id,
+					name: id,
+					api: providerConfig.api,
+					provider: providerConfig.provider,
+					baseUrl,
+					reasoning: false,
+					input: ["text"],
+					cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
+					contextWindow: 128000,
+					maxTokens: 8192,
+					headers,
+					compat: {
+						supportsStore: false,
+						supportsDeveloperRole: false,
+						supportsReasoningEffort: false,
+					},
+				}),
+			);
+		}
+		return this.#applyProviderModelOverrides(providerConfig.provider, discovered);
+	}
 	async #discoverLmStudioModels(providerConfig: DiscoveryProviderConfig): Promise<Model<Api>[]> {
 		const baseUrl = this.#normalizeLmStudioBaseUrl(providerConfig.baseUrl);
 		const modelsUrl = `${baseUrl}/models`;
@@ -1153,6 +1272,18 @@ export class ModelRegistry {
 		return this.#applyProviderModelOverrides(providerConfig.provider, discovered);
 	}
+	#normalizeLlamaCppBaseUrl(baseUrl?: string): string {
+		const defaultBaseUrl = "http://127.0.0.1:8080";
+		const raw = baseUrl || defaultBaseUrl;
+		try {
+			const parsed = new URL(raw);
+			const trimmedPath = parsed.pathname.replace(/\/+$/g, "");
+			return `${parsed.protocol}//${parsed.host}${trimmedPath}`;
+		} catch {
+			return raw;
+		}
+	}
 	#normalizeLmStudioBaseUrl(baseUrl?: string): string {
 		const defaultBaseUrl = "http://127.0.0.1:1234/v1";
 		const raw = baseUrl || defaultBaseUrl;
@@ -1221,6 +1352,7 @@ export class ModelRegistry {
 					providerConfig.headers,
 					providerConfig.apiKey,
 					providerConfig.authHeader,
+					providerConfig.compat,
 					modelDef as CustomModelDefinitionLike,
 					{ useDefaults: true },
 				);
@@ -1382,6 +1514,7 @@ export class ModelRegistry {
 					config.headers,
 					config.apiKey,
 					config.authHeader,
+					config.compat,
 					modelDef as CustomModelDefinitionLike,
 					{ useDefaults: false },
 				);
@@ -1425,6 +1558,7 @@ export interface ProviderConfigInput {
 	api?: Api;
 	streamSimple?: (model: Model<Api>, context: Context, options?: SimpleStreamOptions) => AssistantMessageEventStream;
 	headers?: Record<string, string>;
+	compat?: Model<Api>["compat"];
 	authHeader?: boolean;
 	oauth?: {
 		name: string;