npm - @oh-my-pi/pi-coding-agent - Versions diffs - 15.9.67 → 15.10.1 - Mend

@oh-my-pi/pi-coding-agent 15.9.67 → 15.10.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (266) hide show

package/CHANGELOG.md +136 -0
package/dist/types/cli/args.d.ts +1 -1
package/dist/types/cli/dry-balance-cli.d.ts +15 -1
package/dist/types/cli/gallery-cli.d.ts +43 -0
package/dist/types/cli/gallery-fixtures/agentic.d.ts +2 -0
package/dist/types/cli/gallery-fixtures/codeintel.d.ts +3 -0
package/dist/types/cli/gallery-fixtures/edit.d.ts +3 -0
package/dist/types/cli/gallery-fixtures/fs.d.ts +2 -0
package/dist/types/cli/gallery-fixtures/index.d.ts +4 -0
package/dist/types/cli/gallery-fixtures/interaction.d.ts +3 -0
package/dist/types/cli/gallery-fixtures/memory.d.ts +2 -0
package/dist/types/cli/gallery-fixtures/misc.d.ts +3 -0
package/dist/types/cli/gallery-fixtures/search.d.ts +3 -0
package/dist/types/cli/gallery-fixtures/shell.d.ts +3 -0
package/dist/types/cli/gallery-fixtures/types.d.ts +44 -0
package/dist/types/cli/gallery-fixtures/web.d.ts +2 -0
package/dist/types/cli/gallery-screenshot.d.ts +35 -0
package/dist/types/commands/gallery.d.ts +47 -0
package/dist/types/commit/analysis/conventional.d.ts +2 -2
package/dist/types/commit/analysis/summary.d.ts +2 -2
package/dist/types/commit/changelog/generate.d.ts +2 -2
package/dist/types/commit/changelog/index.d.ts +2 -2
package/dist/types/commit/map-reduce/index.d.ts +3 -3
package/dist/types/commit/map-reduce/map-phase.d.ts +2 -2
package/dist/types/commit/map-reduce/reduce-phase.d.ts +2 -2
package/dist/types/commit/model-selection.d.ts +10 -4
package/dist/types/config/api-key-resolver.d.ts +34 -0
package/dist/types/config/keybindings.d.ts +6 -1
package/dist/types/config/model-id-affixes.d.ts +2 -0
package/dist/types/config/model-registry.d.ts +25 -2
package/dist/types/config/settings-schema.d.ts +41 -6
package/dist/types/dap/config.d.ts +14 -1
package/dist/types/dap/types.d.ts +10 -0
package/dist/types/extensibility/plugins/marketplace-auto-update.d.ts +8 -0
package/dist/types/lsp/types.d.ts +10 -0
package/dist/types/lsp/utils.d.ts +3 -2
package/dist/types/main.d.ts +3 -2
package/dist/types/memory-backend/index.d.ts +2 -1
package/dist/types/memory-backend/resolve.d.ts +1 -1
package/dist/types/memory-backend/types.d.ts +1 -1
package/dist/types/modes/components/chat-block.d.ts +64 -0
package/dist/types/modes/components/custom-editor.d.ts +5 -1
package/dist/types/modes/components/overlay-box.d.ts +17 -0
package/dist/types/modes/components/plan-review-overlay.d.ts +59 -0
package/dist/types/modes/components/plan-toc.d.ts +41 -0
package/dist/types/modes/components/read-tool-group.d.ts +2 -0
package/dist/types/modes/components/tool-execution.d.ts +18 -0
package/dist/types/modes/components/transcript-container.d.ts +11 -0
package/dist/types/modes/controllers/command-controller.d.ts +1 -0
package/dist/types/modes/controllers/event-controller.d.ts +0 -1
package/dist/types/modes/controllers/extension-ui-controller.d.ts +0 -1
package/dist/types/modes/controllers/input-controller.d.ts +1 -1
package/dist/types/modes/controllers/selector-controller.d.ts +1 -1
package/dist/types/modes/controllers/streaming-reveal.d.ts +22 -0
package/dist/types/modes/controllers/tan-command-controller.d.ts +6 -0
package/dist/types/modes/index.d.ts +5 -4
package/dist/types/modes/interactive-mode.d.ts +16 -6
package/dist/types/modes/setup-version.d.ts +11 -0
package/dist/types/modes/setup-wizard/index.d.ts +2 -1
package/dist/types/modes/setup-wizard/scenes/web-search.d.ts +2 -1
package/dist/types/modes/theme/theme.d.ts +1 -1
package/dist/types/modes/types.d.ts +19 -6
package/dist/types/modes/utils/copy-targets.d.ts +21 -1
package/dist/types/plan-mode/approved-plan.d.ts +27 -8
package/dist/types/plan-mode/plan-protection.d.ts +4 -4
package/dist/types/sdk.d.ts +3 -1
package/dist/types/session/agent-session.d.ts +21 -0
package/dist/types/session/messages.d.ts +12 -0
package/dist/types/session/session-manager.d.ts +3 -1
package/dist/types/slash-commands/types.d.ts +4 -6
package/dist/types/task/executor.d.ts +14 -0
package/dist/types/task/index.d.ts +1 -0
package/dist/types/task/render.d.ts +3 -2
package/dist/types/telemetry-export.d.ts +1 -1
package/dist/types/tools/archive-reader.d.ts +5 -0
package/dist/types/tools/ast-edit.d.ts +3 -0
package/dist/types/tools/ast-grep.d.ts +3 -0
package/dist/types/tools/bash.d.ts +1 -0
package/dist/types/tools/eval-render.d.ts +1 -8
package/dist/types/tools/fetch.d.ts +15 -7
package/dist/types/tools/find.d.ts +8 -4
package/dist/types/tools/grouped-file-output.d.ts +95 -12
package/dist/types/tools/memory-render.d.ts +4 -1
package/dist/types/tools/plan-mode-guard.d.ts +8 -9
package/dist/types/tools/render-utils.d.ts +13 -9
package/dist/types/tools/renderers.d.ts +16 -2
package/dist/types/tools/search.d.ts +5 -1
package/dist/types/tools/sqlite-reader.d.ts +1 -0
package/dist/types/tools/todo.d.ts +3 -2
package/dist/types/tools/write.d.ts +5 -0
package/dist/types/tui/output-block.d.ts +16 -4
package/dist/types/tui/status-line.d.ts +3 -0
package/dist/types/utils/enhanced-paste.d.ts +20 -0
package/dist/types/web/scrapers/github.d.ts +22 -0
package/dist/types/web/search/providers/kimi.d.ts +1 -1
package/dist/types/web/search/providers/perplexity.d.ts +8 -1
package/dist/types/web/search/types.d.ts +1 -1
package/package.json +9 -9
package/scripts/dev-launch +42 -0
package/scripts/dev-launch-preload.ts +19 -0
package/src/auto-thinking/classifier.ts +5 -1
package/src/cli/args.ts +2 -2
package/src/cli/dry-balance-cli.ts +52 -17
package/src/cli/gallery-cli.ts +226 -0
package/src/cli/gallery-fixtures/agentic.ts +292 -0
package/src/cli/gallery-fixtures/codeintel.ts +188 -0
package/src/cli/gallery-fixtures/edit.ts +194 -0
package/src/cli/gallery-fixtures/fs.ts +153 -0
package/src/cli/gallery-fixtures/index.ts +40 -0
package/src/cli/gallery-fixtures/interaction.ts +49 -0
package/src/cli/gallery-fixtures/memory.ts +81 -0
package/src/cli/gallery-fixtures/misc.ts +250 -0
package/src/cli/gallery-fixtures/search.ts +213 -0
package/src/cli/gallery-fixtures/shell.ts +167 -0
package/src/cli/gallery-fixtures/types.ts +41 -0
package/src/cli/gallery-fixtures/web.ts +158 -0
package/src/cli/gallery-screenshot.ts +279 -0
package/src/cli-commands.ts +1 -0
package/src/commands/gallery.ts +52 -0
package/src/commands/launch.ts +1 -1
package/src/commit/analysis/conventional.ts +2 -2
package/src/commit/analysis/summary.ts +2 -2
package/src/commit/changelog/generate.ts +2 -2
package/src/commit/changelog/index.ts +2 -2
package/src/commit/map-reduce/index.ts +3 -3
package/src/commit/map-reduce/map-phase.ts +2 -2
package/src/commit/map-reduce/reduce-phase.ts +2 -2
package/src/commit/model-selection.ts +33 -9
package/src/commit/pipeline.ts +4 -4
package/src/config/api-key-resolver.ts +58 -0
package/src/config/keybindings.ts +15 -6
package/src/config/model-equivalence.ts +35 -12
package/src/config/model-id-affixes.ts +39 -22
package/src/config/model-registry.ts +41 -18
package/src/config/settings-schema.ts +28 -5
package/src/config/settings.ts +31 -2
package/src/dap/client.ts +14 -16
package/src/dap/config.ts +41 -2
package/src/dap/defaults.json +1 -0
package/src/dap/session.ts +1 -0
package/src/dap/types.ts +10 -0
package/src/debug/index.ts +40 -54
package/src/edit/renderer.ts +111 -119
package/src/eval/__tests__/agent-bridge.test.ts +75 -32
package/src/eval/__tests__/llm-bridge.test.ts +90 -31
package/src/eval/agent-bridge.ts +34 -7
package/src/eval/llm-bridge.ts +8 -3
package/src/extensibility/extensions/runner.ts +1 -0
package/src/extensibility/plugins/doctor.ts +0 -1
package/src/extensibility/plugins/marketplace-auto-update.ts +49 -0
package/src/goals/tools/goal-tool.ts +37 -27
package/src/internal-urls/docs-index.generated.ts +10 -10
package/src/lsp/client.ts +104 -55
package/src/lsp/types.ts +10 -0
package/src/lsp/utils.ts +3 -2
package/src/main.ts +53 -56
package/src/memories/index.ts +12 -5
package/src/memory-backend/index.ts +13 -1
package/src/memory-backend/resolve.ts +3 -5
package/src/memory-backend/types.ts +1 -1
package/src/mnemopi/backend.ts +5 -1
package/src/modes/acp/acp-agent.ts +33 -26
package/src/modes/components/assistant-message.ts +2 -9
package/src/modes/components/chat-block.ts +111 -0
package/src/modes/components/copy-selector.ts +1 -44
package/src/modes/components/custom-editor.ts +33 -1
package/src/modes/components/custom-message.ts +1 -3
package/src/modes/components/execution-shared.ts +1 -2
package/src/modes/components/hook-message.ts +1 -3
package/src/modes/components/overlay-box.ts +108 -0
package/src/modes/components/plan-review-overlay.ts +799 -0
package/src/modes/components/plan-toc.ts +138 -0
package/src/modes/components/read-tool-group.ts +20 -4
package/src/modes/components/skill-message.ts +0 -1
package/src/modes/components/status-line.ts +3 -5
package/src/modes/components/tips.txt +1 -0
package/src/modes/components/todo-reminder.ts +0 -2
package/src/modes/components/tool-execution.ts +115 -90
package/src/modes/components/transcript-container.ts +84 -24
package/src/modes/components/user-message.ts +1 -2
package/src/modes/controllers/command-controller-shared.ts +7 -6
package/src/modes/controllers/command-controller.ts +70 -57
package/src/modes/controllers/event-controller.ts +41 -40
package/src/modes/controllers/extension-ui-controller.ts +10 -73
package/src/modes/controllers/input-controller.ts +135 -122
package/src/modes/controllers/mcp-command-controller.ts +69 -60
package/src/modes/controllers/selector-controller.ts +25 -27
package/src/modes/controllers/streaming-reveal.ts +212 -0
package/src/modes/controllers/tan-command-controller.ts +173 -0
package/src/modes/index.ts +5 -4
package/src/modes/interactive-mode.ts +171 -82
package/src/modes/setup-version.ts +11 -0
package/src/modes/setup-wizard/index.ts +3 -2
package/src/modes/setup-wizard/scenes/web-search.ts +3 -2
package/src/modes/setup-wizard/wizard-overlay.ts +1 -1
package/src/modes/theme/theme-schema.json +1 -1
package/src/modes/theme/theme.ts +8 -4
package/src/modes/types.ts +19 -8
package/src/modes/utils/context-usage.ts +10 -6
package/src/modes/utils/copy-targets.ts +133 -27
package/src/modes/utils/hotkeys-markdown.ts +1 -0
package/src/modes/utils/ui-helpers.ts +44 -46
package/src/plan-mode/approved-plan.ts +66 -43
package/src/plan-mode/plan-protection.ts +4 -4
package/src/prompts/system/background-tan-dispatch.md +8 -0
package/src/prompts/system/plan-mode-active.md +67 -58
package/src/prompts/system/plan-mode-approved.md +1 -1
package/src/sdk.ts +32 -60
package/src/session/agent-session.ts +89 -13
package/src/session/messages.ts +26 -0
package/src/session/session-manager.ts +13 -5
package/src/slash-commands/builtin-registry.ts +37 -10
package/src/slash-commands/helpers/usage-report.ts +2 -0
package/src/slash-commands/types.ts +4 -6
package/src/task/executor.ts +25 -4
package/src/task/index.ts +4 -0
package/src/task/render.ts +212 -148
package/src/telemetry-export.ts +25 -7
package/src/tools/archive-reader.ts +64 -0
package/src/tools/ask.ts +119 -164
package/src/tools/ast-edit.ts +98 -71
package/src/tools/ast-grep.ts +37 -43
package/src/tools/bash.ts +50 -6
package/src/tools/debug.ts +20 -8
package/src/tools/eval-backends.ts +6 -17
package/src/tools/eval-render.ts +21 -18
package/src/tools/eval.ts +5 -4
package/src/tools/fetch.ts +391 -91
package/src/tools/find.ts +44 -30
package/src/tools/gh-renderer.ts +81 -42
package/src/tools/grouped-file-output.ts +272 -48
package/src/tools/image-gen.ts +150 -103
package/src/tools/inspect-image-renderer.ts +63 -41
package/src/tools/inspect-image.ts +8 -1
package/src/tools/job.ts +3 -4
package/src/tools/memory-render.ts +4 -1
package/src/tools/plan-mode-guard.ts +21 -39
package/src/tools/read.ts +23 -16
package/src/tools/render-utils.ts +38 -40
package/src/tools/renderers.ts +16 -1
package/src/tools/report-tool-issue.ts +1 -1
package/src/tools/resolve.ts +14 -0
package/src/tools/search-tool-bm25.ts +36 -23
package/src/tools/search.ts +189 -95
package/src/tools/sqlite-reader.ts +9 -12
package/src/tools/todo.ts +138 -59
package/src/tools/write.ts +100 -60
package/src/tui/output-block.ts +60 -13
package/src/tui/status-line.ts +5 -1
package/src/utils/commit-message-generator.ts +9 -1
package/src/utils/enhanced-paste.ts +202 -0
package/src/utils/title-generator.ts +2 -1
package/src/web/scrapers/github.ts +255 -3
package/src/web/scrapers/youtube.ts +3 -2
package/src/web/search/providers/anthropic.ts +25 -19
package/src/web/search/providers/exa.ts +11 -3
package/src/web/search/providers/kimi.ts +28 -17
package/src/web/search/providers/parallel.ts +35 -24
package/src/web/search/providers/perplexity.ts +199 -51
package/src/web/search/providers/synthetic.ts +8 -6
package/src/web/search/providers/tavily.ts +9 -8
package/src/web/search/providers/zai.ts +8 -6
package/src/web/search/render.ts +39 -54
package/src/web/search/types.ts +5 -1
package/dist/types/eval/__tests__/shared-executors.test.d.ts +0 -1
package/src/eval/__tests__/shared-executors.test.ts +0 -609

package/src/eval/__tests__/agent-bridge.test.ts CHANGED Viewed

@@ -231,6 +231,57 @@ describe("runEvalAgent", () => {
 		});
 		await expect(runEvalAgent({ prompt: "fail" }, { session: makeSession() })).rejects.toThrow("boom");
 	});
+	// Regression: a runtime-limit abort returns exitCode=1, stderr="", error=undefined,
+	// aborted=true, abortReason="Subagent runtime limit exceeded (...)". The previous
+	// failure-message coalesce stopped at the empty `stderr` (since `??` only skips
+	// nullish values) and shipped an empty error through the bridge — Python then
+	// surfaced the generic `bridge call '__agent__' failed`. See #2006.
+	it("surfaces abortReason for aborts that leave stderr empty", async () => {
+		mockAgents();
+		const runSpy = vi.spyOn(taskExecutor, "runSubprocess");
+		runSpy.mockImplementationOnce(async options =>
+			singleResult(options, {
+				exitCode: 1,
+				output: "",
+				stderr: "",
+				error: undefined,
+				aborted: true,
+				abortReason: "Subagent runtime limit exceeded (task.maxRuntimeMs=900000)",
+			}),
+		);
+		runSpy.mockImplementationOnce(async options =>
+			singleResult(options, {
+				exitCode: 1,
+				output: "",
+				stderr: "   ",
+				error: "   ",
+				aborted: true,
+				abortReason: "Cancelled by caller",
+			}),
+		);
+		runSpy.mockImplementationOnce(async options =>
+			singleResult(options, {
+				exitCode: 1,
+				output: "",
+				stderr: "",
+				error: undefined,
+			}),
+		);
+		await expect(runEvalAgent({ prompt: "slow" }, { session: makeSession() })).rejects.toThrow(
+			"Subagent runtime limit exceeded (task.maxRuntimeMs=900000)",
+		);
+		// Whitespace-only stderr/error must not mask abortReason either.
+		await expect(runEvalAgent({ prompt: "cancelled" }, { session: makeSession() })).rejects.toThrow(
+			"Cancelled by caller",
+		);
+		// Last resort: still produce a non-empty message even when nothing useful is set,
+		// so Python never falls back to `bridge call '__agent__' failed`.
+		await expect(runEvalAgent({ prompt: "blank" }, { session: makeSession() })).rejects.toThrow(
+			"agent() subagent 'task' failed.",
+		);
+	});
 });
 describe("agent() through eval runtimes", () => {
@@ -326,18 +377,6 @@ describe("agent() through eval runtimes", () => {
 			singleResult(options, { output: "hello from python" }),
 		);
-		const probe = await executePython('print("probe")', {
-			cwd: tempDir.path(),
-			sessionId: `${sessionId}:probe`,
-			sessionFile,
-			kernelMode: "per-call",
-		});
-		if (probe.exitCode === undefined && probe.cancelled) {
-			expect(probe.output).toBe("");
-			return;
-		}
-		expect(probe.exitCode).toBe(0);
 		const result = await executePython('print(agent("hi"))', {
 			cwd: tempDir.path(),
 			sessionId,
@@ -345,6 +384,10 @@ describe("agent() through eval runtimes", () => {
 			kernelMode: "per-call",
 			toolSession: session,
 		});
+		if (result.exitCode === undefined && result.cancelled) {
+			expect(result.output).toBe("");
+			return; // kernel unavailable in this environment
+		}
 		expect(result.exitCode).toBe(0);
 		expect(result.output.trim()).toBe("hello from python");
@@ -373,22 +416,14 @@ describe("agent() through eval runtimes", () => {
 			}
 		});
-		const probe = await executePython('print("probe")', {
-			cwd: tempDir.path(),
-			sessionId: `${sessionId}:probe`,
-			sessionFile,
-			kernelMode: "per-call",
-		});
-		if (probe.exitCode === undefined && probe.cancelled) {
-			expect(probe.output).toBe("");
-			return;
-		}
-		expect(probe.exitCode).toBe(0);
 		const result = await executePython(
 			'import json\nprint(json.dumps(parallel([lambda n=n: agent(n) for n in ["a", "b", "c", "d"]])))',
 			{ cwd: tempDir.path(), sessionId, sessionFile, kernelMode: "per-call", toolSession: session },
 		);
+		if (result.exitCode === undefined && result.cancelled) {
+			expect(result.output).toBe("");
+			return; // kernel unavailable in this environment
+		}
 		expect(result.exitCode).toBe(0);
 		expect(JSON.parse(result.output.trim())).toEqual(["a", "b", "c", "d"]);
@@ -412,7 +447,14 @@ describe("agent() through eval runtimes", () => {
 		// The host must respond the instant the cell aborts so the kernel can
 		// unwind via KeyboardInterrupt instead of being hard-killed (which used to
 		// surface "[kernel] Python kernel shutdown" and lose all session state).
+		let inFlight = 0;
+		let markSaturated: (() => void) | undefined;
+		const saturated = new Promise<void>(resolve => {
+			markSaturated = resolve;
+		});
 		vi.spyOn(taskExecutor, "runSubprocess").mockImplementation(async options => {
+			// task.maxConcurrency=6 → six bridge calls block at once; signal then.
+			if (++inFlight >= 6) markSaturated?.();
 			await Bun.sleep(9000); // deliberately ignores options.signal
 			return singleResult(options, { output: options.assignment ?? "" });
 		});
@@ -432,8 +474,9 @@ describe("agent() through eval runtimes", () => {
 		expect(seed.exitCode).toBe(0);
 		const ac = new AbortController();
-		// Abort ~1s in, after the worker threads are blocked in their bridge calls.
-		setTimeout(() => ac.abort(new Error("external interrupt")), 1000);
+		// Abort the instant all six worker threads are confirmed blocked in their
+		// bridge calls (condition-driven) instead of waiting a fixed wall second.
+		void saturated.then(() => ac.abort(new Error("external interrupt")));
 		const start = Date.now();
 		const result = await executePython(
@@ -568,12 +611,12 @@ describe("agent() through eval runtimes", () => {
 		// of its own. The bridge pause must make that delegated time invisible to
 		// the watchdog.
 		vi.spyOn(taskExecutor, "runSubprocess").mockImplementation(async options => {
-			await Bun.sleep(200);
+			await Bun.sleep(40);
 			return singleResult(options, { output: "done" });
 		});
 		const ops: string[] = [];
-		using idle = new IdleTimeout(60);
+		using idle = new IdleTimeout(20);
 		const result = await runEvalAgent(
 			{ prompt: "investigate" },
 			{
@@ -591,7 +634,7 @@ describe("agent() through eval runtimes", () => {
 		expect(ops).toEqual([EVAL_TIMEOUT_PAUSE_OP, EVAL_TIMEOUT_RESUME_OP]);
 		expect(idle.signal.aborted).toBe(false);
-		await Bun.sleep(90);
+		await Bun.sleep(60);
 		expect(idle.signal.aborted).toBe(true);
 	});
@@ -604,7 +647,7 @@ describe("agent() through eval runtimes", () => {
 		// They render as status, but timeout accounting is controlled only by the
 		// bridge pause/resume events.
 		vi.spyOn(taskExecutor, "runSubprocess").mockImplementation(async options => {
-			for (let i = 0; i < 40; i++) {
+			for (let i = 0; i < 20; i++) {
 				options.onProgress?.({
 					index: options.index,
 					id: options.id,
@@ -621,13 +664,13 @@ describe("agent() through eval runtimes", () => {
 					cost: 0,
 					durationMs: i * 10,
 				});
-				await Bun.sleep(10);
+				await Bun.sleep(5);
 			}
 			return singleResult(options, { output: "done" });
 		});
 		const ops: string[] = [];
-		using idle = new IdleTimeout(80);
+		using idle = new IdleTimeout(40);
 		const result = await runEvalAgent(
 			{ prompt: "investigate" },
 			{

package/src/eval/__tests__/llm-bridge.test.ts CHANGED Viewed

@@ -4,6 +4,7 @@ import type { Api, AssistantMessage, Model } from "@oh-my-pi/pi-ai";
 import * as ai from "@oh-my-pi/pi-ai";
 import { Effort } from "@oh-my-pi/pi-ai";
 import { TempDir } from "@oh-my-pi/pi-utils";
+import { $ } from "bun";
 import type { ModelRegistry } from "../../config/model-registry";
 import { Settings } from "../../config/settings";
 import type { ToolSession } from "../../tools";
@@ -13,7 +14,7 @@ import { IdleTimeout } from "../idle-timeout";
 import { disposeAllVmContexts } from "../js/context-manager";
 import { executeJs } from "../js/executor";
 import { runEvalLlm } from "../llm-bridge";
-import { disposeAllKernelSessions, executePython } from "../py/executor";
+import { disposeAllKernelSessions, type PythonResult } from "../py/executor";
 function makeModel(provider: string, id: string, extra: Partial<Model<Api>> = {}): Model<Api> {
 	return {
@@ -57,6 +58,7 @@ function makeSession(opts: SessionOptions = {}): ToolSession {
 	const modelRegistry = {
 		getAvailable: () => opts.available ?? [SMOL, DEFAULT, SLOW],
 		getApiKey: async () => (opts.apiKey === undefined ? "test-key" : opts.apiKey),
+		resolver: () => async () => (opts.apiKey === undefined ? "test-key" : opts.apiKey),
 	} as unknown as ModelRegistry;
 	return {
 		settings,
@@ -96,6 +98,77 @@ function assistant(opts: {
 	};
 }
+async function runPythonLlmInSubprocess(options: { structured: boolean; tempDir: TempDir }): Promise<PythonResult> {
+	const repoRoot = path.resolve(import.meta.dir, "../../../..");
+	const scriptPath = path.join(options.tempDir.path(), "run-python-llm.ts");
+	const resultPath = path.join(options.tempDir.path(), "python-llm-result.json");
+	const aiPath = path.resolve(import.meta.dir, "../../../../ai/src/index.ts");
+	const executorPath = path.resolve(import.meta.dir, "../py/executor.ts");
+	const settingsPath = path.resolve(import.meta.dir, "../../config/settings.ts");
+	const code = options.structured
+		? 'import json\nprint(json.dumps(llm("hi", schema={"type": "object"})))'
+		: 'print(llm("hi", model="smol"))';
+	const responseContent = options.structured
+		? '[{ type: "toolCall", id: "tc-1", name: "respond", arguments: { ok: true } }]'
+		: '[{ type: "text", text: "hello from python" }]';
+	await Bun.write(
+		scriptPath,
+		`
+import { vi } from "bun:test";
+import * as ai from ${JSON.stringify(aiPath)};
+import { executePython } from ${JSON.stringify(executorPath)};
+import { Settings } from ${JSON.stringify(settingsPath)};
+const SMOL = {
+	id: "smol",
+	name: "smol",
+	api: "openai-responses",
+	provider: "p",
+	baseUrl: "https://example.test/v1",
+	reasoning: false,
+	input: ["text"],
+	cost: { input: 1, output: 1, cacheRead: 0, cacheWrite: 1 },
+	contextWindow: 128000,
+	maxTokens: 4096,
+};
+const settings = Settings.isolated({ "async.enabled": false, "task.isolation.mode": "none" });
+settings.setModelRole("smol", "p/smol");
+settings.setModelRole("slow", "p/slow");
+const session = {
+	settings,
+	modelRegistry: {
+		getAvailable: () => [SMOL],
+		getApiKey: async () => "test-key",
+		resolver: () => async () => "test-key",
+	},
+	getActiveModelString: () => "p/smol",
+};
+vi.spyOn(ai, "completeSimple").mockResolvedValue({
+	role: "assistant",
+	api: "openai-responses",
+	provider: "p",
+	model: "smol",
+	stopReason: "stop",
+	content: ${responseContent},
+});
+const result = await executePython(${JSON.stringify(code)}, {
+	cwd: ${JSON.stringify(options.tempDir.path())},
+	sessionId: ${JSON.stringify(`py-llm:${options.structured ? "struct" : "plain"}`)},
+	sessionFile: ${JSON.stringify(path.join(options.tempDir.path(), "session.jsonl"))},
+	toolSession: session,
+	kernelMode: "per-call",
+});
+await Bun.write(${JSON.stringify(resultPath)}, JSON.stringify(result));
+process.exit(0);
+`,
+	);
+	const child = await $`bun ${scriptPath}`.cwd(repoRoot).quiet().nothrow();
+	const stdout = child.stdout.toString();
+	const stderr = child.stderr.toString();
+	if (child.exitCode !== 0) throw new Error(stderr || stdout || `Python llm subprocess exited with ${child.exitCode}`);
+	return (await Bun.file(resultPath).json()) as PythonResult;
+}
 describe("runEvalLlm", () => {
 	afterEach(() => {
 		vi.restoreAllMocks();
@@ -290,38 +363,24 @@ describe("llm() through eval runtimes", () => {
 	});
 	it("exposes llm() in the Python runtime", async () => {
-		using tempDir = TempDir.createSync("@omp-eval-llm-py-");
-		const sessionFile = path.join(tempDir.path(), "session.jsonl");
-		const sessionId = `py-llm:${crypto.randomUUID()}`;
-		vi.spyOn(ai, "completeSimple").mockResolvedValue(assistant({ text: "hello from python" }));
-		const result = await executePython('print(llm("hi", model="smol"))', {
-			cwd: tempDir.path(),
-			sessionId,
-			sessionFile,
-			toolSession: makeSession(),
-		});
-		expect(result.exitCode).toBe(0);
-		expect(result.output.trim()).toBe("hello from python");
+		const tempDir = TempDir.createSync("@omp-eval-llm-py-");
+		try {
+			const result = await runPythonLlmInSubprocess({ structured: false, tempDir });
+			expect(result.exitCode).toBe(0);
+			expect(result.output.trim()).toBe("hello from python");
+		} finally {
+			tempDir.removeSync();
+		}
 	});
 	it("parses structured llm() output in the Python runtime", async () => {
-		using tempDir = TempDir.createSync("@omp-eval-llm-py-struct-");
-		const sessionFile = path.join(tempDir.path(), "session.jsonl");
-		const sessionId = `py-llm-struct:${crypto.randomUUID()}`;
-		vi.spyOn(ai, "completeSimple").mockResolvedValue(
-			assistant({ toolCall: { name: "respond", arguments: { ok: true } } }),
-		);
-		const result = await executePython('import json\nprint(json.dumps(llm("hi", schema={"type": "object"})))', {
-			cwd: tempDir.path(),
-			sessionId,
-			sessionFile,
-			toolSession: makeSession(),
-		});
-		expect(result.exitCode).toBe(0);
-		expect(JSON.parse(result.output.trim())).toEqual({ ok: true });
+		const tempDir = TempDir.createSync("@omp-eval-llm-py-struct-");
+		try {
+			const result = await runPythonLlmInSubprocess({ structured: true, tempDir });
+			expect(result.exitCode).toBe(0);
+			expect(JSON.parse(result.output.trim())).toEqual({ ok: true });
+		} finally {
+			tempDir.removeSync();
+		}
 	});
 });

package/src/eval/agent-bridge.ts CHANGED Viewed

@@ -13,7 +13,7 @@ import subagentUserPromptTemplate from "../prompts/system/subagent-user-prompt.m
 import * as taskDiscovery from "../task/discovery";
 import * as taskExecutor from "../task/executor";
 import { AgentOutputManager } from "../task/output-manager";
-import type { AgentDefinition, AgentProgress } from "../task/types";
+import type { AgentDefinition, AgentProgress, SingleResult } from "../task/types";
 import type { ToolSession } from "../tools";
 import { ToolError } from "../tools/tool-errors";
 import { withBridgeTimeoutPause } from "./bridge-timeout";
@@ -173,6 +173,26 @@ function emitProgressStatus(emitStatus: ((event: JsStatusEvent) => void) | undef
 	});
 }
+/**
+ * Coalesce a subagent failure into a non-empty, human-meaningful error message.
+ *
+ * When the executor aborts a subagent (runtime limit, parent cancellation, …)
+ * the actionable explanation lives on `abortReason`, while `error`/`stderr`
+ * are routinely empty strings. Plain `??` coalescing stops at the empty string
+ * and ships an empty error through the bridge — Python then surfaces only the
+ * generic `bridge call '__agent__' failed`. See #2006.
+ */
+function buildSubagentFailureMessage(agentName: string, result: SingleResult): string {
+	const abortReason = trimToUndefined(result.abortReason);
+	if (result.aborted && abortReason) return abortReason;
+	return (
+		trimToUndefined(result.error) ??
+		trimToUndefined(result.stderr) ??
+		abortReason ??
+		`agent() subagent '${agentName}' failed.`
+	);
+}
 /**
  * Run a single subagent on behalf of an eval cell's `agent()` call.
  */
@@ -225,7 +245,6 @@ export async function runEvalAgent(args: unknown, options: EvalAgentBridgeOption
 		getSessionId: options.session.getSessionId ?? (() => null),
 	};
 	const parentArtifactManager = options.session.getArtifactManager?.() ?? undefined;
-	const parentEvalSessionId = options.session.getEvalSessionId?.() ?? undefined;
 	const mcpManager = options.session.mcpManager ?? MCPManager.instance();
 	const { sessionFile, artifactsDir, contextFile } = await getArtifacts(options.session);
 	const outputManager = getOutputManager(options.session);
@@ -260,6 +279,12 @@ export async function runEvalAgent(args: unknown, options: EvalAgentBridgeOption
 			authStorage: options.session.authStorage,
 			modelRegistry: options.session.modelRegistry,
 			settings: options.session.settings,
+			// Eval `agent()` subagents are never wall-clock capped: the parent
+			// cell's idle watchdog is suspended for the whole bridge call
+			// (withBridgeTimeoutPause), so a long-running phase/recovery workflow
+			// must not be killed by `task.maxRuntimeMs`. Force the limit off
+			// regardless of the inherited session setting.
+			maxRuntimeMs: 0,
 			mcpManager,
 			contextFiles,
 			skills: availableSkills,
@@ -271,14 +296,16 @@ export async function runEvalAgent(args: unknown, options: EvalAgentBridgeOption
 			parentHindsightSessionState: options.session.getHindsightSessionState?.(),
 			parentMnemopiSessionState: options.session.getMnemopiSessionState?.(),
 			parentTelemetry: options.session.getTelemetry?.(),
-			parentEvalSessionId,
+			// Deliberately omit parentEvalSessionId: the parent's Python kernel is
+			// blocked on this bridge call, so sharing the eval session would deadlock
+			// (subagent queues behind the parent's in-flight execution, parent waits
+			// for subagent → circular). Each bridge-spawned subagent gets its own
+			// eval session with an independent kernel.
 		}),
 	);
-	if (result.exitCode !== 0 || result.error) {
-		const failureMessage =
-			result.error ?? result.stderr ?? result.abortReason ?? `agent() subagent '${agentName}' failed.`;
-		throw new ToolError(failureMessage);
+	if (result.exitCode !== 0 || result.error || result.aborted) {
+		throw new ToolError(buildSubagentFailureMessage(agentName, result));
 	}
 	options.session.recordEvalSubagentUsage?.(result.usage?.output ?? 0);

package/src/eval/llm-bridge.ts CHANGED Viewed

@@ -15,6 +15,7 @@ import { instrumentedCompleteSimple, resolveTelemetry } from "@oh-my-pi/pi-agent
 import { type Api, Effort, getSupportedEfforts, type Model, type Tool } from "@oh-my-pi/pi-ai";
 import * as z from "zod/v4";
 import { extractTextContent, extractToolCall, parseJsonPayload } from "../commit/utils";
 import { expandRoleAlias, formatModelString, resolveModelFromString } from "../config/model-resolver";
 import type { ToolSession } from "../tools";
 import { ToolError } from "../tools/tool-errors";
@@ -112,8 +113,9 @@ export async function runEvalLlm(args: unknown, options: EvalLlmBridgeOptions):
 		);
 	}
-	const apiKey = await options.session.modelRegistry?.getApiKey(model);
-	if (!apiKey) {
+	const registry = options.session.modelRegistry;
+	const apiKey = await registry?.getApiKey(model);
+	if (!registry || !apiKey) {
 		throw new ToolError(
 			`llm() has no API key for ${formatModelString(model)}. Configure credentials for this provider or choose another tier.`,
 		);
@@ -143,7 +145,10 @@ export async function runEvalLlm(args: unknown, options: EvalLlmBridgeOptions):
 				tools,
 			},
 			{
-				apiKey,
+				apiKey: registry.resolver(model.provider, {
+					sessionId: options.session.getSessionId?.() ?? undefined,
+					baseUrl: model.baseUrl,
+				}),
 				signal: options.signal,
 				reasoning: reasoningForTier(tier, model),
 				toolChoice: schema ? { type: "tool", name: STRUCTURED_TOOL_NAME } : undefined,

package/src/extensibility/extensions/runner.ts CHANGED Viewed

@@ -354,6 +354,7 @@ export class ExtensionRunner {
 		"ctrl+o": true,
 		"ctrl+t": true,
 		"ctrl+g": true,
+		"alt+m": true,
 		// Default chord for `app.message.followUp` (Windows Terminal can't deliver Ctrl+Enter; #1903).
 		"ctrl+q": true,
 		"shift+tab": true,

package/src/extensibility/plugins/doctor.ts CHANGED Viewed

@@ -25,7 +25,6 @@ export async function runDoctorChecks(): Promise<DoctorCheck[]> {
 	const apiKeys = [
 		{ name: "ANTHROPIC_API_KEY", description: "Anthropic API" },
 		{ name: "OPENAI_API_KEY", description: "OpenAI API" },
-		{ name: "PERPLEXITY_API_KEY", description: "Perplexity search" },
 		{ name: "EXA_API_KEY", description: "Exa search" },
 	];

package/src/extensibility/plugins/marketplace-auto-update.ts ADDED Viewed

@@ -0,0 +1,49 @@
+import { getProjectDir, logger } from "@oh-my-pi/pi-utils";
+type MarketplaceAutoUpdateMode = "off" | "notify" | "auto";
+interface MarketplaceAutoUpdateOptions {
+	autoUpdate: MarketplaceAutoUpdateMode;
+	resolveActiveProjectRegistryPath: (cwd: string) => Promise<string | null>;
+	clearPluginRootsCache: () => void;
+}
+export function scheduleMarketplaceAutoUpdate(options: MarketplaceAutoUpdateOptions): void {
+	if (options.autoUpdate === "off") {
+		return;
+	}
+	void runMarketplaceAutoUpdate(options);
+}
+async function runMarketplaceAutoUpdate(options: MarketplaceAutoUpdateOptions): Promise<void> {
+	try {
+		// Startup perf: marketplace manager pulls scraper/fetch/cache code; keep it out of the initial TUI graph.
+		const {
+			MarketplaceManager,
+			getInstalledPluginsRegistryPath,
+			getMarketplacesCacheDir,
+			getMarketplacesRegistryPath,
+			getPluginsCacheDir,
+		} = await import("./marketplace");
+		const mgr = new MarketplaceManager({
+			marketplacesRegistryPath: getMarketplacesRegistryPath(),
+			installedRegistryPath: getInstalledPluginsRegistryPath(),
+			projectInstalledRegistryPath: (await options.resolveActiveProjectRegistryPath(getProjectDir())) ?? undefined,
+			marketplacesCacheDir: getMarketplacesCacheDir(),
+			pluginsCacheDir: getPluginsCacheDir(),
+			clearPluginRootsCache: options.clearPluginRootsCache,
+		});
+		await mgr.refreshStaleMarketplaces();
+		const updates = await mgr.checkForUpdates();
+		if (updates.length === 0) return;
+		if (options.autoUpdate === "auto") {
+			await mgr.upgradeAllPlugins();
+			logger.debug(`Auto-upgraded ${updates.length} marketplace plugin(s)`);
+		} else {
+			logger.debug(`${updates.length} marketplace plugin update(s) available — /marketplace upgrade`);
+		}
+	} catch {
+		// Silently ignore — network failure, corrupt data, offline.
+	}
+}

package/src/goals/tools/goal-tool.ts CHANGED Viewed

@@ -8,9 +8,9 @@ import type { Theme, ThemeColor } from "../../modes/theme/theme";
 import goalDescription from "../../prompts/tools/goal.md" with { type: "text" };
 import { formatDuration } from "../../slash-commands/helpers/format";
 import type { ToolSession } from "../../tools";
-import { formatErrorMessage, TRUNCATE_LENGTHS } from "../../tools/render-utils";
+import { formatErrorDetail, TRUNCATE_LENGTHS } from "../../tools/render-utils";
 import { ToolError } from "../../tools/tool-errors";
-import { renderStatusLine, truncateToWidth } from "../../tui";
+import { framedBlock, renderStatusLine, truncateToWidth } from "../../tui";
 import { completionBudgetReport, remainingTokens } from "../runtime";
 import type { Goal, GoalStatus, GoalToolDetails } from "../state";
@@ -173,8 +173,7 @@ export const goalToolRenderer = {
 		if (args.op === "create" && args.token_budget !== undefined) {
 			meta.push(`budget ${formatNumber(args.token_budget)}`);
 		}
-		const text = renderStatusLine({ icon: "pending", title: "Goal", description, meta }, uiTheme);
-		return new Text(text, 0, 0);
+		return new Text(renderStatusLine({ icon: "pending", title: "Goal", description, meta }, uiTheme), 0, 0);
 	},
 	renderResult(
@@ -190,51 +189,62 @@ export const goalToolRenderer = {
 		if (result.isError) {
 			const header = renderStatusLine({ icon: "error", title: "Goal", description }, uiTheme);
-			const body = formatErrorMessage(fallbackText || "Goal tool failed", uiTheme);
-			return new Text([header, body].join("\n"), 0, 0);
+			return framedBlock(uiTheme, width => ({
+				header,
+				sections: [{ lines: formatErrorDetail(fallbackText || "Goal tool failed", uiTheme).split("\n") }],
+				state: "error",
+				borderColor: "error",
+				width,
+			}));
 		}
 		const goal = details?.goal ?? null;
 		if (!goal) {
-			const header = renderStatusLine({ icon: "warning", title: "Goal", description }, uiTheme);
-			const body = uiTheme.fg("muted", "No active goal.");
-			return new Text([header, body].join("\n"), 0, 0);
+			return new Text(
+				renderStatusLine({ icon: "warning", title: "Goal", description, meta: ["no active goal"] }, uiTheme),
+				0,
+				0,
+			);
 		}
-		const lines: string[] = [];
-		lines.push(
-			renderStatusLine(
-				{
-					icon: "success",
-					title: "Goal",
-					description,
-					badge: { label: goal.status, color: goalBadgeColor(goal.status) },
-				},
-				uiTheme,
-			),
+		const header = renderStatusLine(
+			{
+				icon: "success",
+				title: "Goal",
+				description,
+				badge: { label: goal.status, color: goalBadgeColor(goal.status) },
+			},
+			uiTheme,
 		);
+		const lines: string[] = [];
 		const objectiveText = truncateToWidth(goal.objective.trim(), TRUNCATE_LENGTHS.LONG);
-		lines.push(`  ${uiTheme.italic(uiTheme.fg("muted", `"${objectiveText}"`))}`);
+		lines.push(uiTheme.italic(uiTheme.fg("muted", `"${objectiveText}"`)));
 		const used = formatNumber(goal.tokensUsed);
 		const tokensLine =
 			goal.tokenBudget !== undefined
 				? `${used} / ${formatNumber(goal.tokenBudget)} tokens (${formatNumber(Math.max(0, goal.tokenBudget - goal.tokensUsed))} left)`
 				: `${used} tokens`;
-		lines.push(`  ${uiTheme.fg("dim", tokensLine)}`);
+		const metaParts = [tokensLine];
 		if (goal.timeUsedSeconds > 0) {
-			lines.push(`  ${uiTheme.fg("dim", `${formatDuration(goal.timeUsedSeconds * 1000)} elapsed`)}`);
+			metaParts.push(`${formatDuration(goal.timeUsedSeconds * 1000)} elapsed`);
 		}
+		lines.push(uiTheme.fg("dim", metaParts.join(" · ")));
 		const report = details?.completionBudgetReport;
+		const sections: Array<{ label?: string; lines: string[] }> = [{ lines }];
 		if (report) {
-			lines.push("");
-			lines.push(uiTheme.italic(uiTheme.fg("muted", report)));
+			sections.push({ label: "Report", lines: report.split("\n").map(line => uiTheme.fg("muted", line)) });
 		}
-		return new Text(lines.join("\n"), 0, 0);
+		return framedBlock(uiTheme, width => ({
+			header,
+			sections,
+			state: "success",
+			borderColor: "borderMuted",
+			width,
+		}));
 	},
 	mergeCallAndResult: true,