npm - @oh-my-pi/pi-coding-agent - Versions diffs - 15.5.13 → 15.6.0 - Mend

@oh-my-pi/pi-coding-agent 15.5.13 → 15.6.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (192) hide show

package/CHANGELOG.md +77 -0
package/dist/types/cli/classify-install-target.d.ts +0 -10
package/dist/types/cli/initial-message.d.ts +1 -1
package/dist/types/cli/tiny-models-cli.d.ts +9 -0
package/dist/types/commands/tiny-models.d.ts +22 -0
package/dist/types/commit/analysis/conventional.d.ts +1 -1
package/dist/types/commit/analysis/summary.d.ts +1 -1
package/dist/types/commit/changelog/generate.d.ts +1 -1
package/dist/types/commit/changelog/index.d.ts +2 -2
package/dist/types/commit/map-reduce/map-phase.d.ts +1 -1
package/dist/types/commit/map-reduce/reduce-phase.d.ts +1 -1
package/dist/types/config/model-id-affixes.d.ts +10 -0
package/dist/types/config/model-registry.d.ts +1 -1
package/dist/types/config/models-config-schema.d.ts +2 -0
package/dist/types/config/settings-schema.d.ts +233 -17
package/dist/types/discovery/helpers.d.ts +1 -1
package/dist/types/discovery/substitute-plugin-root.d.ts +0 -4
package/dist/types/eval/__tests__/llm-bridge.test.d.ts +1 -0
package/dist/types/eval/js/shared/rewrite-imports.d.ts +16 -1
package/dist/types/eval/llm-bridge.d.ts +25 -0
package/dist/types/export/html/template.generated.d.ts +1 -1
package/dist/types/extensibility/plugins/legacy-pi-compat.d.ts +15 -0
package/dist/types/internal-urls/agent-protocol.d.ts +2 -1
package/dist/types/internal-urls/artifact-protocol.d.ts +2 -1
package/dist/types/internal-urls/local-protocol.d.ts +2 -1
package/dist/types/internal-urls/memory-protocol.d.ts +2 -1
package/dist/types/internal-urls/omp-protocol.d.ts +2 -1
package/dist/types/internal-urls/router.d.ts +8 -1
package/dist/types/internal-urls/rule-protocol.d.ts +2 -1
package/dist/types/internal-urls/skill-protocol.d.ts +2 -1
package/dist/types/internal-urls/types.d.ts +26 -0
package/dist/types/memory-backend/index.d.ts +1 -0
package/dist/types/memory-backend/resolve.d.ts +2 -1
package/dist/types/memory-backend/types.d.ts +7 -1
package/dist/types/mnemosyne/backend.d.ts +4 -0
package/dist/types/mnemosyne/config.d.ts +29 -0
package/dist/types/mnemosyne/index.d.ts +3 -0
package/dist/types/mnemosyne/state.d.ts +72 -0
package/dist/types/modes/components/custom-editor.d.ts +2 -3
package/dist/types/modes/components/hook-selector.d.ts +27 -0
package/dist/types/modes/components/index.d.ts +1 -0
package/dist/types/modes/components/status-line/context-thresholds.d.ts +6 -0
package/dist/types/modes/components/tiny-title-download-progress.d.ts +11 -0
package/dist/types/modes/components/welcome.d.ts +1 -0
package/dist/types/modes/controllers/extension-ui-controller.d.ts +4 -1
package/dist/types/modes/gradient-highlight.d.ts +23 -0
package/dist/types/modes/interactive-mode.d.ts +4 -2
package/dist/types/modes/internal-url-autocomplete.d.ts +43 -0
package/dist/types/modes/orchestrate.d.ts +10 -0
package/dist/types/modes/theme/defaults/index.d.ts +8406 -8406
package/dist/types/modes/theme/theme.d.ts +2 -1
package/dist/types/modes/ultrathink.d.ts +3 -3
package/dist/types/modes/utils/keybinding-matchers.d.ts +5 -0
package/dist/types/sdk.d.ts +3 -0
package/dist/types/session/agent-session.d.ts +35 -0
package/dist/types/system-prompt.d.ts +2 -0
package/dist/types/task/executor.d.ts +2 -0
package/dist/types/task/render.d.ts +5 -1
package/dist/types/tiny/models.d.ts +185 -0
package/dist/types/tiny/text.d.ts +4 -0
package/dist/types/tiny/title-client.d.ts +24 -0
package/dist/types/tiny/title-protocol.d.ts +74 -0
package/dist/types/tiny/worker.d.ts +2 -0
package/dist/types/tools/bash.d.ts +3 -1
package/dist/types/tools/index.d.ts +7 -4
package/dist/types/tools/memory-edit.d.ts +40 -0
package/dist/types/tools/{hindsight-recall.d.ts → memory-recall.d.ts} +6 -6
package/dist/types/tools/{hindsight-reflect.d.ts → memory-reflect.d.ts} +6 -6
package/dist/types/tools/memory-render.d.ts +60 -0
package/dist/types/tools/{hindsight-retain.d.ts → memory-retain.d.ts} +6 -6
package/dist/types/tools/todo-write.d.ts +8 -0
package/dist/types/tools/tool-result.d.ts +2 -0
package/dist/types/utils/title-generator.d.ts +3 -0
package/package.json +18 -14
package/scripts/build-binary.ts +1 -0
package/src/cli/tiny-models-cli.ts +127 -0
package/src/cli-commands.ts +1 -0
package/src/cli.ts +8 -8
package/src/commands/tiny-models.ts +36 -0
package/src/config/model-equivalence.ts +43 -2
package/src/config/model-id-affixes.ts +64 -0
package/src/config/model-registry.ts +166 -8
package/src/config/models-config-schema.ts +1 -1
package/src/config/settings-schema.ts +206 -14
package/src/edit/hashline/diff.ts +5 -7
package/src/eval/__tests__/llm-bridge.test.ts +297 -0
package/src/eval/__tests__/shared-executors.test.ts +36 -0
package/src/eval/js/shared/local-module-loader.ts +13 -1
package/src/eval/js/shared/prelude.txt +8 -0
package/src/eval/js/shared/rewrite-imports.ts +31 -26
package/src/eval/js/tool-bridge.ts +4 -0
package/src/eval/llm-bridge.ts +181 -0
package/src/eval/py/prelude.py +52 -31
package/src/export/html/template.generated.ts +1 -1
package/src/export/html/template.js +0 -13
package/src/extensibility/plugins/legacy-pi-compat.ts +60 -23
package/src/internal-urls/agent-protocol.ts +18 -1
package/src/internal-urls/artifact-protocol.ts +19 -1
package/src/internal-urls/docs-index.generated.ts +5 -4
package/src/internal-urls/local-protocol.ts +14 -1
package/src/internal-urls/memory-protocol.ts +6 -1
package/src/internal-urls/omp-protocol.ts +5 -1
package/src/internal-urls/router.ts +20 -1
package/src/internal-urls/rule-protocol.ts +8 -1
package/src/internal-urls/skill-protocol.ts +8 -1
package/src/internal-urls/types.ts +27 -0
package/src/lsp/render.ts +1 -1
package/src/main.ts +4 -0
package/src/mcp/oauth-flow.ts +2 -2
package/src/memory-backend/index.ts +1 -0
package/src/memory-backend/resolve.ts +4 -1
package/src/memory-backend/types.ts +8 -1
package/src/mnemosyne/backend.ts +374 -0
package/src/mnemosyne/config.ts +160 -0
package/src/mnemosyne/index.ts +3 -0
package/src/mnemosyne/state.ts +548 -0
package/src/modes/acp/acp-agent.ts +11 -6
package/src/modes/components/agent-dashboard.ts +4 -4
package/src/modes/components/custom-editor.ts +3 -2
package/src/modes/components/diff.ts +2 -2
package/src/modes/components/extensions/extension-list.ts +3 -2
package/src/modes/components/footer.ts +5 -6
package/src/modes/components/history-search.ts +3 -3
package/src/modes/components/hook-selector.ts +94 -8
package/src/modes/components/index.ts +1 -0
package/src/modes/components/mcp-add-wizard.ts +3 -3
package/src/modes/components/model-selector.ts +124 -26
package/src/modes/components/oauth-selector.ts +3 -3
package/src/modes/components/session-observer-overlay.ts +19 -13
package/src/modes/components/session-selector.ts +3 -3
package/src/modes/components/settings-defs.ts +7 -0
package/src/modes/components/status-line/context-thresholds.ts +11 -0
package/src/modes/components/status-line/presets.ts +1 -0
package/src/modes/components/status-line/segments.ts +25 -2
package/src/modes/components/tiny-title-download-progress.ts +90 -0
package/src/modes/components/tips.txt +12 -0
package/src/modes/components/tool-execution.ts +67 -3
package/src/modes/components/tree-selector.ts +3 -3
package/src/modes/components/user-message-selector.ts +3 -3
package/src/modes/components/welcome.ts +55 -1
package/src/modes/controllers/command-controller.ts +16 -1
package/src/modes/controllers/extension-ui-controller.ts +3 -1
package/src/modes/controllers/input-controller.ts +57 -0
package/src/modes/gradient-highlight.ts +70 -0
package/src/modes/interactive-mode.ts +80 -196
package/src/modes/internal-url-autocomplete.ts +143 -0
package/src/modes/orchestrate.ts +36 -0
package/src/modes/prompt-action-autocomplete.ts +12 -0
package/src/modes/theme/theme.ts +7 -0
package/src/modes/ultrathink.ts +9 -53
package/src/modes/utils/keybinding-matchers.ts +11 -0
package/src/prompts/system/memory-consolidation-system.md +8 -0
package/src/prompts/system/memory-extraction-system.md +26 -0
package/src/prompts/{commands/orchestrate.md → system/orchestrate-notice.md} +5 -16
package/src/prompts/system/system-prompt.md +2 -0
package/src/prompts/system/tiny-title-system.md +8 -0
package/src/prompts/tools/eval.md +2 -0
package/src/prompts/tools/memory-edit.md +8 -0
package/src/prompts/tools/task.md +4 -7
package/src/sdk.ts +8 -6
package/src/session/agent-session.ts +147 -44
package/src/session/session-manager.ts +47 -0
package/src/slash-commands/builtin-registry.ts +10 -1
package/src/system-prompt.ts +4 -0
package/src/task/commands.ts +1 -5
package/src/task/executor.ts +8 -0
package/src/task/index.ts +2 -0
package/src/task/render.ts +69 -26
package/src/tiny/models.ts +217 -0
package/src/tiny/text.ts +19 -0
package/src/tiny/title-client.ts +340 -0
package/src/tiny/title-protocol.ts +51 -0
package/src/tiny/worker.ts +523 -0
package/src/tools/bash.ts +58 -16
package/src/tools/browser/tab-worker.ts +1 -1
package/src/tools/eval.ts +24 -48
package/src/tools/index.ts +17 -15
package/src/tools/memory-edit.ts +59 -0
package/src/tools/memory-recall.ts +100 -0
package/src/tools/memory-reflect.ts +88 -0
package/src/tools/memory-render.ts +185 -0
package/src/tools/memory-retain.ts +91 -0
package/src/tools/renderers.ts +4 -2
package/src/tools/todo-write.ts +128 -29
package/src/tools/tool-result.ts +8 -0
package/src/utils/title-generator.ts +115 -13
package/dist/types/tools/calculator.d.ts +0 -77
package/src/prompts/tools/calculator.md +0 -10
package/src/tools/calculator.ts +0 -541
package/src/tools/hindsight-recall.ts +0 -69
package/src/tools/hindsight-reflect.ts +0 -58
package/src/tools/hindsight-retain.ts +0 -57

package/src/eval/__tests__/llm-bridge.test.ts ADDED Viewed

@@ -0,0 +1,297 @@
+import { afterAll, afterEach, describe, expect, it, vi } from "bun:test";
+import * as path from "node:path";
+import type { Api, AssistantMessage, Model } from "@oh-my-pi/pi-ai";
+import * as ai from "@oh-my-pi/pi-ai";
+import { Effort } from "@oh-my-pi/pi-ai";
+import { TempDir } from "@oh-my-pi/pi-utils";
+import type { ModelRegistry } from "../../config/model-registry";
+import { Settings } from "../../config/settings";
+import type { ToolSession } from "../../tools";
+import { ToolError } from "../../tools/tool-errors";
+import { disposeAllVmContexts } from "../js/context-manager";
+import { executeJs } from "../js/executor";
+import { runEvalLlm } from "../llm-bridge";
+import { disposeAllKernelSessions, executePython } from "../py/executor";
+function makeModel(provider: string, id: string, extra: Partial<Model<Api>> = {}): Model<Api> {
+	return {
+		id,
+		name: id,
+		api: "openai-responses",
+		provider,
+		baseUrl: "https://example.test/v1",
+		reasoning: false,
+		input: ["text"],
+		cost: { input: 1, output: 1, cacheRead: 0, cacheWrite: 1 },
+		contextWindow: 128000,
+		maxTokens: 4096,
+		...extra,
+	} as Model<Api>;
+}
+const SMOL = makeModel("p", "smol");
+const DEFAULT = makeModel("p", "default");
+const SLOW = makeModel("p", "slow");
+const REASONING_SLOW = makeModel("p", "slow", {
+	api: "anthropic-messages",
+	reasoning: true,
+	thinking: { minLevel: Effort.Low, maxLevel: Effort.High, mode: "anthropic-adaptive" },
+});
+interface SessionOptions {
+	available?: Model<Api>[];
+	apiKey?: string | null;
+	activeModel?: string;
+	roles?: Partial<Record<"smol" | "default" | "slow", string>>;
+}
+function makeSession(opts: SessionOptions = {}): ToolSession {
+	const settings = Settings.isolated({ "async.enabled": false, "task.isolation.mode": "none" });
+	const roles = opts.roles ?? { smol: "p/smol", slow: "p/slow" };
+	for (const role in roles) {
+		const value = roles[role as keyof typeof roles];
+		if (value) settings.setModelRole(role, value);
+	}
+	const modelRegistry = {
+		getAvailable: () => opts.available ?? [SMOL, DEFAULT, SLOW],
+		getApiKey: async () => (opts.apiKey === undefined ? "test-key" : opts.apiKey),
+	} as unknown as ModelRegistry;
+	return {
+		settings,
+		modelRegistry,
+		getActiveModelString: () => opts.activeModel ?? "p/default",
+	} as unknown as ToolSession;
+}
+function assistant(opts: {
+	text?: string;
+	toolCall?: { name: string; arguments: Record<string, unknown> };
+	stopReason?: AssistantMessage["stopReason"];
+	errorMessage?: string;
+}): AssistantMessage {
+	const content: AssistantMessage["content"] = [];
+	if (opts.text) content.push({ type: "text", text: opts.text });
+	if (opts.toolCall) {
+		content.push({ type: "toolCall", id: "tc-1", name: opts.toolCall.name, arguments: opts.toolCall.arguments });
+	}
+	return {
+		role: "assistant",
+		content,
+		api: "openai-responses",
+		provider: "p",
+		model: "default",
+		usage: {
+			input: 0,
+			output: 0,
+			cacheRead: 0,
+			cacheWrite: 0,
+			totalTokens: 0,
+			cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0, total: 0 },
+		},
+		stopReason: opts.stopReason ?? "stop",
+		errorMessage: opts.errorMessage,
+		timestamp: Date.now(),
+	};
+}
+describe("runEvalLlm", () => {
+	afterEach(() => {
+		vi.restoreAllMocks();
+	});
+	it("resolves each tier to its expected model", async () => {
+		const spy = vi.spyOn(ai, "completeSimple").mockResolvedValue(assistant({ text: "ok" }));
+		const session = makeSession();
+		await runEvalLlm({ prompt: "q", model: "smol" }, { session });
+		await runEvalLlm({ prompt: "q", model: "default" }, { session });
+		await runEvalLlm({ prompt: "q", model: "slow" }, { session });
+		const resolved = spy.mock.calls.map(call => {
+			const model = call[0] as Model<Api>;
+			return `${model.provider}/${model.id}`;
+		});
+		expect(resolved).toEqual(["p/smol", "p/default", "p/slow"]);
+	});
+	it("prefers the session active model for the default tier, falling back to pi/default", async () => {
+		const spy = vi.spyOn(ai, "completeSimple").mockResolvedValue(assistant({ text: "ok" }));
+		const session = makeSession({ available: [SMOL, DEFAULT, SLOW], activeModel: "p/slow" });
+		await runEvalLlm({ prompt: "q", model: "default" }, { session });
+		const model = spy.mock.calls[0]?.[0] as Model<Api>;
+		expect(`${model.provider}/${model.id}`).toBe("p/slow");
+	});
+	it("returns the completion text in plain mode", async () => {
+		vi.spyOn(ai, "completeSimple").mockResolvedValue(assistant({ text: "the answer" }));
+		const result = await runEvalLlm({ prompt: "q", model: "smol" }, { session: makeSession() });
+		expect(result.text).toBe("the answer");
+		expect(result.details).toEqual({ model: "p/smol", tier: "smol", structured: false });
+	});
+	it("forces a respond tool call and returns its arguments in structured mode", async () => {
+		const spy = vi
+			.spyOn(ai, "completeSimple")
+			.mockResolvedValue(assistant({ toolCall: { name: "respond", arguments: { answer: 42 } } }));
+		const result = await runEvalLlm(
+			{ prompt: "q", model: "smol", schema: { type: "object", properties: { answer: { type: "number" } } } },
+			{ session: makeSession() },
+		);
+		expect(JSON.parse(result.text)).toEqual({ answer: 42 });
+		expect(result.details.structured).toBe(true);
+		const ctx = spy.mock.calls[0]?.[1] as { tools?: Array<{ name: string }> };
+		const opts = spy.mock.calls[0]?.[2] as { toolChoice?: unknown };
+		expect(ctx.tools?.[0]?.name).toBe("respond");
+		expect(opts.toolChoice).toEqual({ type: "tool", name: "respond" });
+	});
+	it("falls back to JSON embedded in text when the model skips the respond tool", async () => {
+		vi.spyOn(ai, "completeSimple").mockResolvedValue(assistant({ text: 'here: {"answer": 7}' }));
+		const result = await runEvalLlm(
+			{ prompt: "q", model: "smol", schema: { type: "object" } },
+			{ session: makeSession() },
+		);
+		expect(JSON.parse(result.text)).toEqual({ answer: 7 });
+	});
+	it("requests reasoning only for the slow tier on a reasoning-capable model", async () => {
+		const spy = vi.spyOn(ai, "completeSimple").mockResolvedValue(assistant({ text: "ok" }));
+		const session = makeSession({ available: [SMOL, DEFAULT, REASONING_SLOW] });
+		await runEvalLlm({ prompt: "q", model: "smol" }, { session });
+		await runEvalLlm({ prompt: "q", model: "slow" }, { session });
+		const smolOpts = spy.mock.calls[0]?.[2] as { reasoning?: unknown };
+		const slowOpts = spy.mock.calls[1]?.[2] as { reasoning?: unknown };
+		expect(smolOpts.reasoning).toBeUndefined();
+		expect(slowOpts.reasoning).toBe(Effort.High);
+	});
+	it("does not request reasoning for the slow tier on a non-reasoning model", async () => {
+		const spy = vi.spyOn(ai, "completeSimple").mockResolvedValue(assistant({ text: "ok" }));
+		// SLOW is reasoning:false — must not trip requireSupportedEffort downstream.
+		const result = await runEvalLlm({ prompt: "q", model: "slow" }, { session: makeSession() });
+		expect(result.text).toBe("ok");
+		const opts = spy.mock.calls[0]?.[2] as { reasoning?: unknown };
+		expect(opts.reasoning).toBeUndefined();
+	});
+	it("throws ToolError on invalid arguments", async () => {
+		await expect(runEvalLlm({ prompt: "" }, { session: makeSession() })).rejects.toBeInstanceOf(ToolError);
+		await expect(runEvalLlm({ prompt: "q", model: "huge" }, { session: makeSession() })).rejects.toBeInstanceOf(
+			ToolError,
+		);
+	});
+	it("throws ToolError when no model resolves for the tier", async () => {
+		const session = makeSession({ available: [DEFAULT], roles: { smol: "missing/model" } });
+		await expect(runEvalLlm({ prompt: "q", model: "smol" }, { session })).rejects.toBeInstanceOf(ToolError);
+	});
+	it("throws ToolError when the resolved model has no API key", async () => {
+		const session = makeSession({ apiKey: null });
+		await expect(runEvalLlm({ prompt: "q", model: "smol" }, { session })).rejects.toBeInstanceOf(ToolError);
+	});
+	it("maps error and aborted stop reasons to ToolError", async () => {
+		vi.spyOn(ai, "completeSimple").mockResolvedValueOnce(assistant({ stopReason: "error", errorMessage: "boom" }));
+		await expect(runEvalLlm({ prompt: "q", model: "smol" }, { session: makeSession() })).rejects.toThrow("boom");
+		vi.spyOn(ai, "completeSimple").mockResolvedValueOnce(assistant({ stopReason: "aborted" }));
+		await expect(runEvalLlm({ prompt: "q", model: "smol" }, { session: makeSession() })).rejects.toBeInstanceOf(
+			ToolError,
+		);
+	});
+	it("throws ToolError when plain mode produces no text", async () => {
+		vi.spyOn(ai, "completeSimple").mockResolvedValue(assistant({ text: "" }));
+		await expect(runEvalLlm({ prompt: "q", model: "smol" }, { session: makeSession() })).rejects.toBeInstanceOf(
+			ToolError,
+		);
+	});
+});
+describe("llm() through eval runtimes", () => {
+	afterEach(() => {
+		vi.restoreAllMocks();
+	});
+	afterAll(async () => {
+		await disposeAllVmContexts();
+		await disposeAllKernelSessions();
+	});
+	it("exposes llm() in the JavaScript runtime", async () => {
+		using tempDir = TempDir.createSync("@omp-eval-llm-js-");
+		const sessionFile = path.join(tempDir.path(), "session.jsonl");
+		const sessionId = `js-llm:${crypto.randomUUID()}`;
+		vi.spyOn(ai, "completeSimple").mockResolvedValue(assistant({ text: "hello from smol" }));
+		const result = await executeJs('return await llm("hi", { model: "smol" });', {
+			cwd: tempDir.path(),
+			sessionId,
+			session: makeSession(),
+			sessionFile,
+		});
+		expect(result.exitCode).toBe(0);
+		expect(result.output.trim()).toBe("hello from smol");
+	});
+	it("parses structured llm() output in the JavaScript runtime", async () => {
+		using tempDir = TempDir.createSync("@omp-eval-llm-js-struct-");
+		const sessionFile = path.join(tempDir.path(), "session.jsonl");
+		const sessionId = `js-llm-struct:${crypto.randomUUID()}`;
+		vi.spyOn(ai, "completeSimple").mockResolvedValue(
+			assistant({ toolCall: { name: "respond", arguments: { ok: true, n: 3 } } }),
+		);
+		const result = await executeJs(
+			'const r = await llm("hi", { schema: { type: "object" } }); return JSON.stringify(r);',
+			{ cwd: tempDir.path(), sessionId, session: makeSession(), sessionFile },
+		);
+		expect(result.exitCode).toBe(0);
+		expect(JSON.parse(result.output.trim())).toEqual({ ok: true, n: 3 });
+	});
+	it("exposes llm() in the Python runtime", async () => {
+		using tempDir = TempDir.createSync("@omp-eval-llm-py-");
+		const sessionFile = path.join(tempDir.path(), "session.jsonl");
+		const sessionId = `py-llm:${crypto.randomUUID()}`;
+		vi.spyOn(ai, "completeSimple").mockResolvedValue(assistant({ text: "hello from python" }));
+		const result = await executePython('print(llm("hi", model="smol"))', {
+			cwd: tempDir.path(),
+			sessionId,
+			sessionFile,
+			toolSession: makeSession(),
+		});
+		expect(result.exitCode).toBe(0);
+		expect(result.output.trim()).toBe("hello from python");
+	});
+	it("parses structured llm() output in the Python runtime", async () => {
+		using tempDir = TempDir.createSync("@omp-eval-llm-py-struct-");
+		const sessionFile = path.join(tempDir.path(), "session.jsonl");
+		const sessionId = `py-llm-struct:${crypto.randomUUID()}`;
+		vi.spyOn(ai, "completeSimple").mockResolvedValue(
+			assistant({ toolCall: { name: "respond", arguments: { ok: true } } }),
+		);
+		const result = await executePython('import json\nprint(json.dumps(llm("hi", schema={"type": "object"})))', {
+			cwd: tempDir.path(),
+			sessionId,
+			sessionFile,
+			toolSession: makeSession(),
+		});
+		expect(result.exitCode).toBe(0);
+		expect(JSON.parse(result.output.trim())).toEqual({ ok: true });
+	});
+});

package/src/eval/__tests__/shared-executors.test.ts CHANGED Viewed

@@ -492,6 +492,42 @@ display({"label": "A"})`,
 		expect(reloaded.output.trim()).toBe("2");
 	});
+	it("loads TypeScript type-only imports in cells and local modules", async () => {
+		using tempDir = TempDir.createSync("@omp-eval-js-type-imports-");
+		const sessionFile = path.join(tempDir.path(), "session.jsonl");
+		const sessionId = `js-type-imports:${crypto.randomUUID()}`;
+		const session = createToolSession(tempDir.path(), sessionFile);
+		const typesPath = path.join(tempDir.path(), "types.ts");
+		const valuesPath = path.join(tempDir.path(), "values.ts");
+		const entryPath = path.join(tempDir.path(), "entry.ts");
+		const typesSpec = JSON.stringify(typesPath);
+		const entrySpec = JSON.stringify(entryPath);
+		await Bun.write(typesPath, "export interface TypeOnly { value: number }\n");
+		await Bun.write(valuesPath, "export interface InlineOnly { value: number }\nexport const imported = 41;\n");
+		await Bun.write(
+			entryPath,
+			[
+				'import type { TypeOnly } from "./types.ts";',
+				'import { type InlineOnly, imported } from "./values.ts";',
+				"export const typeOnly = 1;",
+				"export const inlineType = imported;",
+				"",
+			].join("\n"),
+		);
+		const result = await executeJs(
+			`import type { TypeOnly } from ${typesSpec};\nconst mod = await import(${entrySpec});\nreturn mod.typeOnly + mod.inlineType;`,
+			{
+				sessionId,
+				session,
+				sessionFile,
+			},
+		);
+		expect(result.exitCode).toBe(0);
+		expect(result.output.trim()).toBe("42");
+	});
 	it("refreshes the Python tool proxy when bridge env appears after kernel warm-up", async () => {
 		using tempDir = TempDir.createSync("@omp-eval-py-tool-proxy-");
 		const sessionFile = path.join(tempDir.path(), "session.jsonl");

package/src/eval/js/shared/local-module-loader.ts CHANGED Viewed

@@ -88,7 +88,10 @@ export class LocalModuleLoader {
 	async #buildLocalModule(modulePath: string): Promise<LocalModuleEntry> {
 		const rawSource = fs.readFileSync(modulePath, "utf8");
-		const stripped = stripTypeScriptSyntax(rawSource);
+		const stripped = stripTypeScriptSyntax(rawSource, {
+			force: isTypeScriptModulePath(modulePath),
+			loader: stripLoaderForPath(modulePath),
+		});
 		const moduleDir = path.dirname(modulePath);
 		const localDeps = new Set<string>();
 		for (const specifier of collectModuleSourceSpecifiers(stripped)) {
@@ -251,6 +254,15 @@ function isLocalPathSpecifier(source: string): boolean {
 	);
 }
+function isTypeScriptModulePath(modulePath: string): boolean {
+	const ext = path.extname(modulePath);
+	return ext === ".ts" || ext === ".tsx" || ext === ".mts";
+}
+function stripLoaderForPath(modulePath: string): "ts" | "tsx" {
+	return path.extname(modulePath) === ".tsx" ? "tsx" : "ts";
+}
 function isManagedLocalModulePath(target: string): boolean {
 	return (
 		path.isAbsolute(target) &&

package/src/eval/js/shared/prelude.txt CHANGED Viewed

@@ -39,6 +39,13 @@ if (!globalThis.__omp_js_prelude_loaded__) {
 		return values.length === 1 ? values[0] : values;
 	};
+	const llm = async (prompt, opts = {}) => {
+		const o = toOptions(opts);
+		const res = await globalThis.__omp_call_tool__("__llm__", { prompt, ...o });
+		const text = res && typeof res === "object" ? res.text : res;
+		return o.schema ? JSON.parse(text) : text;
+	};
 	const display = value => {
 		globalThis.__omp_display__(value);
 	};
@@ -61,6 +68,7 @@ if (!globalThis.__omp_js_prelude_loaded__) {
 	globalThis.print = consoleBridge.log;
 	globalThis.display = display;
 	globalThis.tool = tool;
+	globalThis.llm = llm;
 	globalThis.output = output;
 	globalThis.read = read;
 	globalThis.write = write;

package/src/eval/js/shared/rewrite-imports.ts CHANGED Viewed

@@ -75,6 +75,7 @@ function parseProgram(code: string): { program: { body: ReadonlyArray<BabelProgr
 			allowSuperOutsideMethod: true,
 			allowUndeclaredExports: true,
 			errorRecovery: true,
+			plugins: ["typescript"],
 		}) as unknown as { program: { body: ReadonlyArray<BabelProgramNode> } };
 	} catch {
 		return null;
@@ -178,8 +179,7 @@ export function rewriteImports(code: string): string {
 		if (node.type !== "CallExpression") return;
 		const call = node as unknown as { callee?: { type?: string; start?: number; end?: number } };
 		const callee = call.callee;
-		if (!callee || callee.type !== "Import" || typeof callee.start !== "number" || typeof callee.end !== "number")
-			return;
+		if (callee?.type !== "Import" || typeof callee.start !== "number" || typeof callee.end !== "number") return;
 		edits.push({ start: callee.start, end: callee.end, text: "__omp_import__" });
 	});
@@ -252,12 +252,7 @@ export function rewriteDynamicImports(code: string, callee = "__omp_import__"):
 		if (node.type !== "CallExpression") return;
 		const call = node as unknown as { callee?: { type?: string; start?: number; end?: number } };
 		const callCallee = call.callee;
-		if (
-			!callCallee ||
-			callCallee.type !== "Import" ||
-			typeof callCallee.start !== "number" ||
-			typeof callCallee.end !== "number"
-		) {
+		if (callCallee?.type !== "Import" || typeof callCallee.start !== "number" || typeof callCallee.end !== "number") {
 			return;
 		}
 		edits.push({ start: callCallee.start, end: callCallee.end, text: callee });
@@ -453,38 +448,48 @@ function requiresAsyncWrapper(code: string): boolean {
 }
 /**
- * Strip TypeScript syntax (type annotations, `interface`, `as`, `satisfies`, generics in
- * call expressions, etc.) before the import/lexical rewriters parse the code. We use Bun's
- * native transpiler in `ts` loader mode — fast, no JSX transforms, preserves `import`/
- * `export` declarations so the downstream Babel rewrites keep working.
+ * Strip TypeScript syntax (type annotations, type-only imports/exports, `interface`, `as`,
+ * `satisfies`, generics in call expressions, etc.) before the import/lexical rewriters parse
+ * the code. Bun's native transpiler preserves `import`/`export` declarations, so downstream
+ * Babel rewrites still control module resolution.
  *
- * Skipped when the code parses as plain JavaScript already (Babel can accept it), so the
- * common case avoids an extra transpile pass. We detect "looks like TS" with a cheap regex
- * before invoking the transpiler.
+ * Eval cells use a cheap "looks like TS" heuristic to avoid transpiling ordinary JS. Known
+ * TypeScript modules pass `force` because a file can contain TS-only module syntax such as
+ * `import type` without any value-level type annotations.
  */
-function stripTypeScript(code: string): string {
-	if (!LOOKS_LIKE_TS.test(code)) return code;
+type TypeScriptStripLoader = "ts" | "tsx";
+const TS_TRANSPILER = new Bun.Transpiler({ loader: "ts" });
+const TSX_TRANSPILER = new Bun.Transpiler({ loader: "tsx" });
+function stripTypeScript(code: string, options: { force?: boolean; loader?: TypeScriptStripLoader } = {}): string {
+	if (!options.force && !LOOKS_LIKE_TS.test(code)) return code;
 	try {
-		return new Bun.Transpiler({ loader: "ts" }).transformSync(code);
+		const transpiler = options.loader === "tsx" ? TSX_TRANSPILER : TS_TRANSPILER;
+		return transpiler.transformSync(code);
 	} catch {
 		// Transpiler failed (e.g. unrecoverable syntax). Hand the original source back so the
 		// downstream rewriter / VM surfaces the real error to the user.
 		return code;
 	}
 }
-export function stripTypeScriptSyntax(code: string): string {
-	return stripTypeScript(code);
+export function stripTypeScriptSyntax(
+	code: string,
+	options: { force?: boolean; loader?: TypeScriptStripLoader } = {},
+): string {
+	return stripTypeScript(code, options);
 }
-// Heuristic: any of the obvious TS-only tokens. Plain JS using `as` only inside strings
-// won't match because we require a leading word boundary plus a colon/keyword neighbor.
+// Heuristic: obvious TS-only tokens, including type-only module syntax. Plain JS using `as`
+// only inside strings won't match because we require a leading word boundary plus a
+// colon/keyword neighbor.
 const LOOKS_LIKE_TS =
-	/(?:\binterface\s+\w|\btype\s+\w+\s*=|\b(?:as|satisfies)\s+(?:[A-Z]|\bconst\b)|:\s*(?:string|number|boolean|any|unknown|void|never|object|[A-Z]\w*)\b|<\s*[A-Z]\w*\s*[,>])/;
+	/(?:\bimport\s+type\b|\bexport\s+type\b|\b(?:import|export)\s*\{[^}\n]*\btype\s+\w|\binterface\s+\w|\btype\s+\w+\s*=|\b(?:as|satisfies)\s+(?:[A-Z]|\bconst\b)|:\s*(?:string|number|boolean|any|unknown|void|never|object|[A-Z]\w*)\b|<\s*[A-Z]\w*\s*[,>])/;
 export function wrapCode(code: string): { source: string; asyncWrapped: boolean; finalExpressionReturned: boolean } {
-	const stripped = stripTypeScript(code);
-	const finalExpression = returnFinalExpression(stripped);
-	const importsRewritten = rewriteImports(finalExpression.source);
+	const finalExpression = returnFinalExpression(code);
+	const stripped = stripTypeScript(finalExpression.source);
+	const importsRewritten = rewriteImports(stripped);
 	const needsAsyncWrapper = requiresAsyncWrapper(importsRewritten);
 	const rewritten = {
 		source: demoteTopLevelLexicals(importsRewritten, { publishGlobals: needsAsyncWrapper }),

package/src/eval/js/tool-bridge.ts CHANGED Viewed

@@ -1,6 +1,7 @@
 import type { AgentTool, AgentToolResult } from "@oh-my-pi/pi-agent-core";
 import type { ToolSession } from "../../tools";
 import { ToolError } from "../../tools/tool-errors";
+import { EVAL_LLM_BRIDGE_NAME, runEvalLlm } from "../llm-bridge";
 import type { JsStatusEvent } from "./shared/types";
 export type { JsStatusEvent } from "./shared/types";
@@ -101,6 +102,9 @@ function summarizeToolResult(
 }
 export async function callSessionTool(name: string, args: unknown, options: ToolBridgeOptions): Promise<ToolValue> {
+	if (name === EVAL_LLM_BRIDGE_NAME) {
+		return await runEvalLlm(args, options);
+	}
 	const tool = getTool(options.session, name);
 	const normalizedArgs = normalizeArgs(args);
 	const toolCallId = `js-${name}-${crypto.randomUUID()}`;