npm - @oh-my-pi/pi-coding-agent - Versions diffs - 15.5.13 → 15.5.15 - Mend

@oh-my-pi/pi-coding-agent 15.5.13 → 15.5.15

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (39) hide show

package/CHANGELOG.md +31 -0
package/dist/types/config/model-registry.d.ts +1 -1
package/dist/types/config/models-config-schema.d.ts +2 -0
package/dist/types/config/settings-schema.d.ts +1 -10
package/dist/types/eval/__tests__/llm-bridge.test.d.ts +1 -0
package/dist/types/eval/llm-bridge.d.ts +25 -0
package/dist/types/export/html/template.generated.d.ts +1 -1
package/dist/types/extensibility/plugins/legacy-pi-compat.d.ts +15 -0
package/dist/types/modes/theme/theme.d.ts +2 -1
package/dist/types/session/agent-session.d.ts +2 -0
package/dist/types/tools/index.d.ts +0 -1
package/package.json +8 -8
package/src/config/model-registry.ts +89 -5
package/src/config/models-config-schema.ts +1 -1
package/src/config/settings-schema.ts +1 -10
package/src/eval/__tests__/llm-bridge.test.ts +297 -0
package/src/eval/js/shared/prelude.txt +8 -0
package/src/eval/js/tool-bridge.ts +4 -0
package/src/eval/llm-bridge.ts +181 -0
package/src/eval/py/prelude.py +52 -31
package/src/export/html/template.generated.ts +1 -1
package/src/export/html/template.js +0 -13
package/src/extensibility/plugins/legacy-pi-compat.ts +60 -23
package/src/internal-urls/docs-index.generated.ts +3 -4
package/src/main.ts +4 -0
package/src/modes/components/model-selector.ts +119 -22
package/src/modes/components/status-line/presets.ts +1 -0
package/src/modes/components/status-line/segments.ts +23 -0
package/src/modes/interactive-mode.ts +22 -87
package/src/modes/theme/theme.ts +7 -0
package/src/prompts/tools/eval.md +2 -0
package/src/session/agent-session.ts +19 -0
package/src/session/session-manager.ts +47 -0
package/src/tools/eval.ts +24 -48
package/src/tools/index.ts +0 -4
package/src/tools/renderers.ts +0 -2
package/dist/types/tools/calculator.d.ts +0 -77
package/src/prompts/tools/calculator.md +0 -10
package/src/tools/calculator.ts +0 -541

package/src/session/session-manager.ts CHANGED Viewed

@@ -702,6 +702,53 @@ export function buildSessionContext(
 		}
 	}
+	// Strip dangling tool_use blocks — a tool_use with no matching tool_result on the
+	// resolved leaf→root path — from ANY assistant turn, not just the trailing one.
+	// This happens whenever the leaf (or a branch point) lands such that an assistant
+	// turn's tool results are off the selected path: its result children live on a
+	// sibling branch, or it is the leaf itself (results are children below it). Left
+	// in place, `transformMessages` fabricates one synthetic "aborted"/"No result
+	// provided" result per dangling call plus a `<turn-aborted>` developer note, which
+	// render as phantom failed calls and re-inject the failed batch into the model's
+	// context — the rewind/restore loop.
+	//
+	// Stripping is necessary but not sufficient: a *modified* assistant turn that still
+	// carries signed `thinking`/`redacted_thinking` is rejected by Anthropic — "thinking
+	// blocks in the latest assistant message cannot be modified", and signed thinking
+	// replayed out of its original turn shape can also fail signature validation (this
+	// bites the handoff/branch-summary request). So when we rewrite a turn we also
+	// neutralize its protected reasoning: drop `redactedThinking` (encrypted, no
+	// plaintext to keep) and clear `thinking` signatures so the provider encoder
+	// downgrades them to plain text (verified accepted by the live API), preserving the
+	// visible reasoning while removing the immutability/invalid-signature hazard. Drop a
+	// turn left with no content. (Live turns never qualify: their results are persisted
+	// on the same path before any context rebuild.)
+	const pairedToolResultIds = new Set<string>();
+	for (const message of messages) {
+		if (message.role === "toolResult") pairedToolResultIds.add(message.toolCallId);
+	}
+	for (let i = messages.length - 1; i >= 0; i--) {
+		const message = messages[i];
+		if (message.role !== "assistant") continue;
+		const hasDangling = message.content.some(
+			block => block.type === "toolCall" && !pairedToolResultIds.has(block.id),
+		);
+		if (!hasDangling) continue;
+		const normalized = message.content
+			.filter(
+				block =>
+					!(block.type === "toolCall" && !pairedToolResultIds.has(block.id)) && block.type !== "redactedThinking",
+			)
+			.map(block =>
+				block.type === "thinking" && block.thinkingSignature ? { ...block, thinkingSignature: undefined } : block,
+			);
+		if (normalized.length === 0) {
+			messages.splice(i, 1);
+		} else {
+			messages[i] = { ...message, content: normalized };
+		}
+	}
 	return {
 		messages,
 		thinkingLevel,

package/src/tools/eval.ts CHANGED Viewed

@@ -13,10 +13,19 @@ import { truncateToVisualLines } from "../modes/components/visual-truncate";
 import { getMarkdownTheme, type Theme } from "../modes/theme/theme";
 import evalDescription from "../prompts/tools/eval.md" with { type: "text" };
 import { DEFAULT_MAX_BYTES, OutputSink, type OutputSummary, TailBuffer } from "../session/streaming-output";
-import { getTreeBranch, getTreeContinuePrefix, renderCodeCell } from "../tui";
+import { renderCodeCell } from "../tui";
 import { formatDimensionNote, resizeImage } from "../utils/image-resize";
 import { resolveEvalBackends, type ToolSession } from ".";
 import { truncateForPrompt } from "./approval";
+import {
+	JSON_TREE_MAX_DEPTH_COLLAPSED,
+	JSON_TREE_MAX_DEPTH_EXPANDED,
+	JSON_TREE_MAX_LINES_COLLAPSED,
+	JSON_TREE_MAX_LINES_EXPANDED,
+	JSON_TREE_SCALAR_LEN_COLLAPSED,
+	JSON_TREE_SCALAR_LEN_EXPANDED,
+	renderJsonTreeLines,
+} from "./json-tree";
 import {
 	formatStyledTruncationWarning,
 	resolveOutputMaxColumns,
@@ -61,15 +70,6 @@ export type EvalToolResult = {
 export type EvalProxyExecutor = (params: EvalToolParams, signal?: AbortSignal) => Promise<EvalToolResult>;
-function formatJsonScalar(value: unknown): string {
-	if (value === null) return "null";
-	if (value === undefined) return "undefined";
-	if (typeof value === "string") return JSON.stringify(value);
-	if (typeof value === "number" || typeof value === "boolean" || typeof value === "bigint") return String(value);
-	if (typeof value === "function") return "[function]";
-	return "[object]";
-}
 /** Cap per `display()` value sent back to the model. */
 const MAX_DISPLAY_TEXT_BYTES = 8000;
@@ -102,41 +102,6 @@ function formatDisplayOutputsForText(outputs: EvalDisplayOutput[]): string {
 	return chunks.join("\n\n");
 }
-function renderJsonTree(value: unknown, theme: Theme, expanded: boolean, maxDepth = expanded ? 6 : 2): string[] {
-	const maxItems = expanded ? 20 : 5;
-	const renderNode = (node: unknown, prefix: string, depth: number, isLast: boolean, label?: string): string[] => {
-		const branch = getTreeBranch(isLast, theme);
-		const displayLabel = label ? `${label}: ` : "";
-		if (depth >= maxDepth || node === null || typeof node !== "object") {
-			return [`${prefix}${branch} ${displayLabel}${formatJsonScalar(node)}`];
-		}
-		const isArray = Array.isArray(node);
-		const entries = isArray
-			? node.map((val, index) => [String(index), val] as const)
-			: Object.entries(node as object);
-		const header = `${prefix}${branch} ${displayLabel}${isArray ? `Array(${entries.length})` : `Object(${entries.length})`}`;
-		const lines = [header];
-		const childPrefix = prefix + getTreeContinuePrefix(isLast, theme);
-		const visible = entries.slice(0, maxItems);
-		for (let i = 0; i < visible.length; i++) {
-			const [key, val] = visible[i];
-			const childLast = i === visible.length - 1 && (expanded || entries.length <= maxItems);
-			lines.push(...renderNode(val, childPrefix, depth + 1, childLast, isArray ? `[${key}]` : key));
-		}
-		if (!expanded && entries.length > maxItems) {
-			const moreBranch = theme.tree.last;
-			lines.push(`${childPrefix}${moreBranch} ${entries.length - maxItems} more item(s)`);
-		}
-		return lines;
-	};
-	return renderNode(value, "", 0, true);
-}
 export interface EvalToolDescriptionOptions {
 	py?: boolean;
 	js?: boolean;
@@ -669,6 +634,7 @@ function formatStatusEvent(event: EvalStatusEvent, theme: Theme): string {
 		sh: "icon.package",
 		env: "icon.package",
 		batch: "icon.package",
+		llm: "icon.package",
 	};
 	const iconKey = opIcons[op] ?? "icon.file";
@@ -735,6 +701,11 @@ function formatStatusEvent(event: EvalStatusEvent, theme: Theme): string {
 		case "batch":
 			parts.push(`${data.files} file${(data.files as number) !== 1 ? "s" : ""} processed`);
 			break;
+		case "llm":
+			if (data.model) parts.push(String(data.model));
+			if (data.tier && data.tier !== data.model) parts.push(`(${data.tier})`);
+			parts.push(`${data.chars ?? 0} chars`);
+			break;
 		case "wc":
 			parts.push(`${data.lines}L ${data.words}W ${data.chars}C`);
 			break;
@@ -950,10 +921,15 @@ export const evalToolRenderer = {
 		const output = stripOutputNotice(rawOutput, details?.meta).trimEnd();
 		const jsonOutputs = details?.jsonOutputs ?? [];
+		const treeExpanded = options.renderContext?.expanded ?? options.expanded;
+		const treeDepth = treeExpanded ? JSON_TREE_MAX_DEPTH_EXPANDED : JSON_TREE_MAX_DEPTH_COLLAPSED;
+		const treeLineCap = treeExpanded ? JSON_TREE_MAX_LINES_EXPANDED : JSON_TREE_MAX_LINES_COLLAPSED;
+		const treeScalarLen = treeExpanded ? JSON_TREE_SCALAR_LEN_EXPANDED : JSON_TREE_SCALAR_LEN_COLLAPSED;
+		const labelOutputs = jsonOutputs.length > 1;
 		const jsonLines = jsonOutputs.flatMap((value, index) => {
-			const header = `JSON output ${index + 1}`;
-			const treeLines = renderJsonTree(value, uiTheme, options.renderContext?.expanded ?? options.expanded);
-			return [header, ...treeLines];
+			const tree = renderJsonTreeLines(value, uiTheme, treeDepth, treeLineCap, treeScalarLen);
+			const body = tree.truncated ? [...tree.lines, uiTheme.fg("dim", "…")] : tree.lines;
+			return labelOutputs ? [uiTheme.fg("dim", `display[${index + 1}]`), ...body] : body;
 		});
 		const timeoutSeconds = options.renderContext?.timeout;

package/src/tools/index.ts CHANGED Viewed

@@ -28,7 +28,6 @@ import { AstEditTool } from "./ast-edit";
 import { AstGrepTool } from "./ast-grep";
 import { BashTool } from "./bash";
 import { BrowserTool } from "./browser";
-import { CalculatorTool } from "./calculator";
 import { type CheckpointState, CheckpointTool, RewindTool } from "./checkpoint";
 import { DebugTool } from "./debug";
 import { EvalTool } from "./eval";
@@ -69,7 +68,6 @@ export * from "./ast-edit";
 export * from "./ast-grep";
 export * from "./bash";
 export * from "./browser";
-export * from "./calculator";
 export * from "./checkpoint";
 export * from "./debug";
 export * from "./eval";
@@ -286,7 +284,6 @@ export const BUILTIN_TOOLS: Record<string, ToolFactory> = {
 	ask: AskTool.createIf,
 	debug: DebugTool.createIf,
 	eval: s => new EvalTool(s),
-	calc: s => new CalculatorTool(s),
 	ssh: loadSshTool,
 	github: GithubTool.createIf,
 	find: s => new FindTool(s),
@@ -455,7 +452,6 @@ export async function createTools(session: ToolSession, toolNames?: string[]): P
 		if (name === "web_search") return session.settings.get("web_search.enabled");
 		// search_tool_bm25 is allowed when either legacy mcp.discoveryMode or new tools.discoveryMode is active.
 		if (name === "search_tool_bm25") return discoveryActive;
-		if (name === "calc") return session.settings.get("calc.enabled");
 		if (name === "browser") return session.settings.get("browser.enabled");
 		if (name === "checkpoint" || name === "rewind") return session.settings.get("checkpoint.enabled");
 		if (name === "irc") {

package/src/tools/renderers.ts CHANGED Viewed

@@ -16,7 +16,6 @@ import { astEditToolRenderer } from "./ast-edit";
 import { astGrepToolRenderer } from "./ast-grep";
 import { bashToolRenderer } from "./bash";
 import { browserToolRenderer } from "./browser/render";
-import { calculatorToolRenderer } from "./calculator";
 import { debugToolRenderer } from "./debug";
 import { evalToolRenderer } from "./eval";
 import { findToolRenderer } from "./find";
@@ -54,7 +53,6 @@ export const toolRenderers: Record<string, ToolRenderer> = {
 	recipe: recipeToolRenderer as ToolRenderer,
 	debug: debugToolRenderer as ToolRenderer,
 	eval: evalToolRenderer as ToolRenderer,
-	calc: calculatorToolRenderer as ToolRenderer,
 	edit: editToolRenderer as ToolRenderer,
 	apply_patch: editToolRenderer as ToolRenderer,
 	find: findToolRenderer as ToolRenderer,

package/dist/types/tools/calculator.d.ts DELETED Viewed

@@ -1,77 +0,0 @@
-import type { AgentTool, AgentToolResult } from "@oh-my-pi/pi-agent-core";
-import type { Component } from "@oh-my-pi/pi-tui";
-import * as z from "zod/v4";
-import type { RenderResultOptions } from "../extensibility/custom-tools/types";
-import type { Theme } from "../modes/theme/theme";
-import type { ToolSession } from ".";
-declare const calculatorSchema: z.ZodObject<{
-    calculations: z.ZodArray<z.ZodObject<{
-        expression: z.ZodString;
-        prefix: z.ZodString;
-        suffix: z.ZodString;
-    }, z.core.$strip>>;
-}, z.core.$strip>;
-export interface CalculatorToolDetails {
-    results: Array<{
-        expression: string;
-        value: number;
-        output: string;
-    }>;
-}
-type CalculatorParams = z.infer<typeof calculatorSchema>;
-/**
- * Calculator tool for evaluating mathematical expressions.
- *
- * Supports decimal, hex (0x), binary (0b), octal (0o) literals,
- * standard arithmetic operators, and parentheses.
- */
-export declare class CalculatorTool implements AgentTool<typeof calculatorSchema, CalculatorToolDetails> {
-    readonly name = "calc";
-    readonly approval: "read";
-    readonly label = "Calc";
-    readonly summary = "Evaluate a mathematical expression";
-    readonly loadMode = "discoverable";
-    readonly description: string;
-    readonly parameters: z.ZodObject<{
-        calculations: z.ZodArray<z.ZodObject<{
-            expression: z.ZodString;
-            prefix: z.ZodString;
-            suffix: z.ZodString;
-        }, z.core.$strip>>;
-    }, z.core.$strip>;
-    readonly strict = true;
-    constructor(_session: ToolSession);
-    execute(_toolCallId: string, { calculations }: CalculatorParams, signal?: AbortSignal): Promise<AgentToolResult<CalculatorToolDetails>>;
-}
-interface CalculatorRenderArgs {
-    calculations?: Array<{
-        expression: string;
-        prefix?: string;
-        suffix?: string;
-    }>;
-}
-/**
- * TUI renderer for calculator tool calls and results.
- * Handles both collapsed (preview) and expanded (full) display modes.
- */
-export declare const calculatorToolRenderer: {
-    /**
-     * Render the tool call header showing the first expression and count.
-     * Format: "Calc <expression> (N calcs)"
-     */
-    renderCall(args: CalculatorRenderArgs, _options: RenderResultOptions, uiTheme: Theme): Component;
-    /**
-     * Render calculation results as a tree list.
-     * Collapsed mode shows first N items with expand hint; expanded shows all.
-     */
-    renderResult(result: {
-        content: Array<{
-            type: string;
-            text?: string;
-        }>;
-        details?: CalculatorToolDetails;
-        isError?: boolean;
-    }, options: RenderResultOptions, uiTheme: Theme, args?: CalculatorRenderArgs): Component;
-    mergeCallAndResult: boolean;
-};
-export {};

package/src/prompts/tools/calculator.md DELETED Viewed

@@ -1,10 +0,0 @@
-Performs basic calculations.
-<instruction>
-- Supports +, -, *, /, %, ** and parentheses
-- Supports decimal, hex (0x), binary (0b), and octal (0o) literals
-</instruction>
-<output>
-Returns each calculation result with its prefix and suffix applied.
-</output>