npm - @oh-my-pi/pi-coding-agent - Versions diffs - 16.0.4 → 16.0.5 - Mend

@oh-my-pi/pi-coding-agent 16.0.4 → 16.0.5

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (71) hide show

package/CHANGELOG.md +41 -0
package/dist/cli.js +341 -261
package/dist/types/advisor/advise-tool.d.ts +9 -0
package/dist/types/cli/args.d.ts +1 -0
package/dist/types/cli/bench-cli.d.ts +6 -0
package/dist/types/commands/launch.d.ts +3 -0
package/dist/types/config/settings-schema.d.ts +91 -2
package/dist/types/extensibility/extensions/runner.d.ts +5 -2
package/dist/types/extensibility/extensions/types.d.ts +8 -7
package/dist/types/extensibility/shared-events.d.ts +22 -1
package/dist/types/main.d.ts +1 -0
package/dist/types/modes/components/status-line/component.d.ts +1 -1
package/dist/types/modes/components/status-line/context-thresholds.d.ts +0 -1
package/dist/types/modes/rpc/rpc-types.d.ts +1 -1
package/dist/types/modes/utils/context-usage.d.ts +12 -0
package/dist/types/sdk.d.ts +3 -1
package/dist/types/session/agent-session.d.ts +20 -0
package/dist/types/session/session-persistence.d.ts +4 -0
package/dist/types/tools/read.d.ts +1 -0
package/dist/types/tui/code-cell.d.ts +2 -0
package/dist/types/utils/image-vision-fallback.d.ts +28 -0
package/dist/types/web/search/providers/base.d.ts +1 -0
package/dist/types/web/search/providers/gemini.d.ts +1 -0
package/package.json +12 -12
package/src/advisor/__tests__/advisor.test.ts +59 -0
package/src/advisor/advise-tool.ts +13 -0
package/src/cli/args.ts +1 -0
package/src/cli/bench-cli.ts +30 -7
package/src/cli/flag-tables.ts +8 -0
package/src/collab/host.ts +2 -2
package/src/commands/launch.ts +3 -0
package/src/config/settings-schema.ts +84 -2
package/src/eval/py/runner.py +44 -0
package/src/extensibility/extensions/runner.ts +20 -2
package/src/extensibility/extensions/types.ts +16 -5
package/src/extensibility/shared-events.ts +24 -0
package/src/internal-urls/docs-index.generated.ts +7 -7
package/src/main.ts +12 -5
package/src/modes/components/branch-summary-message.ts +1 -0
package/src/modes/components/collab-prompt-message.ts +9 -7
package/src/modes/components/compaction-summary-message.ts +1 -0
package/src/modes/components/custom-message.ts +1 -0
package/src/modes/components/footer.ts +6 -5
package/src/modes/components/hook-message.ts +1 -0
package/src/modes/components/read-tool-group.ts +9 -3
package/src/modes/components/skill-message.ts +1 -0
package/src/modes/components/status-line/component.ts +131 -14
package/src/modes/components/status-line/context-thresholds.ts +0 -1
package/src/modes/components/todo-reminder.ts +1 -0
package/src/modes/components/ttsr-notification.ts +1 -0
package/src/modes/components/user-message.ts +6 -6
package/src/modes/controllers/event-controller.ts +2 -7
package/src/modes/controllers/selector-controller.ts +10 -3
package/src/modes/interactive-mode.ts +4 -2
package/src/modes/rpc/rpc-types.ts +1 -1
package/src/modes/utils/context-usage.ts +28 -15
package/src/prompts/tools/image-attachment-describe-system.md +8 -0
package/src/prompts/tools/image-attachment-describe.md +10 -0
package/src/sdk.ts +14 -18
package/src/session/agent-session.ts +564 -231
package/src/session/session-loader.ts +19 -32
package/src/session/session-persistence.ts +27 -11
package/src/ssh/connection-manager.ts +3 -2
package/src/task/executor.ts +1 -1
package/src/tools/image-gen.ts +67 -25
package/src/tools/read.ts +28 -6
package/src/tui/code-cell.ts +44 -3
package/src/utils/image-vision-fallback.ts +197 -0
package/src/web/search/index.ts +12 -0
package/src/web/search/providers/base.ts +1 -0
package/src/web/search/providers/gemini.ts +56 -18

package/src/modes/utils/context-usage.ts CHANGED Viewed

@@ -94,7 +94,7 @@ export function computeNonMessageTokens(session: AgentSession): number {
  * the status-line fast path intentionally uses the equivalent collapsed total
  * in `computeNonMessageTokens`.
  */
-function computeNonMessageBreakdown(session: AgentSession): {
+export function computeNonMessageBreakdown(session: AgentSession): {
 	skillsTokens: number;
 	toolsTokens: number;
 	systemContextTokens: number;
@@ -119,22 +119,37 @@ export function computeContextBreakdown(
 	const model = session.model;
 	const contextWindow = model?.contextWindow ?? 0;
+	const breakdown = typeof session.getContextBreakdown === "function" ? session.getContextBreakdown() : undefined;
 	let messagesTokens = 0;
-	const convo = session.messages;
-	if (convo) {
-		for (const message of convo) {
-			messagesTokens += estimateTokens(message);
+	let skillsTokens = 0;
+	let toolsTokens = 0;
+	let systemContextTokens = 0;
+	let systemPromptTokens = 0;
+	let usedTokens = 0;
+	if (breakdown) {
+		messagesTokens = breakdown.messagesTokens;
+		skillsTokens = breakdown.skillsTokens;
+		toolsTokens = breakdown.systemToolsTokens;
+		systemContextTokens = breakdown.systemContextTokens;
+		systemPromptTokens = breakdown.systemPromptTokens;
+		usedTokens = breakdown.usedTokens;
+	} else {
+		const convo = session.messages;
+		if (convo) {
+			for (const message of convo) {
+				messagesTokens += estimateTokens(message);
+			}
 		}
+		const nonMessage = computeNonMessageBreakdown(session);
+		skillsTokens = nonMessage.skillsTokens;
+		toolsTokens = nonMessage.toolsTokens;
+		systemContextTokens = nonMessage.systemContextTokens;
+		systemPromptTokens = nonMessage.systemPromptTokens;
+		usedTokens = skillsTokens + toolsTokens + systemContextTokens + systemPromptTokens + messagesTokens;
 	}
-	// The rendered system prompt already contains the skill descriptions and the
-	// markdown tool descriptions. To present a non-overlapping breakdown:
-	//   System prompt = total system prompt text - skills section (tool descriptions stay)
-	//   Tools         = JSON tool schema sent separately on the wire
-	//   Skills        = the skill list embedded in the system prompt
-	//   Messages      = conversation messages
-	const { skillsTokens, toolsTokens, systemContextTokens, systemPromptTokens } = computeNonMessageBreakdown(session);
 	const categories: CategoryInfo[] = [
 		{ id: "systemPrompt", label: "System prompt", tokens: systemPromptTokens, color: "accent", glyph: CELL_FILLED },
 		{ id: "systemTools", label: "System tools", tokens: toolsTokens, color: "warning", glyph: CELL_FILLED },
@@ -155,8 +170,6 @@ export function computeContextBreakdown(
 		},
 	];
-	const usedTokens = categories.reduce((sum, c) => sum + c.tokens, 0);
 	let autoCompactBufferTokens = 0;
 	if (contextWindow > 0) {
 		const compactionSettings = session.settings.getGroup("compaction") as CompactionSettings;

package/src/prompts/tools/image-attachment-describe-system.md ADDED Viewed

@@ -0,0 +1,8 @@
+You are an image-analysis assistant. The user attached an image to a model that cannot see images, so your description is injected into that model's context in place of the image. The downstream model relies entirely on your text — it never sees the pixels.
+Core behavior:
+- Be faithful and evidence-first: distinguish direct observations from inferences.
+- Transcribe ALL visible text verbatim, preserving casing, punctuation, and layout order. Mark unreadable segments explicitly rather than guessing.
+- NEVER fabricate occluded, blurry, or uncertain details — say what is uncertain.
+- Be thorough but compact: prefer dense, information-rich prose over filler.
+- Do not add meta commentary, preambles ("This image shows…"), or closing remarks. Output only the description.

package/src/prompts/tools/image-attachment-describe.md ADDED Viewed

@@ -0,0 +1,10 @@
+Describe this image in enough detail that a model which cannot see it can reason about its content.
+Cover, where present:
+- The overall scene, subject, and what is happening.
+- People, objects, and their relationships, positions, colors, and counts.
+- All visible text, transcribed verbatim (OCR).
+- UI/screenshot elements: labels, buttons, inputs, states, errors, highlighted or disabled controls.
+- Diagrams, charts, tables: structure, axes, series, and the values they encode.
+Flag anything ambiguous or unreadable. Output the description as plain prose only.

package/src/sdk.ts CHANGED Viewed

@@ -21,6 +21,7 @@ import {
 	getOpenAICodexTransportDetails,
 	prewarmOpenAICodexResponses,
 } from "@oh-my-pi/pi-ai/providers/openai-codex-responses";
+import { FALLBACK_DIALECT, preferredDialect } from "@oh-my-pi/pi-catalog/identity";
 import type { Component } from "@oh-my-pi/pi-tui";
 import {
 	$env,
@@ -40,7 +41,6 @@ import { AutoLearnController, buildAutoLearnInstructions } from "./autolearn/con
 import { loadCapability } from "./capability";
 import { type Rule, ruleCapability, setActiveRules } from "./capability/rule";
 import { bucketRules } from "./capability/rule-buckets";
-import { createApiKeyResolver } from "./config/api-key-resolver";
 import { shouldEnableAppendOnlyContext } from "./config/append-only-context-mode";
 import { ModelRegistry } from "./config/model-registry";
 import {
@@ -415,6 +415,8 @@ export interface CreateAgentSessionOptions {
 	providerSessionId?: string;
 	/** Optional provider-facing prompt cache key, distinct from request lineage. */
 	providerPromptCacheKey?: string;
+	/** Absolute wall-clock deadline in Unix epoch milliseconds. */
+	deadline?: number;
 	/** Custom tools to register (in addition to built-in tools). Accepts both CustomTool and ToolDefinition. */
 	customTools?: (CustomTool | ToolDefinition)[];
@@ -567,10 +569,15 @@ export type DialectFormat = "auto" | "native" | Dialect;
 export function resolveDialect(
 	format: DialectFormat,
-	model: Pick<Model, "supportsTools"> | undefined,
+	model: (Pick<Model, "supportsTools"> & Partial<Pick<Model, "id">>) | undefined,
 ): Dialect | undefined {
 	if (format === "native") return undefined;
-	if (format === "auto") return model?.supportsTools === false ? "glm" : undefined;
+	if (format === "auto") {
+		if (model?.supportsTools !== false) return undefined;
+		if (!model.id) return "glm";
+		const preferred = preferredDialect(model.id);
+		return preferred === FALLBACK_DIALECT ? "glm" : preferred;
+	}
 	return format;
 }
@@ -2458,6 +2465,7 @@ export async function createAgentSession(options: CreateAgentSessionOptions = {}
 			onResponse,
 			sessionId: providerSessionId,
 			promptCacheKey: options.providerPromptCacheKey,
+			deadline: options.deadline,
 			transformContext,
 			transformProviderContext,
 			steeringMode: settings.get("steeringMode") ?? "one-at-a-time",
@@ -2475,28 +2483,16 @@ export async function createAgentSession(options: CreateAgentSessionOptions = {}
 			kimiApiFormat: settings.get("providers.kimiApiFormat") ?? "anthropic",
 			preferWebsockets: preferOpenAICodexWebsockets,
 			getToolContext: tc => toolContextStore.getContext(tc),
-			getApiKey: async (provider, ctx) => {
-				// Read agent.sessionId at call time so credential selection stays aligned
-				// with metadataResolver after /new, fork, resume, or branch switches.
-				// Retry steps (ctx carries an auth error) drive the central a/b/c
-				// policy — force-refresh the same account, then rotate to a sibling —
-				// and may legitimately yield no key when every account is exhausted.
-				if (ctx?.error !== undefined) {
-					return createApiKeyResolver(modelRegistry, provider, { sessionId: agent.sessionId })(ctx);
-				}
-				const key = await modelRegistry.getApiKeyForProvider(provider, agent.sessionId);
-				if (!key) {
-					throw new Error(`No API key found for provider "${provider}"`);
-				}
-				return key;
-			},
+			getApiKey: requestModel => modelRegistry.resolver(requestModel, agent.sessionId),
 			streamFn: (streamModel, context, streamOptions) => {
 				const openrouterRoutingPreset = settings.get("providers.openrouterVariant");
 				const openrouterVariant =
 					openrouterRoutingPreset && openrouterRoutingPreset !== "default" ? openrouterRoutingPreset : undefined;
+				const antigravityEndpointMode = settings.get("providers.antigravityEndpoint");
 				return streamSimple(streamModel, context, {
 					...streamOptions,
 					openrouterVariant: streamOptions?.openrouterVariant ?? openrouterVariant,
+					antigravityEndpointMode: streamOptions?.antigravityEndpointMode ?? antigravityEndpointMode,
 				});
 			},
 			cursorExecHandlers,