npm - @oh-my-pi/pi-coding-agent - Versions diffs - 15.0.1 → 15.1.0 - Mend

@oh-my-pi/pi-coding-agent 15.0.1 → 15.1.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (168) hide show

package/CHANGELOG.md +94 -1
package/examples/custom-tools/README.md +11 -7
package/examples/custom-tools/hello/index.ts +2 -2
package/examples/extensions/README.md +19 -8
package/examples/extensions/api-demo.ts +15 -19
package/examples/extensions/hello.ts +5 -6
package/examples/extensions/plan-mode.ts +1 -1
package/examples/extensions/reload-runtime.ts +4 -3
package/examples/extensions/with-deps/index.ts +4 -3
package/examples/sdk/06-extensions.ts +4 -2
package/package.json +8 -18
package/src/autoresearch/tools/init-experiment.ts +38 -41
package/src/autoresearch/tools/log-experiment.ts +32 -41
package/src/autoresearch/tools/run-experiment.ts +3 -3
package/src/autoresearch/tools/update-notes.ts +11 -11
package/src/commands/commit.ts +10 -0
package/src/commit/agentic/tools/analyze-file.ts +4 -4
package/src/commit/agentic/tools/git-file-diff.ts +4 -4
package/src/commit/agentic/tools/git-hunk.ts +5 -5
package/src/commit/agentic/tools/git-overview.ts +4 -4
package/src/commit/agentic/tools/propose-changelog.ts +13 -13
package/src/commit/agentic/tools/propose-commit.ts +6 -6
package/src/commit/agentic/tools/recent-commits.ts +3 -3
package/src/commit/agentic/tools/schemas.ts +28 -28
package/src/commit/agentic/tools/split-commit.ts +22 -21
package/src/commit/analysis/summary.ts +4 -4
package/src/commit/changelog/generate.ts +7 -11
package/src/commit/shared-llm.ts +22 -34
package/src/config/config-file.ts +35 -13
package/src/config/model-registry.ts +40 -191
package/src/config/models-config-schema.ts +166 -0
package/src/config/settings-schema.ts +29 -0
package/src/discovery/claude-plugins.ts +19 -7
package/src/edit/index.ts +2 -2
package/src/edit/modes/apply-patch.ts +7 -6
package/src/edit/modes/patch.ts +18 -25
package/src/edit/modes/replace.ts +18 -20
package/src/eval/js/shared/rewrite-imports.ts +131 -10
package/src/eval/py/executor.ts +233 -623
package/src/eval/py/kernel.ts +27 -2
package/src/eval/py/runner.py +42 -11
package/src/eval/py/runtime.ts +1 -0
package/src/exa/factory.ts +5 -4
package/src/exa/mcp-client.ts +1 -1
package/src/exa/researcher.ts +9 -20
package/src/exa/search.ts +26 -52
package/src/exa/types.ts +1 -1
package/src/exa/websets.ts +54 -53
package/src/exec/bash-executor.ts +2 -1
package/src/extensibility/custom-commands/loader.ts +5 -3
package/src/extensibility/custom-commands/types.ts +4 -2
package/src/extensibility/custom-tools/loader.ts +5 -3
package/src/extensibility/custom-tools/types.ts +7 -6
package/src/extensibility/custom-tools/wrapper.ts +1 -1
package/src/extensibility/extensions/get-commands-handler.ts +77 -0
package/src/extensibility/extensions/loader.ts +7 -3
package/src/extensibility/extensions/types.ts +9 -5
package/src/extensibility/extensions/wrapper.ts +1 -2
package/src/extensibility/hooks/loader.ts +3 -1
package/src/extensibility/hooks/tool-wrapper.ts +1 -1
package/src/extensibility/hooks/types.ts +4 -2
package/src/extensibility/plugins/legacy-pi-compat.ts +78 -31
package/src/extensibility/shared-events.ts +1 -1
package/src/extensibility/typebox.ts +391 -0
package/src/goals/tools/goal-tool.ts +6 -12
package/src/hashline/input.ts +2 -1
package/src/hashline/parser.ts +27 -3
package/src/hashline/types.ts +4 -4
package/src/hindsight/state.ts +2 -2
package/src/index.ts +0 -2
package/src/internal-urls/docs-index.generated.ts +15 -15
package/src/internal-urls/router.ts +8 -0
package/src/internal-urls/types.ts +21 -0
package/src/lsp/config.ts +15 -6
package/src/lsp/defaults.json +6 -2
package/src/lsp/types.ts +30 -38
package/src/mcp/manager.ts +1 -1
package/src/mcp/tool-bridge.ts +1 -1
package/src/modes/acp/acp-agent.ts +248 -50
package/src/modes/components/session-observer-overlay.ts +12 -1
package/src/modes/components/status-line/segments.ts +39 -4
package/src/modes/controllers/command-controller.ts +27 -2
package/src/modes/controllers/event-controller.ts +3 -4
package/src/modes/controllers/extension-ui-controller.ts +3 -2
package/src/modes/interactive-mode.ts +1 -1
package/src/modes/rpc/host-tools.ts +1 -1
package/src/modes/rpc/host-uris.ts +235 -0
package/src/modes/rpc/rpc-client.ts +1 -1
package/src/modes/rpc/rpc-mode.ts +27 -1
package/src/modes/rpc/rpc-types.ts +58 -1
package/src/modes/runtime-init.ts +2 -1
package/src/modes/theme/defaults/dark-poimandres.json +1 -0
package/src/modes/theme/defaults/light-poimandres.json +1 -0
package/src/modes/theme/theme.ts +117 -117
package/src/modes/types.ts +1 -1
package/src/modes/utils/context-usage.ts +2 -2
package/src/prompts/tools/github.md +4 -4
package/src/prompts/tools/hashline.md +22 -26
package/src/prompts/tools/read.md +55 -37
package/src/sdk.ts +31 -8
package/src/session/agent-session.ts +74 -104
package/src/session/messages.ts +16 -51
package/src/session/session-manager.ts +22 -2
package/src/session/streaming-output.ts +16 -6
package/src/task/discovery.ts +5 -2
package/src/task/executor.ts +210 -87
package/src/task/index.ts +15 -11
package/src/task/render.ts +32 -5
package/src/task/types.ts +54 -39
package/src/tools/ask.ts +12 -12
package/src/tools/ast-edit.ts +11 -15
package/src/tools/ast-grep.ts +9 -10
package/src/tools/bash-command-fixup.ts +47 -0
package/src/tools/bash.ts +48 -38
package/src/tools/browser/render.ts +2 -2
package/src/tools/browser.ts +39 -53
package/src/tools/calculator.ts +12 -11
package/src/tools/checkpoint.ts +7 -7
package/src/tools/debug.ts +40 -43
package/src/tools/eval.ts +16 -10
package/src/tools/find.ts +10 -13
package/src/tools/gh.ts +108 -132
package/src/tools/hindsight-recall.ts +4 -6
package/src/tools/hindsight-reflect.ts +5 -5
package/src/tools/hindsight-retain.ts +15 -17
package/src/tools/image-gen.ts +31 -81
package/src/tools/index.ts +4 -1
package/src/tools/inspect-image.ts +8 -9
package/src/tools/irc.ts +15 -27
package/src/tools/job.ts +30 -28
package/src/tools/output-meta.ts +26 -0
package/src/tools/read.ts +39 -12
package/src/tools/recipe/index.ts +7 -9
package/src/tools/render-mermaid.ts +12 -12
package/src/tools/report-tool-issue.ts +4 -4
package/src/tools/resolve.ts +11 -11
package/src/tools/review.ts +14 -26
package/src/tools/search-tool-bm25.ts +7 -9
package/src/tools/search.ts +19 -22
package/src/tools/ssh.ts +10 -9
package/src/tools/todo-write.ts +26 -34
package/src/tools/vim.ts +10 -26
package/src/tools/write.ts +25 -5
package/src/tools/yield.ts +100 -54
package/src/web/search/index.ts +9 -24
package/src/web/search/providers/anthropic.ts +5 -0
package/src/web/search/providers/exa.ts +3 -0
package/src/web/search/providers/gemini.ts +5 -0
package/src/web/search/providers/jina.ts +5 -2
package/src/web/search/providers/zai.ts +5 -2
package/src/prompts/compaction/branch-summary-context.md +0 -5
package/src/prompts/compaction/branch-summary-preamble.md +0 -2
package/src/prompts/compaction/branch-summary.md +0 -30
package/src/prompts/compaction/compaction-short-summary.md +0 -9
package/src/prompts/compaction/compaction-summary-context.md +0 -5
package/src/prompts/compaction/compaction-summary.md +0 -38
package/src/prompts/compaction/compaction-turn-prefix.md +0 -17
package/src/prompts/compaction/compaction-update-summary.md +0 -45
package/src/prompts/system/auto-handoff-threshold-focus.md +0 -1
package/src/prompts/system/file-operations.md +0 -10
package/src/prompts/system/handoff-document.md +0 -49
package/src/prompts/system/summarization-system.md +0 -3
package/src/session/compaction/branch-summarization.ts +0 -324
package/src/session/compaction/compaction.ts +0 -1420
package/src/session/compaction/errors.ts +0 -31
package/src/session/compaction/index.ts +0 -8
package/src/session/compaction/pruning.ts +0 -91
package/src/session/compaction/utils.ts +0 -184

package/src/task/executor.ts CHANGED Viewed

@@ -5,10 +5,10 @@
  */
 import path from "node:path";
-import type { AgentEvent, ThinkingLevel } from "@oh-my-pi/pi-agent-core";
+import type { AgentEvent, AgentIdentity, AgentTelemetryConfig, ThinkingLevel } from "@oh-my-pi/pi-agent-core";
+import { recordHandoff, resolveTelemetry } from "@oh-my-pi/pi-agent-core";
+import { isJsonSchemaValueValid } from "@oh-my-pi/pi-ai/utils/schema";
 import { logger, prompt, untilAborted } from "@oh-my-pi/pi-utils";
-import type { TSchema } from "@sinclair/typebox";
-import Ajv, { type ValidateFunction } from "ajv";
 import { ModelRegistry } from "../config/model-registry";
 import { resolveModelOverrideWithAuthFallback } from "../config/model-resolver";
 import type { PromptTemplate } from "../config/prompt-templates";
@@ -16,6 +16,7 @@ import { Settings } from "../config/settings";
 import { SETTINGS_SCHEMA, type SettingPath } from "../config/settings-schema";
 import type { CustomTool } from "../extensibility/custom-tools/types";
 import { runExtensionCompact, runExtensionSetModel } from "../extensibility/extensions/compact-handler";
+import { getSessionSlashCommands } from "../extensibility/extensions/get-commands-handler";
 import type { Skill } from "../extensibility/skills";
 import type { HindsightSessionState } from "../hindsight/state";
 import type { LocalProtocolOptions } from "../internal-urls";
@@ -50,7 +51,6 @@ import {
 } from "./types";
 const MCP_CALL_TIMEOUT_MS = 60_000;
-const ajv = new Ajv({ allErrors: true, strict: false, logger: false });
 /** Agent event types to forward for progress tracking. */
 const agentEventTypes = new Set<AgentEvent["type"]>([
@@ -181,6 +181,15 @@ export interface ExecutorOptions {
 	 */
 	parentArtifactManager?: ArtifactManager;
 	parentHindsightSessionState?: HindsightSessionState;
+	/**
+	 * Parent agent's OpenTelemetry configuration. When defined, the subagent's
+	 * loop is started with the same tracer/hooks but its own agent identity
+	 * stamped, so its `invoke_agent` / `chat` / `execute_tool` spans appear as
+	 * a sub-tree under the parent's active `execute_tool task` span. A
+	 * `handoff` span is emitted on dispatch to mark the parent → subagent
+	 * transition explicitly.
+	 */
+	parentTelemetry?: AgentTelemetryConfig;
 }
 function parseStringifiedJson(value: unknown): unknown {
@@ -195,16 +204,12 @@ function parseStringifiedJson(value: unknown): unknown {
 	}
 }
-function buildOutputValidator(schema: unknown): { validate?: ValidateFunction; error?: string } {
+function buildOutputValidator(schema: unknown): { validate?: (value: unknown) => boolean; error?: string } {
 	const { normalized, error } = normalizeSchema(schema);
 	if (error) return { error };
 	if (normalized === undefined) return {};
 	const jsonSchema = jtdToJsonSchema(normalized);
-	try {
-		return { validate: ajv.compile(jsonSchema as any) };
-	} catch (err) {
-		return { error: err instanceof Error ? err.message : String(err) };
-	}
+	return { validate: value => isJsonSchemaValueValid(jsonSchema, value) };
 }
 function tryParseJsonOutput(text: string): unknown | undefined {
@@ -407,14 +412,14 @@ function getUsageTokens(usage: unknown): number {
 /**
  * Create proxy tools that reuse the parent's MCP connections.
  */
-function createMCPProxyTools(mcpManager: MCPManager): CustomTool<TSchema>[] {
+function createMCPProxyTools(mcpManager: MCPManager): CustomTool[] {
 	return mcpManager.getTools().map(tool => {
 		const mcpTool = tool as { mcpToolName?: string; mcpServerName?: string };
 		return {
 			name: tool.name,
 			label: tool.label ?? tool.name,
 			description: tool.description ?? "",
-			parameters: tool.parameters as TSchema,
+			parameters: tool.parameters,
 			execute: async (_toolCallId, params, _onUpdate, _ctx, signal) => {
 				if (signal?.aborted) {
 					throw new ToolAbortError();
@@ -542,6 +547,7 @@ export async function runSubprocess(options: ExecutorOptions): Promise<SingleRes
 	const settings = options.settings ?? Settings.isolated();
 	const subagentSettings = createSubagentSettings(settings);
 	const maxRecursionDepth = settings.get("task.maxRecursionDepth") ?? 2;
+	const maxRuntimeMs = Math.max(0, Math.trunc(Number(settings.get("task.maxRuntimeMs") ?? 0) || 0));
 	const parentDepth = options.taskDepth ?? 0;
 	const childDepth = parentDepth + 1;
 	const atMaxDepth = maxRecursionDepth >= 0 && childDepth >= maxRecursionDepth;
@@ -589,9 +595,10 @@ export async function runSubprocess(options: ExecutorOptions): Promise<SingleRes
 	let recentOutputTail = "";
 	let stderr = "";
 	let resolved = false;
-	type AbortReason = "signal" | "terminate";
+	type AbortReason = "signal" | "terminate" | "timeout";
 	let abortSent = false;
 	let abortReason: AbortReason | undefined;
+	let runtimeLimitExceeded = false;
 	const listenerController = new AbortController();
 	const listenerSignal = listenerController.signal;
 	const abortController = new AbortController();
@@ -612,8 +619,11 @@ export async function runSubprocess(options: ExecutorOptions): Promise<SingleRes
 	let hasUsage = false;
 	const requestAbort = (reason: AbortReason) => {
+		if (reason === "timeout") {
+			runtimeLimitExceeded = true;
+		}
 		if (abortSent) {
-			if (reason === "signal" && abortReason !== "signal") {
+			if (reason === "signal" && abortReason !== "signal" && abortReason !== "timeout") {
 				abortReason = "signal";
 			}
 			return;
@@ -635,6 +645,24 @@ export async function runSubprocess(options: ExecutorOptions): Promise<SingleRes
 		signal.addEventListener("abort", onAbort, { once: true, signal: listenerSignal });
 	}
+	// Wall-clock hard limit. Defense-in-depth for the case where a provider stream
+	// hang escapes the inference-layer watchdog (see openai-completions
+	// `isOpenAICompletionsProgressChunk`). Disabled by default; set
+	// `task.maxRuntimeMs > 0` to cap each subagent's lifetime.
+	let runtimeTimeoutId: NodeJS.Timeout | undefined;
+	if (maxRuntimeMs > 0) {
+		runtimeTimeoutId = setTimeout(() => {
+			if (!resolved) {
+				logger.warn("Subagent runtime limit exceeded; aborting", {
+					id,
+					agent: agent.name,
+					maxRuntimeMs,
+				});
+				requestAbort("timeout");
+			}
+		}, maxRuntimeMs);
+	}
 	const resolveSignalAbortReason = (): string => {
 		const reason = signal?.reason;
 		if (reason instanceof Error) {
@@ -646,6 +674,12 @@ export async function runSubprocess(options: ExecutorOptions): Promise<SingleRes
 		}
 		return "Cancelled by caller";
 	};
+	const resolveAbortReasonText = (): string => {
+		if (runtimeLimitExceeded) {
+			return `Subagent runtime limit exceeded (task.maxRuntimeMs=${maxRuntimeMs})`;
+		}
+		return resolveSignalAbortReason();
+	};
 	const PROGRESS_COALESCE_MS = 150;
 	let lastProgressEmitMs = 0;
 	let progressTimeoutId: NodeJS.Timeout | null = null;
@@ -906,6 +940,14 @@ export async function runSubprocess(options: ExecutorOptions): Promise<SingleRes
 					}
 					// Accumulate tokens for progress display
 					progress.tokens += getUsageTokens(messageUsage);
+					// Track latest per-turn context size so the UI can show
+					// "current context", not just cumulative billing volume.
+					if (role === "assistant") {
+						const perTurnTotal = getNumberField(messageUsage as Record<string, unknown>, "totalTokens");
+						if (perTurnTotal !== undefined && perTurnTotal > 0) {
+							progress.contextTokens = perTurnTotal;
+						}
+					}
 				}
 				break;
 			}
@@ -946,21 +988,39 @@ export async function runSubprocess(options: ExecutorOptions): Promise<SingleRes
 		let abortReasonText: string | undefined;
 		const checkAbort = () => {
 			if (abortSignal.aborted) {
-				aborted = abortReason === "signal" || abortReason === undefined;
+				aborted = abortReason === "signal" || runtimeLimitExceeded || abortReason === undefined;
 				if (aborted) {
-					abortReasonText ??= resolveSignalAbortReason();
+					abortReasonText ??= resolveAbortReasonText();
 				}
 				exitCode = 1;
 				throw new ToolAbortError();
 			}
 		};
+		const awaitAbortable = async <T>(promise: Promise<T>): Promise<T> => {
+			checkAbort();
+			const { promise: abortPromise, reject } = Promise.withResolvers<never>();
+			const onAbort = () => {
+				try {
+					checkAbort();
+				} catch (err) {
+					reject(err);
+				}
+			};
+			abortSignal.addEventListener("abort", onAbort, { once: true });
+			try {
+				return await Promise.race([promise, abortPromise]);
+			} finally {
+				abortSignal.removeEventListener("abort", onAbort);
+			}
+		};
 		try {
 			checkAbort();
 			// Pin authStorage to modelRegistry.authStorage — mirrors the createAgentSession invariant.
 			const registryFromParent = options.modelRegistry !== undefined;
 			const modelRegistry =
-				options.modelRegistry ?? new ModelRegistry(options.authStorage ?? (await discoverAuthStorage()));
+				options.modelRegistry ??
+				new ModelRegistry(options.authStorage ?? (await awaitAbortable(discoverAuthStorage())));
 			const authStorage = modelRegistry.authStorage;
 			if (options.authStorage && options.authStorage !== authStorage) {
 				throw new Error(
@@ -969,7 +1029,7 @@ export async function runSubprocess(options: ExecutorOptions): Promise<SingleRes
 			}
 			checkAbort();
 			if (!registryFromParent) {
-				await modelRegistry.refresh();
+				await awaitAbortable(modelRegistry.refresh());
 			} else {
 				logger.debug("runSubagent: reusing parent modelRegistry; skipping refresh");
 			}
@@ -980,11 +1040,13 @@ export async function runSubprocess(options: ExecutorOptions): Promise<SingleRes
 				thinkingLevel: resolvedThinkingLevel,
 				explicitThinkingLevel,
 				authFallbackUsed,
-			} = await resolveModelOverrideWithAuthFallback(
-				modelPatterns,
-				options.parentActiveModelPattern,
-				modelRegistry,
-				settings,
+			} = await awaitAbortable(
+				resolveModelOverrideWithAuthFallback(
+					modelPatterns,
+					options.parentActiveModelPattern,
+					modelRegistry,
+					settings,
+				),
 			);
 			if (authFallbackUsed && model) {
 				logger.warn("Subagent model has no working credentials; falling back to parent session model", {
@@ -994,12 +1056,15 @@ export async function runSubprocess(options: ExecutorOptions): Promise<SingleRes
 					resolvedModel: model.id,
 				});
 			}
+			if (model?.contextWindow && model.contextWindow > 0) {
+				progress.contextWindow = model.contextWindow;
+			}
 			const effectiveThinkingLevel = explicitThinkingLevel
 				? resolvedThinkingLevel
 				: (thinkingLevel ?? resolvedThinkingLevel);
 			const sessionManager = sessionFile
-				? await SessionManager.open(sessionFile)
+				? await awaitAbortable(SessionManager.open(sessionFile))
 				: SessionManager.inMemory(worktree ?? cwd);
 			if (options.parentArtifactManager) {
 				sessionManager.adoptArtifactManager(options.parentArtifactManager);
@@ -1008,51 +1073,84 @@ export async function runSubprocess(options: ExecutorOptions): Promise<SingleRes
 			const mcpProxyTools = options.mcpManager ? createMCPProxyTools(options.mcpManager) : [];
 			const enableMCP = !options.mcpManager;
+			// Derive subagent-scoped telemetry from the parent's config so the
+			// child loop's spans nest under the parent's active execute_tool span
+			// (OTEL context propagation handles parent linkage automatically),
+			// carry the subagent's own agent identity, and use the subagent's
+			// own session id for `gen_ai.conversation.id`.
+			const subagentAgentIdentity: AgentIdentity | undefined = options.parentTelemetry
+				? { id, name: agent.name, description: agent.description }
+				: undefined;
+			const subagentTelemetry: AgentTelemetryConfig | undefined =
+				options.parentTelemetry && subagentAgentIdentity
+					? {
+							...options.parentTelemetry,
+							agent: subagentAgentIdentity,
+							// Clear parent's conversationId; the child loop falls back to
+							// its own AgentLoopConfig.sessionId.
+							conversationId: undefined,
+						}
+					: undefined;
+			if (options.parentTelemetry && subagentAgentIdentity) {
+				const parentTelemetryHandle = resolveTelemetry(
+					options.parentTelemetry,
+					options.parentTelemetry.conversationId,
+				);
+				recordHandoff(parentTelemetryHandle, {
+					fromAgent: options.parentTelemetry.agent,
+					toAgent: subagentAgentIdentity,
+				});
+			}
 			const { normalized: normalizedOutputSchema } = normalizeSchema(outputSchema);
-			const { session } = await createAgentSession({
-				cwd: worktree ?? cwd,
-				authStorage,
-				modelRegistry,
-				settings: subagentSettings,
-				model,
-				thinkingLevel: effectiveThinkingLevel,
-				toolNames,
-				outputSchema,
-				requireYieldTool: true,
-				contextFiles: options.contextFiles,
-				skills: options.skills,
-				promptTemplates: options.promptTemplates,
-				workspaceTree: options.workspaceTree,
-				systemPrompt: defaultPrompt => {
-					const subagentPrompt = prompt.render(subagentSystemPromptTemplate, {
-						agent: agent.systemPrompt,
-						context: options.context?.trim() ?? "",
-						worktree: worktree ?? "",
-						outputSchema: normalizedOutputSchema,
-						contextFile: contextFileForPrompt,
-						ircPeers: ircEnabled ? renderIrcPeerRoster(id) : "",
-						ircSelfId: ircEnabled ? id : "",
-					});
-					return defaultPrompt.length === 0
-						? [subagentPrompt]
-						: [...defaultPrompt.slice(0, -1), subagentPrompt, defaultPrompt[defaultPrompt.length - 1]];
-				},
-				sessionManager,
-				hasUI: false,
-				spawns: spawnsEnv,
-				taskDepth: childDepth,
-				parentHindsightSessionState: options.parentHindsightSessionState,
-				parentTaskPrefix: id,
-				agentId: id,
-				agentDisplayName: agent.name,
-				enableLsp: lspEnabled,
-				skipPythonPreflight,
-				enableMCP,
-				mcpManager: options.mcpManager,
-				customTools: mcpProxyTools.length > 0 ? mcpProxyTools : undefined,
-				localProtocolOptions: options.localProtocolOptions,
-			});
+			const { session } = await awaitAbortable(
+				createAgentSession({
+					cwd: worktree ?? cwd,
+					authStorage,
+					modelRegistry,
+					settings: subagentSettings,
+					model,
+					thinkingLevel: effectiveThinkingLevel,
+					toolNames,
+					outputSchema,
+					requireYieldTool: true,
+					contextFiles: options.contextFiles,
+					skills: options.skills,
+					promptTemplates: options.promptTemplates,
+					workspaceTree: options.workspaceTree,
+					systemPrompt: defaultPrompt => {
+						const subagentPrompt = prompt.render(subagentSystemPromptTemplate, {
+							agent: agent.systemPrompt,
+							context: options.context?.trim() ?? "",
+							worktree: worktree ?? "",
+							outputSchema: normalizedOutputSchema,
+							contextFile: contextFileForPrompt,
+							ircPeers: ircEnabled ? renderIrcPeerRoster(id) : "",
+							ircSelfId: ircEnabled ? id : "",
+						});
+						return defaultPrompt.length === 0
+							? [subagentPrompt]
+							: [...defaultPrompt.slice(0, -1), subagentPrompt, defaultPrompt[defaultPrompt.length - 1]];
+					},
+					sessionManager,
+					hasUI: false,
+					spawns: spawnsEnv,
+					taskDepth: childDepth,
+					parentHindsightSessionState: options.parentHindsightSessionState,
+					parentTaskPrefix: id,
+					agentId: id,
+					agentDisplayName: agent.name,
+					enableLsp: lspEnabled,
+					skipPythonPreflight,
+					enableMCP,
+					mcpManager: options.mcpManager,
+					customTools: mcpProxyTools.length > 0 ? mcpProxyTools : undefined,
+					localProtocolOptions: options.localProtocolOptions,
+					telemetry: subagentTelemetry,
+				}),
+			);
 			activeSession = session;
@@ -1073,7 +1171,7 @@ export async function runSubprocess(options: ExecutorOptions): Promise<SingleRes
 			const parentOwnedToolNames = new Set(["todo_write"]);
 			const filteredSubagentTools = subagentToolNames.filter(name => !parentOwnedToolNames.has(name));
 			if (filteredSubagentTools.length !== subagentToolNames.length) {
-				await session.setActiveToolsByName(filteredSubagentTools);
+				await awaitAbortable(session.setActiveToolsByName(filteredSubagentTools));
 			}
 			session.sessionManager.appendSessionInit({
@@ -1090,6 +1188,12 @@ export async function runSubprocess(options: ExecutorOptions): Promise<SingleRes
 				},
 				{ once: true, signal: sessionAbortController.signal },
 			);
+			// Defensive: if the wall-clock timer (or external signal) fired during
+			// the awaited setup above, the listener registration races the dispatch
+			// and may not observe the already-fired abort event. Mirror it manually.
+			if (abortSignal.aborted) {
+				void session.abort();
+			}
 			const extensionRunner = session.extensionRunner;
 			if (extensionRunner) {
@@ -1119,7 +1223,7 @@ export async function runSubprocess(options: ExecutorOptions): Promise<SingleRes
 						getAllTools: () => session.getAllToolNames(),
 						setActiveTools: (toolNames: string[]) =>
 							session.setActiveToolsByName(toolNames.filter(name => !parentOwnedToolNames.has(name))),
-						getCommands: () => [],
+						getCommands: () => getSessionSlashCommands(session),
 						setModel: model => runExtensionSetModel(session, model),
 						getThinkingLevel: () => session.thinkingLevel,
 						setThinkingLevel: level => session.setThinkingLevel(level),
@@ -1142,7 +1246,7 @@ export async function runSubprocess(options: ExecutorOptions): Promise<SingleRes
 				extensionRunner.onError(err => {
 					logger.error("Extension error", { path: err.extensionPath, error: err.error });
 				});
-				await extensionRunner.emit({ type: "session_start" });
+				await awaitAbortable(extensionRunner.emit({ type: "session_start" }));
 			}
 			const MAX_YIELD_RETRIES = 3;
@@ -1159,8 +1263,9 @@ export async function runSubprocess(options: ExecutorOptions): Promise<SingleRes
 				}
 			});
-			await session.prompt(task, { attribution: "agent" });
-			await session.waitForIdle();
+			checkAbort();
+			await awaitAbortable(session.prompt(task, { attribution: "agent" }));
+			await awaitAbortable(session.waitForIdle());
 			const reminderToolChoice = buildNamedToolChoice("yield", session.model);
@@ -1174,11 +1279,13 @@ export async function runSubprocess(options: ExecutorOptions): Promise<SingleRes
 					});
 					const isFinalRetry = retryCount >= MAX_YIELD_RETRIES;
-					await session.prompt(reminder, {
-						attribution: "agent",
-						...(isFinalRetry && reminderToolChoice ? { toolChoice: reminderToolChoice } : {}),
-					});
-					await session.waitForIdle();
+					await awaitAbortable(
+						session.prompt(reminder, {
+							attribution: "agent",
+							...(isFinalRetry && reminderToolChoice ? { toolChoice: reminderToolChoice } : {}),
+						}),
+					);
+					await awaitAbortable(session.waitForIdle());
 				} catch (err) {
 					logger.error("Subagent prompt failed", {
 						error: err instanceof Error ? err.message : String(err),
@@ -1186,7 +1293,7 @@ export async function runSubprocess(options: ExecutorOptions): Promise<SingleRes
 				}
 			}
-			await session.waitForIdle();
+			await awaitAbortable(session.waitForIdle());
 			if (!yieldCalled && !abortSignal.aborted) {
 				exitCode = 0;
 			}
@@ -1194,9 +1301,9 @@ export async function runSubprocess(options: ExecutorOptions): Promise<SingleRes
 			const lastAssistant = session.getLastAssistantMessage();
 			if (lastAssistant) {
 				if (lastAssistant.stopReason === "aborted") {
-					aborted = abortReason === "signal" || abortReason === undefined;
+					aborted = abortReason === "signal" || runtimeLimitExceeded || abortReason === undefined;
 					if (aborted) {
-						abortReasonText ??= resolveSignalAbortReason();
+						abortReasonText ??= resolveAbortReasonText();
 					}
 					exitCode = 1;
 				} else if (lastAssistant.stopReason === "error") {
@@ -1211,9 +1318,9 @@ export async function runSubprocess(options: ExecutorOptions): Promise<SingleRes
 			}
 		} finally {
 			if (abortSignal.aborted) {
-				aborted = abortReason === "signal" || abortReason === undefined;
+				aborted = abortReason === "signal" || runtimeLimitExceeded || abortReason === undefined;
 				if (aborted) {
-					abortReasonText ??= resolveSignalAbortReason();
+					abortReasonText ??= resolveAbortReasonText();
 				}
 				if (exitCode === 0) exitCode = 1;
 			}
@@ -1249,6 +1356,10 @@ export async function runSubprocess(options: ExecutorOptions): Promise<SingleRes
 	const done = await runSubagent();
 	resolved = true;
 	listenerController.abort();
+	if (runtimeTimeoutId !== undefined) {
+		clearTimeout(runtimeTimeoutId);
+		runtimeTimeoutId = undefined;
+	}
 	if (progressTimeoutId) {
 		clearTimeout(progressTimeoutId);
@@ -1302,12 +1413,22 @@ export async function runSubprocess(options: ExecutorOptions): Promise<SingleRes
 		}
 	}
-	// Update final progress
-	const wasAborted = abortedViaYield || (!hasYield && (done.aborted || signal?.aborted || false));
+	// Update final progress. A wall-clock timeout always wins: if the runtime
+	// limit fired we report aborted/failed regardless of whether a yield landed
+	// while we were tearing the session down. The yield data is still surfaced
+	// to the caller via `progress.extractedToolData`, but the exit status must
+	// reflect the timeout so on-call doesn't mistake a stuck run for success.
+	if (runtimeLimitExceeded && exitCode === 0) {
+		exitCode = 1;
+	}
+	const wasAborted =
+		runtimeLimitExceeded || abortedViaYield || (!hasYield && (done.aborted || signal?.aborted || false));
 	const finalAbortReason = wasAborted
-		? abortedViaYield
-			? yieldAbortReason
-			: (done.abortReason ?? (signal?.aborted ? resolveSignalAbortReason() : "Subagent aborted task"))
+		? runtimeLimitExceeded
+			? resolveAbortReasonText()
+			: abortedViaYield
+				? yieldAbortReason
+				: (done.abortReason ?? (signal?.aborted ? resolveSignalAbortReason() : resolveAbortReasonText()))
 		: undefined;
 	progress.status = wasAborted ? "aborted" : exitCode === 0 ? "completed" : "failed";
 	scheduleProgress(true);
@@ -1340,6 +1461,8 @@ export async function runSubprocess(options: ExecutorOptions): Promise<SingleRes
 		truncated: Boolean(truncated),
 		durationMs: Date.now() - startTime,
 		tokens: progress.tokens,
+		contextTokens: progress.contextTokens,
+		contextWindow: progress.contextWindow,
 		modelOverride,
 		error: exitCode !== 0 && stderr ? stderr : undefined,
 		aborted: wasAborted,

package/src/task/index.ts CHANGED Viewed

@@ -18,7 +18,6 @@ import path from "node:path";
 import type { AgentTool, AgentToolResult, AgentToolUpdateCallback } from "@oh-my-pi/pi-agent-core";
 import type { Usage } from "@oh-my-pi/pi-ai";
 import { $env, prompt, Snowflake } from "@oh-my-pi/pi-utils";
-import type { TSchema } from "@sinclair/typebox";
 import type { ToolSession } from "..";
 import { AsyncJobManager } from "../async";
 import { resolveAgentModelPatterns } from "../config/model-resolver";
@@ -29,6 +28,15 @@ import subagentUserPromptTemplate from "../prompts/system/subagent-user-prompt.m
 import taskDescriptionTemplate from "../prompts/tools/task.md" with { type: "text" };
 import taskSummaryTemplate from "../prompts/tools/task-summary.md" with { type: "text" };
 import { formatBytes, formatDuration } from "../tools/render-utils";
+import {
+	type AgentDefinition,
+	type AgentProgress,
+	getTaskSchema,
+	type SingleResult,
+	type TaskParams,
+	type TaskToolDetails,
+	type TaskToolSchemaInstance,
+} from "./types";
 // Import review tools for side effects (registers subagent tool handlers)
 import "../tools/review";
 import type { LocalProtocolOptions } from "../internal-urls";
@@ -40,14 +48,6 @@ import { AgentOutputManager } from "./output-manager";
 import { mapWithConcurrencyLimit, Semaphore } from "./parallel";
 import { renderResult, renderCall as renderTaskCall } from "./render";
 import { getTaskSimpleModeCapabilities, type TaskSimpleMode } from "./simple-mode";
-import {
-	type AgentDefinition,
-	type AgentProgress,
-	getTaskSchema,
-	type SingleResult,
-	type TaskParams,
-	type TaskToolDetails,
-} from "./types";
 import {
 	applyNestedPatches,
 	captureBaseline,
@@ -198,7 +198,7 @@ function validateTaskModeParams(simpleMode: TaskSimpleMode, params: TaskParams):
  * Requires async initialization to discover available agents.
  * Use `TaskTool.create(session)` to instantiate.
  */
-export class TaskTool implements AgentTool<TSchema, TaskToolDetails, Theme> {
+export class TaskTool implements AgentTool<TaskToolSchemaInstance, TaskToolDetails, Theme> {
 	readonly name = "task";
 	readonly label = "Task";
 	readonly summary = "Spawn a subagent to complete a parallel task";
@@ -208,7 +208,7 @@ export class TaskTool implements AgentTool<TSchema, TaskToolDetails, Theme> {
 	readonly #discoveredAgents: AgentDefinition[];
 	readonly #blockedAgent: string | undefined;
-	get parameters(): TSchema {
+	get parameters(): TaskToolSchemaInstance {
 		const isolationEnabled = this.session.settings.get("task.isolation.mode") !== "none";
 		return getTaskSchema({ isolationEnabled, simpleMode: this.#getTaskSimpleMode() });
 	}
@@ -391,6 +391,8 @@ export class TaskTool implements AgentTool<TSchema, TaskToolDetails, Theme> {
 										: "failed";
 								progress.durationMs = singleResult?.durationMs ?? Math.max(0, Date.now() - startedAt);
 								progress.tokens = singleResult?.tokens ?? 0;
+								progress.contextTokens = singleResult?.contextTokens;
+								progress.contextWindow = singleResult?.contextWindow;
 								progress.cost = singleResult?.usage?.cost.total ?? 0;
 								progress.extractedToolData = singleResult?.extractedToolData;
 							}
@@ -881,6 +883,7 @@ export class TaskTool implements AgentTool<TSchema, TaskToolDetails, Theme> {
 						localProtocolOptions,
 						parentArtifactManager,
 						parentHindsightSessionState: this.session.getHindsightSessionState?.(),
+						parentTelemetry: this.session.getTelemetry?.(),
 					});
 				}
@@ -934,6 +937,7 @@ export class TaskTool implements AgentTool<TSchema, TaskToolDetails, Theme> {
 						localProtocolOptions,
 						parentArtifactManager,
 						parentHindsightSessionState: this.session.getHindsightSessionState?.(),
+						parentTelemetry: this.session.getTelemetry?.(),
 					});
 					if (mergeMode === "branch" && result.exitCode === 0) {
 						try {

package/src/task/render.ts CHANGED Viewed

@@ -50,17 +50,35 @@ function getStatusIcon(status: AgentProgress["status"], theme: Theme, spinnerFra
 	}
 }
-/** Append tool-count, token, and cost stats to a status line string. */
+/** Append tool-count, context, cumulative-tokens, and cost stats to a status line string. */
 function appendAgentStats(
 	line: string,
-	opts: { toolCount?: number; tokens: number; cost: number },
+	opts: {
+		toolCount?: number;
+		tokens: number;
+		contextTokens?: number;
+		contextWindow?: number;
+		cost: number;
+	},
 	theme: Theme,
 ): string {
 	if (opts.toolCount) {
 		line += `${theme.sep.dot}${theme.fg("dim", `${opts.toolCount} tools`)}`;
 	}
-	if (opts.tokens > 0) {
-		line += `${theme.sep.dot}${theme.fg("dim", `${formatNumber(opts.tokens)} tokens`)}`;
+	// Current per-turn context — what the user reads as "how full is the context".
+	// Cumulative tokens (billing volume) renders separately with a Σ sigil to avoid
+	// being mistaken for current window pressure.
+	if (opts.contextTokens && opts.contextTokens > 0) {
+		const ctx =
+			opts.contextWindow && opts.contextWindow > 0
+				? `${formatNumber(opts.contextTokens)}/${formatNumber(opts.contextWindow)} ctx`
+				: `${formatNumber(opts.contextTokens)} ctx`;
+		line += `${theme.sep.dot}${theme.fg("dim", ctx)}`;
+		if (opts.tokens > 0) {
+			line += `${theme.sep.dot}${theme.fg("dim", `Σ${formatNumber(opts.tokens)}`)}`;
+		}
+	} else if (opts.tokens > 0) {
+		line += `${theme.sep.dot}${theme.fg("dim", `Σ${formatNumber(opts.tokens)}`)}`;
 	}
 	if (opts.cost > 0) {
 		line += `${theme.sep.dot}${theme.fg("statusLineCost", `$${opts.cost.toFixed(2)}`)}`;
@@ -776,7 +794,16 @@ function renderAgentResult(result: SingleResult, isLast: boolean, expanded: bool
 		iconColor,
 		theme,
 	)}`;
-	statusLine = appendAgentStats(statusLine, { tokens: result.tokens, cost: result.usage?.cost.total ?? 0 }, theme);
+	statusLine = appendAgentStats(
+		statusLine,
+		{
+			tokens: result.tokens,
+			contextTokens: result.contextTokens,
+			contextWindow: result.contextWindow,
+			cost: result.usage?.cost.total ?? 0,
+		},
+		theme,
+	);
 	statusLine += `${theme.sep.dot}${theme.fg("dim", formatDuration(result.durationMs))}`;
 	if (result.truncated) {