npm - skimpyclaw - Versions diffs - 0.3.14 → 0.4.0 - Mend

skimpyclaw 0.3.14 → 0.4.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (222) hide show

package/README.md +47 -37
package/dist/__tests__/adapter-types.test.d.ts +4 -0
package/dist/__tests__/adapter-types.test.js +63 -0
package/dist/__tests__/anthropic-adapter.test.d.ts +4 -0
package/dist/__tests__/anthropic-adapter.test.js +264 -0
package/dist/__tests__/api.test.js +0 -1
package/dist/__tests__/cli.integration.test.js +2 -4
package/dist/__tests__/cli.test.js +0 -1
package/dist/__tests__/code-agents-notifications.test.js +137 -0
package/dist/__tests__/code-agents-parser.test.js +19 -1
package/dist/__tests__/code-agents-preflight.test.js +3 -28
package/dist/__tests__/code-agents-utils.test.js +34 -9
package/dist/__tests__/code-agents-worktrees.test.js +116 -0
package/dist/__tests__/codex-adapter.test.js +184 -0
package/dist/__tests__/codex-auth.test.js +66 -0
package/dist/__tests__/codex-provider-gating.test.js +35 -0
package/dist/__tests__/codex-unified-loop.test.js +111 -0
package/dist/__tests__/config-security.test.js +127 -0
package/dist/__tests__/config.test.js +23 -0
package/dist/__tests__/context-manager.test.js +243 -164
package/dist/__tests__/cron-run.test.js +250 -0
package/dist/__tests__/cron.test.js +12 -38
package/dist/__tests__/digests.test.js +67 -0
package/dist/__tests__/discord-attachments.test.js +211 -0
package/dist/__tests__/discord-docs.test.d.ts +1 -0
package/dist/__tests__/discord-docs.test.js +27 -0
package/dist/__tests__/discord-thread-agents.test.d.ts +1 -0
package/dist/__tests__/discord-thread-agents.test.js +115 -0
package/dist/__tests__/discord-thread-context.test.d.ts +1 -0
package/dist/__tests__/discord-thread-context.test.js +42 -0
package/dist/__tests__/doctor.formatters.test.js +4 -4
package/dist/__tests__/doctor.index.test.js +1 -1
package/dist/__tests__/doctor.runner.test.js +3 -15
package/dist/__tests__/env-sanitizer.test.d.ts +1 -0
package/dist/__tests__/env-sanitizer.test.js +45 -0
package/dist/__tests__/exec-approval.test.js +61 -0
package/dist/__tests__/fetch-tool.test.d.ts +1 -0
package/dist/__tests__/fetch-tool.test.js +85 -0
package/dist/__tests__/gateway-status-auth.test.d.ts +1 -0
package/dist/__tests__/gateway-status-auth.test.js +72 -0
package/dist/__tests__/heartbeat.test.js +3 -3
package/dist/__tests__/interactive-sessions.test.d.ts +1 -0
package/dist/__tests__/interactive-sessions.test.js +96 -0
package/dist/__tests__/langfuse.test.js +6 -18
package/dist/__tests__/model-selection.test.js +3 -4
package/dist/__tests__/providers-init.test.js +2 -8
package/dist/__tests__/providers-routing.test.js +1 -1
package/dist/__tests__/providers-utils.test.js +13 -3
package/dist/__tests__/sessions.test.js +14 -10
package/dist/__tests__/setup.test.js +12 -29
package/dist/__tests__/skills.test.js +10 -7
package/dist/__tests__/stream-formatter.test.d.ts +1 -0
package/dist/__tests__/stream-formatter.test.js +114 -0
package/dist/__tests__/token-efficiency.test.js +131 -15
package/dist/__tests__/tool-loop.test.d.ts +4 -0
package/dist/__tests__/tool-loop.test.js +505 -0
package/dist/__tests__/tools.test.js +101 -276
package/dist/__tests__/utils.test.d.ts +1 -0
package/dist/__tests__/utils.test.js +14 -0
package/dist/__tests__/voice.test.js +21 -0
package/dist/agent.js +35 -4
package/dist/api.js +113 -37
package/dist/channels/discord/attachments.d.ts +50 -0
package/dist/channels/discord/attachments.js +137 -0
package/dist/channels/discord/delegation.d.ts +5 -0
package/dist/channels/discord/delegation.js +136 -0
package/dist/channels/discord/handlers.js +694 -7
package/dist/channels/discord/index.d.ts +16 -1
package/dist/channels/discord/index.js +64 -1
package/dist/channels/discord/thread-agents.d.ts +54 -0
package/dist/channels/discord/thread-agents.js +323 -0
package/dist/channels/discord/threads.d.ts +58 -0
package/dist/channels/discord/threads.js +192 -0
package/dist/channels/discord/types.js +4 -2
package/dist/channels/discord/utils.d.ts +16 -0
package/dist/channels/discord/utils.js +86 -6
package/dist/channels/telegram/index.d.ts +1 -1
package/dist/channels/telegram/types.js +1 -1
package/dist/channels/telegram/utils.js +9 -3
package/dist/channels.d.ts +1 -1
package/dist/cli.js +20 -400
package/dist/code-agents/executor.d.ts +1 -1
package/dist/code-agents/executor.js +101 -45
package/dist/code-agents/index.d.ts +2 -7
package/dist/code-agents/index.js +111 -80
package/dist/code-agents/interactive-resume.d.ts +6 -0
package/dist/code-agents/interactive-resume.js +98 -0
package/dist/code-agents/interactive-sessions.d.ts +20 -0
package/dist/code-agents/interactive-sessions.js +132 -0
package/dist/code-agents/parser.js +5 -1
package/dist/code-agents/registry.d.ts +7 -1
package/dist/code-agents/registry.js +11 -23
package/dist/code-agents/stream-formatter.d.ts +8 -0
package/dist/code-agents/stream-formatter.js +92 -0
package/dist/code-agents/types.d.ts +16 -24
package/dist/code-agents/utils.d.ts +35 -11
package/dist/code-agents/utils.js +349 -95
package/dist/code-agents/worktrees.d.ts +37 -0
package/dist/code-agents/worktrees.js +116 -0
package/dist/config.d.ts +2 -4
package/dist/config.js +123 -23
package/dist/cron.d.ts +1 -6
package/dist/cron.js +175 -82
package/dist/dashboard/assets/index-B345aOO-.js +65 -0
package/dist/dashboard/assets/index-ZWK4dalJ.css +1 -0
package/dist/dashboard/index.html +2 -2
package/dist/digests.d.ts +1 -0
package/dist/digests.js +132 -42
package/dist/doctor/checks.d.ts +0 -3
package/dist/doctor/checks.js +1 -108
package/dist/doctor/runner.js +1 -4
package/dist/env-sanitizer.d.ts +2 -0
package/dist/env-sanitizer.js +61 -0
package/dist/exec-approval.d.ts +11 -1
package/dist/exec-approval.js +17 -4
package/dist/gateway.d.ts +3 -1
package/dist/gateway.js +17 -7
package/dist/heartbeat.js +1 -6
package/dist/langfuse.js +3 -29
package/dist/model-selection.js +3 -1
package/dist/providers/adapter.d.ts +118 -0
package/dist/providers/adapter.js +6 -0
package/dist/providers/adapters/anthropic-adapter.d.ts +22 -0
package/dist/providers/adapters/anthropic-adapter.js +204 -0
package/dist/providers/adapters/codex-adapter.d.ts +26 -0
package/dist/providers/adapters/codex-adapter.js +203 -0
package/dist/providers/anthropic.d.ts +1 -0
package/dist/providers/anthropic.js +10 -272
package/dist/providers/codex.d.ts +21 -0
package/dist/providers/codex.js +149 -330
package/dist/providers/content.d.ts +1 -1
package/dist/providers/content.js +2 -2
package/dist/providers/context-manager.d.ts +18 -6
package/dist/providers/context-manager.js +199 -223
package/dist/providers/index.d.ts +9 -1
package/dist/providers/index.js +73 -64
package/dist/providers/loop-utils.d.ts +20 -0
package/dist/providers/loop-utils.js +30 -0
package/dist/providers/tool-loop.d.ts +12 -0
package/dist/providers/tool-loop.js +251 -0
package/dist/providers/utils.d.ts +19 -3
package/dist/providers/utils.js +100 -29
package/dist/secure-store.d.ts +8 -0
package/dist/secure-store.js +80 -0
package/dist/service.js +3 -28
package/dist/sessions.d.ts +3 -0
package/dist/sessions.js +147 -18
package/dist/setup-templates.js +13 -25
package/dist/setup.d.ts +10 -6
package/dist/setup.js +84 -292
package/dist/skills.js +3 -11
package/dist/tools/agent-delegation.d.ts +19 -0
package/dist/tools/agent-delegation.js +49 -0
package/dist/tools/bash-tool.js +89 -34
package/dist/tools/definitions.d.ts +199 -302
package/dist/tools/definitions.js +70 -123
package/dist/tools/execute-context.d.ts +13 -4
package/dist/tools/fetch-tool.js +109 -13
package/dist/tools/file-tools.js +7 -1
package/dist/tools.d.ts +7 -7
package/dist/tools.js +133 -151
package/dist/types.d.ts +37 -30
package/dist/utils.js +4 -6
package/dist/voice.d.ts +1 -1
package/dist/voice.js +17 -4
package/package.json +33 -23
package/templates/TOOLS.md +0 -27
package/dist/__tests__/audit.test.js +0 -122
package/dist/__tests__/code-agents-orchestrator.test.js +0 -216
package/dist/__tests__/code-agents-sandbox.test.js +0 -163
package/dist/__tests__/orchestrator.test.js +0 -425
package/dist/__tests__/sandbox-bridge.test.js +0 -116
package/dist/__tests__/sandbox-manager.test.js +0 -144
package/dist/__tests__/sandbox-mount-security.test.js +0 -139
package/dist/__tests__/sandbox-runtime.test.js +0 -176
package/dist/__tests__/subagent.test.js +0 -240
package/dist/__tests__/telegram.test.js +0 -42
package/dist/code-agents/orchestrator.d.ts +0 -29
package/dist/code-agents/orchestrator.js +0 -694
package/dist/code-agents/worktree.d.ts +0 -40
package/dist/code-agents/worktree.js +0 -215
package/dist/dashboard/assets/index-BoTHPby4.js +0 -65
package/dist/dashboard/assets/index-D4mufvBg.css +0 -1
package/dist/dashboard.d.ts +0 -8
package/dist/dashboard.js +0 -4071
package/dist/discord.d.ts +0 -8
package/dist/discord.js +0 -792
package/dist/mcp-context-a8c.d.ts +0 -13
package/dist/mcp-context-a8c.js +0 -34
package/dist/orchestrator.d.ts +0 -15
package/dist/orchestrator.js +0 -676
package/dist/providers/openai.d.ts +0 -10
package/dist/providers/openai.js +0 -355
package/dist/sandbox/bridge.d.ts +0 -5
package/dist/sandbox/bridge.js +0 -63
package/dist/sandbox/index.d.ts +0 -5
package/dist/sandbox/index.js +0 -4
package/dist/sandbox/manager.d.ts +0 -7
package/dist/sandbox/manager.js +0 -100
package/dist/sandbox/mount-security.d.ts +0 -12
package/dist/sandbox/mount-security.js +0 -122
package/dist/sandbox/runtime.d.ts +0 -39
package/dist/sandbox/runtime.js +0 -192
package/dist/sandbox-utils.d.ts +0 -6
package/dist/sandbox-utils.js +0 -36
package/dist/subagent.d.ts +0 -19
package/dist/subagent.js +0 -407
package/dist/telegram.d.ts +0 -2
package/dist/telegram.js +0 -11
package/dist/tools/browser-tool.d.ts +0 -3
package/dist/tools/browser-tool.js +0 -266
package/sandbox/Dockerfile +0 -40
/package/dist/__tests__/{audit.test.d.ts → code-agents-notifications.test.d.ts} +0 -0
/package/dist/__tests__/{code-agents-orchestrator.test.d.ts → code-agents-worktrees.test.d.ts} +0 -0
/package/dist/__tests__/{code-agents-sandbox.test.d.ts → codex-adapter.test.d.ts} +0 -0
/package/dist/__tests__/{orchestrator.test.d.ts → codex-auth.test.d.ts} +0 -0
/package/dist/__tests__/{sandbox-bridge.test.d.ts → codex-provider-gating.test.d.ts} +0 -0
/package/dist/__tests__/{sandbox-manager.test.d.ts → codex-unified-loop.test.d.ts} +0 -0
/package/dist/__tests__/{sandbox-mount-security.test.d.ts → config-security.test.d.ts} +0 -0
/package/dist/__tests__/{sandbox-runtime.test.d.ts → cron-run.test.d.ts} +0 -0
/package/dist/__tests__/{subagent.test.d.ts → digests.test.d.ts} +0 -0
/package/dist/__tests__/{telegram.test.d.ts → discord-attachments.test.d.ts} +0 -0

package/dist/providers/index.js CHANGED Viewed

@@ -1,4 +1,7 @@
 // Providers Module - Unified AI Provider Interface
+//
+// Provider registry pattern: adapters implement ProviderAdapter (chat, chatWithTools, isAvailable).
+// Routing resolves a model spec to an adapter and delegates to it.
 import { calculateUsageCost, isLangfuseEnabled } from '../langfuse.js';
 // Re-export utilities
 export { TOOL_GUARD, setUsingOAuth, isUsingOAuth, buildSystemParam, addToolCacheBreakpoint, contentToText, toOpenAITools, resolveModel, resolveProviderRoute, shouldUseCodexAliasProvider, getProvider, stripProvider, buildThinkingConfig, } from './utils.js';
@@ -7,15 +10,31 @@ export { toOpenAIContent, toCodexContent, toCodexToolDefinitions } from './conte
 // Re-export observability
 export { setLangfuseHelpers, toCostDetails, toAnthropicUsageDetails, toUsageDetails, toNumericUsageDetails, } from './observability.js';
 import { setLangfuseHelpers } from './observability.js';
-// Import provider functions directly to avoid circular deps
-import { setAnthropicClient, isAnthropicAvailable, chatAnthropic, chatWithToolsAnthropic, } from './anthropic.js';
-import { addOpenAIClient, clearOpenAIClients, isOpenAIAvailable, chatOpenAI, chatWithToolsOpenAI, } from './openai.js';
-import { addResponsesApiProvider, isResponsesApiProvider, setCodexAuthPath, setCodexBaseUrl, initCodexAuth, resetCodexProviderState, isCodexAvailable, chatCodex, chatWithToolsCodex, } from './codex.js';
+// Import provider module functions for init and backward-compat re-exports
+import { setAnthropicClient, } from './anthropic.js';
+import { addResponsesApiProvider, isResponsesApiProvider, setCodexAuthPath, setCodexBaseUrl, initCodexAuth, resetCodexProviderState, } from './codex.js';
 import { setUsingOAuth, resolveProviderRoute, shouldUseCodexAliasProvider, } from './utils.js';
 import Anthropic from '@anthropic-ai/sdk';
-import OpenAI from 'openai';
+// Lazy adapter imports (avoid circular deps at module load time)
+import { AnthropicAdapter } from './adapters/anthropic-adapter.js';
+import { CodexAdapter } from './adapters/codex-adapter.js';
 // Wire provider observability helpers to runtime cost calculator.
 setLangfuseHelpers(calculateUsageCost, isLangfuseEnabled);
+// ---------------------------------------------------------------------------
+// Provider Registry
+// ---------------------------------------------------------------------------
+/**
+ * Resolve a provider name to a ProviderAdapter instance.
+ * Adapters are lightweight — creating one per call is fine.
+ */
+export function getAdapter(provider) {
+    if (provider === 'anthropic')
+        return new AnthropicAdapter();
+    // Codex providers are registered dynamically via addResponsesApiProvider
+    if (isResponsesApiProvider(provider))
+        return new CodexAdapter();
+    throw new Error(`Unknown provider "${provider}"`);
+}
 function normalizeChatRoute(options, config) {
     const route = resolveProviderRoute(options.model, config);
     const { resolvedModel, provider, modelId, isCodexModel } = route;
@@ -27,16 +46,46 @@ function normalizeChatRoute(options, config) {
         useCodexAliasProvider: shouldUseCodexAliasProvider(provider, isCodexModel, isResponsesApiProvider('codex')),
     };
 }
-// Re-export all provider functions
+/**
+ * Resolve routing and return the correct adapter + normalized options.
+ * Handles the Codex alias compatibility path (openai/*-codex → codex provider).
+ */
+function resolveAdapter(options, config) {
+    const { resolvedModel, provider, chatOpts, useCodexAliasProvider } = normalizeChatRoute(options, config);
+    // Codex alias compatibility: openai/*-codex routes to codex when configured
+    if (useCodexAliasProvider || isResponsesApiProvider(provider)) {
+        const codexAdapter = new CodexAdapter();
+        if (codexAdapter.isAvailable()) {
+            return { adapter: codexAdapter, resolvedModel, chatOpts };
+        }
+        throw new Error(`Codex provider "${provider}" is configured but auth is unavailable. Run "codex" to re-authenticate.`);
+    }
+    let adapter;
+    try {
+        adapter = getAdapter(provider);
+    }
+    catch {
+        throw new Error(`Unknown provider "${provider}" for model: ${resolvedModel}`);
+    }
+    if (adapter.isAvailable()) {
+        return { adapter, resolvedModel, chatOpts };
+    }
+    throw new Error(`Unknown provider "${provider}" for model: ${resolvedModel}`);
+}
+// ---------------------------------------------------------------------------
+// Backward-compat re-exports (provider module functions)
+// ---------------------------------------------------------------------------
+// Anthropic
 export { setAnthropicClient, isAnthropicAvailable, chatAnthropic, chatWithToolsAnthropic, } from './anthropic.js';
-export { addOpenAIClient, getOpenAIClient, hasOpenAIClient, clearOpenAIClients, resetOpenAIProviderState, isOpenAIAvailable, chatOpenAI, chatWithToolsOpenAI, } from './openai.js';
+// Codex
 export { addResponsesApiProvider, isResponsesApiProvider, setCodexAuthPath, setCodexBaseUrl, initCodexAuth, resetCodexProviderState, loadCodexAuth, getCodexAuth, isCodexAvailable, chatCodex, chatWithToolsCodex, } from './codex.js';
-// Initialize all providers from config
+// ---------------------------------------------------------------------------
+// Provider Initialization (unchanged behavior)
+// ---------------------------------------------------------------------------
 export async function initProviders(config) {
     // Reset provider state so reloads strictly reflect current config.
     setAnthropicClient(null);
     setUsingOAuth(false);
-    clearOpenAIClients();
     resetCodexProviderState();
     const anthropicConfig = config.models.providers.anthropic;
     // Initialize Anthropic if configured
@@ -63,7 +112,7 @@ export async function initProviders(config) {
             console.log('[providers] Initialized anthropic');
         }
     }
-    // Initialize all non-Anthropic providers
+    // Initialize Codex providers. API-key chat providers are not core.
     for (const [name, providerConfig] of Object.entries(config.models.providers)) {
         if (name === 'anthropic' || !providerConfig)
             continue;
@@ -82,63 +131,23 @@ export async function initProviders(config) {
             }
             continue;
         }
-        const apiKey = providerConfig.apiKey;
-        if (!apiKey)
-            continue;
-        const opts = { apiKey };
-        if (providerConfig.baseURL) {
-            let normalizedBaseURL = providerConfig.baseURL;
-            if (name === 'minimax') {
-                const trimmed = normalizedBaseURL.replace(/\/+$/, '');
-                normalizedBaseURL = trimmed.endsWith('/v1') ? trimmed : `${trimmed}/v1`;
-            }
-            opts.baseURL = normalizedBaseURL;
-        }
-        // Kimi Code API requires a coding-agent User-Agent with version string
-        if (providerConfig.baseURL?.includes('kimi.com')) {
-            opts.defaultHeaders = { 'User-Agent': 'claude-code/2.1.42' };
-        }
-        addOpenAIClient(name, new OpenAI(opts));
-        console.log(`[providers] Initialized ${name}${providerConfig.baseURL ? ` (${providerConfig.baseURL})` : ''}`);
     }
 }
-// Unified chat function that routes to appropriate provider
+// ---------------------------------------------------------------------------
+// Unified chat + chatWithTools — route via adapter registry
+// ---------------------------------------------------------------------------
+/** Unified chat function that routes to appropriate provider via adapter. */
 export async function chat(messages, options, config) {
-    const { resolvedModel, provider, chatOpts, useCodexAliasProvider } = normalizeChatRoute(options, config);
-    // Route to Codex if available (supports openai/*-codex legacy alias)
-    if ((isResponsesApiProvider(provider) || useCodexAliasProvider) && isCodexAvailable()) {
-        return chatCodex({ messages, options: chatOpts, config });
-    }
-    if (isResponsesApiProvider(provider) || useCodexAliasProvider) {
-        throw new Error(`Codex provider "${provider}" is configured but auth is unavailable. Run "codex" to re-authenticate.`);
-    }
-    // Route to Anthropic if available
-    if (provider === 'anthropic' && isAnthropicAvailable()) {
-        return chatAnthropic({ messages, options: chatOpts, config });
-    }
-    // Route to OpenAI-compatible
-    if (isOpenAIAvailable(provider)) {
-        return chatOpenAI({ messages, options: chatOpts, config }, provider);
-    }
-    throw new Error(`Unknown provider "${provider}" for model: ${resolvedModel}`);
+    const { adapter, chatOpts } = resolveAdapter(options, config);
+    return adapter.chat(messages, chatOpts, config);
 }
-// Unified chatWithTools function that routes to appropriate provider
+/** Unified chatWithTools function that routes to appropriate provider via adapter. */
 export async function chatWithTools(messages, options, config, toolConfig, toolContext) {
-    const { resolvedModel, provider, chatOpts, useCodexAliasProvider } = normalizeChatRoute(options, config);
-    // Route to Codex if available (supports openai/*-codex legacy alias)
-    if ((isResponsesApiProvider(provider) || useCodexAliasProvider) && isCodexAvailable()) {
-        return chatWithToolsCodex({ messages, options: chatOpts, config, toolConfig, toolContext });
-    }
-    if (isResponsesApiProvider(provider) || useCodexAliasProvider) {
-        throw new Error(`Codex provider "${provider}" is configured but auth is unavailable. Run "codex" to re-authenticate.`);
-    }
-    // Route to Anthropic if available
-    if (provider === 'anthropic' && isAnthropicAvailable()) {
-        return chatWithToolsAnthropic({ messages, options: chatOpts, config, toolConfig, toolContext });
-    }
-    // Route to OpenAI-compatible
-    if (isOpenAIAvailable(provider)) {
-        return chatWithToolsOpenAI({ messages, options: chatOpts, config, toolConfig, toolContext }, provider);
-    }
-    throw new Error(`Unknown provider "${provider}" for model: ${resolvedModel}`);
+    const { adapter, resolvedModel, chatOpts } = resolveAdapter(options, config);
+    // Codex default: bump maxIterations to 100 if not specified
+    const effectiveToolConfig = (adapter.name === 'codex' && !toolConfig.maxIterations)
+        ? { ...toolConfig, maxIterations: 100 }
+        : toolConfig;
+    const { runToolLoop } = await import('./tool-loop.js');
+    return runToolLoop(adapter, messages, chatOpts, config, effectiveToolConfig, toolContext);
 }

package/dist/providers/loop-utils.d.ts ADDED Viewed

@@ -0,0 +1,20 @@
+/**
+ * Shared utility functions for the tool loop.
+ * Extracted to eliminate duplication across provider implementations.
+ */
+/**
+ * Build a standardized tool log entry.
+ */
+export declare function buildToolLogEntry(toolName: string, inputStr: string, resultPreview: string): string;
+/**
+ * Log iteration progress to console.
+ */
+export declare function logIteration(provider: string, iteration: number, maxIterations: number, modelId: string): void;
+/**
+ * Log compaction event.
+ */
+export declare function logCompaction(provider: string, method: string, iteration: number): void;
+/**
+ * Log max iterations warning.
+ */
+export declare function logMaxIterations(provider: string, maxIterations: number): void;

package/dist/providers/loop-utils.js ADDED Viewed

@@ -0,0 +1,30 @@
+/**
+ * Shared utility functions for the tool loop.
+ * Extracted to eliminate duplication across provider implementations.
+ */
+/**
+ * Build a standardized tool log entry.
+ */
+export function buildToolLogEntry(toolName, inputStr, resultPreview) {
+    const truncatedInput = inputStr.length > 100 ? inputStr.slice(0, 100) + '...' : inputStr;
+    const truncatedResult = resultPreview.length > 200 ? resultPreview.slice(0, 200) + '...' : resultPreview;
+    return `${toolName}(${truncatedInput}) → ${truncatedResult}`;
+}
+/**
+ * Log iteration progress to console.
+ */
+export function logIteration(provider, iteration, maxIterations, modelId) {
+    console.log(`[${provider}] Iteration ${iteration + 1}/${maxIterations} (model: ${modelId})`);
+}
+/**
+ * Log compaction event.
+ */
+export function logCompaction(provider, method, iteration) {
+    console.log(`[${provider}] Compacted messages (${method}) at iteration ${iteration + 1}`);
+}
+/**
+ * Log max iterations warning.
+ */
+export function logMaxIterations(provider, maxIterations) {
+    console.warn(`[${provider}] Max iterations (${maxIterations}) reached without final answer`);
+}

package/dist/providers/tool-loop.d.ts ADDED Viewed

@@ -0,0 +1,12 @@
+/**
+ * Unified agentic tool loop - works with any provider adapter.
+ * Handles iteration control, tool execution, guard logic, compaction, and observability.
+ */
+import type { ChatMessage, ChatOptions, Config, ToolConfig } from '../types.js';
+import type { ToolChatResult } from './types.js';
+import type { ExecuteToolContext } from '../tools.js';
+import type { ProviderAdapter } from './adapter.js';
+/**
+ * Run the unified agentic tool loop with any provider adapter.
+ */
+export declare function runToolLoop(adapter: ProviderAdapter, messages: ChatMessage[], options: ChatOptions, config: Config, toolConfig: ToolConfig, toolContext?: ExecuteToolContext): Promise<ToolChatResult>;

package/dist/providers/tool-loop.js ADDED Viewed

@@ -0,0 +1,251 @@
+/**
+ * Unified agentic tool loop - works with any provider adapter.
+ * Handles iteration control, tool execution, guard logic, compaction, and observability.
+ */
+import { getToolDefinitions, executeTool } from '../tools.js';
+import { ToolCallGuard } from './tool-guard.js';
+import { splitToolResult } from './utils.js';
+import { startTrace, addEvent, endTrace } from '../audit.js';
+import { toErrorMessage } from '../utils.js';
+import { buildToolLogEntry, logIteration, logCompaction, logMaxIterations } from './loop-utils.js';
+/** Start a Langfuse observation (lazy import to avoid circular deps). Returns null if disabled. */
+async function tryStartObservation(name, params, type) {
+    try {
+        const { isLangfuseEnabled } = await import('../langfuse.js');
+        if (!isLangfuseEnabled())
+            return null;
+        const { startObservation } = await import('@langfuse/tracing');
+        return startObservation(name, params, { asType: type });
+    }
+    catch {
+        return null;
+    }
+}
+/**
+ * Run the unified agentic tool loop with any provider adapter.
+ */
+export async function runToolLoop(adapter, messages, options, config, toolConfig, toolContext) {
+    const maxIterations = toolConfig.maxIterations || 20;
+    const guard = new ToolCallGuard(toolConfig.maxTurnTokens);
+    const toolLog = [];
+    // Resolve tool definitions once
+    const includeSpawn = !!(toolContext?.fullConfig && (toolContext?.chatId || toolContext?.isCronJob));
+    const providerToolDefOptions = adapter.getToolDefinitionOptions?.(toolContext, config) || {};
+    const rawToolDefs = await getToolDefinitions(toolConfig, {
+        includeAgentTools: includeSpawn,
+        includeMcp: providerToolDefOptions.includeMcp,
+        projects: toolContext?.fullConfig?.projects,
+    });
+    // Build provider-specific tool definitions
+    const providerToolDefs = adapter.buildToolDefs(rawToolDefs, config);
+    // Build initial provider messages
+    const providerMessages = adapter.buildMessages(messages, options, config);
+    // Start audit trace if not already started
+    const trigger = (toolContext?.trigger || 'api');
+    const ownTrace = !toolContext?.auditTraceId;
+    const auditTraceId = toolContext?.auditTraceId || startTrace(trigger);
+    // Cumulative usage and cost across all iterations
+    let totalInputTokens = 0;
+    let totalOutputTokens = 0;
+    const totalCost = { input: 0, output: 0, total: 0 };
+    let traceStatus = 'ok';
+    try {
+        // Agentic loop
+        for (let i = 0; i < maxIterations; i++) {
+            // Check abort signal before each iteration
+            if (toolContext?.abortSignal?.aborted) {
+                return {
+                    response: `[Cancelled after ${toolLog.length} tool calls]`,
+                    toolCalls: toolLog,
+                };
+            }
+            // Compact messages if needed
+            const compactionResult = await adapter.compactMessages(providerMessages, toolConfig.contextManagement, i + 1, config);
+            if (compactionResult.compacted) {
+                logCompaction(adapter.name, compactionResult.method || 'unknown', i);
+                toolLog.push(`[context compacted via ${compactionResult.method}]`);
+            }
+            // Make API call
+            logIteration(adapter.name, i, maxIterations, options.model);
+            const genObs = await tryStartObservation(`${adapter.name}:${options.model}`, {
+                input: { messages: providerMessages.messages },
+                model: options.model,
+                modelParameters: { max_tokens: options.maxTokens },
+                metadata: { provider: adapter.name, iteration: i + 1 },
+            }, 'generation');
+            let response;
+            try {
+                response = await adapter.call(providerMessages, providerToolDefs, options, config);
+                // Record usage
+                adapter.recordUsage(options.model, response.usage, toolContext?.trigger || 'api', toolContext?.agentId);
+                // Accumulate usage across iterations
+                totalInputTokens += response.usage?.inputTokens ?? 0;
+                totalOutputTokens += response.usage?.outputTokens ?? 0;
+                // Accumulate cost
+                if (response.cost) {
+                    totalCost.input += response.cost.input;
+                    totalCost.output += response.cost.output;
+                    totalCost.total += response.cost.total;
+                }
+                // Track tokens in guard (for stats only, no enforcement)
+                guard.recordTokens(response.usage?.inputTokens ?? 0, response.usage?.outputTokens ?? 0);
+                genObs?.update({ output: response.textContent });
+                genObs?.end();
+            }
+            catch (err) {
+                const errorMessage = toErrorMessage(err);
+                genObs?.update({ level: 'ERROR', statusMessage: errorMessage, output: { error: errorMessage } });
+                genObs?.end();
+                traceStatus = 'error';
+                throw err;
+            }
+            // If no tool calls, we're done
+            if (!response.hasToolCalls) {
+                let responseText = response.textContent;
+                // Fallback when model returned no text
+                if (!responseText) {
+                    console.warn(`[${adapter.name}] empty text response (stop_reason: ${response.rawResponse?.stop_reason}, content blocks: ${JSON.stringify((response.rawResponse?.content || []).map((b) => b.type))})`);
+                    if (toolLog.length > 0) {
+                        // Let adapter attempt a finalization pass (e.g. Codex re-asks without tools)
+                        if (adapter.onEmptyFinalResponse) {
+                            try {
+                                const finalized = await adapter.onEmptyFinalResponse(providerMessages, providerToolDefs, options, config);
+                                if (finalized)
+                                    responseText = finalized;
+                            }
+                            catch (err) {
+                                console.warn(`[${adapter.name}] finalization pass failed: ${toErrorMessage(err)}`);
+                            }
+                        }
+                        if (!responseText) {
+                            responseText = `[Completed with ${toolLog.length} tool calls, no text response]`;
+                        }
+                    }
+                    else {
+                        responseText = '[Model returned empty response — please try again]';
+                    }
+                }
+                return {
+                    response: responseText,
+                    toolCalls: toolLog,
+                    usage: {
+                        prompt_tokens: totalInputTokens,
+                        completion_tokens: totalOutputTokens,
+                        total_tokens: totalInputTokens + totalOutputTokens,
+                    },
+                    cost: totalCost.total > 0 ? totalCost : undefined,
+                };
+            }
+            // Append assistant's response to history
+            adapter.appendAssistantResponse(providerMessages, response.rawResponse);
+            // Execute each tool call, collecting results for batching
+            const toolResults = [];
+            for (const toolCall of response.toolCalls) {
+                const result = await executeToolCall(toolCall, guard, toolConfig, toolContext, toolLog, adapter.name);
+                toolResults.push(result);
+            }
+            // Append all tool results — batch if adapter supports it, otherwise one at a time
+            if (adapter.appendToolResults && toolResults.length > 1) {
+                adapter.appendToolResults(providerMessages, toolResults);
+            }
+            else {
+                for (const tr of toolResults) {
+                    adapter.appendToolResult(providerMessages, tr.toolCallId, tr.result, tr.isError);
+                }
+            }
+        }
+        // Max iterations reached
+        logMaxIterations(adapter.name, maxIterations);
+        let responseText = `Tool use loop reached maximum iterations (${maxIterations}) before the model produced a final answer.`;
+        if (toolLog.length > 0 && adapter.onEmptyFinalResponse) {
+            try {
+                const finalized = await adapter.onEmptyFinalResponse(providerMessages, providerToolDefs, options, config);
+                if (finalized)
+                    responseText = finalized;
+            }
+            catch (err) {
+                console.warn(`[${adapter.name}] max-iteration finalization pass failed: ${toErrorMessage(err)}`);
+            }
+        }
+        return {
+            response: responseText,
+            toolCalls: toolLog,
+            usage: {
+                prompt_tokens: totalInputTokens,
+                completion_tokens: totalOutputTokens,
+                total_tokens: totalInputTokens + totalOutputTokens,
+            },
+            cost: totalCost.total > 0 ? totalCost : undefined,
+        };
+    }
+    finally {
+        // End the audit trace if we created it
+        if (ownTrace) {
+            await endTrace(auditTraceId, traceStatus).catch(() => { });
+        }
+    }
+}
+/**
+ * Execute a single tool call and return the result (does NOT append to messages).
+ */
+async function executeToolCall(toolCall, guard, toolConfig, toolContext, toolLog, providerName) {
+    const inputStr = toolCall.rawArgs.slice(0, 200);
+    console.log(`[${providerName}:tools] -> ${toolCall.name}(${inputStr})`);
+    // Guard: spin detection
+    const guardResult = guard.recordCall(toolCall.name, toolCall.args);
+    if (guardResult.warning) {
+        console.warn(`[${providerName}:tools:guard] ${guardResult.warning}`);
+    }
+    if (guardResult.blocked) {
+        toolLog.push(`${toolCall.name} [BLOCKED: spin detected]`);
+        return {
+            toolCallId: toolCall.id,
+            result: guardResult.warning || 'Blocked: repeated identical call',
+            isError: true,
+        };
+    }
+    // Execute tool
+    const toolObs = await tryStartObservation(`tool:${toolCall.name}`, { input: toolCall.args, metadata: { app: 'skimpyclaw', tool: toolCall.name } }, 'tool');
+    const toolStart = Date.now();
+    try {
+        const result = await executeTool(toolCall.name, toolCall.args, toolConfig, toolContext);
+        const truncatedResult = splitToolResult(toolCall.name, toolCall.args, result);
+        const resultPreview = result.slice(0, 200) + (result.length > 200 ? '...' : '');
+        console.log(`[${providerName}:tools] <- ${resultPreview}`);
+        toolLog.push(buildToolLogEntry(toolCall.name, inputStr, resultPreview));
+        toolObs?.update({ output: result });
+        toolObs?.end();
+        // Record audit event
+        if (toolContext?.auditTraceId) {
+            addEvent(toolContext.auditTraceId, {
+                type: 'tool_use',
+                summary: `${toolCall.name}(${inputStr})`,
+                durationMs: Date.now() - toolStart,
+            });
+        }
+        // Guard: no-progress detection
+        const progressResult = guard.recordResult(result);
+        let finalResult = truncatedResult;
+        if (progressResult.nudge) {
+            console.warn(`[${providerName}:tools:guard] ${progressResult.nudge}`);
+            finalResult += `\n\n[System: ${progressResult.nudge}]`;
+        }
+        return { toolCallId: toolCall.id, result: finalResult, isError: false };
+    }
+    catch (err) {
+        const errorMessage = toErrorMessage(err);
+        toolObs?.update({ level: 'ERROR', statusMessage: errorMessage, output: { error: errorMessage } });
+        toolObs?.end();
+        if (toolContext?.auditTraceId) {
+            addEvent(toolContext.auditTraceId, {
+                type: 'tool_error',
+                summary: `${toolCall.name} error: ${errorMessage.slice(0, 150)}`,
+                durationMs: Date.now() - toolStart,
+            });
+        }
+        const errorResult = `[Tool Error] ${toolCall.name}: ${errorMessage}`;
+        console.error(`[${providerName}:tools] tool error: ${errorMessage}`);
+        toolLog.push(`${toolCall.name} [ERROR: ${errorMessage.slice(0, 100)}]`);
+        return { toolCallId: toolCall.id, result: errorResult, isError: true };
+    }
+}

package/dist/providers/utils.d.ts CHANGED Viewed

@@ -1,5 +1,5 @@
-import type { ContentBlock, Config } from '../types.js';
-export declare const TOOL_GUARD = "You are a personal assistant running inside SkimpyClaw.\nYou are NOT the full Claude Code CLI. Do NOT roleplay as Claude Code.\n\n## Tool Rules\n- You have ONLY the tools provided via the API tool_use mechanism.\n- Tool names are case-sensitive. Call tools exactly as listed.\n- NEVER output tool calls as text/XML/JSON. Use the API tool_use mechanism only.\n- NEVER fabricate tool results or file contents. If you haven't read a file, say so.\n- NEVER invent tools that are not in your tool list (no str_replace_editor, no view, etc.)\n- If a Browser tool is available, you DO have web-browsing access via that tool. Use it instead of claiming you can't browse.\n- If you need information, use a tool to get it. Do not guess.";
+import type { ContentBlock, Config, ThinkingLevel } from '../types.js';
+export declare const TOOL_GUARD = "You are SkimpyClaw (NOT Claude Code CLI). Use only API tool_use \u2014 never text/XML tools. Never fabricate results.";
 export declare function setUsingOAuth(value: boolean): void;
 export declare function isUsingOAuth(): boolean;
 /**
@@ -60,10 +60,26 @@ export declare function stripProvider(model: string, openaiClients?: Map<string,
  * Falls back to simple truncation if file write fails.
  */
 export declare function truncateToolResult(result: string, _maxBytes?: number): string;
+/**
+ * Structured split tool results: generates a semantic summary based on tool type.
+ * For small results (<= MASK_THRESHOLD), returns unchanged.
+ * For large results, writes full output to scratch file and returns a compact,
+ * tool-aware summary with the scratch file path.
+ */
+export declare function splitToolResult(toolName: string, toolInput: Record<string, any>, result: string): string;
+/**
+ * Compact old tool results in Anthropic-format messages.
+ * Replaces tool_result content with '✓' for all results except the last
+ * `keepRecent` messages. The model has already processed these results,
+ * so we only need to preserve the structure (tool_use_id matching).
+ *
+ * Mutates the messages array in place for efficiency.
+ */
+export declare function compactOldResults(messages: any[], keepRecent?: number): void;
 /**
  * Build thinking config based on thinking level.
  */
-export declare function buildThinkingConfig(thinking?: 'none' | 'low' | 'medium' | 'high'): {
+export declare function buildThinkingConfig(thinking?: ThinkingLevel): {
     budget: number;
     maxTokens: number;
 } | undefined;