npm - skimpyclaw - Versions diffs - 0.3.14 → 0.4.0 - Mend

skimpyclaw 0.3.14 → 0.4.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (222) hide show

package/README.md +47 -37
package/dist/__tests__/adapter-types.test.d.ts +4 -0
package/dist/__tests__/adapter-types.test.js +63 -0
package/dist/__tests__/anthropic-adapter.test.d.ts +4 -0
package/dist/__tests__/anthropic-adapter.test.js +264 -0
package/dist/__tests__/api.test.js +0 -1
package/dist/__tests__/cli.integration.test.js +2 -4
package/dist/__tests__/cli.test.js +0 -1
package/dist/__tests__/code-agents-notifications.test.js +137 -0
package/dist/__tests__/code-agents-parser.test.js +19 -1
package/dist/__tests__/code-agents-preflight.test.js +3 -28
package/dist/__tests__/code-agents-utils.test.js +34 -9
package/dist/__tests__/code-agents-worktrees.test.js +116 -0
package/dist/__tests__/codex-adapter.test.js +184 -0
package/dist/__tests__/codex-auth.test.js +66 -0
package/dist/__tests__/codex-provider-gating.test.js +35 -0
package/dist/__tests__/codex-unified-loop.test.js +111 -0
package/dist/__tests__/config-security.test.js +127 -0
package/dist/__tests__/config.test.js +23 -0
package/dist/__tests__/context-manager.test.js +243 -164
package/dist/__tests__/cron-run.test.js +250 -0
package/dist/__tests__/cron.test.js +12 -38
package/dist/__tests__/digests.test.js +67 -0
package/dist/__tests__/discord-attachments.test.js +211 -0
package/dist/__tests__/discord-docs.test.d.ts +1 -0
package/dist/__tests__/discord-docs.test.js +27 -0
package/dist/__tests__/discord-thread-agents.test.d.ts +1 -0
package/dist/__tests__/discord-thread-agents.test.js +115 -0
package/dist/__tests__/discord-thread-context.test.d.ts +1 -0
package/dist/__tests__/discord-thread-context.test.js +42 -0
package/dist/__tests__/doctor.formatters.test.js +4 -4
package/dist/__tests__/doctor.index.test.js +1 -1
package/dist/__tests__/doctor.runner.test.js +3 -15
package/dist/__tests__/env-sanitizer.test.d.ts +1 -0
package/dist/__tests__/env-sanitizer.test.js +45 -0
package/dist/__tests__/exec-approval.test.js +61 -0
package/dist/__tests__/fetch-tool.test.d.ts +1 -0
package/dist/__tests__/fetch-tool.test.js +85 -0
package/dist/__tests__/gateway-status-auth.test.d.ts +1 -0
package/dist/__tests__/gateway-status-auth.test.js +72 -0
package/dist/__tests__/heartbeat.test.js +3 -3
package/dist/__tests__/interactive-sessions.test.d.ts +1 -0
package/dist/__tests__/interactive-sessions.test.js +96 -0
package/dist/__tests__/langfuse.test.js +6 -18
package/dist/__tests__/model-selection.test.js +3 -4
package/dist/__tests__/providers-init.test.js +2 -8
package/dist/__tests__/providers-routing.test.js +1 -1
package/dist/__tests__/providers-utils.test.js +13 -3
package/dist/__tests__/sessions.test.js +14 -10
package/dist/__tests__/setup.test.js +12 -29
package/dist/__tests__/skills.test.js +10 -7
package/dist/__tests__/stream-formatter.test.d.ts +1 -0
package/dist/__tests__/stream-formatter.test.js +114 -0
package/dist/__tests__/token-efficiency.test.js +131 -15
package/dist/__tests__/tool-loop.test.d.ts +4 -0
package/dist/__tests__/tool-loop.test.js +505 -0
package/dist/__tests__/tools.test.js +101 -276
package/dist/__tests__/utils.test.d.ts +1 -0
package/dist/__tests__/utils.test.js +14 -0
package/dist/__tests__/voice.test.js +21 -0
package/dist/agent.js +35 -4
package/dist/api.js +113 -37
package/dist/channels/discord/attachments.d.ts +50 -0
package/dist/channels/discord/attachments.js +137 -0
package/dist/channels/discord/delegation.d.ts +5 -0
package/dist/channels/discord/delegation.js +136 -0
package/dist/channels/discord/handlers.js +694 -7
package/dist/channels/discord/index.d.ts +16 -1
package/dist/channels/discord/index.js +64 -1
package/dist/channels/discord/thread-agents.d.ts +54 -0
package/dist/channels/discord/thread-agents.js +323 -0
package/dist/channels/discord/threads.d.ts +58 -0
package/dist/channels/discord/threads.js +192 -0
package/dist/channels/discord/types.js +4 -2
package/dist/channels/discord/utils.d.ts +16 -0
package/dist/channels/discord/utils.js +86 -6
package/dist/channels/telegram/index.d.ts +1 -1
package/dist/channels/telegram/types.js +1 -1
package/dist/channels/telegram/utils.js +9 -3
package/dist/channels.d.ts +1 -1
package/dist/cli.js +20 -400
package/dist/code-agents/executor.d.ts +1 -1
package/dist/code-agents/executor.js +101 -45
package/dist/code-agents/index.d.ts +2 -7
package/dist/code-agents/index.js +111 -80
package/dist/code-agents/interactive-resume.d.ts +6 -0
package/dist/code-agents/interactive-resume.js +98 -0
package/dist/code-agents/interactive-sessions.d.ts +20 -0
package/dist/code-agents/interactive-sessions.js +132 -0
package/dist/code-agents/parser.js +5 -1
package/dist/code-agents/registry.d.ts +7 -1
package/dist/code-agents/registry.js +11 -23
package/dist/code-agents/stream-formatter.d.ts +8 -0
package/dist/code-agents/stream-formatter.js +92 -0
package/dist/code-agents/types.d.ts +16 -24
package/dist/code-agents/utils.d.ts +35 -11
package/dist/code-agents/utils.js +349 -95
package/dist/code-agents/worktrees.d.ts +37 -0
package/dist/code-agents/worktrees.js +116 -0
package/dist/config.d.ts +2 -4
package/dist/config.js +123 -23
package/dist/cron.d.ts +1 -6
package/dist/cron.js +175 -82
package/dist/dashboard/assets/index-B345aOO-.js +65 -0
package/dist/dashboard/assets/index-ZWK4dalJ.css +1 -0
package/dist/dashboard/index.html +2 -2
package/dist/digests.d.ts +1 -0
package/dist/digests.js +132 -42
package/dist/doctor/checks.d.ts +0 -3
package/dist/doctor/checks.js +1 -108
package/dist/doctor/runner.js +1 -4
package/dist/env-sanitizer.d.ts +2 -0
package/dist/env-sanitizer.js +61 -0
package/dist/exec-approval.d.ts +11 -1
package/dist/exec-approval.js +17 -4
package/dist/gateway.d.ts +3 -1
package/dist/gateway.js +17 -7
package/dist/heartbeat.js +1 -6
package/dist/langfuse.js +3 -29
package/dist/model-selection.js +3 -1
package/dist/providers/adapter.d.ts +118 -0
package/dist/providers/adapter.js +6 -0
package/dist/providers/adapters/anthropic-adapter.d.ts +22 -0
package/dist/providers/adapters/anthropic-adapter.js +204 -0
package/dist/providers/adapters/codex-adapter.d.ts +26 -0
package/dist/providers/adapters/codex-adapter.js +203 -0
package/dist/providers/anthropic.d.ts +1 -0
package/dist/providers/anthropic.js +10 -272
package/dist/providers/codex.d.ts +21 -0
package/dist/providers/codex.js +149 -330
package/dist/providers/content.d.ts +1 -1
package/dist/providers/content.js +2 -2
package/dist/providers/context-manager.d.ts +18 -6
package/dist/providers/context-manager.js +199 -223
package/dist/providers/index.d.ts +9 -1
package/dist/providers/index.js +73 -64
package/dist/providers/loop-utils.d.ts +20 -0
package/dist/providers/loop-utils.js +30 -0
package/dist/providers/tool-loop.d.ts +12 -0
package/dist/providers/tool-loop.js +251 -0
package/dist/providers/utils.d.ts +19 -3
package/dist/providers/utils.js +100 -29
package/dist/secure-store.d.ts +8 -0
package/dist/secure-store.js +80 -0
package/dist/service.js +3 -28
package/dist/sessions.d.ts +3 -0
package/dist/sessions.js +147 -18
package/dist/setup-templates.js +13 -25
package/dist/setup.d.ts +10 -6
package/dist/setup.js +84 -292
package/dist/skills.js +3 -11
package/dist/tools/agent-delegation.d.ts +19 -0
package/dist/tools/agent-delegation.js +49 -0
package/dist/tools/bash-tool.js +89 -34
package/dist/tools/definitions.d.ts +199 -302
package/dist/tools/definitions.js +70 -123
package/dist/tools/execute-context.d.ts +13 -4
package/dist/tools/fetch-tool.js +109 -13
package/dist/tools/file-tools.js +7 -1
package/dist/tools.d.ts +7 -7
package/dist/tools.js +133 -151
package/dist/types.d.ts +37 -30
package/dist/utils.js +4 -6
package/dist/voice.d.ts +1 -1
package/dist/voice.js +17 -4
package/package.json +33 -23
package/templates/TOOLS.md +0 -27
package/dist/__tests__/audit.test.js +0 -122
package/dist/__tests__/code-agents-orchestrator.test.js +0 -216
package/dist/__tests__/code-agents-sandbox.test.js +0 -163
package/dist/__tests__/orchestrator.test.js +0 -425
package/dist/__tests__/sandbox-bridge.test.js +0 -116
package/dist/__tests__/sandbox-manager.test.js +0 -144
package/dist/__tests__/sandbox-mount-security.test.js +0 -139
package/dist/__tests__/sandbox-runtime.test.js +0 -176
package/dist/__tests__/subagent.test.js +0 -240
package/dist/__tests__/telegram.test.js +0 -42
package/dist/code-agents/orchestrator.d.ts +0 -29
package/dist/code-agents/orchestrator.js +0 -694
package/dist/code-agents/worktree.d.ts +0 -40
package/dist/code-agents/worktree.js +0 -215
package/dist/dashboard/assets/index-BoTHPby4.js +0 -65
package/dist/dashboard/assets/index-D4mufvBg.css +0 -1
package/dist/dashboard.d.ts +0 -8
package/dist/dashboard.js +0 -4071
package/dist/discord.d.ts +0 -8
package/dist/discord.js +0 -792
package/dist/mcp-context-a8c.d.ts +0 -13
package/dist/mcp-context-a8c.js +0 -34
package/dist/orchestrator.d.ts +0 -15
package/dist/orchestrator.js +0 -676
package/dist/providers/openai.d.ts +0 -10
package/dist/providers/openai.js +0 -355
package/dist/sandbox/bridge.d.ts +0 -5
package/dist/sandbox/bridge.js +0 -63
package/dist/sandbox/index.d.ts +0 -5
package/dist/sandbox/index.js +0 -4
package/dist/sandbox/manager.d.ts +0 -7
package/dist/sandbox/manager.js +0 -100
package/dist/sandbox/mount-security.d.ts +0 -12
package/dist/sandbox/mount-security.js +0 -122
package/dist/sandbox/runtime.d.ts +0 -39
package/dist/sandbox/runtime.js +0 -192
package/dist/sandbox-utils.d.ts +0 -6
package/dist/sandbox-utils.js +0 -36
package/dist/subagent.d.ts +0 -19
package/dist/subagent.js +0 -407
package/dist/telegram.d.ts +0 -2
package/dist/telegram.js +0 -11
package/dist/tools/browser-tool.d.ts +0 -3
package/dist/tools/browser-tool.js +0 -266
package/sandbox/Dockerfile +0 -40
/package/dist/__tests__/{audit.test.d.ts → code-agents-notifications.test.d.ts} +0 -0
/package/dist/__tests__/{code-agents-orchestrator.test.d.ts → code-agents-worktrees.test.d.ts} +0 -0
/package/dist/__tests__/{code-agents-sandbox.test.d.ts → codex-adapter.test.d.ts} +0 -0
/package/dist/__tests__/{orchestrator.test.d.ts → codex-auth.test.d.ts} +0 -0
/package/dist/__tests__/{sandbox-bridge.test.d.ts → codex-provider-gating.test.d.ts} +0 -0
/package/dist/__tests__/{sandbox-manager.test.d.ts → codex-unified-loop.test.d.ts} +0 -0
/package/dist/__tests__/{sandbox-mount-security.test.d.ts → config-security.test.d.ts} +0 -0
/package/dist/__tests__/{sandbox-runtime.test.d.ts → cron-run.test.d.ts} +0 -0
/package/dist/__tests__/{subagent.test.d.ts → digests.test.d.ts} +0 -0
/package/dist/__tests__/{telegram.test.d.ts → discord-attachments.test.d.ts} +0 -0

package/dist/env-sanitizer.js ADDED Viewed

@@ -0,0 +1,61 @@
+/** Env var name patterns that should never be exposed to model-executed commands. */
+const SENSITIVE_ENV_PATTERNS = [
+    /api.?key/i, /token/i, /secret/i, /password/i, /credential/i,
+    /^ANTHROPIC_/i, /^OPENAI_/i, /^CLAUDE/i, /^CODEX_/i, /^MINIMAX_/i,
+    /^KIMI_/i, /^TOGETHER_/i, /^GROQ_/i, /^OPENROUTER_/i,
+];
+/** Env vars that match SENSITIVE_ENV_PATTERNS but should be kept (e.g. tool auth). */
+const SENSITIVE_ENV_ALLOWLIST = new Set(['GH_TOKEN']);
+/** Common tool paths that may be missing when launched as a service/daemon. */
+const EXTRA_PATH_DIRS = ['/opt/homebrew/bin', '/opt/homebrew/sbin', '/usr/local/bin'];
+const CRON_ENV_ALLOWLIST = new Set([
+    'HOME',
+    'USER',
+    'LOGNAME',
+    'SHELL',
+    'PATH',
+    'TMPDIR',
+    'LANG',
+    'LC_ALL',
+    'LC_CTYPE',
+    'TZ',
+    'TERM',
+    'PWD',
+    'SHLVL',
+    'GH_TOKEN',
+]);
+export function sanitizeExecEnv() {
+    const env = { ...process.env };
+    for (const key of Object.keys(env)) {
+        if (!SENSITIVE_ENV_ALLOWLIST.has(key) && SENSITIVE_ENV_PATTERNS.some(p => p.test(key))) {
+            delete env[key];
+        }
+    }
+    const currentPath = env.PATH || '';
+    const missing = EXTRA_PATH_DIRS.filter(d => !currentPath.includes(d));
+    if (missing.length > 0) {
+        env.PATH = currentPath ? `${currentPath}:${missing.join(':')}` : missing.join(':');
+    }
+    return env;
+}
+export function sanitizeCronEnv() {
+    const env = {};
+    for (const [key, value] of Object.entries(process.env)) {
+        if (value === undefined)
+            continue;
+        if (CRON_ENV_ALLOWLIST.has(key) || key.startsWith('SKIMPYCLAW_')) {
+            env[key] = value;
+        }
+    }
+    for (const key of Object.keys(env)) {
+        if (!SENSITIVE_ENV_ALLOWLIST.has(key) && SENSITIVE_ENV_PATTERNS.some(p => p.test(key))) {
+            delete env[key];
+        }
+    }
+    const currentPath = env.PATH || '';
+    const missing = EXTRA_PATH_DIRS.filter(d => !currentPath.includes(d));
+    if (missing.length > 0) {
+        env.PATH = currentPath ? `${currentPath}:${missing.join(':')}` : missing.join(':');
+    }
+    return env;
+}

package/dist/exec-approval.d.ts CHANGED Viewed

@@ -17,7 +17,14 @@ export interface ExecApprovalConfig {
     ttlMs?: number;
     requireForTiers?: number[];
 }
-export type ApprovalStatus = 'pending' | 'approved' | 'denied' | 'expired';
+export type ApprovalStatus = 'pending' | 'approved' | 'denied' | 'expired' | 'consumed';
+/** A single status transition record (append-only). */
+export interface ApprovalHistoryEntry {
+    from: ApprovalStatus;
+    to: ApprovalStatus;
+    at: Date;
+    by?: string;
+}
 export interface PendingApproval {
     id: string;
     command: string;
@@ -32,6 +39,8 @@ export interface PendingApproval {
     resolvedAt?: Date;
     /** Channel context metadata — where the request originated */
     channelMeta?: ApprovalChannelMeta;
+    /** Append-only history of status transitions */
+    history: ApprovalHistoryEntry[];
 }
 /** Metadata about the channel/chat where an approval request originated */
 export interface ApprovalChannelMeta {
@@ -83,6 +92,7 @@ export declare function denyRequest(id: string, deniedBy?: string): boolean;
 export declare function findApprovedRequest(command: string, cwd?: string): PendingApproval | undefined;
 /**
  * Mark an approved request as consumed (after successful execution).
+ * Preserves the approval in the registry with status 'consumed' for history.
  */
 export declare function consumeApproval(id: string): void;
 /**

package/dist/exec-approval.js CHANGED Viewed

@@ -274,6 +274,7 @@ export function createApprovalRequest(command, cwd, classification, config, chan
         expiresAt: new Date(now.getTime() + ttlMs),
         status: 'pending',
         channelMeta,
+        history: [],
     };
     approvals.set(approval.id, approval);
     emitEvent('created', approval);
@@ -314,9 +315,11 @@ export function approveRequest(id, approvedBy) {
     const approval = approvals.get(id);
     if (!approval || approval.status !== 'pending')
         return false;
+    const now = new Date();
+    approval.history.push({ from: approval.status, to: 'approved', at: now, by: approvedBy });
     approval.status = 'approved';
     approval.approvedBy = approvedBy;
-    approval.resolvedAt = new Date();
+    approval.resolvedAt = now;
     emitEvent('approved', approval);
     return true;
 }
@@ -328,9 +331,11 @@ export function denyRequest(id, deniedBy) {
     const approval = approvals.get(id);
     if (!approval || approval.status !== 'pending')
         return false;
+    const now = new Date();
+    approval.history.push({ from: approval.status, to: 'denied', at: now, by: deniedBy });
     approval.status = 'denied';
     approval.deniedBy = deniedBy;
-    approval.resolvedAt = new Date();
+    approval.resolvedAt = now;
     emitEvent('denied', approval);
     return true;
 }
@@ -351,9 +356,14 @@ export function findApprovedRequest(command, cwd) {
 }
 /**
  * Mark an approved request as consumed (after successful execution).
+ * Preserves the approval in the registry with status 'consumed' for history.
  */
 export function consumeApproval(id) {
-    approvals.delete(id);
+    const approval = approvals.get(id);
+    if (!approval)
+        return;
+    approval.history.push({ from: approval.status, to: 'consumed', at: new Date() });
+    approval.status = 'consumed';
 }
 /**
  * Expire pending approvals past their TTL.
@@ -362,8 +372,10 @@ export function cleanupExpired() {
     const now = Date.now();
     for (const [id, approval] of approvals) {
         if (approval.status === 'pending' && approval.expiresAt.getTime() <= now) {
+            const resolvedAt = new Date(now);
+            approval.history.push({ from: 'pending', to: 'expired', at: resolvedAt });
             approval.status = 'expired';
-            approval.resolvedAt = new Date(now);
+            approval.resolvedAt = resolvedAt;
             emitEvent('expired', approval);
         }
     }
@@ -413,6 +425,7 @@ export function waitForApproval(id, timeoutMs) {
                     createdAt: new Date(),
                     expiresAt: new Date(),
                     status: 'expired',
+                    history: [],
                 });
             }
         }, timeoutMs);

package/dist/gateway.d.ts CHANGED Viewed

@@ -1,8 +1,10 @@
 import { FastifyInstance } from 'fastify';
-import type { Config } from './types.js';
+import type { Config, ThinkingLevel } from './types.js';
 export declare function setGatewayConfig(cfg: Config): void;
 export declare function createGateway(cfg: Config): Promise<FastifyInstance>;
 export declare function getCurrentModel(): string;
 export declare function setCurrentModel(model: string): void;
+export declare function getCurrentThinking(): ThinkingLevel | undefined;
+export declare function setCurrentThinking(thinking: ThinkingLevel | undefined): void;
 export declare function getLastMessage(): Date | undefined;
 export declare function setLastMessage(date: Date): void;

package/dist/gateway.js CHANGED Viewed

@@ -21,13 +21,16 @@ let config;
 let startTime;
 let lastMessage;
 let currentModel;
+let currentThinking;
 export function setGatewayConfig(cfg) {
     config = cfg;
 }
 export async function createGateway(cfg) {
     config = cfg;
     startTime = new Date();
-    currentModel = cfg.agents.list[cfg.agents.default]?.model || 'claude-sonnet-4-5';
+    const defaultAgent = cfg.agents.list[cfg.agents.default];
+    currentModel = defaultAgent?.model || 'claude-sonnet-4-5';
+    currentThinking = defaultAgent?.thinking;
     const fastify = Fastify({
         logger: {
             level: 'info',
@@ -54,6 +57,7 @@ export async function createGateway(cfg) {
             uptime: Date.now() - startTime.getTime(),
             agent: config.agents.default,
             model: currentModel,
+            thinking: currentThinking,
             lastMessage,
             cronJobs: jobs.map(j => ({
                 id: j.id,
@@ -71,7 +75,7 @@ export async function createGateway(cfg) {
         try {
             const response = await runAgentTurn(config.agents.default, message, config, model || currentModel, undefined, undefined, {
                 channel: 'gateway',
-                metadata: { ip: request.ip },
+                metadata: { ip: request.ip, thinkingOverride: currentThinking },
             });
             lastMessage = new Date();
             return { response };
@@ -109,15 +113,15 @@ export async function createGateway(cfg) {
     // Ensure dashboard token exists
     const dashboardToken = ensureDashboardToken(config);
     console.log(`[dashboard] URL: http://localhost:${config.gateway.port}/dashboard`);
-    // Auth guard for gateway write endpoints (same token as dashboard)
+    // Auth guard for sensitive gateway endpoints (same token as dashboard).
     const PROTECTED_ROUTES = new Set(['/message', '/model', '/reload']);
     fastify.addHook('onRequest', async (request, reply) => {
         const url = request.url;
-        // Protect write endpoints + cron trigger
-        if (!PROTECTED_ROUTES.has(url) && !url.startsWith('/cron/'))
+        const isProtected = PROTECTED_ROUTES.has(url) ||
+            url.startsWith('/cron/') ||
+            url === '/status';
+        if (!isProtected)
             return;
-        if (request.method === 'GET')
-            return; // GET /health, GET /status are fine
         if (!dashboardToken)
             return; // No token configured, allow access
         if (!validateBearerToken(dashboardToken, request.headers.authorization)) {
@@ -140,6 +144,12 @@ export function getCurrentModel() {
 export function setCurrentModel(model) {
     currentModel = model;
 }
+export function getCurrentThinking() {
+    return currentThinking;
+}
+export function setCurrentThinking(thinking) {
+    currentThinking = thinking;
+}
 export function getLastMessage() {
     return lastMessage;
 }

package/dist/heartbeat.js CHANGED Viewed

@@ -7,7 +7,6 @@ import { join } from 'path';
 import { homedir } from 'os';
 import { runAgentTurn } from './agent.js';
 import { resolveAllowedPaths } from './config.js';
-import { pruneIdle, SANDBOX_DEFAULTS } from './sandbox/index.js';
 import { getActiveChannelId, isActiveChannelSilenced, sendActiveChannelProactiveMessage, } from './channels.js';
 let heartbeatTimer = null;
 let running = false;
@@ -15,9 +14,7 @@ function getHeartbeatTools(config) {
     if (config.heartbeat.tools) {
         return {
             ...config.heartbeat.tools,
-            allowedPaths: config.heartbeat.tools.allowedPaths?.length
-                ? config.heartbeat.tools.allowedPaths
-                : resolveAllowedPaths(config),
+            allowedPaths: resolveAllowedPaths(config, config.heartbeat.tools.allowedPaths),
         };
     }
     return {
@@ -75,8 +72,6 @@ export function stopHeartbeat() {
     }
 }
 export async function runHeartbeatCheck(config) {
-    // Prune idle sandbox containers
-    pruneIdle(config.sandbox?.idleTimeoutMs ?? SANDBOX_DEFAULTS.idleTimeoutMs ?? 3_600_000).catch(() => { });
     if (running) {
         console.log('[heartbeat] Skipping — previous check still running');
         return 'Skipped — previous check still running';

package/dist/langfuse.js CHANGED Viewed

@@ -13,28 +13,14 @@ export const MODEL_PRICING = {
     'claude-haiku-4-5': { inputPerMTok: 0.25, outputPerMTok: 1.25 },
     'claude-haiku-4': { inputPerMTok: 1.0, outputPerMTok: 5.0 },
     'claude-opus-4': { inputPerMTok: 15.0, outputPerMTok: 75.0 },
-    // OpenAI models (https://developers.openai.com/api/docs/pricing)
-    'gpt-4o': { inputPerMTok: 2.5, outputPerMTok: 10.0 },
-    'gpt-4o-mini': { inputPerMTok: 0.15, outputPerMTok: 0.6 },
-    'gpt-4.1': { inputPerMTok: 2.0, outputPerMTok: 8.0 },
-    'gpt-4.1-mini': { inputPerMTok: 0.4, outputPerMTok: 1.6 },
-    'gpt-4.1-nano': { inputPerMTok: 0.1, outputPerMTok: 0.4 },
-    'gpt-4-turbo': { inputPerMTok: 10.0, outputPerMTok: 30.0 },
-    'gpt-3.5-turbo': { inputPerMTok: 0.5, outputPerMTok: 1.5 },
     // Codex pricing
     'gpt-5.1-codex': { inputPerMTok: 1.25, outputPerMTok: 10.0 },
     'gpt-5.2-codex': { inputPerMTok: 1.75, outputPerMTok: 14.0 },
     'gpt-5.3-codex': { inputPerMTok: 1.75, outputPerMTok: 14.0 },
+    'gpt-5.5': { inputPerMTok: 5.0, outputPerMTok: 30.0 },
     'codex-5.1': { inputPerMTok: 1.25, outputPerMTok: 10.0 },
     'codex-5.2': { inputPerMTok: 1.75, outputPerMTok: 14.0 },
     'codex-5.3': { inputPerMTok: 1.75, outputPerMTok: 14.0 },
-    // MiniMax models (https://platform.minimax.io/docs/pricing/pay-as-you-go)
-    'minimax-m2.1': { inputPerMTok: 0.3, outputPerMTok: 1.2 },
-    'minimax-m2.5': { inputPerMTok: 0.3, outputPerMTok: 1.2 },
-    // Kimi/Moonshot models (https://platform.moonshot.ai/docs/pricing/chat.en-US)
-    // kimi-k2.5 series - using cache miss pricing for input (non-cached)
-    'kimi-k2.5': { inputPerMTok: 0.6, outputPerMTok: 3.0 },
-    'kimi-for-coding': { inputPerMTok: 0.6, outputPerMTok: 3.0 }
 };
 /** Map of common aliases/shorthand to canonical model IDs in MODEL_PRICING */
 const MODEL_ALIAS_MAP = {
@@ -47,24 +33,12 @@ const MODEL_ALIAS_MAP = {
     'claude-opus': 'claude-opus-4',
     'claude-3.5-sonnet': 'claude-3-5-sonnet',
     'claude-3-opus': 'claude-3-opus',
-    // OpenAI aliases
-    gpt4o: 'gpt-4o',
-    'gpt4o-mini': 'gpt-4o-mini',
-    'gpt4.1': 'gpt-4.1',
-    'gpt4.1-mini': 'gpt-4.1-mini',
-    'gpt4.1-nano': 'gpt-4.1-nano',
-    'gpt4-turbo': 'gpt-4-turbo',
-    'gpt35-turbo': 'gpt-3.5-turbo',
-    'gpt-3.5': 'gpt-3.5-turbo',
     'gpt-codex': 'gpt-5.3-codex',
     'codex5.1': 'gpt-5.1-codex',
     'codex5.2': 'gpt-5.2-codex',
     'codex5.3': 'gpt-5.3-codex',
-    codex: 'gpt-5.3-codex',
-    // MiniMax aliases
-    minimax: 'minimax-m2.5',
-    // Kimi/Moonshot aliases
-    kimi: 'kimi-k2.5'
+    'codex5.5': 'gpt-5.5',
+    codex: 'gpt-5.5',
 };
 /**
  * Calculate the USD cost of a model invocation based on token usage.

package/dist/model-selection.js CHANGED Viewed

@@ -34,7 +34,9 @@ export function resolveModelSelection(input, config) {
     if (FULL_MODEL_SPEC_RE.test(value)) {
         return { ok: true, resolved: resolveModel(value, config) };
     }
-    if (BARE_MODEL_ID_RE.test(value) && /[-.]/.test(value)) {
+    // Accept bare model IDs only if they contain a version-like pattern (digits after a hyphen/dot)
+    // e.g. "claude-sonnet-4-5", "gpt-5.3-codex" — but NOT "claude-opuis"
+    if (BARE_MODEL_ID_RE.test(value) && /[-.]/.test(value) && /\d/.test(value)) {
         return { ok: true, resolved: resolveModel(value, config) };
     }
     if (!SAFE_MODEL_INPUT_RE.test(value) || value.includes('/')) {

package/dist/providers/adapter.d.ts ADDED Viewed

@@ -0,0 +1,118 @@
+/**
+ * Provider adapter interface for the unified tool loop.
+ * Each provider implements this to handle API-specific concerns
+ * while sharing the same agentic loop orchestration logic.
+ */
+import type { ChatMessage, ChatOptions, Config } from '../types.js';
+import type { ContextManagementConfig } from './context-manager.js';
+import type { ExecuteToolContext } from '../tools.js';
+/** Normalized representation of a model response within the tool loop. */
+export interface NormalizedResponse {
+    /** Whether the model wants to call tools (vs. returning a final answer) */
+    hasToolCalls: boolean;
+    /** Tool calls extracted from the response */
+    toolCalls: NormalizedToolCall[];
+    /** Text content from the response (final answer when hasToolCalls=false) */
+    textContent: string;
+    /** Raw usage data from the provider */
+    usage?: {
+        inputTokens: number;
+        outputTokens: number;
+        cacheReadTokens?: number;
+        cacheCreationTokens?: number;
+    };
+    /** Cost details for this response */
+    cost?: {
+        input: number;
+        output: number;
+        total: number;
+    };
+    /** Raw response object (provider-specific, for appending to message history) */
+    rawResponse: unknown;
+}
+export interface NormalizedToolCall {
+    /** Unique ID for this tool call (tool_use_id, call_id, toolCall.id) */
+    id: string;
+    /** Tool name */
+    name: string;
+    /** Parsed arguments */
+    args: Record<string, any>;
+    /** Raw arguments string (for logging) */
+    rawArgs: string;
+}
+export interface CompactionResult<T> {
+    /** Updated messages array */
+    messages: T[];
+    /** Whether compaction actually occurred */
+    compacted: boolean;
+    /** Compaction method used (if any) */
+    method?: 'llm' | 'truncation';
+}
+/**
+ * Provider-specific message container.
+ * Each adapter defines its own internal message format.
+ */
+export interface ProviderMessages {
+    /** The mutable message array (format depends on provider) */
+    messages: any[];
+    /** System prompt / instructions (extracted once, reused per call) */
+    systemParam?: any;
+}
+/**
+ * Message format helper for generic compaction.
+ * Each provider implements this to teach the compaction engine
+ * how to inspect/truncate/serialize its message format.
+ */
+export interface MessageFormatHelper<T> {
+    /** Check if an item is a tool result (to be truncated during fallback compaction). */
+    isToolResult(item: T): boolean;
+    /** Truncate a tool result item's content to maxChars. Returns a new item (no mutation). */
+    truncateToolResult(item: T, maxChars: number): T;
+    /** Serialize a list of items into a human-readable transcript for LLM summarization. */
+    serialize(items: T[]): string;
+    /** Build a summary message that replaces compacted head messages. */
+    buildSummaryMessage(summary: string): T;
+}
+/**
+ * Adapter interface that each provider implements.
+ * Separates provider-specific API details from shared tool loop logic.
+ */
+export interface ProviderAdapter {
+    readonly name: string;
+    /** Check whether this provider is initialized and ready to handle requests. */
+    isAvailable(): boolean;
+    /** Simple chat (no tool loop). Returns the model's text response. */
+    chat(messages: ChatMessage[], options: ChatOptions, config: Config): Promise<string>;
+    /** Provider-specific tool discovery options (e.g. disable MCP for non-Anthropic providers). */
+    getToolDefinitionOptions?(toolContext?: ExecuteToolContext, config?: Config): {
+        includeMcp?: boolean;
+    };
+    /** Build the initial API messages from ChatMessage[] (strip system, format content) */
+    buildMessages(messages: ChatMessage[], options: ChatOptions, config: Config): ProviderMessages;
+    /** Build tool definitions in provider-native format */
+    buildToolDefs(toolDefs: any[], config: Config): any[];
+    /** Make one API call with tools. Returns normalized response. */
+    call(messages: ProviderMessages, toolDefs: any[], options: ChatOptions, config: Config): Promise<NormalizedResponse>;
+    /** Append the assistant's raw response to the message history */
+    appendAssistantResponse(messages: ProviderMessages, rawResponse: unknown): void;
+    /** Append a single tool result to the message history.
+     *  For providers that batch tool results (e.g. Anthropic), use appendToolResults instead. */
+    appendToolResult(messages: ProviderMessages, toolCallId: string, result: string, isError?: boolean): void;
+    /** Append multiple tool results as a single message (for providers that batch).
+     *  Default implementation calls appendToolResult for each. */
+    appendToolResults?(messages: ProviderMessages, results: {
+        toolCallId: string;
+        result: string;
+        isError?: boolean;
+    }[]): void;
+    /**
+     * Optional hook called when the model's final response has no text but tool calls were made.
+     * Allows providers (e.g. Codex) to make an additional API call to elicit a text summary.
+     * Returns the finalized text, or undefined to use the default fallback.
+     */
+    onEmptyFinalResponse?(providerMessages: ProviderMessages, toolDefs: any[], options: ChatOptions, config: Config): Promise<string | undefined>;
+    /** Compact messages when context grows too large */
+    compactMessages(messages: ProviderMessages, config: ContextManagementConfig | undefined, iteration: number, fullConfig?: Config): Promise<CompactionResult<any>>;
+    /** Record usage/cost to the usage tracking system */
+    recordUsage(model: string, usage: unknown, trigger?: string, agentId?: string): void;
+}

package/dist/providers/adapter.js ADDED Viewed

@@ -0,0 +1,6 @@
+/**
+ * Provider adapter interface for the unified tool loop.
+ * Each provider implements this to handle API-specific concerns
+ * while sharing the same agentic loop orchestration logic.
+ */
+export {};

package/dist/providers/adapters/anthropic-adapter.d.ts ADDED Viewed

@@ -0,0 +1,22 @@
+/**
+ * Anthropic provider adapter for the unified tool loop.
+ */
+import type { ChatMessage, ChatOptions, Config } from '../../types.js';
+import type { ProviderAdapter, ProviderMessages, NormalizedResponse, CompactionResult } from '../adapter.js';
+export declare class AnthropicAdapter implements ProviderAdapter {
+    readonly name = "anthropic";
+    isAvailable(): boolean;
+    chat(messages: ChatMessage[], options: ChatOptions, config: Config): Promise<string>;
+    buildMessages(messages: ChatMessage[], options: ChatOptions, config: Config): ProviderMessages;
+    buildToolDefs(toolDefs: any[], config: Config): any[];
+    call(providerMessages: ProviderMessages, toolDefs: any[], options: ChatOptions, config: Config): Promise<NormalizedResponse>;
+    appendAssistantResponse(providerMessages: ProviderMessages, rawResponse: unknown): void;
+    appendToolResult(providerMessages: ProviderMessages, toolCallId: string, result: string, isError?: boolean): void;
+    appendToolResults(providerMessages: ProviderMessages, results: {
+        toolCallId: string;
+        result: string;
+        isError?: boolean;
+    }[]): void;
+    compactMessages(providerMessages: ProviderMessages, config: any, iteration: number, fullConfig?: Config): Promise<CompactionResult<any>>;
+    recordUsage(model: string, usage: unknown, trigger?: string, agentId?: string): void;
+}