npm - skimpyclaw - Versions diffs - 0.3.14 → 0.4.0 - Mend

skimpyclaw 0.3.14 → 0.4.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (222) hide show

package/README.md +47 -37
package/dist/__tests__/adapter-types.test.d.ts +4 -0
package/dist/__tests__/adapter-types.test.js +63 -0
package/dist/__tests__/anthropic-adapter.test.d.ts +4 -0
package/dist/__tests__/anthropic-adapter.test.js +264 -0
package/dist/__tests__/api.test.js +0 -1
package/dist/__tests__/cli.integration.test.js +2 -4
package/dist/__tests__/cli.test.js +0 -1
package/dist/__tests__/code-agents-notifications.test.js +137 -0
package/dist/__tests__/code-agents-parser.test.js +19 -1
package/dist/__tests__/code-agents-preflight.test.js +3 -28
package/dist/__tests__/code-agents-utils.test.js +34 -9
package/dist/__tests__/code-agents-worktrees.test.js +116 -0
package/dist/__tests__/codex-adapter.test.js +184 -0
package/dist/__tests__/codex-auth.test.js +66 -0
package/dist/__tests__/codex-provider-gating.test.js +35 -0
package/dist/__tests__/codex-unified-loop.test.js +111 -0
package/dist/__tests__/config-security.test.js +127 -0
package/dist/__tests__/config.test.js +23 -0
package/dist/__tests__/context-manager.test.js +243 -164
package/dist/__tests__/cron-run.test.js +250 -0
package/dist/__tests__/cron.test.js +12 -38
package/dist/__tests__/digests.test.js +67 -0
package/dist/__tests__/discord-attachments.test.js +211 -0
package/dist/__tests__/discord-docs.test.d.ts +1 -0
package/dist/__tests__/discord-docs.test.js +27 -0
package/dist/__tests__/discord-thread-agents.test.d.ts +1 -0
package/dist/__tests__/discord-thread-agents.test.js +115 -0
package/dist/__tests__/discord-thread-context.test.d.ts +1 -0
package/dist/__tests__/discord-thread-context.test.js +42 -0
package/dist/__tests__/doctor.formatters.test.js +4 -4
package/dist/__tests__/doctor.index.test.js +1 -1
package/dist/__tests__/doctor.runner.test.js +3 -15
package/dist/__tests__/env-sanitizer.test.d.ts +1 -0
package/dist/__tests__/env-sanitizer.test.js +45 -0
package/dist/__tests__/exec-approval.test.js +61 -0
package/dist/__tests__/fetch-tool.test.d.ts +1 -0
package/dist/__tests__/fetch-tool.test.js +85 -0
package/dist/__tests__/gateway-status-auth.test.d.ts +1 -0
package/dist/__tests__/gateway-status-auth.test.js +72 -0
package/dist/__tests__/heartbeat.test.js +3 -3
package/dist/__tests__/interactive-sessions.test.d.ts +1 -0
package/dist/__tests__/interactive-sessions.test.js +96 -0
package/dist/__tests__/langfuse.test.js +6 -18
package/dist/__tests__/model-selection.test.js +3 -4
package/dist/__tests__/providers-init.test.js +2 -8
package/dist/__tests__/providers-routing.test.js +1 -1
package/dist/__tests__/providers-utils.test.js +13 -3
package/dist/__tests__/sessions.test.js +14 -10
package/dist/__tests__/setup.test.js +12 -29
package/dist/__tests__/skills.test.js +10 -7
package/dist/__tests__/stream-formatter.test.d.ts +1 -0
package/dist/__tests__/stream-formatter.test.js +114 -0
package/dist/__tests__/token-efficiency.test.js +131 -15
package/dist/__tests__/tool-loop.test.d.ts +4 -0
package/dist/__tests__/tool-loop.test.js +505 -0
package/dist/__tests__/tools.test.js +101 -276
package/dist/__tests__/utils.test.d.ts +1 -0
package/dist/__tests__/utils.test.js +14 -0
package/dist/__tests__/voice.test.js +21 -0
package/dist/agent.js +35 -4
package/dist/api.js +113 -37
package/dist/channels/discord/attachments.d.ts +50 -0
package/dist/channels/discord/attachments.js +137 -0
package/dist/channels/discord/delegation.d.ts +5 -0
package/dist/channels/discord/delegation.js +136 -0
package/dist/channels/discord/handlers.js +694 -7
package/dist/channels/discord/index.d.ts +16 -1
package/dist/channels/discord/index.js +64 -1
package/dist/channels/discord/thread-agents.d.ts +54 -0
package/dist/channels/discord/thread-agents.js +323 -0
package/dist/channels/discord/threads.d.ts +58 -0
package/dist/channels/discord/threads.js +192 -0
package/dist/channels/discord/types.js +4 -2
package/dist/channels/discord/utils.d.ts +16 -0
package/dist/channels/discord/utils.js +86 -6
package/dist/channels/telegram/index.d.ts +1 -1
package/dist/channels/telegram/types.js +1 -1
package/dist/channels/telegram/utils.js +9 -3
package/dist/channels.d.ts +1 -1
package/dist/cli.js +20 -400
package/dist/code-agents/executor.d.ts +1 -1
package/dist/code-agents/executor.js +101 -45
package/dist/code-agents/index.d.ts +2 -7
package/dist/code-agents/index.js +111 -80
package/dist/code-agents/interactive-resume.d.ts +6 -0
package/dist/code-agents/interactive-resume.js +98 -0
package/dist/code-agents/interactive-sessions.d.ts +20 -0
package/dist/code-agents/interactive-sessions.js +132 -0
package/dist/code-agents/parser.js +5 -1
package/dist/code-agents/registry.d.ts +7 -1
package/dist/code-agents/registry.js +11 -23
package/dist/code-agents/stream-formatter.d.ts +8 -0
package/dist/code-agents/stream-formatter.js +92 -0
package/dist/code-agents/types.d.ts +16 -24
package/dist/code-agents/utils.d.ts +35 -11
package/dist/code-agents/utils.js +349 -95
package/dist/code-agents/worktrees.d.ts +37 -0
package/dist/code-agents/worktrees.js +116 -0
package/dist/config.d.ts +2 -4
package/dist/config.js +123 -23
package/dist/cron.d.ts +1 -6
package/dist/cron.js +175 -82
package/dist/dashboard/assets/index-B345aOO-.js +65 -0
package/dist/dashboard/assets/index-ZWK4dalJ.css +1 -0
package/dist/dashboard/index.html +2 -2
package/dist/digests.d.ts +1 -0
package/dist/digests.js +132 -42
package/dist/doctor/checks.d.ts +0 -3
package/dist/doctor/checks.js +1 -108
package/dist/doctor/runner.js +1 -4
package/dist/env-sanitizer.d.ts +2 -0
package/dist/env-sanitizer.js +61 -0
package/dist/exec-approval.d.ts +11 -1
package/dist/exec-approval.js +17 -4
package/dist/gateway.d.ts +3 -1
package/dist/gateway.js +17 -7
package/dist/heartbeat.js +1 -6
package/dist/langfuse.js +3 -29
package/dist/model-selection.js +3 -1
package/dist/providers/adapter.d.ts +118 -0
package/dist/providers/adapter.js +6 -0
package/dist/providers/adapters/anthropic-adapter.d.ts +22 -0
package/dist/providers/adapters/anthropic-adapter.js +204 -0
package/dist/providers/adapters/codex-adapter.d.ts +26 -0
package/dist/providers/adapters/codex-adapter.js +203 -0
package/dist/providers/anthropic.d.ts +1 -0
package/dist/providers/anthropic.js +10 -272
package/dist/providers/codex.d.ts +21 -0
package/dist/providers/codex.js +149 -330
package/dist/providers/content.d.ts +1 -1
package/dist/providers/content.js +2 -2
package/dist/providers/context-manager.d.ts +18 -6
package/dist/providers/context-manager.js +199 -223
package/dist/providers/index.d.ts +9 -1
package/dist/providers/index.js +73 -64
package/dist/providers/loop-utils.d.ts +20 -0
package/dist/providers/loop-utils.js +30 -0
package/dist/providers/tool-loop.d.ts +12 -0
package/dist/providers/tool-loop.js +251 -0
package/dist/providers/utils.d.ts +19 -3
package/dist/providers/utils.js +100 -29
package/dist/secure-store.d.ts +8 -0
package/dist/secure-store.js +80 -0
package/dist/service.js +3 -28
package/dist/sessions.d.ts +3 -0
package/dist/sessions.js +147 -18
package/dist/setup-templates.js +13 -25
package/dist/setup.d.ts +10 -6
package/dist/setup.js +84 -292
package/dist/skills.js +3 -11
package/dist/tools/agent-delegation.d.ts +19 -0
package/dist/tools/agent-delegation.js +49 -0
package/dist/tools/bash-tool.js +89 -34
package/dist/tools/definitions.d.ts +199 -302
package/dist/tools/definitions.js +70 -123
package/dist/tools/execute-context.d.ts +13 -4
package/dist/tools/fetch-tool.js +109 -13
package/dist/tools/file-tools.js +7 -1
package/dist/tools.d.ts +7 -7
package/dist/tools.js +133 -151
package/dist/types.d.ts +37 -30
package/dist/utils.js +4 -6
package/dist/voice.d.ts +1 -1
package/dist/voice.js +17 -4
package/package.json +33 -23
package/templates/TOOLS.md +0 -27
package/dist/__tests__/audit.test.js +0 -122
package/dist/__tests__/code-agents-orchestrator.test.js +0 -216
package/dist/__tests__/code-agents-sandbox.test.js +0 -163
package/dist/__tests__/orchestrator.test.js +0 -425
package/dist/__tests__/sandbox-bridge.test.js +0 -116
package/dist/__tests__/sandbox-manager.test.js +0 -144
package/dist/__tests__/sandbox-mount-security.test.js +0 -139
package/dist/__tests__/sandbox-runtime.test.js +0 -176
package/dist/__tests__/subagent.test.js +0 -240
package/dist/__tests__/telegram.test.js +0 -42
package/dist/code-agents/orchestrator.d.ts +0 -29
package/dist/code-agents/orchestrator.js +0 -694
package/dist/code-agents/worktree.d.ts +0 -40
package/dist/code-agents/worktree.js +0 -215
package/dist/dashboard/assets/index-BoTHPby4.js +0 -65
package/dist/dashboard/assets/index-D4mufvBg.css +0 -1
package/dist/dashboard.d.ts +0 -8
package/dist/dashboard.js +0 -4071
package/dist/discord.d.ts +0 -8
package/dist/discord.js +0 -792
package/dist/mcp-context-a8c.d.ts +0 -13
package/dist/mcp-context-a8c.js +0 -34
package/dist/orchestrator.d.ts +0 -15
package/dist/orchestrator.js +0 -676
package/dist/providers/openai.d.ts +0 -10
package/dist/providers/openai.js +0 -355
package/dist/sandbox/bridge.d.ts +0 -5
package/dist/sandbox/bridge.js +0 -63
package/dist/sandbox/index.d.ts +0 -5
package/dist/sandbox/index.js +0 -4
package/dist/sandbox/manager.d.ts +0 -7
package/dist/sandbox/manager.js +0 -100
package/dist/sandbox/mount-security.d.ts +0 -12
package/dist/sandbox/mount-security.js +0 -122
package/dist/sandbox/runtime.d.ts +0 -39
package/dist/sandbox/runtime.js +0 -192
package/dist/sandbox-utils.d.ts +0 -6
package/dist/sandbox-utils.js +0 -36
package/dist/subagent.d.ts +0 -19
package/dist/subagent.js +0 -407
package/dist/telegram.d.ts +0 -2
package/dist/telegram.js +0 -11
package/dist/tools/browser-tool.d.ts +0 -3
package/dist/tools/browser-tool.js +0 -266
package/sandbox/Dockerfile +0 -40
/package/dist/__tests__/{audit.test.d.ts → code-agents-notifications.test.d.ts} +0 -0
/package/dist/__tests__/{code-agents-orchestrator.test.d.ts → code-agents-worktrees.test.d.ts} +0 -0
/package/dist/__tests__/{code-agents-sandbox.test.d.ts → codex-adapter.test.d.ts} +0 -0
/package/dist/__tests__/{orchestrator.test.d.ts → codex-auth.test.d.ts} +0 -0
/package/dist/__tests__/{sandbox-bridge.test.d.ts → codex-provider-gating.test.d.ts} +0 -0
/package/dist/__tests__/{sandbox-manager.test.d.ts → codex-unified-loop.test.d.ts} +0 -0
/package/dist/__tests__/{sandbox-mount-security.test.d.ts → config-security.test.d.ts} +0 -0
/package/dist/__tests__/{sandbox-runtime.test.d.ts → cron-run.test.d.ts} +0 -0
/package/dist/__tests__/{subagent.test.d.ts → digests.test.d.ts} +0 -0
/package/dist/__tests__/{telegram.test.d.ts → discord-attachments.test.d.ts} +0 -0

package/dist/__tests__/context-manager.test.js CHANGED Viewed

@@ -1,5 +1,5 @@
 import { describe, it, expect, vi, beforeEach } from 'vitest';
-import { estimateTokens, compactAnthropicMessages, compactOpenAIMessages, compactCodexMessages, serializeAnthropicMessages, serializeOpenAIMessages, serializeCodexMessages, } from '../providers/context-manager.js';
+import { estimateTokens, compactMessages, compactAnthropicMessages, compactOpenAIMessages, compactCodexMessages, anthropicFormatHelper, openaiFormatHelper, codexFormatHelper, serializeAnthropicMessages, serializeOpenAIMessages, serializeCodexMessages, } from '../providers/context-manager.js';
 // Mock the chat function used for LLM summarization
 vi.mock('../providers/index.js', () => ({
     chat: vi.fn().mockResolvedValue('Summary of the conversation: the user asked to list files and the assistant ran ls.'),
@@ -51,6 +51,14 @@ function openaiExchange(toolResult) {
         { role: 'tool', tool_call_id: 'tc_1', content: toolResult },
     ];
 }
+// Helper: build many items for compaction tests
+function manyItems(factory, content, count = 30) {
+    const items = [];
+    for (let i = 0; i < count; i++) {
+        items.push(...factory(content));
+    }
+    return items;
+}
 describe('estimateTokens', () => {
     it('returns a positive number for non-empty data', () => {
         expect(estimateTokens([{ role: 'user', content: 'hello' }])).toBeGreaterThan(0);
@@ -64,25 +72,119 @@ describe('estimateTokens', () => {
         expect(large).toBeGreaterThan(small);
     });
 });
-describe('compactAnthropicMessages', () => {
-    it('passes through unchanged when under threshold', async () => {
+// =====================================================================
+// MessageFormatHelper unit tests
+// =====================================================================
+describe('anthropicFormatHelper', () => {
+    it('isToolResult returns true for tool_result content blocks', () => {
+        const msg = { role: 'user', content: [{ type: 'tool_result', tool_use_id: 'tu_1', content: 'result' }] };
+        expect(anthropicFormatHelper.isToolResult(msg)).toBe(true);
+    });
+    it('isToolResult returns false for text messages', () => {
+        const msg = { role: 'user', content: [{ type: 'text', text: 'hello' }] };
+        expect(anthropicFormatHelper.isToolResult(msg)).toBe(false);
+    });
+    it('isToolResult returns false for string content', () => {
+        expect(anthropicFormatHelper.isToolResult({ role: 'user', content: 'hi' })).toBe(false);
+    });
+    it('truncateToolResult truncates long tool_result content', () => {
+        const msg = {
+            role: 'user',
+            content: [{ type: 'tool_result', tool_use_id: 'tu_1', content: 'x'.repeat(1000) }],
+        };
+        const truncated = anthropicFormatHelper.truncateToolResult(msg, 100);
+        expect(truncated.content[0].content).toContain('[truncated]');
+        expect(truncated.content[0].content.length).toBeLessThan(200);
+    });
+    it('truncateToolResult leaves short content unchanged', () => {
+        const msg = {
+            role: 'user',
+            content: [{ type: 'tool_result', tool_use_id: 'tu_1', content: 'short' }],
+        };
+        const result = anthropicFormatHelper.truncateToolResult(msg, 500);
+        expect(result).toBe(msg); // same reference (no change)
+    });
+    it('buildSummaryMessage returns Anthropic-format summary', () => {
+        const summary = anthropicFormatHelper.buildSummaryMessage('test summary');
+        expect(summary.role).toBe('user');
+        expect(summary.content[0].type).toBe('text');
+        expect(summary.content[0].text).toContain('[Conversation Summary]');
+        expect(summary.content[0].text).toContain('test summary');
+    });
+});
+describe('openaiFormatHelper', () => {
+    it('isToolResult returns true for tool role messages', () => {
+        expect(openaiFormatHelper.isToolResult({ role: 'tool', content: 'result' })).toBe(true);
+    });
+    it('isToolResult returns false for non-tool messages', () => {
+        expect(openaiFormatHelper.isToolResult({ role: 'assistant', content: 'hi' })).toBe(false);
+    });
+    it('truncateToolResult truncates long content', () => {
+        const msg = { role: 'tool', tool_call_id: 'tc_1', content: 'x'.repeat(1000) };
+        const truncated = openaiFormatHelper.truncateToolResult(msg, 100);
+        expect(truncated.content).toContain('[truncated]');
+        expect(truncated.content.length).toBeLessThan(200);
+    });
+    it('truncateToolResult leaves short content unchanged', () => {
+        const msg = { role: 'tool', tool_call_id: 'tc_1', content: 'short' };
+        const result = openaiFormatHelper.truncateToolResult(msg, 500);
+        expect(result).toBe(msg);
+    });
+    it('buildSummaryMessage returns OpenAI-format summary', () => {
+        const summary = openaiFormatHelper.buildSummaryMessage('test summary');
+        expect(summary.role).toBe('user');
+        expect(summary.content).toContain('[Conversation Summary]');
+        expect(summary.content).toContain('test summary');
+    });
+});
+describe('codexFormatHelper', () => {
+    it('isToolResult returns true for function_call_output items', () => {
+        expect(codexFormatHelper.isToolResult({ type: 'function_call_output', output: 'result' })).toBe(true);
+    });
+    it('isToolResult returns false for function_call items', () => {
+        expect(codexFormatHelper.isToolResult({ type: 'function_call', name: 'Bash' })).toBe(false);
+    });
+    it('isToolResult returns false for message items', () => {
+        expect(codexFormatHelper.isToolResult({ type: 'message', role: 'user' })).toBe(false);
+    });
+    it('truncateToolResult truncates long output', () => {
+        const item = { type: 'function_call_output', call_id: 'fc_1', output: 'x'.repeat(1000) };
+        const truncated = codexFormatHelper.truncateToolResult(item, 100);
+        expect(truncated.output).toContain('[truncated]');
+        expect(truncated.output.length).toBeLessThan(200);
+    });
+    it('truncateToolResult leaves short output unchanged', () => {
+        const item = { type: 'function_call_output', call_id: 'fc_1', output: 'short' };
+        const result = codexFormatHelper.truncateToolResult(item, 500);
+        expect(result).toBe(item);
+    });
+    it('buildSummaryMessage returns Codex-format summary', () => {
+        const summary = codexFormatHelper.buildSummaryMessage('test summary');
+        expect(summary.type).toBe('message');
+        expect(summary.role).toBe('user');
+        expect(summary.content).toContain('[Conversation Summary]');
+        expect(summary.content).toContain('test summary');
+    });
+});
+// =====================================================================
+// Generic compactMessages() tests
+// =====================================================================
+describe('compactMessages (generic)', () => {
+    it('passes through when under threshold', async () => {
         const messages = anthropicExchange('short result');
-        const result = await compactAnthropicMessages(messages, { maxContextTokens: 100_000 });
-        expect(result.messages).toEqual(messages);
+        const result = await compactMessages(messages, anthropicFormatHelper, { maxContextTokens: 100_000 });
+        expect(result.messages).toBe(messages);
         expect(result.compacted).toBe(false);
     });
-    it('returns same reference when no compaction needed', async () => {
-        const messages = anthropicExchange('short result');
-        const result = await compactAnthropicMessages(messages, { maxContextTokens: 100_000 });
+    it('passes through when disabled', async () => {
+        const messages = manyItems(anthropicExchange, 'x'.repeat(10_000));
+        const result = await compactMessages(messages, anthropicFormatHelper, { enabled: false, maxContextTokens: 1 });
         expect(result.messages).toBe(messages);
+        expect(result.compacted).toBe(false);
     });
-    it('uses LLM summarization when fullConfig is provided', async () => {
-        const longResult = 'x'.repeat(10_000);
-        const messages = [];
-        for (let i = 0; i < 30; i++) {
-            messages.push(...anthropicExchange(longResult));
-        }
-        const result = await compactAnthropicMessages(messages, { maxContextTokens: 1_000 }, 1, fullConfig);
+    it('uses LLM summarization with Anthropic helper', async () => {
+        const messages = manyItems(anthropicExchange, 'x'.repeat(10_000));
+        const result = await compactMessages(messages, anthropicFormatHelper, { maxContextTokens: 1_000 }, 1, fullConfig);
         expect(result.compacted).toBe(true);
         expect(result.method).toBe('llm');
         expect(result.summary).toBeTruthy();
@@ -90,86 +192,157 @@ describe('compactAnthropicMessages', () => {
         expect(result.tokensAfter).toBeGreaterThan(0);
         expect(result.tokensAfter).toBeLessThan(result.tokensBefore);
         expect(mockChat).toHaveBeenCalledOnce();
-        // First message should be the summary
+        // First message should be the summary in Anthropic format
         expect(result.messages[0].role).toBe('user');
         expect(result.messages[0].content[0].text).toContain('[Conversation Summary]');
         // Last 8 should be preserved
         expect(result.messages.slice(-8)).toEqual(messages.slice(-8));
     });
-    it('falls back to truncation when LLM fails', async () => {
+    it('uses LLM summarization with OpenAI helper', async () => {
+        const messages = manyItems(openaiExchange, 'x'.repeat(10_000));
+        const result = await compactMessages(messages, openaiFormatHelper, { maxContextTokens: 1_000 }, 1, fullConfig);
+        expect(result.compacted).toBe(true);
+        expect(result.method).toBe('llm');
+        expect(result.messages[0].role).toBe('user');
+        expect(result.messages[0].content).toContain('[Conversation Summary]');
+    });
+    it('uses LLM summarization with Codex helper', async () => {
+        const messages = manyItems(codexExchange, 'x'.repeat(10_000));
+        const result = await compactMessages(messages, codexFormatHelper, { maxContextTokens: 1_000 }, 1, fullConfig);
+        expect(result.compacted).toBe(true);
+        expect(result.method).toBe('llm');
+        expect(result.messages[0].type).toBe('message');
+        expect(result.messages[0].content).toContain('[Conversation Summary]');
+    });
+    it('falls back to truncation when LLM fails (Anthropic)', async () => {
         mockChat.mockRejectedValueOnce(new Error('API error'));
-        const longResult = 'x'.repeat(10_000);
-        const messages = [];
-        for (let i = 0; i < 30; i++) {
-            messages.push(...anthropicExchange(longResult));
-        }
-        const result = await compactAnthropicMessages(messages, { maxContextTokens: 1_000 }, 1, fullConfig);
+        const messages = manyItems(anthropicExchange, 'x'.repeat(10_000));
+        const result = await compactMessages(messages, anthropicFormatHelper, { maxContextTokens: 1_000 }, 1, fullConfig);
         expect(result.compacted).toBe(true);
         expect(result.method).toBe('truncation');
-        // Head messages should have truncated tool results
         const headMessages = result.messages.slice(0, -8);
         const toolResultMessages = headMessages.filter((m) => Array.isArray(m.content) && m.content.some((b) => b.type === 'tool_result'));
         for (const msg of toolResultMessages) {
             const block = msg.content.find((b) => b.type === 'tool_result');
             expect(block.content).toContain('[truncated]');
-            expect(block.content.length).toBeLessThan(longResult.length);
         }
     });
-    it('falls back to truncation without fullConfig', async () => {
-        const longResult = 'x'.repeat(10_000);
-        const messages = [];
-        for (let i = 0; i < 30; i++) {
-            messages.push(...anthropicExchange(longResult));
+    it('falls back to truncation when LLM fails (OpenAI)', async () => {
+        mockChat.mockRejectedValueOnce(new Error('API error'));
+        const messages = manyItems(openaiExchange, 'x'.repeat(10_000));
+        const result = await compactMessages(messages, openaiFormatHelper, { maxContextTokens: 1_000 }, 1, fullConfig);
+        expect(result.method).toBe('truncation');
+        const toolMessages = result.messages.slice(0, -8).filter((m) => m.role === 'tool');
+        for (const msg of toolMessages) {
+            expect(msg.content).toContain('[truncated]');
+        }
+    });
+    it('falls back to truncation when LLM fails (Codex)', async () => {
+        mockChat.mockRejectedValueOnce(new Error('API error'));
+        const messages = manyItems(codexExchange, 'x'.repeat(10_000));
+        const result = await compactMessages(messages, codexFormatHelper, { maxContextTokens: 1_000 }, 1, fullConfig);
+        expect(result.method).toBe('truncation');
+        const outputItems = result.messages.slice(0, -8).filter((item) => item.type === 'function_call_output');
+        for (const item of outputItems) {
+            expect(item.output).toContain('[truncated]');
         }
-        const result = await compactAnthropicMessages(messages, { maxContextTokens: 1_000 });
+    });
+    it('falls back to truncation without fullConfig', async () => {
+        const messages = manyItems(anthropicExchange, 'x'.repeat(10_000));
+        const result = await compactMessages(messages, anthropicFormatHelper, { maxContextTokens: 1_000 });
         expect(result.compacted).toBe(true);
         expect(result.method).toBe('truncation');
         expect(mockChat).not.toHaveBeenCalled();
     });
-    it('keeps last 8 messages intact when compacting', async () => {
-        const longResult = 'x'.repeat(10_000);
-        const messages = [];
-        for (let i = 0; i < 30; i++) {
-            messages.push(...anthropicExchange(longResult));
+    it('keeps last 8 items intact across all formats', async () => {
+        for (const [factory, helper] of [
+            [anthropicExchange, anthropicFormatHelper],
+            [openaiExchange, openaiFormatHelper],
+            [codexExchange, codexFormatHelper],
+        ]) {
+            const items = manyItems(factory, 'x'.repeat(10_000));
+            const result = await compactMessages(items, helper, { maxContextTokens: 1_000 }, 1, fullConfig);
+            expect(result.messages.slice(-8)).toEqual(items.slice(-8));
+            mockChat.mockClear();
+            mockChat.mockResolvedValue('Summary of the conversation.');
         }
-        const result = await compactAnthropicMessages(messages, { maxContextTokens: 1_000 }, 1, fullConfig);
-        // Last 8 messages should be untouched
-        const tail = result.messages.slice(-8);
-        const originalTail = messages.slice(-8);
-        expect(tail).toEqual(originalTail);
     });
     it('does not mutate the input array', async () => {
-        const longResult = 'x'.repeat(10_000);
-        const messages = [];
-        for (let i = 0; i < 30; i++) {
-            messages.push(...anthropicExchange(longResult));
-        }
+        const messages = manyItems(anthropicExchange, 'x'.repeat(10_000));
         const originalJson = JSON.stringify(messages);
-        await compactAnthropicMessages(messages, { maxContextTokens: 1_000 }, 1, fullConfig);
+        await compactMessages(messages, anthropicFormatHelper, { maxContextTokens: 1_000 }, 1, fullConfig);
         expect(JSON.stringify(messages)).toBe(originalJson);
     });
-    it('passes through unchanged when disabled', async () => {
-        const longResult = 'x'.repeat(10_000);
-        const messages = [];
-        for (let i = 0; i < 30; i++) {
-            messages.push(...anthropicExchange(longResult));
+    it('includes token counts in result', async () => {
+        const messages = manyItems(anthropicExchange, 'x'.repeat(10_000));
+        const result = await compactMessages(messages, anthropicFormatHelper, { maxContextTokens: 1_000 }, 1, fullConfig);
+        expect(result.tokensBefore).toBeGreaterThan(1_000);
+        expect(result.tokensAfter).toBeDefined();
+    });
+    it('preserves non-tool-result items during truncation', async () => {
+        mockChat.mockRejectedValueOnce(new Error('fail'));
+        const items = manyItems(codexExchange, 'x'.repeat(10_000));
+        const result = await compactMessages(items, codexFormatHelper, { maxContextTokens: 1_000 }, 1, fullConfig);
+        const callItems = result.messages.filter((item) => item.type === 'function_call');
+        for (const item of callItems) {
+            expect(item.name).toBe('Bash');
         }
-        const result = await compactAnthropicMessages(messages, { enabled: false, maxContextTokens: 1 });
-        expect(result.messages).toBe(messages);
-        expect(result.compacted).toBe(false);
     });
-    it('includes token counts in result', async () => {
-        const longResult = 'x'.repeat(10_000);
-        const messages = [];
+    it('works with a custom MessageFormatHelper', async () => {
+        // Demonstrate that any format helper works with the generic function
+        const customHelper = {
+            isToolResult: (item) => item.kind === 'result',
+            truncateToolResult: (item, maxChars) => ({
+                ...item,
+                data: item.data.slice(0, maxChars) + ' [truncated]',
+            }),
+            serialize: (items) => items.map(i => JSON.stringify(i)).join('\n'),
+            buildSummaryMessage: (summary) => ({ kind: 'summary', data: summary }),
+        };
+        const items = [];
         for (let i = 0; i < 30; i++) {
-            messages.push(...anthropicExchange(longResult));
+            items.push({ kind: 'call', name: 'test' });
+            items.push({ kind: 'result', data: 'x'.repeat(10_000) });
         }
+        const result = await compactMessages(items, customHelper, { maxContextTokens: 1_000 }, 1, fullConfig);
+        expect(result.compacted).toBe(true);
+        expect(result.method).toBe('llm');
+        expect(result.messages[0].kind).toBe('summary');
+    });
+});
+// =====================================================================
+// Legacy wrapper tests (verify backward compatibility)
+// =====================================================================
+describe('compactAnthropicMessages (legacy wrapper)', () => {
+    it('passes through unchanged when under threshold', async () => {
+        const messages = anthropicExchange('short result');
+        const result = await compactAnthropicMessages(messages, { maxContextTokens: 100_000 });
+        expect(result.messages).toEqual(messages);
+        expect(result.compacted).toBe(false);
+    });
+    it('returns same reference when no compaction needed', async () => {
+        const messages = anthropicExchange('short result');
+        const result = await compactAnthropicMessages(messages, { maxContextTokens: 100_000 });
+        expect(result.messages).toBe(messages);
+    });
+    it('uses LLM summarization when fullConfig is provided', async () => {
+        const messages = manyItems(anthropicExchange, 'x'.repeat(10_000));
         const result = await compactAnthropicMessages(messages, { maxContextTokens: 1_000 }, 1, fullConfig);
-        expect(result.tokensBefore).toBeGreaterThan(1_000);
-        expect(result.tokensAfter).toBeDefined();
+        expect(result.compacted).toBe(true);
+        expect(result.method).toBe('llm');
+        expect(result.summary).toBeTruthy();
+        expect(result.messages[0].role).toBe('user');
+        expect(result.messages[0].content[0].text).toContain('[Conversation Summary]');
+        expect(result.messages.slice(-8)).toEqual(messages.slice(-8));
+    });
+    it('passes through unchanged when disabled', async () => {
+        const messages = manyItems(anthropicExchange, 'x'.repeat(10_000));
+        const result = await compactAnthropicMessages(messages, { enabled: false, maxContextTokens: 1 });
+        expect(result.messages).toBe(messages);
+        expect(result.compacted).toBe(false);
     });
 });
-describe('compactOpenAIMessages', () => {
+describe('compactOpenAIMessages (legacy wrapper)', () => {
     it('passes through unchanged when under threshold', async () => {
         const messages = openaiExchange('short result');
         const result = await compactOpenAIMessages(messages, { maxContextTokens: 100_000 });
@@ -177,63 +350,21 @@ describe('compactOpenAIMessages', () => {
         expect(result.compacted).toBe(false);
     });
     it('uses LLM summarization when fullConfig is provided', async () => {
-        const longResult = 'x'.repeat(10_000);
-        const messages = [];
-        for (let i = 0; i < 30; i++) {
-            messages.push(...openaiExchange(longResult));
-        }
+        const messages = manyItems(openaiExchange, 'x'.repeat(10_000));
         const result = await compactOpenAIMessages(messages, { maxContextTokens: 1_000 }, 1, fullConfig);
         expect(result.compacted).toBe(true);
         expect(result.method).toBe('llm');
         expect(result.messages[0].role).toBe('user');
         expect(result.messages[0].content).toContain('[Conversation Summary]');
     });
-    it('falls back to truncation when LLM fails', async () => {
-        mockChat.mockRejectedValueOnce(new Error('API error'));
-        const longResult = 'x'.repeat(10_000);
-        const messages = [];
-        for (let i = 0; i < 30; i++) {
-            messages.push(...openaiExchange(longResult));
-        }
-        const result = await compactOpenAIMessages(messages, { maxContextTokens: 1_000 }, 1, fullConfig);
-        expect(result.method).toBe('truncation');
-        const headItems = result.messages.slice(0, -8);
-        const toolMessages = headItems.filter((m) => m.role === 'tool');
-        for (const msg of toolMessages) {
-            expect(msg.content).toContain('[truncated]');
-        }
-    });
-    it('keeps last 8 messages intact', async () => {
-        const longResult = 'x'.repeat(10_000);
-        const messages = [];
-        for (let i = 0; i < 30; i++) {
-            messages.push(...openaiExchange(longResult));
-        }
-        const result = await compactOpenAIMessages(messages, { maxContextTokens: 1_000 }, 1, fullConfig);
-        expect(result.messages.slice(-8)).toEqual(messages.slice(-8));
-    });
-    it('does not mutate the input array', async () => {
-        const longResult = 'x'.repeat(10_000);
-        const messages = [];
-        for (let i = 0; i < 30; i++) {
-            messages.push(...openaiExchange(longResult));
-        }
-        const original = JSON.stringify(messages);
-        await compactOpenAIMessages(messages, { maxContextTokens: 1_000 }, 1, fullConfig);
-        expect(JSON.stringify(messages)).toBe(original);
-    });
     it('passes through unchanged when disabled', async () => {
-        const longResult = 'x'.repeat(10_000);
-        const messages = [];
-        for (let i = 0; i < 30; i++) {
-            messages.push(...openaiExchange(longResult));
-        }
+        const messages = manyItems(openaiExchange, 'x'.repeat(10_000));
         const result = await compactOpenAIMessages(messages, { enabled: false, maxContextTokens: 1 });
         expect(result.messages).toBe(messages);
         expect(result.compacted).toBe(false);
     });
 });
-describe('compactCodexMessages', () => {
+describe('compactCodexMessages (legacy wrapper)', () => {
     it('passes through unchanged when under threshold', async () => {
         const items = codexExchange('short result');
         const result = await compactCodexMessages(items, { maxContextTokens: 100_000 });
@@ -241,75 +372,23 @@ describe('compactCodexMessages', () => {
         expect(result.compacted).toBe(false);
     });
     it('uses LLM summarization when fullConfig is provided', async () => {
-        const longOutput = 'x'.repeat(10_000);
-        const items = [];
-        for (let i = 0; i < 30; i++) {
-            items.push(...codexExchange(longOutput));
-        }
+        const items = manyItems(codexExchange, 'x'.repeat(10_000));
         const result = await compactCodexMessages(items, { maxContextTokens: 1_000 }, 1, fullConfig);
         expect(result.compacted).toBe(true);
         expect(result.method).toBe('llm');
         expect(result.messages[0].type).toBe('message');
         expect(result.messages[0].content).toContain('[Conversation Summary]');
     });
-    it('falls back to truncation when LLM fails', async () => {
-        mockChat.mockRejectedValueOnce(new Error('API error'));
-        const longOutput = 'x'.repeat(10_000);
-        const items = [];
-        for (let i = 0; i < 30; i++) {
-            items.push(...codexExchange(longOutput));
-        }
-        const result = await compactCodexMessages(items, { maxContextTokens: 1_000 }, 1, fullConfig);
-        expect(result.method).toBe('truncation');
-        const headItems = result.messages.slice(0, -8);
-        const outputItems = headItems.filter((item) => item.type === 'function_call_output');
-        for (const item of outputItems) {
-            expect(item.output).toContain('[truncated]');
-        }
-    });
-    it('keeps last 8 items intact when compacting', async () => {
-        const longOutput = 'x'.repeat(10_000);
-        const items = [];
-        for (let i = 0; i < 30; i++) {
-            items.push(...codexExchange(longOutput));
-        }
-        const result = await compactCodexMessages(items, { maxContextTokens: 1_000 }, 1, fullConfig);
-        expect(result.messages.slice(-8)).toEqual(items.slice(-8));
-    });
-    it('does not mutate the input array', async () => {
-        const longOutput = 'x'.repeat(10_000);
-        const items = [];
-        for (let i = 0; i < 30; i++) {
-            items.push(...codexExchange(longOutput));
-        }
-        const originalJson = JSON.stringify(items);
-        await compactCodexMessages(items, { maxContextTokens: 1_000 }, 1, fullConfig);
-        expect(JSON.stringify(items)).toBe(originalJson);
-    });
-    it('preserves function_call items unchanged', async () => {
-        mockChat.mockRejectedValueOnce(new Error('fail')); // force truncation
-        const longOutput = 'x'.repeat(10_000);
-        const items = [];
-        for (let i = 0; i < 30; i++) {
-            items.push(...codexExchange(longOutput));
-        }
-        const result = await compactCodexMessages(items, { maxContextTokens: 1_000 }, 1, fullConfig);
-        const callItems = result.messages.filter((item) => item.type === 'function_call');
-        for (const item of callItems) {
-            expect(item.name).toBe('Bash');
-        }
-    });
     it('passes through unchanged when disabled', async () => {
-        const longOutput = 'x'.repeat(10_000);
-        const items = [];
-        for (let i = 0; i < 30; i++) {
-            items.push(...codexExchange(longOutput));
-        }
+        const items = manyItems(codexExchange, 'x'.repeat(10_000));
         const result = await compactCodexMessages(items, { enabled: false, maxContextTokens: 1 });
         expect(result.messages).toBe(items);
         expect(result.compacted).toBe(false);
     });
 });
+// =====================================================================
+// Serializer tests (unchanged — these test the format helpers indirectly)
+// =====================================================================
 describe('serializers', () => {
     it('serializeAnthropicMessages produces readable transcript', () => {
         const messages = [