npm - @librechat/agents - Versions diffs - 3.1.57 → 3.1.61 - Mend

@librechat/agents 3.1.57 → 3.1.61

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (214) hide show

package/dist/cjs/agents/AgentContext.cjs +326 -62
package/dist/cjs/agents/AgentContext.cjs.map +1 -1
package/dist/cjs/common/enum.cjs +13 -0
package/dist/cjs/common/enum.cjs.map +1 -1
package/dist/cjs/events.cjs +7 -27
package/dist/cjs/events.cjs.map +1 -1
package/dist/cjs/graphs/Graph.cjs +303 -222
package/dist/cjs/graphs/Graph.cjs.map +1 -1
package/dist/cjs/llm/anthropic/utils/message_inputs.cjs +4 -4
package/dist/cjs/llm/anthropic/utils/message_inputs.cjs.map +1 -1
package/dist/cjs/llm/bedrock/utils/message_inputs.cjs +6 -2
package/dist/cjs/llm/bedrock/utils/message_inputs.cjs.map +1 -1
package/dist/cjs/llm/init.cjs +60 -0
package/dist/cjs/llm/init.cjs.map +1 -0
package/dist/cjs/llm/invoke.cjs +90 -0
package/dist/cjs/llm/invoke.cjs.map +1 -0
package/dist/cjs/llm/openai/index.cjs +2 -0
package/dist/cjs/llm/openai/index.cjs.map +1 -1
package/dist/cjs/llm/request.cjs +41 -0
package/dist/cjs/llm/request.cjs.map +1 -0
package/dist/cjs/main.cjs +40 -0
package/dist/cjs/main.cjs.map +1 -1
package/dist/cjs/messages/cache.cjs +76 -89
package/dist/cjs/messages/cache.cjs.map +1 -1
package/dist/cjs/messages/contextPruning.cjs +156 -0
package/dist/cjs/messages/contextPruning.cjs.map +1 -0
package/dist/cjs/messages/contextPruningSettings.cjs +53 -0
package/dist/cjs/messages/contextPruningSettings.cjs.map +1 -0
package/dist/cjs/messages/core.cjs +23 -37
package/dist/cjs/messages/core.cjs.map +1 -1
package/dist/cjs/messages/format.cjs +156 -11
package/dist/cjs/messages/format.cjs.map +1 -1
package/dist/cjs/messages/prune.cjs +1161 -49
package/dist/cjs/messages/prune.cjs.map +1 -1
package/dist/cjs/messages/reducer.cjs +87 -0
package/dist/cjs/messages/reducer.cjs.map +1 -0
package/dist/cjs/run.cjs +81 -42
package/dist/cjs/run.cjs.map +1 -1
package/dist/cjs/stream.cjs +54 -7
package/dist/cjs/stream.cjs.map +1 -1
package/dist/cjs/summarization/index.cjs +75 -0
package/dist/cjs/summarization/index.cjs.map +1 -0
package/dist/cjs/summarization/node.cjs +663 -0
package/dist/cjs/summarization/node.cjs.map +1 -0
package/dist/cjs/tools/ToolNode.cjs +16 -8
package/dist/cjs/tools/ToolNode.cjs.map +1 -1
package/dist/cjs/tools/handlers.cjs +2 -0
package/dist/cjs/tools/handlers.cjs.map +1 -1
package/dist/cjs/utils/errors.cjs +115 -0
package/dist/cjs/utils/errors.cjs.map +1 -0
package/dist/cjs/utils/events.cjs +17 -0
package/dist/cjs/utils/events.cjs.map +1 -1
package/dist/cjs/utils/handlers.cjs +16 -0
package/dist/cjs/utils/handlers.cjs.map +1 -1
package/dist/cjs/utils/llm.cjs +10 -0
package/dist/cjs/utils/llm.cjs.map +1 -1
package/dist/cjs/utils/tokens.cjs +247 -14
package/dist/cjs/utils/tokens.cjs.map +1 -1
package/dist/cjs/utils/truncation.cjs +107 -0
package/dist/cjs/utils/truncation.cjs.map +1 -0
package/dist/esm/agents/AgentContext.mjs +325 -61
package/dist/esm/agents/AgentContext.mjs.map +1 -1
package/dist/esm/common/enum.mjs +13 -0
package/dist/esm/common/enum.mjs.map +1 -1
package/dist/esm/events.mjs +8 -28
package/dist/esm/events.mjs.map +1 -1
package/dist/esm/graphs/Graph.mjs +307 -226
package/dist/esm/graphs/Graph.mjs.map +1 -1
package/dist/esm/llm/anthropic/utils/message_inputs.mjs +4 -4
package/dist/esm/llm/anthropic/utils/message_inputs.mjs.map +1 -1
package/dist/esm/llm/bedrock/utils/message_inputs.mjs +6 -2
package/dist/esm/llm/bedrock/utils/message_inputs.mjs.map +1 -1
package/dist/esm/llm/init.mjs +58 -0
package/dist/esm/llm/init.mjs.map +1 -0
package/dist/esm/llm/invoke.mjs +87 -0
package/dist/esm/llm/invoke.mjs.map +1 -0
package/dist/esm/llm/openai/index.mjs +2 -0
package/dist/esm/llm/openai/index.mjs.map +1 -1
package/dist/esm/llm/request.mjs +38 -0
package/dist/esm/llm/request.mjs.map +1 -0
package/dist/esm/main.mjs +13 -3
package/dist/esm/main.mjs.map +1 -1
package/dist/esm/messages/cache.mjs +76 -89
package/dist/esm/messages/cache.mjs.map +1 -1
package/dist/esm/messages/contextPruning.mjs +154 -0
package/dist/esm/messages/contextPruning.mjs.map +1 -0
package/dist/esm/messages/contextPruningSettings.mjs +50 -0
package/dist/esm/messages/contextPruningSettings.mjs.map +1 -0
package/dist/esm/messages/core.mjs +23 -37
package/dist/esm/messages/core.mjs.map +1 -1
package/dist/esm/messages/format.mjs +156 -11
package/dist/esm/messages/format.mjs.map +1 -1
package/dist/esm/messages/prune.mjs +1158 -52
package/dist/esm/messages/prune.mjs.map +1 -1
package/dist/esm/messages/reducer.mjs +83 -0
package/dist/esm/messages/reducer.mjs.map +1 -0
package/dist/esm/run.mjs +82 -43
package/dist/esm/run.mjs.map +1 -1
package/dist/esm/stream.mjs +54 -7
package/dist/esm/stream.mjs.map +1 -1
package/dist/esm/summarization/index.mjs +73 -0
package/dist/esm/summarization/index.mjs.map +1 -0
package/dist/esm/summarization/node.mjs +659 -0
package/dist/esm/summarization/node.mjs.map +1 -0
package/dist/esm/tools/ToolNode.mjs +16 -8
package/dist/esm/tools/ToolNode.mjs.map +1 -1
package/dist/esm/tools/handlers.mjs +2 -0
package/dist/esm/tools/handlers.mjs.map +1 -1
package/dist/esm/utils/errors.mjs +111 -0
package/dist/esm/utils/errors.mjs.map +1 -0
package/dist/esm/utils/events.mjs +17 -1
package/dist/esm/utils/events.mjs.map +1 -1
package/dist/esm/utils/handlers.mjs +16 -0
package/dist/esm/utils/handlers.mjs.map +1 -1
package/dist/esm/utils/llm.mjs +10 -1
package/dist/esm/utils/llm.mjs.map +1 -1
package/dist/esm/utils/tokens.mjs +245 -15
package/dist/esm/utils/tokens.mjs.map +1 -1
package/dist/esm/utils/truncation.mjs +102 -0
package/dist/esm/utils/truncation.mjs.map +1 -0
package/dist/types/agents/AgentContext.d.ts +124 -6
package/dist/types/common/enum.d.ts +14 -1
package/dist/types/graphs/Graph.d.ts +22 -27
package/dist/types/index.d.ts +5 -0
package/dist/types/llm/init.d.ts +18 -0
package/dist/types/llm/invoke.d.ts +48 -0
package/dist/types/llm/request.d.ts +14 -0
package/dist/types/messages/contextPruning.d.ts +42 -0
package/dist/types/messages/contextPruningSettings.d.ts +44 -0
package/dist/types/messages/core.d.ts +1 -1
package/dist/types/messages/format.d.ts +17 -1
package/dist/types/messages/index.d.ts +3 -0
package/dist/types/messages/prune.d.ts +162 -1
package/dist/types/messages/reducer.d.ts +18 -0
package/dist/types/run.d.ts +12 -1
package/dist/types/summarization/index.d.ts +20 -0
package/dist/types/summarization/node.d.ts +29 -0
package/dist/types/tools/ToolNode.d.ts +3 -1
package/dist/types/types/graph.d.ts +44 -6
package/dist/types/types/index.d.ts +1 -0
package/dist/types/types/run.d.ts +30 -0
package/dist/types/types/stream.d.ts +31 -4
package/dist/types/types/summarize.d.ts +47 -0
package/dist/types/types/tools.d.ts +7 -0
package/dist/types/utils/errors.d.ts +28 -0
package/dist/types/utils/events.d.ts +13 -0
package/dist/types/utils/index.d.ts +2 -0
package/dist/types/utils/llm.d.ts +4 -0
package/dist/types/utils/tokens.d.ts +14 -1
package/dist/types/utils/truncation.d.ts +49 -0
package/package.json +3 -3
package/src/agents/AgentContext.ts +388 -58
package/src/agents/__tests__/AgentContext.test.ts +265 -5
package/src/common/enum.ts +13 -0
package/src/events.ts +9 -39
package/src/graphs/Graph.ts +468 -331
package/src/index.ts +7 -0
package/src/llm/anthropic/llm.spec.ts +3 -3
package/src/llm/anthropic/utils/message_inputs.ts +6 -4
package/src/llm/bedrock/llm.spec.ts +1 -1
package/src/llm/bedrock/utils/message_inputs.ts +6 -2
package/src/llm/init.ts +63 -0
package/src/llm/invoke.ts +144 -0
package/src/llm/request.ts +55 -0
package/src/messages/__tests__/observationMasking.test.ts +221 -0
package/src/messages/cache.ts +77 -102
package/src/messages/contextPruning.ts +191 -0
package/src/messages/contextPruningSettings.ts +90 -0
package/src/messages/core.ts +32 -53
package/src/messages/ensureThinkingBlock.test.ts +39 -39
package/src/messages/format.ts +227 -15
package/src/messages/formatAgentMessages.test.ts +511 -1
package/src/messages/index.ts +3 -0
package/src/messages/prune.ts +1548 -62
package/src/messages/reducer.ts +22 -0
package/src/run.ts +104 -51
package/src/scripts/bedrock-merge-test.ts +1 -1
package/src/scripts/test-thinking-handoff-bedrock.ts +1 -1
package/src/scripts/test-thinking-handoff.ts +1 -1
package/src/scripts/thinking-bedrock.ts +1 -1
package/src/scripts/thinking.ts +1 -1
package/src/specs/anthropic.simple.test.ts +1 -1
package/src/specs/multi-agent-summarization.test.ts +396 -0
package/src/specs/prune.test.ts +1196 -23
package/src/specs/summarization-unit.test.ts +868 -0
package/src/specs/summarization.test.ts +3827 -0
package/src/specs/summarize-prune.test.ts +376 -0
package/src/specs/thinking-handoff.test.ts +10 -10
package/src/specs/thinking-prune.test.ts +7 -4
package/src/specs/token-accounting-e2e.test.ts +1034 -0
package/src/specs/token-accounting-pipeline.test.ts +882 -0
package/src/specs/token-distribution-edge-case.test.ts +25 -26
package/src/splitStream.test.ts +42 -33
package/src/stream.ts +64 -11
package/src/summarization/__tests__/aggregator.test.ts +153 -0
package/src/summarization/__tests__/node.test.ts +708 -0
package/src/summarization/__tests__/trigger.test.ts +50 -0
package/src/summarization/index.ts +102 -0
package/src/summarization/node.ts +982 -0
package/src/tools/ToolNode.ts +25 -3
package/src/types/graph.ts +62 -7
package/src/types/index.ts +1 -0
package/src/types/run.ts +32 -0
package/src/types/stream.ts +45 -5
package/src/types/summarize.ts +58 -0
package/src/types/tools.ts +7 -0
package/src/utils/errors.ts +117 -0
package/src/utils/events.ts +31 -0
package/src/utils/handlers.ts +18 -0
package/src/utils/index.ts +2 -0
package/src/utils/llm.ts +12 -0
package/src/utils/tokens.ts +336 -18
package/src/utils/truncation.ts +124 -0
package/src/scripts/image.ts +0 -180

package/src/specs/summarize-prune.test.ts ADDED Viewed

@@ -0,0 +1,376 @@
+import {
+  HumanMessage,
+  AIMessage,
+  SystemMessage,
+} from '@langchain/core/messages';
+import type { UsageMetadata } from '@langchain/core/messages';
+import { createPruneMessages } from '@/messages/prune';
+import { Providers, ContentTypes } from '@/common';
+function tokenCounter(msg: { content: unknown }): number {
+  const content =
+    typeof msg.content === 'string' ? msg.content : JSON.stringify(msg.content);
+  return Math.ceil(content.length / 4);
+}
+describe('Prune + Summarize Integration', () => {
+  it('should return messagesToRefine when messages exceed token limit', () => {
+    const messages = [
+      new SystemMessage('You are a helpful assistant.'),
+      new HumanMessage('First question'),
+      new AIMessage('First answer'),
+      new HumanMessage('Second question'),
+      new AIMessage('Second answer'),
+      new HumanMessage('Third question'),
+      new AIMessage(
+        'Third answer that is quite long to push things over the limit'
+      ),
+    ];
+    const indexTokenCountMap: Record<string, number | undefined> = {};
+    for (let i = 0; i < messages.length; i++) {
+      indexTokenCountMap[i] = tokenCounter(messages[i]);
+    }
+    const totalTokens = Object.values(indexTokenCountMap).reduce(
+      (a = 0, b = 0) => a! + b!,
+      0
+    ) as number;
+    const maxTokens = Math.floor(totalTokens * 0.6);
+    const pruneMessages = createPruneMessages({
+      provider: Providers.OPENAI,
+      maxTokens,
+      startIndex: messages.length,
+      tokenCounter,
+      indexTokenCountMap,
+    });
+    const result = pruneMessages({ messages });
+    expect(result.messagesToRefine).toBeDefined();
+    expect(result.messagesToRefine!.length).toBeGreaterThan(0);
+    expect(result.remainingContextTokens).toBeDefined();
+    expect(typeof result.remainingContextTokens).toBe('number');
+    expect(result.context.length).toBeLessThan(messages.length);
+  });
+  it('should return empty messagesToRefine when all messages fit', () => {
+    const messages = [new HumanMessage('Hi'), new AIMessage('Hello')];
+    const indexTokenCountMap: Record<string, number | undefined> = {};
+    for (let i = 0; i < messages.length; i++) {
+      indexTokenCountMap[i] = tokenCounter(messages[i]);
+    }
+    const pruneMessages = createPruneMessages({
+      provider: Providers.OPENAI,
+      maxTokens: 10000,
+      startIndex: messages.length,
+      tokenCounter,
+      indexTokenCountMap,
+    });
+    const result = pruneMessages({ messages });
+    expect(result.messagesToRefine).toBeDefined();
+    expect(result.messagesToRefine).toHaveLength(0);
+    expect(result.remainingContextTokens).toBeGreaterThan(0);
+    expect(result.context).toEqual(messages);
+  });
+  it('should preserve system message in context even when pruning', () => {
+    const sysMsg = new SystemMessage(
+      'Instructions for the assistant to follow carefully'
+    );
+    const messages = [
+      sysMsg,
+      new HumanMessage(
+        'This is the first message in our conversation and it is fairly long'
+      ),
+      new AIMessage(
+        'This is the first response and it is also fairly long with details'
+      ),
+      new HumanMessage(
+        'This is the second message with more context and questions'
+      ),
+      new AIMessage(
+        'This is the second response which is even more detailed and verbose'
+      ),
+      new HumanMessage('Third message in the conversation chain'),
+      new AIMessage('Third response with additional lengthy explanations'),
+    ];
+    const indexTokenCountMap: Record<string, number | undefined> = {};
+    for (let i = 0; i < messages.length; i++) {
+      indexTokenCountMap[i] = tokenCounter(messages[i]);
+    }
+    const totalTokens = Object.values(indexTokenCountMap).reduce(
+      (a = 0, b = 0) => a! + b!,
+      0
+    ) as number;
+    const maxTokens = Math.floor(totalTokens * 0.35);
+    const pruneMessages = createPruneMessages({
+      provider: Providers.OPENAI,
+      maxTokens,
+      startIndex: messages.length,
+      tokenCounter,
+      indexTokenCountMap,
+    });
+    const result = pruneMessages({ messages });
+    expect(result.context[0]).toBe(sysMsg);
+    expect(result.messagesToRefine!.length).toBeGreaterThan(0);
+  });
+  it('should not include summary content type in pruned messages passed to providers', () => {
+    const summaryBlock = {
+      type: ContentTypes.SUMMARY,
+      text: 'Summary of prior conversation',
+    };
+    expect(summaryBlock.type).toBe('summary');
+    expect(Object.values(ContentTypes)).toContain('summary');
+  });
+});
+describe('pruneMessages ratio-based token grounding', () => {
+  it('should adjust indexTokenCountMap entries proportionally when usageMetadata is provided', () => {
+    const messages = [
+      new SystemMessage('Be concise.'),
+      new HumanMessage('What is 2+2?'),
+      new AIMessage('The answer is 4.'),
+    ];
+    const indexTokenCountMap: Record<string, number | undefined> = {
+      0: 10,
+      1: 20,
+      2: 30,
+    };
+    const pruneMessages = createPruneMessages({
+      provider: Providers.OPENAI,
+      maxTokens: 5000,
+      startIndex: messages.length,
+      tokenCounter,
+      indexTokenCountMap,
+    });
+    const usageMetadata: Partial<UsageMetadata> = {
+      input_tokens: 50,
+      output_tokens: 40,
+    };
+    const result = pruneMessages({ messages, usageMetadata });
+    // Map stays in raw tiktoken space — calibrationRatio captures the multiplier.
+    const originalTotal = 10 + 20 + 30;
+    const expectedRatio = 50 / originalTotal;
+    expect(result.indexTokenCountMap[0]).toBe(10);
+    expect(result.indexTokenCountMap[1]).toBe(20);
+    expect(result.indexTokenCountMap[2]).toBe(30);
+    expect(result.calibrationRatio).toBeCloseTo(expectedRatio, 2);
+  });
+  it('should NOT adjust when ratio falls outside safe bounds (< 1/3)', () => {
+    const messages = [
+      new HumanMessage('What is 2+2?'),
+      new AIMessage('The answer is 4.'),
+    ];
+    const indexTokenCountMap: Record<string, number | undefined> = {
+      0: 100,
+      1: 200,
+    };
+    const pruneMessages = createPruneMessages({
+      provider: Providers.OPENAI,
+      maxTokens: 50000,
+      startIndex: messages.length,
+      tokenCounter,
+      indexTokenCountMap,
+    });
+    const usageMetadata: Partial<UsageMetadata> = {
+      input_tokens: 5,
+      output_tokens: 5,
+    };
+    const result = pruneMessages({ messages, usageMetadata });
+    expect(result.indexTokenCountMap[0]).toBe(100);
+    expect(result.indexTokenCountMap[1]).toBe(200);
+  });
+  it('should NOT adjust when ratio falls outside safe bounds (> 2.5)', () => {
+    const messages = [new HumanMessage('Hi'), new AIMessage('Hello')];
+    const indexTokenCountMap: Record<string, number | undefined> = {
+      0: 5,
+      1: 5,
+    };
+    const pruneMessages = createPruneMessages({
+      provider: Providers.OPENAI,
+      maxTokens: 50000,
+      startIndex: messages.length,
+      tokenCounter,
+      indexTokenCountMap,
+    });
+    const usageMetadata: Partial<UsageMetadata> = {
+      input_tokens: 100,
+      output_tokens: 100,
+    };
+    const result = pruneMessages({ messages, usageMetadata });
+    expect(result.indexTokenCountMap[0]).toBe(5);
+    expect(result.indexTokenCountMap[1]).toBe(5);
+  });
+  it('should include cache_read and cache_creation in ratio total', () => {
+    const messages = [
+      new SystemMessage('Instructions'),
+      new HumanMessage('Hello'),
+      new AIMessage('Hi there!'),
+    ];
+    const indexTokenCountMap: Record<string, number | undefined> = {
+      0: 10,
+      1: 20,
+      2: 30,
+    };
+    const pruneMessages = createPruneMessages({
+      provider: Providers.ANTHROPIC,
+      maxTokens: 5000,
+      startIndex: messages.length,
+      tokenCounter,
+      indexTokenCountMap,
+    });
+    // Anthropic: cache_read (15) + cache_creation (10) = 25 > input_tokens (30)?
+    // No, 25 < 30, so NOT additive. totalInput = 30.
+    // providerMessageTokens = 30 - 0 (no instruction overhead) = 30.
+    // ratio = 30 / 60 = 0.5 — safe (>= 1/3, <= 2.5).
+    const usageMetadata: Partial<UsageMetadata> = {
+      input_tokens: 30,
+      output_tokens: 20,
+      input_token_details: {
+        cache_read: 15,
+        cache_creation: 10,
+      },
+    };
+    const originalTotal = 10 + 20 + 30;
+    const expectedRatio = 30 / originalTotal;
+    const result = pruneMessages({ messages, usageMetadata });
+    // Map stays raw — calibrationRatio captures the multiplier
+    expect(result.indexTokenCountMap[0]).toBe(10);
+    expect(result.indexTokenCountMap[1]).toBe(20);
+    expect(result.indexTokenCountMap[2]).toBe(30);
+    expect(result.calibrationRatio).toBeCloseTo(expectedRatio, 2);
+  });
+  it('should assign output_tokens to the first new message at startIndex', () => {
+    const messages = [
+      new HumanMessage('What is 2+2?'),
+      new AIMessage('The answer is 4.'),
+    ];
+    const indexTokenCountMap: Record<string, number | undefined> = {
+      0: 15,
+    };
+    const pruneMessages = createPruneMessages({
+      provider: Providers.OPENAI,
+      maxTokens: 5000,
+      startIndex: 1,
+      tokenCounter,
+      indexTokenCountMap,
+    });
+    const usageMetadata: Partial<UsageMetadata> = {
+      input_tokens: 20,
+      output_tokens: 25,
+    };
+    const result = pruneMessages({ messages, usageMetadata });
+    expect(result.indexTokenCountMap[1]).toBeDefined();
+    expect(result.indexTokenCountMap[1] as number).toBeGreaterThan(0);
+    // index[1] is the AI response at startIndex — assigned output_tokens (25).
+    // Calibration: providerMessageTokens = input_tokens (20) - overhead (0) = 20.
+    // messageTokenSum = index[0] (15) + index[1] is newOutput so excluded = 15.
+    // ratio = 20 / 15 = 1.33 — safe.
+    const preRatioIndex0 = 15;
+    const ratio = 20 / preRatioIndex0;
+    const isRatioSafe = ratio >= 1 / 3 && ratio <= 2.5;
+    // Map stays raw regardless of ratio safety
+    expect(result.indexTokenCountMap[0]).toBe(preRatioIndex0);
+    if (isRatioSafe) {
+      expect(result.calibrationRatio).toBeCloseTo(ratio, 1);
+    }
+  });
+  it('should ground tokens correctly across multiple pruneMessages calls', () => {
+    const turn1Messages = [
+      new SystemMessage('Be concise.'),
+      new HumanMessage('What is 2+2?'),
+    ];
+    const indexTokenCountMap: Record<string, number | undefined> = {
+      0: 10,
+      1: 20,
+    };
+    const pruneMessages = createPruneMessages({
+      provider: Providers.OPENAI,
+      maxTokens: 5000,
+      startIndex: turn1Messages.length,
+      tokenCounter,
+      indexTokenCountMap,
+    });
+    const turn1Result = pruneMessages({
+      messages: turn1Messages,
+    });
+    expect(turn1Result.indexTokenCountMap[0]).toBe(10);
+    expect(turn1Result.indexTokenCountMap[1]).toBe(20);
+    const turn2Messages = [
+      ...turn1Messages,
+      new AIMessage('4'),
+      new HumanMessage('And 3+3?'),
+    ];
+    const turn2Usage: Partial<UsageMetadata> = {
+      input_tokens: 25,
+      output_tokens: 10,
+    };
+    const turn2Result = pruneMessages({
+      messages: turn2Messages,
+      usageMetadata: turn2Usage,
+    });
+    expect(turn2Result.indexTokenCountMap[2]).toBeDefined();
+    expect(turn2Result.indexTokenCountMap[2] as number).toBeGreaterThan(0);
+    expect(turn2Result.indexTokenCountMap[3]).toBeDefined();
+    expect(turn2Result.indexTokenCountMap[3] as number).toBeGreaterThan(0);
+    for (let i = 0; i < turn2Messages.length; i++) {
+      expect(turn2Result.indexTokenCountMap[i]).toBeDefined();
+      expect(turn2Result.indexTokenCountMap[i] as number).toBeGreaterThan(0);
+    }
+  });
+});

package/src/specs/thinking-handoff.test.ts CHANGED Viewed

@@ -61,7 +61,7 @@ describe('Thinking-Enabled Agent Handoff Tests', () => {
           agentId: 'specialist',
           provider: Providers.ANTHROPIC,
           clientOptions: {
-            modelName: 'claude-3-7-sonnet-20250219',
+            modelName: 'claude-sonnet-4-5-20250929',
             apiKey: 'test-key',
             thinking: {
               type: 'enabled',
@@ -150,7 +150,7 @@ describe('Thinking-Enabled Agent Handoff Tests', () => {
           agentId: 'agent_b',
           provider: Providers.ANTHROPIC,
           clientOptions: {
-            modelName: 'claude-3-7-sonnet-20250219',
+            modelName: 'claude-sonnet-4-5-20250929',
             apiKey: 'test-key',
             thinking: {
               type: 'enabled',
@@ -195,7 +195,7 @@ describe('Thinking-Enabled Agent Handoff Tests', () => {
           provider: Providers.BEDROCK,
           clientOptions: {
             region: 'us-east-1',
-            model: 'anthropic.claude-3-5-haiku-20241022-v1:0',
+            model: 'us.anthropic.claude-haiku-4-5-20251001-v1:0',
             // No thinking config
           },
           instructions: 'You are a coordinator',
@@ -206,7 +206,7 @@ describe('Thinking-Enabled Agent Handoff Tests', () => {
           provider: Providers.BEDROCK,
           clientOptions: {
             region: 'us-east-1',
-            model: 'us.anthropic.claude-3-7-sonnet-20250219-v1:0',
+            model: 'us.anthropic.claude-sonnet-4-5-20250929-v1:0',
             additionalModelRequestFields: {
               thinking: {
                 type: 'enabled',
@@ -280,7 +280,7 @@ describe('Thinking-Enabled Agent Handoff Tests', () => {
           provider: Providers.BEDROCK,
           clientOptions: {
             region: 'us-east-1',
-            model: 'us.anthropic.claude-3-7-sonnet-20250219-v1:0',
+            model: 'us.anthropic.claude-sonnet-4-5-20250929-v1:0',
             additionalModelRequestFields: {
               thinking: {
                 type: 'enabled',
@@ -343,7 +343,7 @@ describe('Thinking-Enabled Agent Handoff Tests', () => {
           provider: Providers.BEDROCK,
           clientOptions: {
             region: 'us-east-1',
-            model: 'us.anthropic.claude-3-7-sonnet-20250219-v1:0',
+            model: 'us.anthropic.claude-sonnet-4-5-20250929-v1:0',
             additionalModelRequestFields: {
               thinking: {
                 type: 'enabled',
@@ -434,7 +434,7 @@ describe('Thinking-Enabled Agent Handoff Tests', () => {
           agentId: 'reviewer',
           provider: Providers.ANTHROPIC,
           clientOptions: {
-            modelName: 'claude-3-7-sonnet-20250219',
+            modelName: 'claude-sonnet-4-5-20250929',
             apiKey: 'test-key',
             thinking: {
               type: 'enabled',
@@ -508,7 +508,7 @@ describe('Thinking-Enabled Agent Handoff Tests', () => {
           agentId: 'agent_a',
           provider: Providers.ANTHROPIC,
           clientOptions: {
-            modelName: 'claude-3-7-sonnet-20250219',
+            modelName: 'claude-sonnet-4-5-20250929',
             apiKey: 'test-key',
             thinking: {
               type: 'enabled',
@@ -522,7 +522,7 @@ describe('Thinking-Enabled Agent Handoff Tests', () => {
           agentId: 'agent_b',
           provider: Providers.ANTHROPIC,
           clientOptions: {
-            modelName: 'claude-3-7-sonnet-20250219',
+            modelName: 'claude-sonnet-4-5-20250929',
             apiKey: 'test-key',
             thinking: {
               type: 'enabled',
@@ -587,7 +587,7 @@ describe('Thinking-Enabled Agent Handoff Tests', () => {
           agentId: 'agent_b',
           provider: Providers.ANTHROPIC,
           clientOptions: {
-            modelName: 'claude-3-7-sonnet-20250219',
+            modelName: 'claude-sonnet-4-5-20250929',
             apiKey: 'test-key',
             thinking: {
               type: 'enabled',

package/src/specs/thinking-prune.test.ts CHANGED Viewed

@@ -741,6 +741,7 @@ describe('Prune Messages with Thinking Mode Tests', () => {
       tokenCounter,
       indexTokenCountMap: { ...indexTokenCountMap },
       thinkingEnabled: true,
+      reserveRatio: 0,
     });
     // Prune messages
@@ -767,7 +768,7 @@ describe('Prune Messages with Thinking Mode Tests', () => {
     );
   });
-  it('should throw descriptive error when aggressive pruning removes all AI messages', () => {
+  it('should gracefully degrade when aggressive pruning removes all AI messages', () => {
     const tokenCounter = createTestTokenCounter();
     const assistantMessageWithThinking = new AIMessage({
@@ -817,8 +818,10 @@ describe('Prune Messages with Thinking Mode Tests', () => {
       thinkingEnabled: true,
     });
-    expect(() => pruneMessages({ messages })).toThrow(
-      /Context window exceeded/
-    );
+    // Should not throw — gracefully degrades by skipping thinking block reattachment
+    expect(() => pruneMessages({ messages })).not.toThrow();
+    const result = pruneMessages({ messages });
+    // Context should contain at most the system message (no AI messages survived)
+    expect(result.context.length).toBeLessThanOrEqual(2);
   });
 });