npm - @librechat/agents - Versions diffs - 2.3.1 → 2.3.3 - Mend

@librechat/agents 2.3.1 → 2.3.3

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (77) hide show

package/dist/cjs/graphs/Graph.cjs +6 -6
package/dist/cjs/graphs/Graph.cjs.map +1 -1
package/dist/cjs/llm/anthropic/llm.cjs +7 -7
package/dist/cjs/llm/anthropic/llm.cjs.map +1 -1
package/dist/cjs/llm/anthropic/utils/message_inputs.cjs +6 -6
package/dist/cjs/llm/anthropic/utils/message_inputs.cjs.map +1 -1
package/dist/cjs/llm/anthropic/utils/message_outputs.cjs +24 -24
package/dist/cjs/llm/anthropic/utils/message_outputs.cjs.map +1 -1
package/dist/cjs/llm/fake.cjs.map +1 -1
package/dist/cjs/llm/text.cjs.map +1 -1
package/dist/cjs/main.cjs +3 -0
package/dist/cjs/main.cjs.map +1 -1
package/dist/cjs/messages/core.cjs +6 -6
package/dist/cjs/messages/core.cjs.map +1 -1
package/dist/cjs/messages/format.cjs +11 -9
package/dist/cjs/messages/format.cjs.map +1 -1
package/dist/cjs/messages/prune.cjs +155 -205
package/dist/cjs/messages/prune.cjs.map +1 -1
package/dist/cjs/run.cjs.map +1 -1
package/dist/cjs/stream.cjs +7 -7
package/dist/cjs/stream.cjs.map +1 -1
package/dist/cjs/tools/ToolNode.cjs +1 -1
package/dist/cjs/tools/ToolNode.cjs.map +1 -1
package/dist/cjs/utils/tokens.cjs +3 -3
package/dist/cjs/utils/tokens.cjs.map +1 -1
package/dist/esm/graphs/Graph.mjs +6 -6
package/dist/esm/graphs/Graph.mjs.map +1 -1
package/dist/esm/llm/anthropic/llm.mjs +7 -7
package/dist/esm/llm/anthropic/llm.mjs.map +1 -1
package/dist/esm/llm/anthropic/utils/message_inputs.mjs +6 -6
package/dist/esm/llm/anthropic/utils/message_inputs.mjs.map +1 -1
package/dist/esm/llm/anthropic/utils/message_outputs.mjs +24 -24
package/dist/esm/llm/anthropic/utils/message_outputs.mjs.map +1 -1
package/dist/esm/llm/fake.mjs.map +1 -1
package/dist/esm/llm/text.mjs.map +1 -1
package/dist/esm/main.mjs +1 -1
package/dist/esm/messages/core.mjs +6 -6
package/dist/esm/messages/core.mjs.map +1 -1
package/dist/esm/messages/format.mjs +11 -9
package/dist/esm/messages/format.mjs.map +1 -1
package/dist/esm/messages/prune.mjs +153 -206
package/dist/esm/messages/prune.mjs.map +1 -1
package/dist/esm/run.mjs.map +1 -1
package/dist/esm/stream.mjs +7 -7
package/dist/esm/stream.mjs.map +1 -1
package/dist/esm/tools/ToolNode.mjs +1 -1
package/dist/esm/tools/ToolNode.mjs.map +1 -1
package/dist/esm/utils/tokens.mjs +3 -3
package/dist/esm/utils/tokens.mjs.map +1 -1
package/dist/types/messages/format.d.ts +1 -2
package/dist/types/messages/prune.d.ts +31 -2
package/dist/types/types/stream.d.ts +2 -2
package/dist/types/utils/tokens.d.ts +1 -1
package/package.json +4 -3
package/src/graphs/Graph.ts +8 -8
package/src/llm/anthropic/llm.ts +7 -8
package/src/llm/anthropic/types.ts +4 -4
package/src/llm/anthropic/utils/message_inputs.ts +6 -6
package/src/llm/anthropic/utils/message_outputs.ts +39 -39
package/src/llm/fake.ts +2 -2
package/src/llm/text.ts +1 -1
package/src/messages/core.ts +9 -9
package/src/messages/format.ts +43 -42
package/src/messages/formatAgentMessages.test.ts +35 -35
package/src/messages/formatAgentMessages.tools.test.ts +30 -30
package/src/messages/prune.ts +182 -255
package/src/messages/shiftIndexTokenCountMap.test.ts +18 -18
package/src/mockStream.ts +1 -1
package/src/run.ts +2 -2
package/src/specs/prune.test.ts +89 -89
package/src/specs/reasoning.test.ts +1 -1
package/src/specs/thinking-prune.test.ts +265 -261
package/src/specs/tool-error.test.ts +16 -17
package/src/stream.ts +21 -18
package/src/tools/ToolNode.ts +1 -1
package/src/types/stream.ts +4 -3
package/src/utils/tokens.ts +12 -12

package/src/specs/prune.test.ts CHANGED Viewed

@@ -5,40 +5,40 @@ import { HumanMessage, AIMessage, SystemMessage, BaseMessage } from '@langchain/
 import type { RunnableConfig } from '@langchain/core/runnables';
 import type { UsageMetadata } from '@langchain/core/messages';
 import type * as t from '@/types';
-import { GraphEvents, Providers } from '@/common';
+import { createPruneMessages } from '@/messages/prune';
 import { getLLMConfig } from '@/utils/llmConfig';
+import { Providers } from '@/common';
 import { Run } from '@/run';
-import { createPruneMessages } from '@/messages/prune';
 // Create a simple token counter for testing
 const createTestTokenCounter = (): t.TokenCounter => {
   // This simple token counter just counts characters as tokens for predictable testing
   return (message: BaseMessage): number => {
     // Use type assertion to help TypeScript understand the type
-    const content = message.content as string | Array<any> | undefined;
+    const content = message.content as string | Array<t.MessageContentComplex | string> | undefined;
     // Handle string content
     if (typeof content === 'string') {
       return content.length;
     }
     // Handle array content
     if (Array.isArray(content)) {
       let totalLength = 0;
       for (const item of content) {
         if (typeof item === 'string') {
           totalLength += item.length;
-        } else if (item && typeof item === 'object') {
+        } else if (typeof item === 'object') {
           if ('text' in item && typeof item.text === 'string') {
             totalLength += item.text.length;
           }
         }
       }
       return totalLength;
     }
     // Default case - if content is null, undefined, or any other type
     return 0;
   };
@@ -50,7 +50,7 @@ function calculateTotalTokens(usage: Partial<UsageMetadata>): UsageMetadata {
   const baseInputTokens = Number(usage.input_tokens) || 0;
   const cacheCreation = Number(usage.input_token_details?.cache_creation) || 0;
   const cacheRead = Number(usage.input_token_details?.cache_read) || 0;
   const totalInputTokens = baseInputTokens + cacheCreation + cacheRead;
   const totalOutputTokens = Number(usage.output_tokens) || 0;
@@ -65,12 +65,12 @@ function getMessagesWithinTokenLimit({
   messages: _messages,
   maxContextTokens,
   indexTokenCountMap,
-  startOnMessageType,
+  startType,
 }: {
   messages: BaseMessage[];
   maxContextTokens: number;
   indexTokenCountMap: Record<string, number>;
-  startOnMessageType?: string;
+  startType?: string;
 }): {
   context: BaseMessage[];
   remainingContextTokens: number;
@@ -81,7 +81,7 @@ function getMessagesWithinTokenLimit({
   // start with 3 tokens for the label after all messages have been counted.
   let summaryIndex = -1;
   let currentTokenCount = 3;
-  const instructions = _messages?.[0]?.getType() === 'system' ? _messages[0] : undefined;
+  const instructions = _messages[0]?.getType() === 'system' ? _messages[0] : undefined;
   const instructionsTokenCount = instructions != null ? indexTokenCountMap[0] : 0;
   let remainingContextTokens = maxContextTokens - instructionsTokenCount;
   const messages = [..._messages];
@@ -96,7 +96,7 @@ function getMessagesWithinTokenLimit({
       }
       const poppedMessage = messages.pop();
       if (!poppedMessage) continue;
       const tokenCount = indexTokenCountMap[currentIndex] || 0;
       if ((currentTokenCount + tokenCount) <= remainingContextTokens) {
@@ -107,11 +107,11 @@ function getMessagesWithinTokenLimit({
         break;
       }
     }
-    // If startOnMessageType is specified, discard messages until we find one of the required type
-    if (startOnMessageType && context.length > 0) {
-      const requiredTypeIndex = context.findIndex(msg => msg.getType() === startOnMessageType);
+    // If startType is specified, discard messages until we find one of the required type
+    if (startType && context.length > 0) {
+      const requiredTypeIndex = context.findIndex(msg => msg.getType() === startType);
       if (requiredTypeIndex > 0) {
         // If we found a message of the required type, discard all messages before it
         const remainingMessages = context.slice(requiredTypeIndex);
@@ -144,7 +144,7 @@ function checkValidNumber(value: unknown): value is number {
 describe('Prune Messages Tests', () => {
   jest.setTimeout(30000);
   describe('calculateTotalTokens', () => {
     it('should calculate total tokens correctly with all fields present', () => {
       const usage: Partial<UsageMetadata> = {
@@ -155,38 +155,38 @@ describe('Prune Messages Tests', () => {
           cache_read: 5
         }
       };
       const result = calculateTotalTokens(usage);
       expect(result.input_tokens).toBe(115); // 100 + 10 + 5
       expect(result.output_tokens).toBe(50);
       expect(result.total_tokens).toBe(165); // 115 + 50
     });
     it('should handle missing fields gracefully', () => {
       const usage: Partial<UsageMetadata> = {
         input_tokens: 100,
         output_tokens: 50
       };
       const result = calculateTotalTokens(usage);
       expect(result.input_tokens).toBe(100);
       expect(result.output_tokens).toBe(50);
       expect(result.total_tokens).toBe(150);
     });
     it('should handle empty usage object', () => {
       const usage: Partial<UsageMetadata> = {};
       const result = calculateTotalTokens(usage);
       expect(result.input_tokens).toBe(0);
       expect(result.output_tokens).toBe(0);
       expect(result.total_tokens).toBe(0);
     });
   });
   describe('getMessagesWithinTokenLimit', () => {
     it('should include all messages when under token limit', () => {
       const messages = [
@@ -194,26 +194,26 @@ describe('Prune Messages Tests', () => {
         new HumanMessage('Hello'),
         new AIMessage('Hi there')
       ];
       const indexTokenCountMap = {
         0: 17, // "System instruction"
         1: 5,  // "Hello"
         2: 8   // "Hi there"
       };
       const result = getMessagesWithinTokenLimit({
         messages,
         maxContextTokens: 100,
         indexTokenCountMap
       });
       expect(result.context.length).toBe(3);
       expect(result.context[0]).toBe(messages[0]); // System message
       expect(result.context[0].getType()).toBe('system'); // System message
       expect(result.remainingContextTokens).toBe(100 - 17 - 5 - 8 - 3); // -3 for the assistant label tokens
       expect(result.messagesToRefine.length).toBe(0);
     });
     it('should prune oldest messages when over token limit', () => {
       const messages = [
         new SystemMessage('System instruction'),
@@ -222,7 +222,7 @@ describe('Prune Messages Tests', () => {
         new HumanMessage('Message 2'),
         new AIMessage('Response 2')
       ];
       const indexTokenCountMap = {
         0: 17, // "System instruction"
         1: 9,  // "Message 1"
@@ -230,54 +230,54 @@ describe('Prune Messages Tests', () => {
         3: 9,  // "Message 2"
         4: 10  // "Response 2"
       };
       // Set a limit that can only fit the system message and the last two messages
       const result = getMessagesWithinTokenLimit({
         messages,
         maxContextTokens: 40,
         indexTokenCountMap
       });
       // Should include system message and the last two messages
       expect(result.context.length).toBe(3);
       expect(result.context[0]).toBe(messages[0]); // System message
       expect(result.context[0].getType()).toBe('system'); // System message
       expect(result.context[1]).toBe(messages[3]); // Message 2
       expect(result.context[2]).toBe(messages[4]); // Response 2
       // Should have the first two messages in messagesToRefine
       expect(result.messagesToRefine.length).toBe(2);
       expect(result.messagesToRefine[0]).toBe(messages[1]); // Message 1
       expect(result.messagesToRefine[1]).toBe(messages[2]); // Response 1
     });
     it('should always include system message even when at token limit', () => {
       const messages = [
         new SystemMessage('System instruction'),
         new HumanMessage('Hello'),
         new AIMessage('Hi there')
       ];
       const indexTokenCountMap = {
         0: 17, // "System instruction"
         1: 5,  // "Hello"
         2: 8   // "Hi there"
       };
       // Set a limit that can only fit the system message
       const result = getMessagesWithinTokenLimit({
         messages,
         maxContextTokens: 20,
         indexTokenCountMap
       });
       expect(result.context.length).toBe(1);
       expect(result.context[0]).toBe(messages[0]); // System message
       expect(result.messagesToRefine.length).toBe(2);
     });
-    it('should start context with a specific message type when startOnMessageType is specified', () => {
+    it('should start context with a specific message type when startType is specified', () => {
       const messages = [
         new SystemMessage('System instruction'),
         new AIMessage('AI message 1'),
@@ -285,7 +285,7 @@ describe('Prune Messages Tests', () => {
         new AIMessage('AI message 2'),
         new HumanMessage('Human message 2')
       ];
       const indexTokenCountMap = {
         0: 17, // "System instruction"
         1: 12, // "AI message 1"
@@ -293,15 +293,15 @@ describe('Prune Messages Tests', () => {
         3: 12, // "AI message 2"
         4: 15  // "Human message 2"
       };
       // Set a limit that can fit all messages
       const result = getMessagesWithinTokenLimit({
         messages,
         maxContextTokens: 100,
         indexTokenCountMap,
-        startOnMessageType: 'human'
+        startType: 'human'
       });
       // All messages should be included since we're under the token limit
       expect(result.context.length).toBe(5);
       expect(result.context[0]).toBe(messages[0]); // System message
@@ -309,7 +309,7 @@ describe('Prune Messages Tests', () => {
       expect(result.context[2]).toBe(messages[2]); // Human message 1
       expect(result.context[3]).toBe(messages[3]); // AI message 2
       expect(result.context[4]).toBe(messages[4]); // Human message 2
       // All messages should be included since we're under the token limit
       expect(result.messagesToRefine.length).toBe(0);
     });
@@ -320,44 +320,44 @@ describe('Prune Messages Tests', () => {
         new AIMessage('AI message 1'),
         new AIMessage('AI message 2')
       ];
       const indexTokenCountMap = {
         0: 17, // "System instruction"
         1: 12, // "AI message 1"
         2: 12  // "AI message 2"
       };
       // Set a limit that can fit all messages
       const result = getMessagesWithinTokenLimit({
         messages,
         maxContextTokens: 100,
         indexTokenCountMap,
-        startOnMessageType: 'human'
+        startType: 'human'
       });
       // Should include all messages since no human messages exist to start from
       expect(result.context.length).toBe(3);
       expect(result.context[0]).toBe(messages[0]); // System message
       expect(result.context[1]).toBe(messages[1]); // AI message 1
       expect(result.context[2]).toBe(messages[2]); // AI message 2
       expect(result.messagesToRefine.length).toBe(0);
     });
   });
   describe('checkValidNumber', () => {
     it('should return true for valid positive numbers', () => {
       expect(checkValidNumber(5)).toBe(true);
       expect(checkValidNumber(1.5)).toBe(true);
       expect(checkValidNumber(Number.MAX_SAFE_INTEGER)).toBe(true);
     });
     it('should return false for zero, negative numbers, and NaN', () => {
       expect(checkValidNumber(0)).toBe(false);
       expect(checkValidNumber(-5)).toBe(false);
       expect(checkValidNumber(NaN)).toBe(false);
     });
     it('should return false for non-number types', () => {
       expect(checkValidNumber('5')).toBe(false);
       expect(checkValidNumber(null)).toBe(false);
@@ -366,7 +366,7 @@ describe('Prune Messages Tests', () => {
       expect(checkValidNumber([])).toBe(false);
     });
   });
   describe('createPruneMessages', () => {
     it('should return all messages when under token limit', () => {
       const tokenCounter = createTestTokenCounter();
@@ -375,26 +375,26 @@ describe('Prune Messages Tests', () => {
         new HumanMessage('Hello'),
         new AIMessage('Hi there')
       ];
       const indexTokenCountMap = {
         0: tokenCounter(messages[0]),
         1: tokenCounter(messages[1]),
         2: tokenCounter(messages[2])
       };
       const pruneMessages = createPruneMessages({
         maxTokens: 100,
         startIndex: 0,
         tokenCounter,
         indexTokenCountMap
       });
       const result = pruneMessages({ messages });
       expect(result.context.length).toBe(3);
       expect(result.context).toEqual(messages);
     });
     it('should prune messages when over token limit', () => {
       const tokenCounter = createTestTokenCounter();
       const messages = [
@@ -404,7 +404,7 @@ describe('Prune Messages Tests', () => {
         new HumanMessage('Message 2'),
         new AIMessage('Response 2')
       ];
       const indexTokenCountMap = {
         0: tokenCounter(messages[0]),
         1: tokenCounter(messages[1]),
@@ -412,7 +412,7 @@ describe('Prune Messages Tests', () => {
         3: tokenCounter(messages[3]),
         4: tokenCounter(messages[4])
       };
       // Set a limit that can only fit the system message and the last two messages
       const pruneMessages = createPruneMessages({
         maxTokens: 40,
@@ -420,9 +420,9 @@ describe('Prune Messages Tests', () => {
         tokenCounter,
         indexTokenCountMap
       });
       const result = pruneMessages({ messages });
       // Should include system message and the last two messages
       expect(result.context.length).toBe(3);
       expect(result.context[0]).toBe(messages[0]); // System message
@@ -430,7 +430,7 @@ describe('Prune Messages Tests', () => {
       expect(result.context[2]).toBe(messages[4]); // Response 2
     });
-    it('should respect startOnMessageType parameter', () => {
+    it('should respect startType parameter', () => {
       const tokenCounter = createTestTokenCounter();
       const messages = [
         new SystemMessage('System instruction'),
@@ -439,7 +439,7 @@ describe('Prune Messages Tests', () => {
         new AIMessage('AI message 2'),
         new HumanMessage('Human message 2')
       ];
       const indexTokenCountMap = {
         0: tokenCounter(messages[0]),
         1: tokenCounter(messages[1]),
@@ -447,7 +447,7 @@ describe('Prune Messages Tests', () => {
         3: tokenCounter(messages[3]),
         4: tokenCounter(messages[4])
       };
       // Set a limit that can fit all messages
       const pruneMessages = createPruneMessages({
         maxTokens: 100,
@@ -455,12 +455,12 @@ describe('Prune Messages Tests', () => {
         tokenCounter,
         indexTokenCountMap: { ...indexTokenCountMap }
       });
-      const result = pruneMessages({
+      const result = pruneMessages({
         messages,
-        startOnMessageType: 'human'
+        startType: 'human'
       });
       // All messages should be included since we're under the token limit
       expect(result.context.length).toBe(5);
       expect(result.context[0]).toBe(messages[0]); // System message
@@ -469,7 +469,7 @@ describe('Prune Messages Tests', () => {
       expect(result.context[3]).toBe(messages[3]); // AI message 2
       expect(result.context[4]).toBe(messages[4]); // Human message 2
     });
     it('should update token counts when usage metadata is provided', () => {
       const tokenCounter = createTestTokenCounter();
       const messages = [
@@ -477,47 +477,47 @@ describe('Prune Messages Tests', () => {
         new HumanMessage('Hello'),
         new AIMessage('Hi there')
       ];
       const indexTokenCountMap = {
         0: tokenCounter(messages[0]),
         1: tokenCounter(messages[1]),
         2: tokenCounter(messages[2])
       };
       const pruneMessages = createPruneMessages({
         maxTokens: 100,
         startIndex: 0,
         tokenCounter,
         indexTokenCountMap: { ...indexTokenCountMap }
       });
       // Provide usage metadata that indicates different token counts
       const usageMetadata: Partial<UsageMetadata> = {
         input_tokens: 50,
         output_tokens: 25,
         total_tokens: 75
       };
-      const result = pruneMessages({
+      const result = pruneMessages({
         messages,
         usageMetadata
       });
       // The function should have updated the indexTokenCountMap based on the usage metadata
       expect(result.indexTokenCountMap).not.toEqual(indexTokenCountMap);
       // The total of all values in indexTokenCountMap should equal the total_tokens from usageMetadata
       const totalTokens = Object.values(result.indexTokenCountMap).reduce((a, b) => a + b, 0);
       expect(totalTokens).toBe(75);
     });
   });
   describe('Integration with Run', () => {
     it('should initialize Run with custom token counter and process messages', async () => {
       const provider = Providers.OPENAI;
       const llmConfig = getLLMConfig(provider);
       const tokenCounter = createTestTokenCounter();
       const run = await Run.create<t.IState>({
         runId: 'test-prune-run',
         graphConfig: {
@@ -527,18 +527,18 @@ describe('Prune Messages Tests', () => {
         },
         returnContent: true,
       });
       // Override the model to use a fake LLM
       run.Graph?.overrideTestModel(['This is a test response'], 1);
       const messages = [
         new HumanMessage('Hello, how are you?')
       ];
       const indexTokenCountMap = {
         0: tokenCounter(messages[0])
       };
       const config: Partial<RunnableConfig> & { version: 'v1' | 'v2'; streamMode: string } = {
         configurable: {
           thread_id: 'test-thread',
@@ -546,7 +546,7 @@ describe('Prune Messages Tests', () => {
         streamMode: 'values',
         version: 'v2' as const,
       };
       await run.processStream(
         { messages },
         config,
@@ -556,7 +556,7 @@ describe('Prune Messages Tests', () => {
           tokenCounter,
         }
       );
       const finalMessages = run.getRunMessages();
       expect(finalMessages).toBeDefined();
       expect(finalMessages?.length).toBeGreaterThan(0);

package/src/specs/reasoning.test.ts CHANGED Viewed

@@ -1,5 +1,5 @@
 /* eslint-disable no-console */
-/* eslint-disable @typescript-eslint/no-explicit-any */
 // src/scripts/cli.test.ts
 import { config } from 'dotenv';
 config();