npm - @librechat/agents - Versions diffs - 2.2.2 → 2.2.3 - Mend

@librechat/agents 2.2.2 → 2.2.3

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (54) hide show

package/dist/cjs/graphs/Graph.cjs +50 -14
package/dist/cjs/graphs/Graph.cjs.map +1 -1
package/dist/cjs/main.cjs +3 -4
package/dist/cjs/main.cjs.map +1 -1
package/dist/cjs/messages/format.cjs +21 -0
package/dist/cjs/messages/format.cjs.map +1 -1
package/dist/cjs/messages/prune.cjs +124 -0
package/dist/cjs/messages/prune.cjs.map +1 -0
package/dist/cjs/run.cjs +24 -0
package/dist/cjs/run.cjs.map +1 -1
package/dist/cjs/utils/tokens.cjs +64 -0
package/dist/cjs/utils/tokens.cjs.map +1 -0
package/dist/esm/graphs/Graph.mjs +50 -14
package/dist/esm/graphs/Graph.mjs.map +1 -1
package/dist/esm/main.mjs +2 -3
package/dist/esm/main.mjs.map +1 -1
package/dist/esm/messages/format.mjs +21 -1
package/dist/esm/messages/format.mjs.map +1 -1
package/dist/esm/messages/prune.mjs +122 -0
package/dist/esm/messages/prune.mjs.map +1 -0
package/dist/esm/run.mjs +24 -0
package/dist/esm/run.mjs.map +1 -1
package/dist/esm/utils/tokens.mjs +62 -0
package/dist/esm/utils/tokens.mjs.map +1 -0
package/dist/types/graphs/Graph.d.ts +8 -1
package/dist/types/messages/format.d.ts +9 -0
package/dist/types/messages/index.d.ts +1 -2
package/dist/types/messages/prune.d.ts +16 -0
package/dist/types/types/run.d.ts +4 -0
package/dist/types/utils/tokens.d.ts +2 -0
package/package.json +1 -1
package/src/graphs/Graph.ts +54 -16
package/src/messages/format.ts +27 -0
package/src/messages/index.ts +1 -2
package/src/messages/prune.ts +167 -0
package/src/messages/shiftIndexTokenCountMap.test.ts +81 -0
package/src/run.ts +26 -0
package/src/scripts/code_exec_simple.ts +21 -8
package/src/specs/prune.test.ts +444 -0
package/src/types/run.ts +5 -0
package/src/utils/tokens.ts +70 -0
package/dist/cjs/messages/transformers.cjs +0 -318
package/dist/cjs/messages/transformers.cjs.map +0 -1
package/dist/cjs/messages/trimMessagesFactory.cjs +0 -129
package/dist/cjs/messages/trimMessagesFactory.cjs.map +0 -1
package/dist/esm/messages/transformers.mjs +0 -316
package/dist/esm/messages/transformers.mjs.map +0 -1
package/dist/esm/messages/trimMessagesFactory.mjs +0 -127
package/dist/esm/messages/trimMessagesFactory.mjs.map +0 -1
package/dist/types/messages/transformers.d.ts +0 -320
package/dist/types/messages/trimMessagesFactory.d.ts +0 -37
package/src/messages/transformers.ts +0 -786
package/src/messages/trimMessagesFactory.test.ts +0 -331
package/src/messages/trimMessagesFactory.ts +0 -140

package/src/specs/prune.test.ts ADDED Viewed

@@ -0,0 +1,444 @@
+// src/specs/prune.test.ts
+import { config } from 'dotenv';
+config();
+import { HumanMessage, AIMessage, SystemMessage, BaseMessage } from '@langchain/core/messages';
+import type { RunnableConfig } from '@langchain/core/runnables';
+import type { UsageMetadata } from '@langchain/core/messages';
+import type * as t from '@/types';
+import { GraphEvents, Providers } from '@/common';
+import { getLLMConfig } from '@/utils/llmConfig';
+import { Run } from '@/run';
+import { createPruneMessages } from '@/messages/prune';
+// Create a simple token counter for testing
+const createTestTokenCounter = (): t.TokenCounter => {
+  // This simple token counter just counts characters as tokens for predictable testing
+  return (message: BaseMessage): number => {
+    // Use type assertion to help TypeScript understand the type
+    const content = message.content as string | Array<any> | undefined;
+    // Handle string content
+    if (typeof content === 'string') {
+      return content.length;
+    }
+    // Handle array content
+    if (Array.isArray(content)) {
+      let totalLength = 0;
+      for (const item of content) {
+        if (typeof item === 'string') {
+          totalLength += item.length;
+        } else if (item && typeof item === 'object') {
+          if ('text' in item && typeof item.text === 'string') {
+            totalLength += item.text.length;
+          }
+        }
+      }
+      return totalLength;
+    }
+    // Default case - if content is null, undefined, or any other type
+    return 0;
+  };
+};
+// Since the internal functions in prune.ts are not exported, we'll reimplement them here for testing
+// This is based on the implementation in src/messages/prune.ts
+function calculateTotalTokens(usage: Partial<UsageMetadata>): UsageMetadata {
+  const baseInputTokens = Number(usage.input_tokens) || 0;
+  const cacheCreation = Number(usage.input_token_details?.cache_creation) || 0;
+  const cacheRead = Number(usage.input_token_details?.cache_read) || 0;
+  const totalInputTokens = baseInputTokens + cacheCreation + cacheRead;
+  const totalOutputTokens = Number(usage.output_tokens) || 0;
+  return {
+    input_tokens: totalInputTokens,
+    output_tokens: totalOutputTokens,
+    total_tokens: totalInputTokens + totalOutputTokens
+  };
+}
+function getMessagesWithinTokenLimit({
+  messages: _messages,
+  maxContextTokens,
+  indexTokenCountMap,
+}: {
+  messages: BaseMessage[];
+  maxContextTokens: number;
+  indexTokenCountMap: Record<string, number>;
+}): {
+  context: BaseMessage[];
+  remainingContextTokens: number;
+  messagesToRefine: BaseMessage[];
+  summaryIndex: number;
+} {
+  // Every reply is primed with <|start|>assistant<|message|>, so we
+  // start with 3 tokens for the label after all messages have been counted.
+  let summaryIndex = -1;
+  let currentTokenCount = 3;
+  const instructions = _messages?.[0]?.getType() === 'system' ? _messages[0] : undefined;
+  const instructionsTokenCount = instructions != null ? indexTokenCountMap[0] : 0;
+  let remainingContextTokens = maxContextTokens - instructionsTokenCount;
+  const messages = [..._messages];
+  const context: BaseMessage[] = [];
+  if (currentTokenCount < remainingContextTokens) {
+    let currentIndex = messages.length;
+    while (messages.length > 0 && currentTokenCount < remainingContextTokens && currentIndex > 1) {
+      currentIndex--;
+      if (messages.length === 1 && instructions) {
+        break;
+      }
+      const poppedMessage = messages.pop();
+      if (!poppedMessage) continue;
+      const tokenCount = indexTokenCountMap[currentIndex] || 0;
+      if ((currentTokenCount + tokenCount) <= remainingContextTokens) {
+        context.push(poppedMessage);
+        currentTokenCount += tokenCount;
+      } else {
+        messages.push(poppedMessage);
+        break;
+      }
+    }
+  }
+  if (instructions && _messages.length > 0) {
+    context.push(_messages[0] as BaseMessage);
+    messages.shift();
+  }
+  const prunedMemory = messages;
+  summaryIndex = prunedMemory.length - 1;
+  remainingContextTokens -= currentTokenCount;
+  return {
+    summaryIndex,
+    remainingContextTokens,
+    context: context.reverse(),
+    messagesToRefine: prunedMemory,
+  };
+}
+function checkValidNumber(value: unknown): value is number {
+  return typeof value === 'number' && !isNaN(value) && value > 0;
+}
+describe('Prune Messages Tests', () => {
+  jest.setTimeout(30000);
+  describe('calculateTotalTokens', () => {
+    it('should calculate total tokens correctly with all fields present', () => {
+      const usage: Partial<UsageMetadata> = {
+        input_tokens: 100,
+        output_tokens: 50,
+        input_token_details: {
+          cache_creation: 10,
+          cache_read: 5
+        }
+      };
+      const result = calculateTotalTokens(usage);
+      expect(result.input_tokens).toBe(115); // 100 + 10 + 5
+      expect(result.output_tokens).toBe(50);
+      expect(result.total_tokens).toBe(165); // 115 + 50
+    });
+    it('should handle missing fields gracefully', () => {
+      const usage: Partial<UsageMetadata> = {
+        input_tokens: 100,
+        output_tokens: 50
+      };
+      const result = calculateTotalTokens(usage);
+      expect(result.input_tokens).toBe(100);
+      expect(result.output_tokens).toBe(50);
+      expect(result.total_tokens).toBe(150);
+    });
+    it('should handle empty usage object', () => {
+      const usage: Partial<UsageMetadata> = {};
+      const result = calculateTotalTokens(usage);
+      expect(result.input_tokens).toBe(0);
+      expect(result.output_tokens).toBe(0);
+      expect(result.total_tokens).toBe(0);
+    });
+  });
+  describe('getMessagesWithinTokenLimit', () => {
+    it('should include all messages when under token limit', () => {
+      const messages = [
+        new SystemMessage('System instruction'),
+        new HumanMessage('Hello'),
+        new AIMessage('Hi there')
+      ];
+      const indexTokenCountMap = {
+        0: 17, // "System instruction"
+        1: 5,  // "Hello"
+        2: 8   // "Hi there"
+      };
+      const result = getMessagesWithinTokenLimit({
+        messages,
+        maxContextTokens: 100,
+        indexTokenCountMap
+      });
+      expect(result.context.length).toBe(3);
+      expect(result.context[0]).toBe(messages[0]); // System message
+      expect(result.context[0].getType()).toBe('system'); // System message
+      expect(result.remainingContextTokens).toBe(100 - 17 - 5 - 8 - 3); // -3 for the assistant label tokens
+      expect(result.messagesToRefine.length).toBe(0);
+    });
+    it('should prune oldest messages when over token limit', () => {
+      const messages = [
+        new SystemMessage('System instruction'),
+        new HumanMessage('Message 1'),
+        new AIMessage('Response 1'),
+        new HumanMessage('Message 2'),
+        new AIMessage('Response 2')
+      ];
+      const indexTokenCountMap = {
+        0: 17, // "System instruction"
+        1: 9,  // "Message 1"
+        2: 10, // "Response 1"
+        3: 9,  // "Message 2"
+        4: 10  // "Response 2"
+      };
+      // Set a limit that can only fit the system message and the last two messages
+      const result = getMessagesWithinTokenLimit({
+        messages,
+        maxContextTokens: 40,
+        indexTokenCountMap
+      });
+      // Should include system message and the last two messages
+      expect(result.context.length).toBe(3);
+      expect(result.context[0]).toBe(messages[0]); // System message
+      expect(result.context[0].getType()).toBe('system'); // System message
+      expect(result.context[1]).toBe(messages[3]); // Message 2
+      expect(result.context[2]).toBe(messages[4]); // Response 2
+      // Should have the first two messages in messagesToRefine
+      expect(result.messagesToRefine.length).toBe(2);
+      expect(result.messagesToRefine[0]).toBe(messages[1]); // Message 1
+      expect(result.messagesToRefine[1]).toBe(messages[2]); // Response 1
+    });
+    it('should always include system message even when at token limit', () => {
+      const messages = [
+        new SystemMessage('System instruction'),
+        new HumanMessage('Hello'),
+        new AIMessage('Hi there')
+      ];
+      const indexTokenCountMap = {
+        0: 17, // "System instruction"
+        1: 5,  // "Hello"
+        2: 8   // "Hi there"
+      };
+      // Set a limit that can only fit the system message
+      const result = getMessagesWithinTokenLimit({
+        messages,
+        maxContextTokens: 20,
+        indexTokenCountMap
+      });
+      expect(result.context.length).toBe(1);
+      expect(result.context[0]).toBe(messages[0]); // System message
+      expect(result.messagesToRefine.length).toBe(2);
+    });
+  });
+  describe('checkValidNumber', () => {
+    it('should return true for valid positive numbers', () => {
+      expect(checkValidNumber(5)).toBe(true);
+      expect(checkValidNumber(1.5)).toBe(true);
+      expect(checkValidNumber(Number.MAX_SAFE_INTEGER)).toBe(true);
+    });
+    it('should return false for zero, negative numbers, and NaN', () => {
+      expect(checkValidNumber(0)).toBe(false);
+      expect(checkValidNumber(-5)).toBe(false);
+      expect(checkValidNumber(NaN)).toBe(false);
+    });
+    it('should return false for non-number types', () => {
+      expect(checkValidNumber('5')).toBe(false);
+      expect(checkValidNumber(null)).toBe(false);
+      expect(checkValidNumber(undefined)).toBe(false);
+      expect(checkValidNumber({})).toBe(false);
+      expect(checkValidNumber([])).toBe(false);
+    });
+  });
+  describe('createPruneMessages', () => {
+    it('should return all messages when under token limit', () => {
+      const tokenCounter = createTestTokenCounter();
+      const messages = [
+        new SystemMessage('System instruction'),
+        new HumanMessage('Hello'),
+        new AIMessage('Hi there')
+      ];
+      const indexTokenCountMap = {
+        0: tokenCounter(messages[0]),
+        1: tokenCounter(messages[1]),
+        2: tokenCounter(messages[2])
+      };
+      const pruneMessages = createPruneMessages({
+        maxTokens: 100,
+        startIndex: 0,
+        tokenCounter,
+        indexTokenCountMap
+      });
+      const result = pruneMessages({ messages });
+      expect(result.context.length).toBe(3);
+      expect(result.context).toEqual(messages);
+    });
+    it('should prune messages when over token limit', () => {
+      const tokenCounter = createTestTokenCounter();
+      const messages = [
+        new SystemMessage('System instruction'),
+        new HumanMessage('Message 1'),
+        new AIMessage('Response 1'),
+        new HumanMessage('Message 2'),
+        new AIMessage('Response 2')
+      ];
+      const indexTokenCountMap = {
+        0: tokenCounter(messages[0]),
+        1: tokenCounter(messages[1]),
+        2: tokenCounter(messages[2]),
+        3: tokenCounter(messages[3]),
+        4: tokenCounter(messages[4])
+      };
+      // Set a limit that can only fit the system message and the last two messages
+      const pruneMessages = createPruneMessages({
+        maxTokens: 40,
+        startIndex: 0,
+        tokenCounter,
+        indexTokenCountMap
+      });
+      const result = pruneMessages({ messages });
+      // Should include system message and the last two messages
+      expect(result.context.length).toBe(3);
+      expect(result.context[0]).toBe(messages[0]); // System message
+      expect(result.context[1]).toBe(messages[3]); // Message 2
+      expect(result.context[2]).toBe(messages[4]); // Response 2
+    });
+    it('should update token counts when usage metadata is provided', () => {
+      const tokenCounter = createTestTokenCounter();
+      const messages = [
+        new SystemMessage('System instruction'),
+        new HumanMessage('Hello'),
+        new AIMessage('Hi there')
+      ];
+      const indexTokenCountMap = {
+        0: tokenCounter(messages[0]),
+        1: tokenCounter(messages[1]),
+        2: tokenCounter(messages[2])
+      };
+      const pruneMessages = createPruneMessages({
+        maxTokens: 100,
+        startIndex: 0,
+        tokenCounter,
+        indexTokenCountMap: { ...indexTokenCountMap }
+      });
+      // Provide usage metadata that indicates different token counts
+      const usageMetadata: Partial<UsageMetadata> = {
+        input_tokens: 50,
+        output_tokens: 25,
+        total_tokens: 75
+      };
+      const result = pruneMessages({
+        messages,
+        usageMetadata
+      });
+      // The function should have updated the indexTokenCountMap based on the usage metadata
+      expect(result.indexTokenCountMap).not.toEqual(indexTokenCountMap);
+      // The total of all values in indexTokenCountMap should equal the total_tokens from usageMetadata
+      const totalTokens = Object.values(result.indexTokenCountMap).reduce((a, b) => a + b, 0);
+      expect(totalTokens).toBe(75);
+    });
+  });
+  describe('Integration with Run', () => {
+    it('should initialize Run with custom token counter and process messages', async () => {
+      const provider = Providers.OPENAI;
+      const llmConfig = getLLMConfig(provider);
+      const tokenCounter = createTestTokenCounter();
+      const run = await Run.create<t.IState>({
+        runId: 'test-prune-run',
+        graphConfig: {
+          type: 'standard',
+          llmConfig,
+          instructions: 'You are a helpful assistant.',
+        },
+        returnContent: true,
+      });
+      // Override the model to use a fake LLM
+      run.Graph?.overrideTestModel(['This is a test response'], 1);
+      const messages = [
+        new HumanMessage('Hello, how are you?')
+      ];
+      const indexTokenCountMap = {
+        0: tokenCounter(messages[0])
+      };
+      const config: Partial<RunnableConfig> & { version: 'v1' | 'v2'; streamMode: string } = {
+        configurable: {
+          thread_id: 'test-thread',
+        },
+        streamMode: 'values',
+        version: 'v2' as const,
+      };
+      await run.processStream(
+        { messages },
+        config,
+        {
+          maxContextTokens: 1000,
+          indexTokenCountMap,
+          tokenCounter,
+        }
+      );
+      const finalMessages = run.getRunMessages();
+      expect(finalMessages).toBeDefined();
+      expect(finalMessages?.length).toBeGreaterThan(0);
+    });
+  });
+});

package/src/types/run.ts CHANGED Viewed

@@ -55,7 +55,12 @@ export type RunConfig = {
 export type ProvidedCallbacks = (BaseCallbackHandler | CallbackHandlerMethods)[] | undefined;
+export type TokenCounter = (message: BaseMessage) => number;
 export type EventStreamOptions = {
   callbacks?: graph.ClientCallbacks;
   keepContent?: boolean;
+  /* Context Management */
+  maxContextTokens?: number;
+  tokenCounter?: TokenCounter;
+  indexTokenCountMap?: Record<string, number>;
 }

package/src/utils/tokens.ts ADDED Viewed

@@ -0,0 +1,70 @@
+import { Tiktoken } from "js-tiktoken/lite";
+import type { BaseMessage } from "@langchain/core/messages";
+import { ContentTypes } from "@/common/enum";
+function getTokenCountForMessage(message: BaseMessage, getTokenCount: (text: string) => number): number {
+  let tokensPerMessage = 3;
+  const processValue = (value: unknown) => {
+    if (Array.isArray(value)) {
+      for (let item of value) {
+        if (
+          !item ||
+          !item.type ||
+          item.type === ContentTypes.ERROR ||
+          item.type === ContentTypes.IMAGE_URL
+        ) {
+          continue;
+        }
+        if (item.type === ContentTypes.TOOL_CALL && item.tool_call != null) {
+          const toolName = item.tool_call?.name || '';
+          if (toolName != null && toolName && typeof toolName === 'string') {
+            numTokens += getTokenCount(toolName);
+          }
+          const args = item.tool_call?.args || '';
+          if (args != null && args && typeof args === 'string') {
+            numTokens += getTokenCount(args);
+          }
+          const output = item.tool_call?.output || '';
+          if (output != null && output && typeof output === 'string') {
+            numTokens += getTokenCount(output);
+          }
+          continue;
+        }
+        const nestedValue = item[item.type];
+        if (!nestedValue) {
+          continue;
+        }
+        processValue(nestedValue);
+      }
+    } else if (typeof value === 'string') {
+      numTokens += getTokenCount(value);
+    } else if (typeof value === 'number') {
+      numTokens += getTokenCount(value.toString());
+    } else if (typeof value === 'boolean') {
+      numTokens += getTokenCount(value.toString());
+    }
+  };
+  let numTokens = tokensPerMessage;
+  processValue(message.content);
+  return numTokens;
+}
+export const createTokenCounter = async () => {
+  const res = await fetch(`https://tiktoken.pages.dev/js/o200k_base.json`);
+  const o200k_base = await res.json();
+  const countTokens = (text: string) => {
+    const enc = new Tiktoken(o200k_base);
+    return enc.encode(text).length;
+  }
+  return (message: BaseMessage) => getTokenCountForMessage(message, countTokens);
+}