npm - @librechat/agents - Versions diffs - 3.1.73 → 3.1.75-dev.0 - Mend

@librechat/agents 3.1.73 → 3.1.75-dev.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (159) hide show

package/README.md +66 -0
package/dist/cjs/agents/AgentContext.cjs +146 -57
package/dist/cjs/agents/AgentContext.cjs.map +1 -1
package/dist/cjs/graphs/Graph.cjs +13 -3
package/dist/cjs/graphs/Graph.cjs.map +1 -1
package/dist/cjs/llm/anthropic/index.cjs +145 -52
package/dist/cjs/llm/anthropic/index.cjs.map +1 -1
package/dist/cjs/llm/anthropic/types.cjs.map +1 -1
package/dist/cjs/llm/anthropic/utils/message_inputs.cjs +25 -15
package/dist/cjs/llm/anthropic/utils/message_inputs.cjs.map +1 -1
package/dist/cjs/llm/anthropic/utils/message_outputs.cjs +84 -70
package/dist/cjs/llm/anthropic/utils/message_outputs.cjs.map +1 -1
package/dist/cjs/llm/bedrock/index.cjs +1 -1
package/dist/cjs/llm/bedrock/index.cjs.map +1 -1
package/dist/cjs/llm/bedrock/utils/message_inputs.cjs +213 -3
package/dist/cjs/llm/bedrock/utils/message_inputs.cjs.map +1 -1
package/dist/cjs/llm/bedrock/utils/message_outputs.cjs +2 -1
package/dist/cjs/llm/bedrock/utils/message_outputs.cjs.map +1 -1
package/dist/cjs/llm/google/utils/common.cjs +5 -4
package/dist/cjs/llm/google/utils/common.cjs.map +1 -1
package/dist/cjs/llm/openai/index.cjs +468 -647
package/dist/cjs/llm/openai/index.cjs.map +1 -1
package/dist/cjs/llm/openai/utils/index.cjs +1 -448
package/dist/cjs/llm/openai/utils/index.cjs.map +1 -1
package/dist/cjs/llm/openrouter/index.cjs +57 -175
package/dist/cjs/llm/openrouter/index.cjs.map +1 -1
package/dist/cjs/llm/vertexai/index.cjs +5 -3
package/dist/cjs/llm/vertexai/index.cjs.map +1 -1
package/dist/cjs/main.cjs +1 -0
package/dist/cjs/main.cjs.map +1 -1
package/dist/cjs/messages/cache.cjs +39 -4
package/dist/cjs/messages/cache.cjs.map +1 -1
package/dist/cjs/messages/core.cjs +7 -6
package/dist/cjs/messages/core.cjs.map +1 -1
package/dist/cjs/messages/format.cjs +7 -6
package/dist/cjs/messages/format.cjs.map +1 -1
package/dist/cjs/messages/langchain.cjs +26 -0
package/dist/cjs/messages/langchain.cjs.map +1 -0
package/dist/cjs/messages/prune.cjs +7 -6
package/dist/cjs/messages/prune.cjs.map +1 -1
package/dist/cjs/tools/BashExecutor.cjs +21 -11
package/dist/cjs/tools/BashExecutor.cjs.map +1 -1
package/dist/cjs/tools/CodeExecutor.cjs +37 -10
package/dist/cjs/tools/CodeExecutor.cjs.map +1 -1
package/dist/cjs/tools/ProgrammaticToolCalling.cjs +16 -11
package/dist/cjs/tools/ProgrammaticToolCalling.cjs.map +1 -1
package/dist/cjs/tools/ToolNode.cjs +5 -1
package/dist/cjs/tools/ToolNode.cjs.map +1 -1
package/dist/esm/agents/AgentContext.mjs +147 -58
package/dist/esm/agents/AgentContext.mjs.map +1 -1
package/dist/esm/graphs/Graph.mjs +13 -3
package/dist/esm/graphs/Graph.mjs.map +1 -1
package/dist/esm/llm/anthropic/index.mjs +146 -54
package/dist/esm/llm/anthropic/index.mjs.map +1 -1
package/dist/esm/llm/anthropic/types.mjs.map +1 -1
package/dist/esm/llm/anthropic/utils/message_inputs.mjs +25 -15
package/dist/esm/llm/anthropic/utils/message_inputs.mjs.map +1 -1
package/dist/esm/llm/anthropic/utils/message_outputs.mjs +84 -71
package/dist/esm/llm/anthropic/utils/message_outputs.mjs.map +1 -1
package/dist/esm/llm/bedrock/index.mjs +1 -1
package/dist/esm/llm/bedrock/index.mjs.map +1 -1
package/dist/esm/llm/bedrock/utils/message_inputs.mjs +214 -4
package/dist/esm/llm/bedrock/utils/message_inputs.mjs.map +1 -1
package/dist/esm/llm/bedrock/utils/message_outputs.mjs +2 -1
package/dist/esm/llm/bedrock/utils/message_outputs.mjs.map +1 -1
package/dist/esm/llm/google/utils/common.mjs +5 -4
package/dist/esm/llm/google/utils/common.mjs.map +1 -1
package/dist/esm/llm/openai/index.mjs +469 -648
package/dist/esm/llm/openai/index.mjs.map +1 -1
package/dist/esm/llm/openai/utils/index.mjs +4 -449
package/dist/esm/llm/openai/utils/index.mjs.map +1 -1
package/dist/esm/llm/openrouter/index.mjs +57 -175
package/dist/esm/llm/openrouter/index.mjs.map +1 -1
package/dist/esm/llm/vertexai/index.mjs +5 -3
package/dist/esm/llm/vertexai/index.mjs.map +1 -1
package/dist/esm/main.mjs +1 -1
package/dist/esm/messages/cache.mjs +39 -4
package/dist/esm/messages/cache.mjs.map +1 -1
package/dist/esm/messages/core.mjs +7 -6
package/dist/esm/messages/core.mjs.map +1 -1
package/dist/esm/messages/format.mjs +7 -6
package/dist/esm/messages/format.mjs.map +1 -1
package/dist/esm/messages/langchain.mjs +23 -0
package/dist/esm/messages/langchain.mjs.map +1 -0
package/dist/esm/messages/prune.mjs +7 -6
package/dist/esm/messages/prune.mjs.map +1 -1
package/dist/esm/tools/BashExecutor.mjs +22 -12
package/dist/esm/tools/BashExecutor.mjs.map +1 -1
package/dist/esm/tools/CodeExecutor.mjs +37 -11
package/dist/esm/tools/CodeExecutor.mjs.map +1 -1
package/dist/esm/tools/ProgrammaticToolCalling.mjs +17 -12
package/dist/esm/tools/ProgrammaticToolCalling.mjs.map +1 -1
package/dist/esm/tools/ToolNode.mjs +5 -1
package/dist/esm/tools/ToolNode.mjs.map +1 -1
package/dist/types/agents/AgentContext.d.ts +29 -4
package/dist/types/agents/__tests__/promptCacheLiveHelpers.d.ts +46 -0
package/dist/types/llm/anthropic/index.d.ts +22 -9
package/dist/types/llm/anthropic/types.d.ts +5 -1
package/dist/types/llm/anthropic/utils/message_outputs.d.ts +13 -6
package/dist/types/llm/anthropic/utils/output_parsers.d.ts +1 -1
package/dist/types/llm/openai/index.d.ts +21 -24
package/dist/types/llm/openrouter/index.d.ts +11 -9
package/dist/types/llm/vertexai/index.d.ts +1 -0
package/dist/types/messages/cache.d.ts +4 -1
package/dist/types/messages/langchain.d.ts +27 -0
package/dist/types/tools/CodeExecutor.d.ts +6 -0
package/dist/types/types/graph.d.ts +26 -38
package/dist/types/types/llm.d.ts +3 -3
package/dist/types/types/run.d.ts +2 -0
package/dist/types/types/stream.d.ts +1 -1
package/dist/types/types/tools.d.ts +9 -0
package/package.json +17 -16
package/src/agents/AgentContext.ts +189 -71
package/src/agents/__tests__/AgentContext.anthropic.live.test.ts +116 -0
package/src/agents/__tests__/AgentContext.bedrock.live.test.ts +149 -0
package/src/agents/__tests__/AgentContext.test.ts +333 -2
package/src/agents/__tests__/promptCacheLiveHelpers.ts +165 -0
package/src/graphs/Graph.ts +24 -4
package/src/graphs/__tests__/composition.smoke.test.ts +188 -0
package/src/llm/anthropic/index.ts +252 -84
package/src/llm/anthropic/llm.spec.ts +751 -102
package/src/llm/anthropic/types.ts +9 -1
package/src/llm/anthropic/utils/message_inputs.ts +43 -20
package/src/llm/anthropic/utils/message_outputs.ts +119 -101
package/src/llm/anthropic/utils/server-tool-inputs.test.ts +77 -0
package/src/llm/bedrock/index.ts +2 -2
package/src/llm/bedrock/llm.spec.ts +341 -0
package/src/llm/bedrock/utils/message_inputs.ts +303 -4
package/src/llm/bedrock/utils/message_outputs.ts +2 -1
package/src/llm/custom-chat-models.smoke.test.ts +662 -0
package/src/llm/google/llm.spec.ts +339 -57
package/src/llm/google/utils/common.ts +53 -48
package/src/llm/openai/contentBlocks.test.ts +346 -0
package/src/llm/openai/index.ts +736 -837
package/src/llm/openai/utils/index.ts +84 -64
package/src/llm/openrouter/index.ts +124 -247
package/src/llm/openrouter/reasoning.test.ts +8 -1
package/src/llm/vertexai/index.ts +11 -5
package/src/llm/vertexai/llm.spec.ts +28 -1
package/src/messages/cache.test.ts +106 -4
package/src/messages/cache.ts +57 -5
package/src/messages/core.ts +16 -9
package/src/messages/format.ts +9 -6
package/src/messages/langchain.ts +39 -0
package/src/messages/prune.ts +12 -8
package/src/scripts/caching.ts +2 -3
package/src/specs/anthropic.simple.test.ts +61 -0
package/src/specs/summarization.test.ts +58 -61
package/src/tools/BashExecutor.ts +37 -13
package/src/tools/CodeExecutor.ts +55 -11
package/src/tools/ProgrammaticToolCalling.ts +29 -14
package/src/tools/ToolNode.ts +5 -1
package/src/tools/__tests__/ProgrammaticToolCalling.test.ts +60 -0
package/src/types/graph.ts +35 -88
package/src/types/llm.ts +3 -3
package/src/types/run.ts +2 -0
package/src/types/stream.ts +1 -1
package/src/types/tools.ts +9 -0
package/src/utils/llmConfig.ts +1 -6

package/src/llm/openrouter/index.ts CHANGED Viewed

@@ -1,33 +1,12 @@
 import { ChatOpenAI } from '@/llm/openai';
-import { ChatGenerationChunk } from '@langchain/core/outputs';
-import { CallbackManagerForLLMRun } from '@langchain/core/callbacks/manager';
-import { AIMessageChunk as AIMessageChunkClass } from '@langchain/core/messages';
-import type {
-  FunctionMessageChunk,
-  SystemMessageChunk,
-  HumanMessageChunk,
-  ToolMessageChunk,
-  ChatMessageChunk,
-  AIMessageChunk,
-  BaseMessage,
-} from '@langchain/core/messages';
+import type { BaseMessage } from '@langchain/core/messages';
+import type { ChatGenerationChunk } from '@langchain/core/outputs';
+import type { CallbackManagerForLLMRun } from '@langchain/core/callbacks/manager';
 import type {
   ChatOpenAICallOptions,
   OpenAIChatInput,
   OpenAIClient,
 } from '@langchain/openai';
-import { _convertMessagesToOpenAIParams } from '@/llm/openai/utils';
-type OpenAICompletionParam =
-  OpenAIClient.Chat.Completions.ChatCompletionMessageParam;
-type OpenAIRoleEnum =
-  | 'system'
-  | 'developer'
-  | 'assistant'
-  | 'user'
-  | 'function'
-  | 'tool';
 export type OpenRouterReasoningEffort =
   | 'xhigh'
@@ -52,6 +31,10 @@ export interface ChatOpenRouterCallOptions
   modelKwargs?: OpenAIChatInput['modelKwargs'];
 }
+export type ChatOpenRouterInput = Partial<
+  ChatOpenRouterCallOptions & OpenAIChatInput
+>;
 /** invocationParams return type extended with OpenRouter reasoning */
 export type OpenRouterInvocationParams = Omit<
   OpenAIClient.Chat.ChatCompletionCreateParams,
@@ -59,12 +42,68 @@ export type OpenRouterInvocationParams = Omit<
 > & {
   reasoning?: OpenRouterReasoning;
 };
+type InvocationParamsExtra = {
+  streaming?: boolean;
+};
+interface OpenRouterReasoningTextDetail {
+  type: 'reasoning.text';
+  text?: string;
+  format?: string;
+  index?: number;
+}
+interface OpenRouterReasoningEncryptedDetail {
+  type: 'reasoning.encrypted';
+  id?: string;
+  data?: string;
+  format?: string;
+  index?: number;
+}
+type OpenRouterReasoningDetail =
+  | OpenRouterReasoningTextDetail
+  | OpenRouterReasoningEncryptedDetail;
+function isReasoningTextDetail(
+  value: unknown
+): value is OpenRouterReasoningTextDetail {
+  return (
+    typeof value === 'object' &&
+    value !== null &&
+    'type' in value &&
+    value.type === 'reasoning.text'
+  );
+}
+function isReasoningEncryptedDetail(
+  value: unknown
+): value is OpenRouterReasoningEncryptedDetail {
+  return (
+    typeof value === 'object' &&
+    value !== null &&
+    'type' in value &&
+    value.type === 'reasoning.encrypted'
+  );
+}
+function getReasoningDetails(value: unknown): OpenRouterReasoningDetail[] {
+  if (!Array.isArray(value)) {
+    return [];
+  }
+  return value.filter(
+    (detail): detail is OpenRouterReasoningDetail =>
+      isReasoningTextDetail(detail) || isReasoningEncryptedDetail(detail)
+  );
+}
 export class ChatOpenRouter extends ChatOpenAI {
   private openRouterReasoning?: OpenRouterReasoning;
   /** @deprecated Use `reasoning` object instead */
   private includeReasoning?: boolean;
-  constructor(_fields: Partial<ChatOpenRouterCallOptions>) {
+  constructor(_fields: ChatOpenRouterInput) {
     const {
       include_reasoning,
       reasoning: openRouterReasoning,
@@ -80,6 +119,8 @@ export class ChatOpenRouter extends ChatOpenAI {
     super({
       ...fields,
       modelKwargs: restModelKwargs,
+      includeReasoningDetails: true,
+      convertReasoningDetailsToContent: true,
     });
     // Merge reasoning config: modelKwargs.reasoning < constructor reasoning
@@ -101,21 +142,26 @@ export class ChatOpenRouter extends ChatOpenAI {
   // The parent's generic conditional return type cannot be widened in an override.
   override invocationParams(
     options?: this['ParsedCallOptions'],
-    extra?: { streaming?: boolean }
+    extra?: InvocationParamsExtra
   ): OpenRouterInvocationParams {
     type MutableParams = Omit<
       OpenAIClient.Chat.ChatCompletionCreateParams,
       'messages'
     > & { reasoning_effort?: string; reasoning?: OpenRouterReasoning };
-    const params = super.invocationParams(options, extra) as MutableParams;
+    const optionsWithDefaults = this._combineCallOptions(options);
+    const params = (
+      this._useResponsesApi(options)
+        ? this.responses.invocationParams(optionsWithDefaults)
+        : this.completions.invocationParams(optionsWithDefaults, extra)
+    ) as MutableParams;
     // Remove the OpenAI-native reasoning_effort that the parent sets;
     // OpenRouter uses a `reasoning` object instead
     delete params.reasoning_effort;
     // Build the OpenRouter reasoning config
-    const reasoning = this.buildOpenRouterReasoning(options);
+    const reasoning = this.buildOpenRouterReasoning(optionsWithDefaults);
     if (reasoning != null) {
       params.reasoning = reasoning;
     } else {
@@ -158,245 +204,76 @@ export class ChatOpenRouter extends ChatOpenAI {
     return reasoning;
   }
-  protected override _convertOpenAIDeltaToBaseMessageChunk(
-    // eslint-disable-next-line @typescript-eslint/no-explicit-any
-    delta: Record<string, any>,
-    rawResponse: OpenAIClient.ChatCompletionChunk,
-    defaultRole?:
-      | 'function'
-      | 'user'
-      | 'system'
-      | 'developer'
-      | 'assistant'
-      | 'tool'
-  ):
-    | AIMessageChunk
-    | HumanMessageChunk
-    | SystemMessageChunk
-    | FunctionMessageChunk
-    | ToolMessageChunk
-    | ChatMessageChunk {
-    const messageChunk = super._convertOpenAIDeltaToBaseMessageChunk(
-      delta,
-      rawResponse,
-      defaultRole
-    );
-    if (delta.reasoning != null) {
-      messageChunk.additional_kwargs.reasoning = delta.reasoning;
-    }
-    if (delta.reasoning_details != null) {
-      messageChunk.additional_kwargs.reasoning_details =
-        delta.reasoning_details;
-    }
-    return messageChunk;
-  }
-  async *_streamResponseChunks2(
+  override async *_streamResponseChunks(
     messages: BaseMessage[],
     options: this['ParsedCallOptions'],
     runManager?: CallbackManagerForLLMRun
   ): AsyncGenerator<ChatGenerationChunk> {
-    const messagesMapped: OpenAICompletionParam[] =
-      _convertMessagesToOpenAIParams(messages, this.model, {
-        includeReasoningDetails: true,
-        convertReasoningDetailsToContent: true,
-      });
-    const params = {
-      ...this.invocationParams(options, {
-        streaming: true,
-      }),
-      messages: messagesMapped,
-      stream: true as const,
-    };
-    let defaultRole: OpenAIRoleEnum | undefined;
-    const streamIterable = await this.completionWithRetry(params, options);
-    let usage: OpenAIClient.Completions.CompletionUsage | undefined;
-    // Store reasoning_details keyed by unique identifier to prevent incorrect merging
-    // eslint-disable-next-line @typescript-eslint/no-explicit-any
-    const reasoningTextByIndex: Map<number, Record<string, any>> = new Map();
-    // eslint-disable-next-line @typescript-eslint/no-explicit-any
-    const reasoningEncryptedById: Map<string, Record<string, any>> = new Map();
-    for await (const data of streamIterable) {
-      const choice = data.choices[0] as
-        | Partial<OpenAIClient.Chat.Completions.ChatCompletionChunk.Choice>
-        | undefined;
-      if (data.usage) {
-        usage = data.usage;
-      }
-      if (!choice) {
-        continue;
-      }
-      const { delta } = choice;
-      if (!delta) {
-        continue;
-      }
+    const reasoningTextByIndex = new Map<
+      number,
+      OpenRouterReasoningTextDetail
+    >();
+    const reasoningEncryptedById = new Map<
+      string,
+      OpenRouterReasoningEncryptedDetail
+    >();
+    for await (const generationChunk of super._streamResponseChunks(
+      messages,
+      options,
+      runManager
+    )) {
+      let currentReasoningText = '';
+      const reasoningDetails = getReasoningDetails(
+        generationChunk.message.additional_kwargs.reasoning_details
+      );
-      // Accumulate reasoning_details from each delta
-      // eslint-disable-next-line @typescript-eslint/no-explicit-any
-      const deltaAny = delta as Record<string, any>;
-      // Extract current chunk's reasoning text for streaming (before accumulation)
-      let currentChunkReasoningText = '';
-      if (
-        deltaAny.reasoning_details != null &&
-        Array.isArray(deltaAny.reasoning_details)
-      ) {
-        for (const detail of deltaAny.reasoning_details) {
-          // For encrypted reasoning (thought signatures), store by ID - MUST be separate
-          if (detail.type === 'reasoning.encrypted' && detail.id) {
-            reasoningEncryptedById.set(detail.id, {
-              type: detail.type,
-              id: detail.id,
-              data: detail.data,
-              format: detail.format,
-              index: detail.index,
-            });
-          } else if (detail.type === 'reasoning.text') {
-            // Extract current chunk's text for streaming
-            currentChunkReasoningText += detail.text || '';
-            // For text reasoning, accumulate text by index for final message
-            const idx = detail.index ?? 0;
-            const existing = reasoningTextByIndex.get(idx);
-            if (existing) {
-              // Only append text, keep other fields from first entry
-              existing.text = (existing.text || '') + (detail.text || '');
-            } else {
-              reasoningTextByIndex.set(idx, {
-                type: detail.type,
-                text: detail.text || '',
-                format: detail.format,
-                index: idx,
-              });
-            }
+      for (const detail of reasoningDetails) {
+        if (detail.type === 'reasoning.text') {
+          currentReasoningText += detail.text ?? '';
+          const index = detail.index ?? 0;
+          const existing = reasoningTextByIndex.get(index);
+          if (existing != null) {
+            existing.text = `${existing.text ?? ''}${detail.text ?? ''}`;
+            continue;
           }
+          reasoningTextByIndex.set(index, {
+            ...detail,
+            text: detail.text ?? '',
+          });
+          continue;
+        }
+        if (detail.id != null) {
+          reasoningEncryptedById.set(detail.id, { ...detail });
         }
       }
-      const chunk = this._convertOpenAIDeltaToBaseMessageChunk(
-        delta,
-        data,
-        defaultRole
-      );
-      // For models that send reasoning_details (Gemini style) instead of reasoning (DeepSeek style),
-      // set the current chunk's reasoning text to additional_kwargs.reasoning for streaming
-      if (currentChunkReasoningText && !chunk.additional_kwargs.reasoning) {
-        chunk.additional_kwargs.reasoning = currentChunkReasoningText;
+      if (
+        currentReasoningText.length > 0 &&
+        generationChunk.message.additional_kwargs.reasoning == null
+      ) {
+        generationChunk.message.additional_kwargs.reasoning =
+          currentReasoningText;
       }
-      // IMPORTANT: Only set reasoning_details on the FINAL chunk to prevent
-      // LangChain's chunk concatenation from corrupting the array
-      // Check if this is the final chunk (has finish_reason)
-      if (choice.finish_reason != null) {
-        // Build properly structured reasoning_details array
-        // Text entries first (but we only need the encrypted ones for thought signatures)
-        // eslint-disable-next-line @typescript-eslint/no-explicit-any
-        const finalReasoningDetails: Record<string, any>[] = [
+      if (generationChunk.generationInfo?.finish_reason != null) {
+        const finalReasoningDetails = [
           ...reasoningTextByIndex.values(),
           ...reasoningEncryptedById.values(),
         ];
         if (finalReasoningDetails.length > 0) {
-          chunk.additional_kwargs.reasoning_details = finalReasoningDetails;
+          generationChunk.message.additional_kwargs.reasoning_details =
+            finalReasoningDetails;
+        } else {
+          delete generationChunk.message.additional_kwargs.reasoning_details;
         }
-      } else {
-        // Clear reasoning_details from intermediate chunks to prevent concatenation issues
-        delete chunk.additional_kwargs.reasoning_details;
-      }
-      defaultRole = delta.role ?? defaultRole;
-      const newTokenIndices = {
-        prompt: options.promptIndex ?? 0,
-        completion: choice.index ?? 0,
-      };
-      if (typeof chunk.content !== 'string') {
-        // eslint-disable-next-line no-console
-        console.log(
-          '[WARNING]: Received non-string content from OpenAI. This is currently not supported.'
-        );
+        yield generationChunk;
         continue;
       }
-      // eslint-disable-next-line @typescript-eslint/no-explicit-any
-      const generationInfo: Record<string, any> = { ...newTokenIndices };
-      if (choice.finish_reason != null) {
-        generationInfo.finish_reason = choice.finish_reason;
-        generationInfo.system_fingerprint = data.system_fingerprint;
-        generationInfo.model_name = data.model;
-        generationInfo.service_tier = data.service_tier;
-      }
-      if (this.logprobs == true) {
-        generationInfo.logprobs = choice.logprobs;
-      }
-      const generationChunk = new ChatGenerationChunk({
-        message: chunk,
-        text: chunk.content,
-        generationInfo,
-      });
-      yield generationChunk;
-      if (this._lc_stream_delay != null) {
-        await new Promise((resolve) =>
-          setTimeout(resolve, this._lc_stream_delay)
-        );
-      }
-      await runManager?.handleLLMNewToken(
-        generationChunk.text || '',
-        newTokenIndices,
-        undefined,
-        undefined,
-        undefined,
-        { chunk: generationChunk }
-      );
-    }
-    if (usage) {
-      const inputTokenDetails = {
-        ...(usage.prompt_tokens_details?.audio_tokens != null && {
-          audio: usage.prompt_tokens_details.audio_tokens,
-        }),
-        ...(usage.prompt_tokens_details?.cached_tokens != null && {
-          cache_read: usage.prompt_tokens_details.cached_tokens,
-        }),
-      };
-      const outputTokenDetails = {
-        ...(usage.completion_tokens_details?.audio_tokens != null && {
-          audio: usage.completion_tokens_details.audio_tokens,
-        }),
-        ...(usage.completion_tokens_details?.reasoning_tokens != null && {
-          reasoning: usage.completion_tokens_details.reasoning_tokens,
-        }),
-      };
-      const generationChunk = new ChatGenerationChunk({
-        message: new AIMessageChunkClass({
-          content: '',
-          response_metadata: {
-            usage: { ...usage },
-          },
-          usage_metadata: {
-            input_tokens: usage.prompt_tokens,
-            output_tokens: usage.completion_tokens,
-            total_tokens: usage.total_tokens,
-            ...(Object.keys(inputTokenDetails).length > 0 && {
-              input_token_details: inputTokenDetails,
-            }),
-            ...(Object.keys(outputTokenDetails).length > 0 && {
-              output_token_details: outputTokenDetails,
-            }),
-          },
-        }),
-        text: '',
-      });
+      delete generationChunk.message.additional_kwargs.reasoning_details;
       yield generationChunk;
-      if (this._lc_stream_delay != null) {
-        await new Promise((resolve) =>
-          setTimeout(resolve, this._lc_stream_delay)
-        );
-      }
-    }
-    if (options.signal?.aborted === true) {
-      throw new Error('AbortError');
     }
   }
 }

package/src/llm/openrouter/reasoning.test.ts CHANGED Viewed

@@ -3,7 +3,8 @@ import type { OpenRouterReasoning, ChatOpenRouterCallOptions } from './index';
 import type { OpenAIChatInput } from '@langchain/openai';
 type CreateRouterOptions = Partial<
-  ChatOpenRouterCallOptions & Pick<OpenAIChatInput, 'model' | 'apiKey'>
+  ChatOpenRouterCallOptions &
+    Pick<OpenAIChatInput, 'model' | 'apiKey' | 'streamUsage'>
 >;
 function createRouter(overrides: CreateRouterOptions = {}): ChatOpenRouter {
@@ -96,6 +97,12 @@ describe('ChatOpenRouter reasoning handling', () => {
       expect(params.reasoning).toBeUndefined();
       expect(params.reasoning_effort).toBeUndefined();
     });
+    it('preserves streaming extras from parent invocation params', () => {
+      const router = createRouter({ streamUsage: true });
+      const params = router.invocationParams(undefined, { streaming: true });
+      expect(params.stream_options).toEqual({ include_usage: true });
+    });
   });
   // ---------------------------------------------------------------

package/src/llm/vertexai/index.ts CHANGED Viewed

@@ -97,10 +97,7 @@ class CustomChatConnection extends ChatConnection<VertexAIClientOptions> {
       }
       delete formattedData.generationConfig.thinkingConfig.thinkingBudget;
     }
-    if (
-      this.thinkingConfig?.thinkingLevel != null &&
-      this.thinkingConfig.thinkingLevel !== ''
-    ) {
+    if (this.thinkingConfig?.thinkingLevel != null) {
       formattedData.generationConfig ??= {};
       // thinkingLevel and thinkingBudget cannot coexist — the API rejects the request.
       // Remove thinkingBudget when thinkingLevel is set.
@@ -422,7 +419,16 @@ export class ChatVertexAI extends ChatGoogle {
     return 'LibreChatVertexAI';
   }
-  constructor(fields?: VertexAIClientOptions) {
+  constructor(model: string, fields?: Omit<VertexAIClientOptions, 'model'>);
+  constructor(fields?: VertexAIClientOptions);
+  constructor(
+    modelOrFields?: string | VertexAIClientOptions,
+    params?: Omit<VertexAIClientOptions, 'model'>
+  ) {
+    const fields =
+      typeof modelOrFields === 'string'
+        ? { ...(params ?? {}), model: modelOrFields }
+        : modelOrFields;
     const dynamicThinkingBudget = fields?.thinkingBudget === -1;
     super({
       ...fields,

package/src/llm/vertexai/llm.spec.ts CHANGED Viewed

@@ -1,6 +1,6 @@
 import { config } from 'dotenv';
 config();
-import { test, describe, jest } from '@jest/globals';
+import { expect, test, describe, jest } from '@jest/globals';
 jest.setTimeout(90000);
 import {
@@ -26,6 +26,33 @@ const weatherTool = tool(async () => 'The weather is 80 degrees and sunny', {
   }),
 });
+describe('ChatVertexAI upstream compatibility', () => {
+  test('serialization uses the LibreChat constructor name on the Vertex namespace', () => {
+    const model = new ChatVertexAI();
+    expect(JSON.stringify(model)).toEqual(
+      '{"lc":1,"type":"constructor","id":["langchain","chat_models","vertexai","LibreChatVertexAI"],"kwargs":{"platform_type":"gcp"}}'
+    );
+  });
+  test('labels parameter support', () => {
+    expect(() => {
+      const model = new ChatVertexAI({
+        labels: {
+          team: 'test',
+          environment: 'development',
+        },
+      });
+      expect(model.platform).toEqual('gcp');
+    }).not.toThrow();
+  });
+  test('constructor overload supports model string', () => {
+    const model = new ChatVertexAI('gemini-1.5-pro');
+    expect(model.model).toEqual('gemini-1.5-pro');
+    expect(model.platform).toEqual('gcp');
+  });
+});
 describe.each(gemini3Models)(
   'Vertex AI reasoning with thinkingLevel (%s)',
   (modelName) => {

package/src/messages/cache.test.ts CHANGED Viewed

@@ -1,10 +1,11 @@
 import {
   AIMessage,
   BaseMessage,
-  ToolMessage,
   HumanMessage,
-  MessageContentComplex,
+  SystemMessage,
+  ToolMessage,
 } from '@langchain/core/messages';
+import type { MessageContentComplex } from '@langchain/core/messages';
 import type Anthropic from '@anthropic-ai/sdk';
 import type { AnthropicMessages } from '@/types/messages';
 import {
@@ -13,6 +14,7 @@ import {
   addBedrockCacheControl,
   addCacheControl,
 } from './cache';
+import { toLangChainContent } from './langchain';
 import { ContentTypes } from '@/common/enum';
 describe('addCacheControl', () => {
@@ -404,7 +406,107 @@ describe('addBedrockCacheControl (Bedrock cache checkpoints)', () => {
     expect(first[1]).toEqual({ cachePoint: { type: 'default' } });
   });
-  it('works with the example from the langchain pr (with multi-turn behavior)', () => {
+  it('preserves LangChain system message content unchanged', () => {
+    const systemContent = [
+      { type: ContentTypes.TEXT, text: 'Stable system text' },
+      { cachePoint: { type: 'default' } },
+      { type: ContentTypes.TEXT, text: 'Dynamic system text' },
+    ] as MessageContentComplex[];
+    const messages: BaseMessage[] = [
+      new SystemMessage({ content: toLangChainContent(systemContent) }),
+      new HumanMessage('Hello'),
+      new AIMessage('Hi'),
+    ];
+    const result = addBedrockCacheControl(messages);
+    expect(result[0]).toBe(messages[0]);
+    expect(result[0].content).toEqual(systemContent);
+  });
+  it('preserves serialized system message content unchanged', () => {
+    const systemContent = [
+      { type: ContentTypes.TEXT, text: 'Stable system text' },
+      { cachePoint: { type: 'default' } },
+      { type: ContentTypes.TEXT, text: 'Dynamic system text' },
+    ] as MessageContentComplex[];
+    const messages: TestMsg[] = [
+      { role: 'system', content: systemContent },
+      { role: 'user', content: 'Hello' },
+      { role: 'assistant', content: 'Hi' },
+    ];
+    const result = addBedrockCacheControl(messages);
+    expect(result[0]).toBe(messages[0]);
+    expect(result[0].content).toEqual(systemContent);
+  });
+  it('strips Anthropic cache_control from LangChain system messages without moving cache points', () => {
+    const systemContent = [
+      {
+        type: ContentTypes.TEXT,
+        text: 'Stable system text',
+        cache_control: { type: 'ephemeral' },
+      } as MessageContentComplex,
+      { cachePoint: { type: 'default' } },
+      {
+        type: ContentTypes.TEXT,
+        text: 'Dynamic system text',
+        cache_control: { type: 'ephemeral' },
+      } as MessageContentComplex,
+    ] as MessageContentComplex[];
+    const messages: BaseMessage[] = [
+      new SystemMessage({ content: toLangChainContent(systemContent) }),
+      new HumanMessage('Hello'),
+      new AIMessage('Hi'),
+    ];
+    const result = addBedrockCacheControl(messages);
+    expect(result[0]).not.toBe(messages[0]);
+    expect(result[0].content).toEqual([
+      { type: ContentTypes.TEXT, text: 'Stable system text' },
+      { cachePoint: { type: 'default' } },
+      { type: ContentTypes.TEXT, text: 'Dynamic system text' },
+    ]);
+    expect(systemContent[0]).toHaveProperty('cache_control');
+    expect(systemContent[2]).toHaveProperty('cache_control');
+  });
+  it('strips Anthropic cache_control from serialized system messages without moving cache points', () => {
+    const systemContent = [
+      {
+        type: ContentTypes.TEXT,
+        text: 'Stable system text',
+        cache_control: { type: 'ephemeral' },
+      } as MessageContentComplex,
+      { cachePoint: { type: 'default' } },
+      {
+        type: ContentTypes.TEXT,
+        text: 'Dynamic system text',
+        cache_control: { type: 'ephemeral' },
+      } as MessageContentComplex,
+    ] as MessageContentComplex[];
+    const messages: TestMsg[] = [
+      { role: 'system', content: systemContent },
+      { role: 'user', content: 'Hello' },
+      { role: 'assistant', content: 'Hi' },
+    ];
+    const result = addBedrockCacheControl(messages);
+    expect(result[0]).not.toBe(messages[0]);
+    expect(result[0].content).toEqual([
+      { type: ContentTypes.TEXT, text: 'Stable system text' },
+      { cachePoint: { type: 'default' } },
+      { type: ContentTypes.TEXT, text: 'Dynamic system text' },
+    ]);
+    expect(systemContent[0]).toHaveProperty('cache_control');
+    expect(systemContent[2]).toHaveProperty('cache_control');
+  });
+  it('skips serialized system messages while adding cache points to non-system turns', () => {
     const messages: TestMsg[] = [
       {
         role: 'system',
@@ -429,7 +531,7 @@ describe('addBedrockCacheControl (Bedrock cache checkpoints)', () => {
       type: ContentTypes.TEXT,
       text: 'You\'re an advanced AI assistant.',
     });
-    expect(system[1]).toEqual({ cachePoint: { type: 'default' } });
+    expect(system).toHaveLength(1);
     expect(user[0]).toEqual({
       type: ContentTypes.TEXT,
       text: 'What is the capital of France?',