npm - illuma-agents - Versions diffs - 1.0.9 → 1.0.11 - Mend

illuma-agents 1.0.9 → 1.0.11

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (146) hide show

package/LICENSE +1 -1
package/dist/cjs/agents/AgentContext.cjs +228 -27
package/dist/cjs/agents/AgentContext.cjs.map +1 -1
package/dist/cjs/common/enum.cjs +2 -0
package/dist/cjs/common/enum.cjs.map +1 -1
package/dist/cjs/events.cjs +3 -0
package/dist/cjs/events.cjs.map +1 -1
package/dist/cjs/graphs/Graph.cjs +29 -19
package/dist/cjs/graphs/Graph.cjs.map +1 -1
package/dist/cjs/instrumentation.cjs +1 -1
package/dist/cjs/instrumentation.cjs.map +1 -1
package/dist/cjs/llm/anthropic/index.cjs +1 -1
package/dist/cjs/llm/anthropic/index.cjs.map +1 -1
package/dist/cjs/llm/bedrock/index.cjs +122 -7
package/dist/cjs/llm/bedrock/index.cjs.map +1 -1
package/dist/cjs/llm/google/index.cjs +1 -1
package/dist/cjs/llm/google/index.cjs.map +1 -1
package/dist/cjs/llm/openai/index.cjs +108 -6
package/dist/cjs/llm/openai/index.cjs.map +1 -1
package/dist/cjs/llm/openai/utils/index.cjs +87 -1
package/dist/cjs/llm/openai/utils/index.cjs.map +1 -1
package/dist/cjs/llm/openrouter/index.cjs +176 -2
package/dist/cjs/llm/openrouter/index.cjs.map +1 -1
package/dist/cjs/main.cjs +18 -0
package/dist/cjs/main.cjs.map +1 -1
package/dist/cjs/messages/cache.cjs +149 -54
package/dist/cjs/messages/cache.cjs.map +1 -1
package/dist/cjs/messages/tools.cjs +85 -0
package/dist/cjs/messages/tools.cjs.map +1 -0
package/dist/cjs/stream.cjs +20 -0
package/dist/cjs/stream.cjs.map +1 -1
package/dist/cjs/tools/CodeExecutor.cjs +4 -0
package/dist/cjs/tools/CodeExecutor.cjs.map +1 -1
package/dist/cjs/tools/ProgrammaticToolCalling.cjs +438 -0
package/dist/cjs/tools/ProgrammaticToolCalling.cjs.map +1 -0
package/dist/cjs/tools/ToolNode.cjs +54 -6
package/dist/cjs/tools/ToolNode.cjs.map +1 -1
package/dist/cjs/tools/ToolSearchRegex.cjs +455 -0
package/dist/cjs/tools/ToolSearchRegex.cjs.map +1 -0
package/dist/cjs/tools/search/tool.cjs +21 -1
package/dist/cjs/tools/search/tool.cjs.map +1 -1
package/dist/cjs/utils/run.cjs +5 -1
package/dist/cjs/utils/run.cjs.map +1 -1
package/dist/esm/agents/AgentContext.mjs +228 -27
package/dist/esm/agents/AgentContext.mjs.map +1 -1
package/dist/esm/common/enum.mjs +2 -0
package/dist/esm/common/enum.mjs.map +1 -1
package/dist/esm/events.mjs +4 -1
package/dist/esm/events.mjs.map +1 -1
package/dist/esm/graphs/Graph.mjs +29 -19
package/dist/esm/graphs/Graph.mjs.map +1 -1
package/dist/esm/instrumentation.mjs +1 -1
package/dist/esm/instrumentation.mjs.map +1 -1
package/dist/esm/llm/anthropic/index.mjs +1 -1
package/dist/esm/llm/anthropic/index.mjs.map +1 -1
package/dist/esm/llm/bedrock/index.mjs +122 -7
package/dist/esm/llm/bedrock/index.mjs.map +1 -1
package/dist/esm/llm/google/index.mjs +1 -1
package/dist/esm/llm/google/index.mjs.map +1 -1
package/dist/esm/llm/openai/index.mjs +109 -7
package/dist/esm/llm/openai/index.mjs.map +1 -1
package/dist/esm/llm/openai/utils/index.mjs +88 -2
package/dist/esm/llm/openai/utils/index.mjs.map +1 -1
package/dist/esm/llm/openrouter/index.mjs +176 -2
package/dist/esm/llm/openrouter/index.mjs.map +1 -1
package/dist/esm/main.mjs +3 -0
package/dist/esm/main.mjs.map +1 -1
package/dist/esm/messages/cache.mjs +149 -54
package/dist/esm/messages/cache.mjs.map +1 -1
package/dist/esm/messages/tools.mjs +82 -0
package/dist/esm/messages/tools.mjs.map +1 -0
package/dist/esm/stream.mjs +20 -0
package/dist/esm/stream.mjs.map +1 -1
package/dist/esm/tools/CodeExecutor.mjs +4 -0
package/dist/esm/tools/CodeExecutor.mjs.map +1 -1
package/dist/esm/tools/ProgrammaticToolCalling.mjs +430 -0
package/dist/esm/tools/ProgrammaticToolCalling.mjs.map +1 -0
package/dist/esm/tools/ToolNode.mjs +54 -6
package/dist/esm/tools/ToolNode.mjs.map +1 -1
package/dist/esm/tools/ToolSearchRegex.mjs +448 -0
package/dist/esm/tools/ToolSearchRegex.mjs.map +1 -0
package/dist/esm/tools/search/tool.mjs +21 -1
package/dist/esm/tools/search/tool.mjs.map +1 -1
package/dist/esm/utils/run.mjs +5 -1
package/dist/esm/utils/run.mjs.map +1 -1
package/dist/types/agents/AgentContext.d.ts +65 -5
package/dist/types/common/enum.d.ts +2 -0
package/dist/types/graphs/Graph.d.ts +3 -2
package/dist/types/index.d.ts +2 -0
package/dist/types/llm/anthropic/index.d.ts +1 -1
package/dist/types/llm/bedrock/index.d.ts +31 -4
package/dist/types/llm/google/index.d.ts +1 -1
package/dist/types/llm/openai/index.d.ts +4 -3
package/dist/types/llm/openai/utils/index.d.ts +10 -1
package/dist/types/llm/openrouter/index.d.ts +5 -2
package/dist/types/messages/cache.d.ts +23 -8
package/dist/types/messages/index.d.ts +1 -0
package/dist/types/messages/tools.d.ts +17 -0
package/dist/types/test/mockTools.d.ts +28 -0
package/dist/types/tools/ProgrammaticToolCalling.d.ts +91 -0
package/dist/types/tools/ToolNode.d.ts +10 -2
package/dist/types/tools/ToolSearchRegex.d.ts +80 -0
package/dist/types/types/graph.d.ts +7 -1
package/dist/types/types/tools.d.ts +138 -0
package/package.json +8 -3
package/src/agents/AgentContext.ts +267 -27
package/src/agents/__tests__/AgentContext.test.ts +805 -0
package/src/common/enum.ts +2 -0
package/src/events.ts +5 -1
package/src/graphs/Graph.ts +35 -20
package/src/index.ts +2 -0
package/src/instrumentation.ts +1 -1
package/src/llm/anthropic/index.ts +2 -2
package/src/llm/bedrock/__tests__/bedrock-caching.test.ts +473 -0
package/src/llm/bedrock/index.ts +150 -13
package/src/llm/google/index.ts +2 -2
package/src/llm/google/llm.spec.ts +3 -1
package/src/llm/openai/index.ts +135 -9
package/src/llm/openai/utils/index.ts +116 -1
package/src/llm/openrouter/index.ts +224 -3
package/src/messages/__tests__/tools.test.ts +473 -0
package/src/messages/cache.ts +163 -61
package/src/messages/index.ts +1 -0
package/src/messages/tools.ts +99 -0
package/src/scripts/code_exec_ptc.ts +334 -0
package/src/scripts/programmatic_exec.ts +396 -0
package/src/scripts/programmatic_exec_agent.ts +231 -0
package/src/scripts/tool_search_regex.ts +162 -0
package/src/specs/thinking-prune.test.ts +52 -118
package/src/stream.ts +26 -0
package/src/test/mockTools.ts +366 -0
package/src/tools/CodeExecutor.ts +4 -0
package/src/tools/ProgrammaticToolCalling.ts +558 -0
package/src/tools/ToolNode.ts +60 -7
package/src/tools/ToolSearchRegex.ts +535 -0
package/src/tools/__tests__/ProgrammaticToolCalling.integration.test.ts +318 -0
package/src/tools/__tests__/ProgrammaticToolCalling.test.ts +853 -0
package/src/tools/__tests__/ToolSearchRegex.integration.test.ts +161 -0
package/src/tools/__tests__/ToolSearchRegex.test.ts +232 -0
package/src/tools/search/jina-reranker.test.ts +16 -16
package/src/tools/search/tool.ts +23 -1
package/src/types/graph.ts +7 -1
package/src/types/tools.ts +166 -0
package/src/utils/llmConfig.ts +8 -2
package/src/utils/run.ts +5 -1
package/src/tools/search/direct-url.test.ts +0 -530

package/src/llm/bedrock/index.ts CHANGED Viewed

@@ -1,5 +1,6 @@
 /**
  * Optimized ChatBedrockConverse wrapper that fixes contentBlockIndex conflicts
+ * and adds prompt caching support for Bedrock Converse API.
  *
  * Bedrock sends the same contentBlockIndex for both text and tool_use content blocks,
  * causing LangChain's merge logic to fail with "field[contentBlockIndex] already exists"
@@ -9,28 +10,128 @@
  * The contentBlockIndex field is only used internally by Bedrock's streaming protocol
  * and isn't needed by application logic - the index field on tool_call_chunks serves
  * the purpose of tracking tool call ordering.
+ *
+ * PROMPT CACHING:
+ * When promptCache: true is set, this wrapper adds cachePoint markers to the tools array
+ * to enable Bedrock prompt caching for tool definitions. This allows tool schemas to be
+ * cached and reused across requests, reducing latency and costs.
+ *
+ * CACHE TOKEN EXTRACTION:
+ * LangChain AWS doesn't extract cacheReadInputTokens/cacheWriteInputTokens from Bedrock's
+ * response. This wrapper adds input_token_details to usage_metadata with cache information.
  */
 import { ChatBedrockConverse } from '@langchain/aws';
 import type { ChatBedrockConverseInput } from '@langchain/aws';
 import { AIMessageChunk } from '@langchain/core/messages';
-import type { BaseMessage } from '@langchain/core/messages';
+import type { BaseMessage, UsageMetadata } from '@langchain/core/messages';
 import { ChatGenerationChunk } from '@langchain/core/outputs';
 import type { CallbackManagerForLLMRun } from '@langchain/core/callbacks/manager';
+/** Extended input type with promptCache option */
+export interface CustomChatBedrockConverseInput extends ChatBedrockConverseInput {
+  promptCache?: boolean;
+}
 export class CustomChatBedrockConverse extends ChatBedrockConverse {
-  constructor(fields?: ChatBedrockConverseInput) {
+  promptCache: boolean;
+  constructor(fields?: CustomChatBedrockConverseInput) {
     super(fields);
+    this.promptCache = fields?.promptCache ?? false;
   }
   static lc_name(): string {
-    return 'IllumaBedrockConverse';
+    return 'LibreChatBedrockConverse';
   }
   /**
-   * Override _streamResponseChunks to strip contentBlockIndex from response_metadata
-   * This prevents LangChain's merge conflicts when the same index is used for
-   * different content types (text vs tool calls)
+   * Override invocationParams to add cachePoint to tools when promptCache is enabled.
+   * This enables Bedrock prompt caching for tool definitions.
+   *
+   * STRATEGY: Separate cachePoints for core tools and MCP tools
+   * - Core tools (web_search, execute_code, etc.) are stable → cache first
+   * - MCP tools (have '_mcp_' in name) are dynamic → cache separately after
+   * - This allows core tools to stay cached when MCP selection changes
+   *
+   * NOTE: Only Claude models support cachePoint - Nova and other models will reject it.
+   */
+  invocationParams(
+    options?: this['ParsedCallOptions']
+  ): ReturnType<ChatBedrockConverse['invocationParams']> {
+    const params = super.invocationParams(options);
+    // Add cachePoint to tools array if promptCache is enabled and tools exist
+    // Only Claude models support cachePoint - check model name
+    const modelId = this.model?.toLowerCase() ?? '';
+    const isClaudeModel = modelId.includes('claude') || modelId.includes('anthropic');
+    if (
+      this.promptCache &&
+      isClaudeModel &&
+      params.toolConfig?.tools &&
+      Array.isArray(params.toolConfig.tools) &&
+      params.toolConfig.tools.length > 0
+    ) {
+      // Separate core tools from MCP tools
+      // MCP tools have '_mcp_' in their name (e.g., 'search_emails_mcp_Google-Workspace')
+      const coreTools: typeof params.toolConfig.tools = [];
+      const mcpTools: typeof params.toolConfig.tools = [];
+      const coreToolNames: string[] = [];
+      const mcpToolNames: string[] = [];
+      for (const tool of params.toolConfig.tools) {
+        // Check if tool has a name property with '_mcp_' pattern
+        const toolName = (tool as { toolSpec?: { name?: string } })?.toolSpec?.name ?? '';
+        if (toolName.includes('_mcp_')) {
+          mcpTools.push(tool);
+          mcpToolNames.push(toolName);
+        } else {
+          coreTools.push(tool);
+          coreToolNames.push(toolName);
+        }
+      }
+      // Always log cache structure (INFO level for tracking)
+      console.log(`[Cache] 🔧 Tools | Core: [${coreToolNames.join(', ')}] (${coreTools.length}) | MCP: [${mcpToolNames.join(', ')}] (${mcpTools.length})`);
+      // Build tools array with strategic cachePoints:
+      // [CoreTool1, CoreTool2, cachePoint] + [MCPTool1, MCPTool2, cachePoint]
+      const toolsWithCache: typeof params.toolConfig.tools = [];
+      let cachePointCount = 0;
+      // Add core tools with cachePoint (if any)
+      if (coreTools.length > 0) {
+        toolsWithCache.push(...coreTools);
+        toolsWithCache.push({ cachePoint: { type: 'default' } });
+        cachePointCount++;
+      }
+      // Add MCP tools with their own cachePoint (if any)
+      if (mcpTools.length > 0) {
+        toolsWithCache.push(...mcpTools);
+        toolsWithCache.push({ cachePoint: { type: 'default' } });
+        cachePointCount++;
+      }
+      // If no tools at all (shouldn't happen but safety check)
+      if (toolsWithCache.length === 0) {
+        toolsWithCache.push({ cachePoint: { type: 'default' } });
+        cachePointCount++;
+      }
+      console.log(`[Cache] 📍 Tool cachePoints: ${cachePointCount} | Order: [${coreToolNames.length > 0 ? 'CoreTools→CP' : ''}${mcpToolNames.length > 0 ? '→MCPTools→CP' : ''}]`);
+      params.toolConfig.tools = toolsWithCache;
+    }
+    return params;
+  }
+  /**
+   * Override _streamResponseChunks to:
+   * 1. Strip contentBlockIndex from response_metadata to prevent merge conflicts
+   * 2. Extract cacheReadInputTokens/cacheWriteInputTokens and add to usage_metadata
    */
   async *_streamResponseChunks(
     messages: BaseMessage[],
@@ -50,21 +151,57 @@ export class CustomChatBedrockConverse extends ChatBedrockConverse {
         (chunk.message as Partial<AIMessageChunk>).response_metadata &&
         typeof chunk.message.response_metadata === 'object'
       ) {
-        // Check if contentBlockIndex exists anywhere in response_metadata (top level or nested)
-        const hasContentBlockIndex = this.hasContentBlockIndex(
-          chunk.message.response_metadata
-        );
+        const responseMetadata = chunk.message.response_metadata as Record<string, unknown>;
+        let needsModification = false;
+        let cleanedMetadata = responseMetadata;
+        // Check if contentBlockIndex exists anywhere in response_metadata
+        const hasContentBlockIndex = this.hasContentBlockIndex(responseMetadata);
         if (hasContentBlockIndex) {
-          const cleanedMetadata = this.removeContentBlockIndex(
-            chunk.message.response_metadata
-          ) as Record<string, unknown>;
+          cleanedMetadata = this.removeContentBlockIndex(responseMetadata) as Record<string, unknown>;
+          needsModification = true;
+        }
+        // Extract cache tokens from metadata.usage (Bedrock streaming format)
+        // The metadata chunk contains usage with cacheReadInputTokens/cacheWriteInputTokens
+        const metadata = responseMetadata.metadata as Record<string, unknown> | undefined;
+        const usage = (metadata?.usage ?? responseMetadata.usage) as Record<string, unknown> | undefined;
+        let enhancedUsageMetadata: UsageMetadata | undefined = chunk.message.usage_metadata;
+        if (usage) {
+          const cacheRead = (usage.cacheReadInputTokens as number) ?? 0;
+          const cacheWrite = (usage.cacheWriteInputTokens as number) ?? 0;
+          const inputTokens = (usage.inputTokens as number) ?? 0;
+          const outputTokens = (usage.outputTokens as number) ?? 0;
+          if (cacheRead > 0 || cacheWrite > 0) {
+            // Always log cache results for tracking
+            const cacheStatus = cacheRead > 0 && cacheWrite === 0 ? '✅ HIT' :
+                               cacheWrite > 0 && cacheRead === 0 ? '📝 WRITE' :
+                               cacheRead > 0 && cacheWrite > 0 ? '🔄 PARTIAL' : '❌ MISS';
+            console.log(`[Cache] ${cacheStatus} | read=${cacheRead} | write=${cacheWrite} | input=${inputTokens} | output=${outputTokens}`);
+            needsModification = true;
+            enhancedUsageMetadata = {
+              input_tokens: chunk.message.usage_metadata?.input_tokens ?? inputTokens,
+              output_tokens: chunk.message.usage_metadata?.output_tokens ?? outputTokens,
+              total_tokens: chunk.message.usage_metadata?.total_tokens ?? (usage.totalTokens as number) ?? 0,
+              input_token_details: {
+                cache_read: cacheRead,
+                cache_creation: cacheWrite,
+              },
+            };
+          }
+        }
+        if (needsModification) {
           yield new ChatGenerationChunk({
             text: chunk.text,
             message: new AIMessageChunk({
               ...chunk.message,
               response_metadata: cleanedMetadata,
+              usage_metadata: enhancedUsageMetadata,
             }),
             generationInfo: chunk.generationInfo,
           });

package/src/llm/google/index.ts CHANGED Viewed

@@ -122,8 +122,8 @@ export class CustomChatGoogleGenerativeAI extends ChatGoogleGenerativeAI {
     this.streamUsage = fields.streamUsage ?? this.streamUsage;
   }
-  static lc_name(): 'IllumaGoogleGenerativeAI' {
-    return 'IllumaGoogleGenerativeAI';
+  static lc_name(): 'LibreChatGoogleGenerativeAI' {
+    return 'LibreChatGoogleGenerativeAI';
   }
   /**

package/src/llm/google/llm.spec.ts CHANGED Viewed

@@ -1,6 +1,8 @@
 import { config } from 'dotenv';
 config();
-import { test } from '@jest/globals';
+import { test, jest } from '@jest/globals';
+jest.setTimeout(90000);
 import * as fs from 'node:fs/promises';
 import * as path from 'node:path';
 import {

package/src/llm/openai/index.ts CHANGED Viewed

@@ -211,7 +211,7 @@ export class ChatOpenAI extends OriginalChatOpenAI<t.ChatOpenAICallOptions> {
     return this.client;
   }
   static lc_name(): string {
-    return 'IllumaOpenAI';
+    return 'LibreChatOpenAI';
   }
   protected _getClientOptions(
     options?: OpenAICoreRequestOptions
@@ -466,8 +466,8 @@ export class AzureChatOpenAI extends OriginalAzureChatOpenAI {
   public get exposedClient(): CustomOpenAIClient {
     return this.client;
   }
-  static lc_name(): 'IllumaAzureOpenAI' {
-    return 'IllumaAzureOpenAI';
+  static lc_name(): 'LibreChatAzureOpenAI' {
+    return 'LibreChatAzureOpenAI';
   }
   /**
    * Returns backwards compatible reasoning parameters from constructor params and call options
@@ -539,8 +539,8 @@ export class AzureChatOpenAI extends OriginalAzureChatOpenAI {
         ...params.defaultHeaders,
         'User-Agent':
           defaultHeaders['User-Agent'] != null
-            ? `${defaultHeaders['User-Agent']}: illuma-azure-openai-v2`
-            : 'illuma-azure-openai-v2',
+            ? `${defaultHeaders['User-Agent']}: librechat-azure-openai-v2`
+            : 'librechat-azure-openai-v2',
       };
       this.client = new CustomAzureOpenAIClient({
@@ -613,8 +613,8 @@ export class ChatDeepSeek extends OriginalChatDeepSeek {
   public get exposedClient(): CustomOpenAIClient {
     return this.client;
   }
-  static lc_name(): 'IllumaDeepSeek' {
-    return 'IllumaDeepSeek';
+  static lc_name(): 'LibreChatDeepSeek' {
+    return 'LibreChatDeepSeek';
   }
   protected _getClientOptions(
     options?: OpenAICoreRequestOptions
@@ -643,6 +643,132 @@ export class ChatDeepSeek extends OriginalChatDeepSeek {
     } as OpenAICoreRequestOptions;
     return requestOptions;
   }
+  async *_streamResponseChunks(
+    messages: BaseMessage[],
+    options: this['ParsedCallOptions'],
+    runManager?: CallbackManagerForLLMRun
+  ): AsyncGenerator<ChatGenerationChunk> {
+    const messagesMapped: OpenAICompletionParam[] =
+      _convertMessagesToOpenAIParams(messages, this.model, {
+        includeReasoningContent: true,
+      });
+    const params = {
+      ...this.invocationParams(options, {
+        streaming: true,
+      }),
+      messages: messagesMapped,
+      stream: true as const,
+    };
+    let defaultRole: OpenAIRoleEnum | undefined;
+    const streamIterable = await this.completionWithRetry(params, options);
+    let usage: OpenAIClient.Completions.CompletionUsage | undefined;
+    for await (const data of streamIterable) {
+      const choice = data.choices[0] as
+        | Partial<OpenAIClient.Chat.Completions.ChatCompletionChunk.Choice>
+        | undefined;
+      if (data.usage) {
+        usage = data.usage;
+      }
+      if (!choice) {
+        continue;
+      }
+      const { delta } = choice;
+      if (!delta) {
+        continue;
+      }
+      const chunk = this._convertOpenAIDeltaToBaseMessageChunk(
+        delta,
+        data,
+        defaultRole
+      );
+      if ('reasoning_content' in delta) {
+        chunk.additional_kwargs.reasoning_content = delta.reasoning_content;
+      }
+      defaultRole = delta.role ?? defaultRole;
+      const newTokenIndices = {
+        prompt: (options as OpenAIChatCallOptions).promptIndex ?? 0,
+        completion: choice.index ?? 0,
+      };
+      if (typeof chunk.content !== 'string') {
+        // eslint-disable-next-line no-console
+        console.log(
+          '[WARNING]: Received non-string content from OpenAI. This is currently not supported.'
+        );
+        continue;
+      }
+      // eslint-disable-next-line @typescript-eslint/no-explicit-any
+      const generationInfo: Record<string, any> = { ...newTokenIndices };
+      if (choice.finish_reason != null) {
+        generationInfo.finish_reason = choice.finish_reason;
+        generationInfo.system_fingerprint = data.system_fingerprint;
+        generationInfo.model_name = data.model;
+        generationInfo.service_tier = data.service_tier;
+      }
+      if (this.logprobs == true) {
+        generationInfo.logprobs = choice.logprobs;
+      }
+      const generationChunk = new ChatGenerationChunk({
+        message: chunk,
+        text: chunk.content,
+        generationInfo,
+      });
+      yield generationChunk;
+      await runManager?.handleLLMNewToken(
+        generationChunk.text || '',
+        newTokenIndices,
+        undefined,
+        undefined,
+        undefined,
+        { chunk: generationChunk }
+      );
+    }
+    if (usage) {
+      const inputTokenDetails = {
+        ...(usage.prompt_tokens_details?.audio_tokens != null && {
+          audio: usage.prompt_tokens_details.audio_tokens,
+        }),
+        ...(usage.prompt_tokens_details?.cached_tokens != null && {
+          cache_read: usage.prompt_tokens_details.cached_tokens,
+        }),
+      };
+      const outputTokenDetails = {
+        ...(usage.completion_tokens_details?.audio_tokens != null && {
+          audio: usage.completion_tokens_details.audio_tokens,
+        }),
+        ...(usage.completion_tokens_details?.reasoning_tokens != null && {
+          reasoning: usage.completion_tokens_details.reasoning_tokens,
+        }),
+      };
+      const generationChunk = new ChatGenerationChunk({
+        message: new AIMessageChunk({
+          content: '',
+          response_metadata: {
+            usage: { ...usage },
+          },
+          usage_metadata: {
+            input_tokens: usage.prompt_tokens,
+            output_tokens: usage.completion_tokens,
+            total_tokens: usage.total_tokens,
+            ...(Object.keys(inputTokenDetails).length > 0 && {
+              input_token_details: inputTokenDetails,
+            }),
+            ...(Object.keys(outputTokenDetails).length > 0 && {
+              output_token_details: outputTokenDetails,
+            }),
+          },
+        }),
+        text: '',
+      });
+      yield generationChunk;
+    }
+    if (options.signal?.aborted === true) {
+      throw new Error('AbortError');
+    }
+  }
 }
 /** xAI-specific usage metadata type */
@@ -688,8 +814,8 @@ export class ChatXAI extends OriginalChatXAI {
     }
   }
-  static lc_name(): 'IllumaXAI' {
-    return 'IllumaXAI';
+  static lc_name(): 'LibreChatXAI' {
+    return 'LibreChatXAI';
   }
   public get exposedClient(): CustomOpenAIClient {

package/src/llm/openai/utils/index.ts CHANGED Viewed

@@ -286,10 +286,21 @@ const completionsApiContentBlockConverter: StandardContentBlockConverter<{
   },
 };
+/** Options for converting messages to OpenAI params */
+export interface ConvertMessagesOptions {
+  /** Include reasoning_content field for DeepSeek thinking mode with tool calls */
+  includeReasoningContent?: boolean;
+  /** Include reasoning_details field for OpenRouter/Gemini thinking mode with tool calls */
+  includeReasoningDetails?: boolean;
+  /** Convert reasoning_details to content blocks for Claude (requires content array format) */
+  convertReasoningDetailsToContent?: boolean;
+}
 // Used in LangSmith, export is important here
 export function _convertMessagesToOpenAIParams(
   messages: BaseMessage[],
-  model?: string
+  model?: string,
+  options?: ConvertMessagesOptions
 ): OpenAICompletionParam[] {
   // TODO: Function messages do not support array content, fix cast
   return messages.flatMap((message) => {
@@ -333,9 +344,113 @@ export function _convertMessagesToOpenAIParams(
         convertLangChainToolCallToOpenAI
       );
       completionParam.content = hasAnthropicThinkingBlock ? content : '';
+      if (
+        options?.includeReasoningContent === true &&
+        message.additional_kwargs.reasoning_content != null
+      ) {
+        completionParam.reasoning_content =
+          message.additional_kwargs.reasoning_content;
+      }
+      if (
+        options?.includeReasoningDetails === true &&
+        message.additional_kwargs.reasoning_details != null
+      ) {
+        // For Claude via OpenRouter, convert reasoning_details to content blocks
+        const isClaudeModel =
+          model?.includes('claude') === true ||
+          model?.includes('anthropic') === true;
+        if (
+          options.convertReasoningDetailsToContent === true &&
+          isClaudeModel
+        ) {
+          const reasoningDetails = message.additional_kwargs
+            .reasoning_details as Record<string, unknown>[];
+          const contentBlocks = [];
+          // Add thinking blocks from reasoning_details
+          for (const detail of reasoningDetails) {
+            if (detail.type === 'reasoning.text' && detail.text != null) {
+              contentBlocks.push({
+                type: 'thinking',
+                thinking: detail.text,
+              });
+            } else if (
+              detail.type === 'reasoning.encrypted' &&
+              detail.data != null
+            ) {
+              contentBlocks.push({
+                type: 'redacted_thinking',
+                data: detail.data,
+                id: detail.id,
+              });
+            }
+          }
+          // Set content to array with thinking blocks
+          if (contentBlocks.length > 0) {
+            completionParam.content = contentBlocks;
+          }
+        } else {
+          // For non-Claude models, pass as separate field
+          completionParam.reasoning_details =
+            message.additional_kwargs.reasoning_details;
+        }
+      }
     } else {
       if (message.additional_kwargs.tool_calls != null) {
         completionParam.tool_calls = message.additional_kwargs.tool_calls;
+        if (
+          options?.includeReasoningContent === true &&
+          message.additional_kwargs.reasoning_content != null
+        ) {
+          completionParam.reasoning_content =
+            message.additional_kwargs.reasoning_content;
+        }
+        if (
+          options?.includeReasoningDetails === true &&
+          message.additional_kwargs.reasoning_details != null
+        ) {
+          // For Claude via OpenRouter, convert reasoning_details to content blocks
+          const isClaudeModel =
+            model?.includes('claude') === true ||
+            model?.includes('anthropic') === true;
+          if (
+            options.convertReasoningDetailsToContent === true &&
+            isClaudeModel
+          ) {
+            const reasoningDetails = message.additional_kwargs
+              .reasoning_details as Record<string, unknown>[];
+            const contentBlocks = [];
+            // Add thinking blocks from reasoning_details
+            for (const detail of reasoningDetails) {
+              if (detail.type === 'reasoning.text' && detail.text != null) {
+                contentBlocks.push({
+                  type: 'thinking',
+                  thinking: detail.text,
+                });
+              } else if (
+                detail.type === 'reasoning.encrypted' &&
+                detail.data != null
+              ) {
+                contentBlocks.push({
+                  type: 'redacted_thinking',
+                  data: detail.data,
+                  id: detail.id,
+                });
+              }
+            }
+            // Set content to array with thinking blocks
+            if (contentBlocks.length > 0) {
+              completionParam.content = contentBlocks;
+            }
+          } else {
+            // For non-Claude models, pass as separate field
+            completionParam.reasoning_details =
+              message.additional_kwargs.reasoning_details;
+          }
+        }
       }
       if ((message as ToolMessage).tool_call_id != null) {
         completionParam.tool_call_id = (message as ToolMessage).tool_call_id;