npm - @librechat/agents - Versions diffs - 2.4.321 → 3.0.0-rc1 - Mend

@librechat/agents 2.4.321 → 3.0.0-rc1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (266) hide show

package/dist/cjs/agents/AgentContext.cjs +218 -0
package/dist/cjs/agents/AgentContext.cjs.map +1 -0
package/dist/cjs/common/enum.cjs +14 -5
package/dist/cjs/common/enum.cjs.map +1 -1
package/dist/cjs/events.cjs +10 -6
package/dist/cjs/events.cjs.map +1 -1
package/dist/cjs/graphs/Graph.cjs +309 -212
package/dist/cjs/graphs/Graph.cjs.map +1 -1
package/dist/cjs/graphs/MultiAgentGraph.cjs +322 -0
package/dist/cjs/graphs/MultiAgentGraph.cjs.map +1 -0
package/dist/cjs/llm/anthropic/index.cjs +54 -9
package/dist/cjs/llm/anthropic/index.cjs.map +1 -1
package/dist/cjs/llm/anthropic/types.cjs.map +1 -1
package/dist/cjs/llm/anthropic/utils/message_inputs.cjs +52 -6
package/dist/cjs/llm/anthropic/utils/message_inputs.cjs.map +1 -1
package/dist/cjs/llm/anthropic/utils/message_outputs.cjs +22 -2
package/dist/cjs/llm/anthropic/utils/message_outputs.cjs.map +1 -1
package/dist/cjs/llm/anthropic/utils/tools.cjs +29 -0
package/dist/cjs/llm/anthropic/utils/tools.cjs.map +1 -0
package/dist/cjs/llm/google/index.cjs +144 -0
package/dist/cjs/llm/google/index.cjs.map +1 -0
package/dist/cjs/llm/google/utils/common.cjs +477 -0
package/dist/cjs/llm/google/utils/common.cjs.map +1 -0
package/dist/cjs/llm/ollama/index.cjs +67 -0
package/dist/cjs/llm/ollama/index.cjs.map +1 -0
package/dist/cjs/llm/ollama/utils.cjs +158 -0
package/dist/cjs/llm/ollama/utils.cjs.map +1 -0
package/dist/cjs/llm/openai/index.cjs +389 -3
package/dist/cjs/llm/openai/index.cjs.map +1 -1
package/dist/cjs/llm/openai/utils/index.cjs +672 -0
package/dist/cjs/llm/openai/utils/index.cjs.map +1 -0
package/dist/cjs/llm/providers.cjs +15 -15
package/dist/cjs/llm/providers.cjs.map +1 -1
package/dist/cjs/llm/text.cjs +14 -3
package/dist/cjs/llm/text.cjs.map +1 -1
package/dist/cjs/llm/vertexai/index.cjs +330 -0
package/dist/cjs/llm/vertexai/index.cjs.map +1 -0
package/dist/cjs/main.cjs +11 -0
package/dist/cjs/main.cjs.map +1 -1
package/dist/cjs/run.cjs +120 -81
package/dist/cjs/run.cjs.map +1 -1
package/dist/cjs/stream.cjs +85 -51
package/dist/cjs/stream.cjs.map +1 -1
package/dist/cjs/tools/ToolNode.cjs +10 -4
package/dist/cjs/tools/ToolNode.cjs.map +1 -1
package/dist/cjs/tools/handlers.cjs +119 -13
package/dist/cjs/tools/handlers.cjs.map +1 -1
package/dist/cjs/tools/search/anthropic.cjs +40 -0
package/dist/cjs/tools/search/anthropic.cjs.map +1 -0
package/dist/cjs/tools/search/firecrawl.cjs +61 -13
package/dist/cjs/tools/search/firecrawl.cjs.map +1 -1
package/dist/cjs/tools/search/format.cjs +9 -3
package/dist/cjs/tools/search/format.cjs.map +1 -1
package/dist/cjs/tools/search/rerankers.cjs +35 -50
package/dist/cjs/tools/search/rerankers.cjs.map +1 -1
package/dist/cjs/tools/search/schema.cjs +70 -0
package/dist/cjs/tools/search/schema.cjs.map +1 -0
package/dist/cjs/tools/search/search.cjs +145 -38
package/dist/cjs/tools/search/search.cjs.map +1 -1
package/dist/cjs/tools/search/tool.cjs +165 -48
package/dist/cjs/tools/search/tool.cjs.map +1 -1
package/dist/cjs/tools/search/utils.cjs +34 -5
package/dist/cjs/tools/search/utils.cjs.map +1 -1
package/dist/cjs/utils/events.cjs +31 -0
package/dist/cjs/utils/events.cjs.map +1 -0
package/dist/cjs/utils/title.cjs +57 -21
package/dist/cjs/utils/title.cjs.map +1 -1
package/dist/cjs/utils/tokens.cjs +54 -7
package/dist/cjs/utils/tokens.cjs.map +1 -1
package/dist/esm/agents/AgentContext.mjs +216 -0
package/dist/esm/agents/AgentContext.mjs.map +1 -0
package/dist/esm/common/enum.mjs +15 -6
package/dist/esm/common/enum.mjs.map +1 -1
package/dist/esm/events.mjs +10 -6
package/dist/esm/events.mjs.map +1 -1
package/dist/esm/graphs/Graph.mjs +311 -214
package/dist/esm/graphs/Graph.mjs.map +1 -1
package/dist/esm/graphs/MultiAgentGraph.mjs +320 -0
package/dist/esm/graphs/MultiAgentGraph.mjs.map +1 -0
package/dist/esm/llm/anthropic/index.mjs +54 -9
package/dist/esm/llm/anthropic/index.mjs.map +1 -1
package/dist/esm/llm/anthropic/types.mjs.map +1 -1
package/dist/esm/llm/anthropic/utils/message_inputs.mjs +52 -6
package/dist/esm/llm/anthropic/utils/message_inputs.mjs.map +1 -1
package/dist/esm/llm/anthropic/utils/message_outputs.mjs +22 -2
package/dist/esm/llm/anthropic/utils/message_outputs.mjs.map +1 -1
package/dist/esm/llm/anthropic/utils/tools.mjs +27 -0
package/dist/esm/llm/anthropic/utils/tools.mjs.map +1 -0
package/dist/esm/llm/google/index.mjs +142 -0
package/dist/esm/llm/google/index.mjs.map +1 -0
package/dist/esm/llm/google/utils/common.mjs +471 -0
package/dist/esm/llm/google/utils/common.mjs.map +1 -0
package/dist/esm/llm/ollama/index.mjs +65 -0
package/dist/esm/llm/ollama/index.mjs.map +1 -0
package/dist/esm/llm/ollama/utils.mjs +155 -0
package/dist/esm/llm/ollama/utils.mjs.map +1 -0
package/dist/esm/llm/openai/index.mjs +388 -4
package/dist/esm/llm/openai/index.mjs.map +1 -1
package/dist/esm/llm/openai/utils/index.mjs +666 -0
package/dist/esm/llm/openai/utils/index.mjs.map +1 -0
package/dist/esm/llm/providers.mjs +5 -5
package/dist/esm/llm/providers.mjs.map +1 -1
package/dist/esm/llm/text.mjs +14 -3
package/dist/esm/llm/text.mjs.map +1 -1
package/dist/esm/llm/vertexai/index.mjs +328 -0
package/dist/esm/llm/vertexai/index.mjs.map +1 -0
package/dist/esm/main.mjs +6 -5
package/dist/esm/main.mjs.map +1 -1
package/dist/esm/run.mjs +121 -83
package/dist/esm/run.mjs.map +1 -1
package/dist/esm/stream.mjs +87 -54
package/dist/esm/stream.mjs.map +1 -1
package/dist/esm/tools/ToolNode.mjs +10 -4
package/dist/esm/tools/ToolNode.mjs.map +1 -1
package/dist/esm/tools/handlers.mjs +119 -15
package/dist/esm/tools/handlers.mjs.map +1 -1
package/dist/esm/tools/search/anthropic.mjs +37 -0
package/dist/esm/tools/search/anthropic.mjs.map +1 -0
package/dist/esm/tools/search/firecrawl.mjs +61 -13
package/dist/esm/tools/search/firecrawl.mjs.map +1 -1
package/dist/esm/tools/search/format.mjs +10 -4
package/dist/esm/tools/search/format.mjs.map +1 -1
package/dist/esm/tools/search/rerankers.mjs +35 -50
package/dist/esm/tools/search/rerankers.mjs.map +1 -1
package/dist/esm/tools/search/schema.mjs +61 -0
package/dist/esm/tools/search/schema.mjs.map +1 -0
package/dist/esm/tools/search/search.mjs +146 -39
package/dist/esm/tools/search/search.mjs.map +1 -1
package/dist/esm/tools/search/tool.mjs +164 -47
package/dist/esm/tools/search/tool.mjs.map +1 -1
package/dist/esm/tools/search/utils.mjs +33 -6
package/dist/esm/tools/search/utils.mjs.map +1 -1
package/dist/esm/utils/events.mjs +29 -0
package/dist/esm/utils/events.mjs.map +1 -0
package/dist/esm/utils/title.mjs +57 -22
package/dist/esm/utils/title.mjs.map +1 -1
package/dist/esm/utils/tokens.mjs +54 -8
package/dist/esm/utils/tokens.mjs.map +1 -1
package/dist/types/agents/AgentContext.d.ts +91 -0
package/dist/types/common/enum.d.ts +15 -6
package/dist/types/events.d.ts +5 -4
package/dist/types/graphs/Graph.d.ts +64 -67
package/dist/types/graphs/MultiAgentGraph.d.ts +37 -0
package/dist/types/graphs/index.d.ts +1 -0
package/dist/types/llm/anthropic/index.d.ts +11 -0
package/dist/types/llm/anthropic/types.d.ts +9 -3
package/dist/types/llm/anthropic/utils/message_inputs.d.ts +1 -1
package/dist/types/llm/anthropic/utils/output_parsers.d.ts +4 -4
package/dist/types/llm/anthropic/utils/tools.d.ts +3 -0
package/dist/types/llm/google/index.d.ts +13 -0
package/dist/types/llm/google/types.d.ts +32 -0
package/dist/types/llm/google/utils/common.d.ts +19 -0
package/dist/types/llm/google/utils/tools.d.ts +10 -0
package/dist/types/llm/google/utils/zod_to_genai_parameters.d.ts +14 -0
package/dist/types/llm/ollama/index.d.ts +7 -0
package/dist/types/llm/ollama/utils.d.ts +7 -0
package/dist/types/llm/openai/index.d.ts +72 -3
package/dist/types/llm/openai/types.d.ts +10 -0
package/dist/types/llm/openai/utils/index.d.ts +20 -0
package/dist/types/llm/text.d.ts +1 -1
package/dist/types/llm/vertexai/index.d.ts +293 -0
package/dist/types/messages/reducer.d.ts +9 -0
package/dist/types/run.d.ts +19 -12
package/dist/types/scripts/ant_web_search.d.ts +1 -0
package/dist/types/scripts/args.d.ts +2 -1
package/dist/types/scripts/handoff-test.d.ts +1 -0
package/dist/types/scripts/multi-agent-conditional.d.ts +1 -0
package/dist/types/scripts/multi-agent-parallel.d.ts +1 -0
package/dist/types/scripts/multi-agent-sequence.d.ts +1 -0
package/dist/types/scripts/multi-agent-test.d.ts +1 -0
package/dist/types/stream.d.ts +10 -3
package/dist/types/tools/CodeExecutor.d.ts +2 -2
package/dist/types/tools/ToolNode.d.ts +1 -1
package/dist/types/tools/handlers.d.ts +17 -4
package/dist/types/tools/search/anthropic.d.ts +16 -0
package/dist/types/tools/search/firecrawl.d.ts +16 -0
package/dist/types/tools/search/rerankers.d.ts +8 -5
package/dist/types/tools/search/schema.d.ts +16 -0
package/dist/types/tools/search/tool.d.ts +13 -0
package/dist/types/tools/search/types.d.ts +64 -9
package/dist/types/tools/search/utils.d.ts +9 -2
package/dist/types/types/graph.d.ts +95 -15
package/dist/types/types/llm.d.ts +24 -10
package/dist/types/types/run.d.ts +46 -8
package/dist/types/types/stream.d.ts +16 -2
package/dist/types/types/tools.d.ts +1 -1
package/dist/types/utils/events.d.ts +6 -0
package/dist/types/utils/title.d.ts +2 -1
package/dist/types/utils/tokens.d.ts +24 -0
package/package.json +35 -18
package/src/agents/AgentContext.ts +315 -0
package/src/common/enum.ts +14 -5
package/src/events.ts +24 -13
package/src/graphs/Graph.ts +495 -312
package/src/graphs/MultiAgentGraph.ts +381 -0
package/src/graphs/index.ts +2 -1
package/src/llm/anthropic/Jacob_Lee_Resume_2023.pdf +0 -0
package/src/llm/anthropic/index.ts +78 -13
package/src/llm/anthropic/llm.spec.ts +491 -115
package/src/llm/anthropic/types.ts +39 -3
package/src/llm/anthropic/utils/message_inputs.ts +67 -11
package/src/llm/anthropic/utils/message_outputs.ts +21 -2
package/src/llm/anthropic/utils/output_parsers.ts +25 -6
package/src/llm/anthropic/utils/tools.ts +29 -0
package/src/llm/google/index.ts +218 -0
package/src/llm/google/types.ts +43 -0
package/src/llm/google/utils/common.ts +646 -0
package/src/llm/google/utils/tools.ts +160 -0
package/src/llm/google/utils/zod_to_genai_parameters.ts +86 -0
package/src/llm/ollama/index.ts +89 -0
package/src/llm/ollama/utils.ts +193 -0
package/src/llm/openai/index.ts +600 -14
package/src/llm/openai/types.ts +24 -0
package/src/llm/openai/utils/index.ts +912 -0
package/src/llm/openai/utils/isReasoningModel.test.ts +90 -0
package/src/llm/providers.ts +10 -9
package/src/llm/text.ts +26 -7
package/src/llm/vertexai/index.ts +360 -0
package/src/messages/reducer.ts +80 -0
package/src/run.ts +181 -112
package/src/scripts/ant_web_search.ts +158 -0
package/src/scripts/args.ts +12 -8
package/src/scripts/cli4.ts +29 -21
package/src/scripts/cli5.ts +29 -21
package/src/scripts/code_exec.ts +54 -23
package/src/scripts/code_exec_files.ts +48 -17
package/src/scripts/code_exec_simple.ts +46 -27
package/src/scripts/handoff-test.ts +135 -0
package/src/scripts/image.ts +52 -20
package/src/scripts/multi-agent-conditional.ts +220 -0
package/src/scripts/multi-agent-example-output.md +110 -0
package/src/scripts/multi-agent-parallel.ts +337 -0
package/src/scripts/multi-agent-sequence.ts +212 -0
package/src/scripts/multi-agent-test.ts +186 -0
package/src/scripts/search.ts +4 -12
package/src/scripts/simple.ts +25 -10
package/src/scripts/tools.ts +48 -18
package/src/specs/anthropic.simple.test.ts +150 -34
package/src/specs/azure.simple.test.ts +325 -0
package/src/specs/openai.simple.test.ts +140 -33
package/src/specs/openrouter.simple.test.ts +107 -0
package/src/specs/prune.test.ts +4 -9
package/src/specs/reasoning.test.ts +80 -44
package/src/specs/token-memoization.test.ts +39 -0
package/src/stream.test.ts +94 -0
package/src/stream.ts +139 -60
package/src/tools/ToolNode.ts +21 -7
package/src/tools/handlers.ts +192 -18
package/src/tools/search/anthropic.ts +51 -0
package/src/tools/search/firecrawl.ts +78 -24
package/src/tools/search/format.ts +10 -5
package/src/tools/search/rerankers.ts +50 -62
package/src/tools/search/schema.ts +63 -0
package/src/tools/search/search.ts +167 -34
package/src/tools/search/tool.ts +222 -46
package/src/tools/search/types.ts +65 -10
package/src/tools/search/utils.ts +37 -5
package/src/types/graph.ts +272 -103
package/src/types/llm.ts +25 -12
package/src/types/run.ts +51 -13
package/src/types/stream.ts +22 -1
package/src/types/tools.ts +16 -10
package/src/utils/events.ts +32 -0
package/src/utils/llmConfig.ts +20 -8
package/src/utils/title.ts +104 -30
package/src/utils/tokens.ts +69 -10

package/src/llm/openai/index.ts CHANGED Viewed

@@ -1,21 +1,127 @@
 import { AzureOpenAI as AzureOpenAIClient } from 'openai';
+import { AIMessageChunk } from '@langchain/core/messages';
 import { ChatXAI as OriginalChatXAI } from '@langchain/xai';
+import { ChatGenerationChunk } from '@langchain/core/outputs';
+import { ToolDefinition } from '@langchain/core/language_models/base';
+import { isLangChainTool } from '@langchain/core/utils/function_calling';
 import { ChatDeepSeek as OriginalChatDeepSeek } from '@langchain/deepseek';
+import { CallbackManagerForLLMRun } from '@langchain/core/callbacks/manager';
 import {
   getEndpoint,
   OpenAIClient,
+  formatToOpenAITool,
   ChatOpenAI as OriginalChatOpenAI,
   AzureChatOpenAI as OriginalAzureChatOpenAI,
 } from '@langchain/openai';
-import type { OpenAICoreRequestOptions } from 'node_modules/@langchain/deepseek/node_modules/@langchain/openai';
+import type {
+  OpenAIChatCallOptions,
+  OpenAIRoleEnum,
+  HeaderValue,
+  HeadersLike,
+} from './types';
+import type { BindToolsInput } from '@langchain/core/language_models/chat_models';
+import type { BaseMessage, UsageMetadata } from '@langchain/core/messages';
+import type { ChatXAIInput } from '@langchain/xai';
 import type * as t from '@langchain/openai';
+import {
+  isReasoningModel,
+  _convertMessagesToOpenAIParams,
+  _convertMessagesToOpenAIResponsesParams,
+  _convertOpenAIResponsesDeltaToBaseMessageChunk,
+  type ResponseReturnStreamEvents,
+} from './utils';
+// eslint-disable-next-line @typescript-eslint/explicit-function-return-type
+const iife = <T>(fn: () => T) => fn();
+export function isHeaders(headers: unknown): headers is Headers {
+  return (
+    typeof Headers !== 'undefined' &&
+    headers !== null &&
+    typeof headers === 'object' &&
+    Object.prototype.toString.call(headers) === '[object Headers]'
+  );
+}
+export function normalizeHeaders(
+  headers: HeadersLike
+): Record<string, HeaderValue | readonly HeaderValue[]> {
+  const output = iife(() => {
+    // If headers is a Headers instance
+    if (isHeaders(headers)) {
+      return headers;
+    }
+    // If headers is an array of [key, value] pairs
+    else if (Array.isArray(headers)) {
+      return new Headers(headers);
+    }
+    // If headers is a NullableHeaders-like object (has 'values' property that is a Headers)
+    else if (
+      typeof headers === 'object' &&
+      headers !== null &&
+      'values' in headers &&
+      isHeaders(headers.values)
+    ) {
+      return headers.values;
+    }
+    // If headers is a plain object
+    else if (typeof headers === 'object' && headers !== null) {
+      const entries: [string, string][] = Object.entries(headers)
+        .filter(([, v]) => typeof v === 'string')
+        .map(([k, v]) => [k, v as string]);
+      return new Headers(entries);
+    }
+    return new Headers();
+  });
+  return Object.fromEntries(output.entries());
+}
+type OpenAICompletionParam =
+  OpenAIClient.Chat.Completions.ChatCompletionMessageParam;
+type OpenAICoreRequestOptions = OpenAIClient.RequestOptions;
 function createAbortHandler(controller: AbortController): () => void {
   return function (): void {
     controller.abort();
   };
 }
+/**
+ * Formats a tool in either OpenAI format, or LangChain structured tool format
+ * into an OpenAI tool format. If the tool is already in OpenAI format, return without
+ * any changes. If it is in LangChain structured tool format, convert it to OpenAI tool format
+ * using OpenAI's `zodFunction` util, falling back to `convertToOpenAIFunction` if the parameters
+ * returned from the `zodFunction` util are not defined.
+ *
+ * @param {BindToolsInput} tool The tool to convert to an OpenAI tool.
+ * @param {Object} [fields] Additional fields to add to the OpenAI tool.
+ * @returns {ToolDefinition} The inputted tool in OpenAI tool format.
+ */
+export function _convertToOpenAITool(
+  tool: BindToolsInput,
+  fields?: {
+    /**
+     * If `true`, model output is guaranteed to exactly match the JSON Schema
+     * provided in the function definition.
+     */
+    strict?: boolean;
+  }
+): OpenAIClient.ChatCompletionTool {
+  let toolDef: OpenAIClient.ChatCompletionTool | undefined;
+  if (isLangChainTool(tool)) {
+    toolDef = formatToOpenAITool(tool);
+  } else {
+    toolDef = tool as ToolDefinition;
+  }
+  if (fields?.strict !== undefined) {
+    toolDef.function.strict = fields.strict;
+  }
+  return toolDef;
+}
 export class CustomOpenAIClient extends OpenAIClient {
   abortHandler?: () => void;
   async fetchWithTimeout(
@@ -87,13 +193,14 @@ export class CustomAzureOpenAIClient extends AzureOpenAIClient {
   }
 }
+/** @ts-expect-error We are intentionally overriding `getReasoningParams` */
 export class ChatOpenAI extends OriginalChatOpenAI<t.ChatOpenAICallOptions> {
   public get exposedClient(): CustomOpenAIClient {
     return this.client;
   }
   protected _getClientOptions(
-    options?: t.OpenAICoreRequestOptions
-  ): t.OpenAICoreRequestOptions {
+    options?: OpenAICoreRequestOptions
+  ): OpenAICoreRequestOptions {
     if (!(this.client as OpenAIClient | undefined)) {
       const openAIEndpointConfig: t.OpenAIEndpointConfig = {
         baseURL: this.clientConfig.baseURL,
@@ -115,19 +222,258 @@ export class ChatOpenAI extends OriginalChatOpenAI<t.ChatOpenAICallOptions> {
     const requestOptions = {
       ...this.clientConfig,
       ...options,
-    } as t.OpenAICoreRequestOptions;
+    } as OpenAICoreRequestOptions;
     return requestOptions;
   }
+  /**
+   * Returns backwards compatible reasoning parameters from constructor params and call options
+   * @internal
+   */
+  getReasoningParams(
+    options?: this['ParsedCallOptions']
+  ): OpenAIClient.Reasoning | undefined {
+    if (!isReasoningModel(this.model)) {
+      return;
+    }
+    // apply options in reverse order of importance -- newer options supersede older options
+    let reasoning: OpenAIClient.Reasoning | undefined;
+    if (this.reasoning !== undefined) {
+      reasoning = {
+        ...reasoning,
+        ...this.reasoning,
+      };
+    }
+    if (options?.reasoning !== undefined) {
+      reasoning = {
+        ...reasoning,
+        ...options.reasoning,
+      };
+    }
+    return reasoning;
+  }
+  protected _getReasoningParams(
+    options?: this['ParsedCallOptions']
+  ): OpenAIClient.Reasoning | undefined {
+    return this.getReasoningParams(options);
+  }
+  async *_streamResponseChunks(
+    messages: BaseMessage[],
+    options: this['ParsedCallOptions'],
+    runManager?: CallbackManagerForLLMRun
+  ): AsyncGenerator<ChatGenerationChunk> {
+    if (!this._useResponseApi(options)) {
+      return yield* this._streamResponseChunks2(messages, options, runManager);
+    }
+    const streamIterable = await this.responseApiWithRetry(
+      {
+        ...this.invocationParams<'responses'>(options, { streaming: true }),
+        input: _convertMessagesToOpenAIResponsesParams(
+          messages,
+          this.model,
+          this.zdrEnabled
+        ),
+        stream: true,
+      },
+      options
+    );
+    for await (const data of streamIterable) {
+      const chunk = _convertOpenAIResponsesDeltaToBaseMessageChunk(
+        data as ResponseReturnStreamEvents
+      );
+      if (chunk == null) continue;
+      yield chunk;
+      await runManager?.handleLLMNewToken(
+        chunk.text || '',
+        undefined,
+        undefined,
+        undefined,
+        undefined,
+        { chunk }
+      );
+    }
+    return;
+  }
+  async *_streamResponseChunks2(
+    messages: BaseMessage[],
+    options: this['ParsedCallOptions'],
+    runManager?: CallbackManagerForLLMRun
+  ): AsyncGenerator<ChatGenerationChunk> {
+    const messagesMapped: OpenAICompletionParam[] =
+      _convertMessagesToOpenAIParams(messages, this.model);
+    const params = {
+      ...this.invocationParams(options, {
+        streaming: true,
+      }),
+      messages: messagesMapped,
+      stream: true as const,
+    };
+    let defaultRole: OpenAIRoleEnum | undefined;
+    const streamIterable = await this.completionWithRetry(params, options);
+    let usage: OpenAIClient.Completions.CompletionUsage | undefined;
+    for await (const data of streamIterable) {
+      const choice = data.choices[0] as
+        | Partial<OpenAIClient.Chat.Completions.ChatCompletionChunk.Choice>
+        | undefined;
+      if (data.usage) {
+        usage = data.usage;
+      }
+      if (!choice) {
+        continue;
+      }
+      const { delta } = choice;
+      if (!delta) {
+        continue;
+      }
+      const chunk = this._convertOpenAIDeltaToBaseMessageChunk(
+        delta,
+        data,
+        defaultRole
+      );
+      if ('reasoning_content' in delta) {
+        chunk.additional_kwargs.reasoning_content = delta.reasoning_content;
+      } else if ('reasoning' in delta) {
+        chunk.additional_kwargs.reasoning_content = delta.reasoning;
+      }
+      defaultRole = delta.role ?? defaultRole;
+      const newTokenIndices = {
+        prompt: options.promptIndex ?? 0,
+        completion: choice.index ?? 0,
+      };
+      if (typeof chunk.content !== 'string') {
+        // eslint-disable-next-line no-console
+        console.log(
+          '[WARNING]: Received non-string content from OpenAI. This is currently not supported.'
+        );
+        continue;
+      }
+      // eslint-disable-next-line @typescript-eslint/no-explicit-any
+      const generationInfo: Record<string, any> = { ...newTokenIndices };
+      if (choice.finish_reason != null) {
+        generationInfo.finish_reason = choice.finish_reason;
+        // Only include system fingerprint in the last chunk for now
+        // to avoid concatenation issues
+        generationInfo.system_fingerprint = data.system_fingerprint;
+        generationInfo.model_name = data.model;
+        generationInfo.service_tier = data.service_tier;
+      }
+      if (this.logprobs == true) {
+        generationInfo.logprobs = choice.logprobs;
+      }
+      const generationChunk = new ChatGenerationChunk({
+        message: chunk,
+        text: chunk.content,
+        generationInfo,
+      });
+      yield generationChunk;
+      await runManager?.handleLLMNewToken(
+        generationChunk.text || '',
+        newTokenIndices,
+        undefined,
+        undefined,
+        undefined,
+        { chunk: generationChunk }
+      );
+    }
+    if (usage) {
+      const inputTokenDetails = {
+        ...(usage.prompt_tokens_details?.audio_tokens != null && {
+          audio: usage.prompt_tokens_details.audio_tokens,
+        }),
+        ...(usage.prompt_tokens_details?.cached_tokens != null && {
+          cache_read: usage.prompt_tokens_details.cached_tokens,
+        }),
+      };
+      const outputTokenDetails = {
+        ...(usage.completion_tokens_details?.audio_tokens != null && {
+          audio: usage.completion_tokens_details.audio_tokens,
+        }),
+        ...(usage.completion_tokens_details?.reasoning_tokens != null && {
+          reasoning: usage.completion_tokens_details.reasoning_tokens,
+        }),
+      };
+      const generationChunk = new ChatGenerationChunk({
+        message: new AIMessageChunk({
+          content: '',
+          response_metadata: {
+            usage: { ...usage },
+          },
+          usage_metadata: {
+            input_tokens: usage.prompt_tokens,
+            output_tokens: usage.completion_tokens,
+            total_tokens: usage.total_tokens,
+            ...(Object.keys(inputTokenDetails).length > 0 && {
+              input_token_details: inputTokenDetails,
+            }),
+            ...(Object.keys(outputTokenDetails).length > 0 && {
+              output_token_details: outputTokenDetails,
+            }),
+          },
+        }),
+        text: '',
+      });
+      yield generationChunk;
+    }
+    if (options.signal?.aborted === true) {
+      throw new Error('AbortError');
+    }
+  }
 }
+/** @ts-expect-error We are intentionally overriding `getReasoningParams` */
 export class AzureChatOpenAI extends OriginalAzureChatOpenAI {
   public get exposedClient(): CustomOpenAIClient {
     return this.client;
   }
+  /**
+   * Returns backwards compatible reasoning parameters from constructor params and call options
+   * @internal
+   */
+  getReasoningParams(
+    options?: this['ParsedCallOptions']
+  ): OpenAIClient.Reasoning | undefined {
+    if (!isReasoningModel(this.model)) {
+      return;
+    }
+    // apply options in reverse order of importance -- newer options supersede older options
+    let reasoning: OpenAIClient.Reasoning | undefined;
+    if (this.reasoning !== undefined) {
+      reasoning = {
+        ...reasoning,
+        ...this.reasoning,
+      };
+    }
+    if (options?.reasoning !== undefined) {
+      reasoning = {
+        ...reasoning,
+        ...options.reasoning,
+      };
+    }
+    return reasoning;
+  }
+  protected _getReasoningParams(
+    options?: this['ParsedCallOptions']
+  ): OpenAIClient.Reasoning | undefined {
+    return this.getReasoningParams(options);
+  }
   protected _getClientOptions(
-    options: t.OpenAICoreRequestOptions | undefined
-  ): t.OpenAICoreRequestOptions {
-    if (!(this.client as AzureOpenAIClient | undefined)) {
+    options: OpenAICoreRequestOptions | undefined
+  ): OpenAICoreRequestOptions {
+    if (!(this.client as unknown as AzureOpenAIClient | undefined)) {
       const openAIEndpointConfig: t.OpenAIEndpointConfig = {
         azureOpenAIApiDeploymentName: this.azureOpenAIApiDeploymentName,
         azureOpenAIApiInstanceName: this.azureOpenAIApiInstanceName,
@@ -154,25 +500,26 @@ export class AzureChatOpenAI extends OriginalAzureChatOpenAI {
         delete params.baseURL;
       }
+      const defaultHeaders = normalizeHeaders(params.defaultHeaders);
       params.defaultHeaders = {
         ...params.defaultHeaders,
         'User-Agent':
-          params.defaultHeaders?.['User-Agent'] != null
-            ? `${params.defaultHeaders['User-Agent']}: langchainjs-azure-openai-v2`
-            : 'langchainjs-azure-openai-v2',
+          defaultHeaders['User-Agent'] != null
+            ? `${defaultHeaders['User-Agent']}: librechat-azure-openai-v2`
+            : 'librechat-azure-openai-v2',
       };
       this.client = new CustomAzureOpenAIClient({
         apiVersion: this.azureOpenAIApiVersion,
         azureADTokenProvider: this.azureADTokenProvider,
-        ...params,
-      });
+        ...(params as t.AzureOpenAIInput),
+      }) as unknown as CustomOpenAIClient;
     }
     const requestOptions = {
       ...this.clientConfig,
       ...options,
-    } as t.OpenAICoreRequestOptions;
+    } as OpenAICoreRequestOptions;
     if (this.azureOpenAIApiKey != null) {
       requestOptions.headers = {
         'api-key': this.azureOpenAIApiKey,
@@ -185,8 +532,46 @@ export class AzureChatOpenAI extends OriginalAzureChatOpenAI {
     }
     return requestOptions;
   }
-}
+  async *_streamResponseChunks(
+    messages: BaseMessage[],
+    options: this['ParsedCallOptions'],
+    runManager?: CallbackManagerForLLMRun
+  ): AsyncGenerator<ChatGenerationChunk> {
+    if (!this._useResponseApi(options)) {
+      return yield* super._streamResponseChunks(messages, options, runManager);
+    }
+    const streamIterable = await this.responseApiWithRetry(
+      {
+        ...this.invocationParams<'responses'>(options, { streaming: true }),
+        input: _convertMessagesToOpenAIResponsesParams(
+          messages,
+          this.model,
+          this.zdrEnabled
+        ),
+        stream: true,
+      },
+      options
+    );
+    for await (const data of streamIterable) {
+      const chunk = _convertOpenAIResponsesDeltaToBaseMessageChunk(
+        data as ResponseReturnStreamEvents
+      );
+      if (chunk == null) continue;
+      yield chunk;
+      await runManager?.handleLLMNewToken(
+        chunk.text || '',
+        undefined,
+        undefined,
+        undefined,
+        undefined,
+        { chunk }
+      );
+    }
+    return;
+  }
+}
 export class ChatDeepSeek extends OriginalChatDeepSeek {
   public get exposedClient(): CustomOpenAIClient {
     return this.client;
@@ -220,10 +605,49 @@ export class ChatDeepSeek extends OriginalChatDeepSeek {
   }
 }
+/** xAI-specific usage metadata type */
+export interface XAIUsageMetadata
+  extends OpenAIClient.Completions.CompletionUsage {
+  prompt_tokens_details?: {
+    audio_tokens?: number;
+    cached_tokens?: number;
+    text_tokens?: number;
+    image_tokens?: number;
+  };
+  completion_tokens_details?: {
+    audio_tokens?: number;
+    reasoning_tokens?: number;
+    accepted_prediction_tokens?: number;
+    rejected_prediction_tokens?: number;
+  };
+  num_sources_used?: number;
+}
 export class ChatXAI extends OriginalChatXAI {
+  constructor(
+    fields?: Partial<ChatXAIInput> & {
+      configuration?: { baseURL?: string };
+      clientConfig?: { baseURL?: string };
+    }
+  ) {
+    super(fields);
+    const customBaseURL =
+      fields?.configuration?.baseURL ?? fields?.clientConfig?.baseURL;
+    if (customBaseURL != null && customBaseURL) {
+      this.clientConfig = {
+        ...this.clientConfig,
+        baseURL: customBaseURL,
+      };
+      // Reset the client to force recreation with new config
+      // eslint-disable-next-line @typescript-eslint/no-explicit-any
+      this.client = undefined as any;
+    }
+  }
   public get exposedClient(): CustomOpenAIClient {
     return this.client;
   }
   protected _getClientOptions(
     options?: OpenAICoreRequestOptions
   ): OpenAICoreRequestOptions {
@@ -251,4 +675,166 @@ export class ChatXAI extends OriginalChatXAI {
     } as OpenAICoreRequestOptions;
     return requestOptions;
   }
+  async *_streamResponseChunks(
+    messages: BaseMessage[],
+    options: this['ParsedCallOptions'],
+    runManager?: CallbackManagerForLLMRun
+  ): AsyncGenerator<ChatGenerationChunk> {
+    const messagesMapped: OpenAICompletionParam[] =
+      _convertMessagesToOpenAIParams(messages, this.model);
+    const params = {
+      ...this.invocationParams(options, {
+        streaming: true,
+      }),
+      messages: messagesMapped,
+      stream: true as const,
+    };
+    let defaultRole: OpenAIRoleEnum | undefined;
+    const streamIterable = await this.completionWithRetry(params, options);
+    let usage: OpenAIClient.Completions.CompletionUsage | undefined;
+    for await (const data of streamIterable) {
+      const choice = data.choices[0] as
+        | Partial<OpenAIClient.Chat.Completions.ChatCompletionChunk.Choice>
+        | undefined;
+      if (data.usage) {
+        usage = data.usage;
+      }
+      if (!choice) {
+        continue;
+      }
+      const { delta } = choice;
+      if (!delta) {
+        continue;
+      }
+      const chunk = this._convertOpenAIDeltaToBaseMessageChunk(
+        delta,
+        data,
+        defaultRole
+      );
+      if (chunk.usage_metadata != null) {
+        chunk.usage_metadata = {
+          input_tokens:
+            (chunk.usage_metadata as Partial<UsageMetadata>).input_tokens ?? 0,
+          output_tokens:
+            (chunk.usage_metadata as Partial<UsageMetadata>).output_tokens ?? 0,
+          total_tokens:
+            (chunk.usage_metadata as Partial<UsageMetadata>).total_tokens ?? 0,
+        };
+      }
+      if ('reasoning_content' in delta) {
+        chunk.additional_kwargs.reasoning_content = delta.reasoning_content;
+      }
+      defaultRole = delta.role ?? defaultRole;
+      const newTokenIndices = {
+        prompt: (options as OpenAIChatCallOptions).promptIndex ?? 0,
+        completion: choice.index ?? 0,
+      };
+      if (typeof chunk.content !== 'string') {
+        // eslint-disable-next-line no-console
+        console.log(
+          '[WARNING]: Received non-string content from OpenAI. This is currently not supported.'
+        );
+        continue;
+      }
+      // eslint-disable-next-line @typescript-eslint/no-explicit-any
+      const generationInfo: Record<string, any> = { ...newTokenIndices };
+      if (choice.finish_reason != null) {
+        generationInfo.finish_reason = choice.finish_reason;
+        // Only include system fingerprint in the last chunk for now
+        // to avoid concatenation issues
+        generationInfo.system_fingerprint = data.system_fingerprint;
+        generationInfo.model_name = data.model;
+        generationInfo.service_tier = data.service_tier;
+      }
+      if (this.logprobs == true) {
+        generationInfo.logprobs = choice.logprobs;
+      }
+      const generationChunk = new ChatGenerationChunk({
+        message: chunk,
+        text: chunk.content,
+        generationInfo,
+      });
+      yield generationChunk;
+      await runManager?.handleLLMNewToken(
+        generationChunk.text || '',
+        newTokenIndices,
+        undefined,
+        undefined,
+        undefined,
+        { chunk: generationChunk }
+      );
+    }
+    if (usage) {
+      // Type assertion for xAI-specific usage structure
+      const xaiUsage = usage as XAIUsageMetadata;
+      const inputTokenDetails = {
+        // Standard OpenAI fields
+        ...(usage.prompt_tokens_details?.audio_tokens != null && {
+          audio: usage.prompt_tokens_details.audio_tokens,
+        }),
+        ...(usage.prompt_tokens_details?.cached_tokens != null && {
+          cache_read: usage.prompt_tokens_details.cached_tokens,
+        }),
+        // Add xAI-specific prompt token details if they exist
+        ...(xaiUsage.prompt_tokens_details?.text_tokens != null && {
+          text: xaiUsage.prompt_tokens_details.text_tokens,
+        }),
+        ...(xaiUsage.prompt_tokens_details?.image_tokens != null && {
+          image: xaiUsage.prompt_tokens_details.image_tokens,
+        }),
+      };
+      const outputTokenDetails = {
+        // Standard OpenAI fields
+        ...(usage.completion_tokens_details?.audio_tokens != null && {
+          audio: usage.completion_tokens_details.audio_tokens,
+        }),
+        ...(usage.completion_tokens_details?.reasoning_tokens != null && {
+          reasoning: usage.completion_tokens_details.reasoning_tokens,
+        }),
+        // Add xAI-specific completion token details if they exist
+        ...(xaiUsage.completion_tokens_details?.accepted_prediction_tokens !=
+          null && {
+          accepted_prediction:
+            xaiUsage.completion_tokens_details.accepted_prediction_tokens,
+        }),
+        ...(xaiUsage.completion_tokens_details?.rejected_prediction_tokens !=
+          null && {
+          rejected_prediction:
+            xaiUsage.completion_tokens_details.rejected_prediction_tokens,
+        }),
+      };
+      const generationChunk = new ChatGenerationChunk({
+        message: new AIMessageChunk({
+          content: '',
+          response_metadata: {
+            usage: { ...usage },
+            // Include xAI-specific metadata if it exists
+            ...(xaiUsage.num_sources_used != null && {
+              num_sources_used: xaiUsage.num_sources_used,
+            }),
+          },
+          usage_metadata: {
+            input_tokens: usage.prompt_tokens,
+            output_tokens: usage.completion_tokens,
+            total_tokens: usage.total_tokens,
+            ...(Object.keys(inputTokenDetails).length > 0 && {
+              input_token_details: inputTokenDetails,
+            }),
+            ...(Object.keys(outputTokenDetails).length > 0 && {
+              output_token_details: outputTokenDetails,
+            }),
+          },
+        }),
+        text: '',
+      });
+      yield generationChunk;
+    }
+    if (options.signal?.aborted === true) {
+      throw new Error('AbortError');
+    }
+  }
 }