npm - @librechat/agents - Versions diffs - 3.1.75 → 3.1.77-dev.1 - Mend

@librechat/agents 3.1.75 → 3.1.77-dev.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (272) hide show

package/dist/cjs/graphs/Graph.cjs +22 -3
package/dist/cjs/graphs/Graph.cjs.map +1 -1
package/dist/cjs/hitl/askUserQuestion.cjs +67 -0
package/dist/cjs/hitl/askUserQuestion.cjs.map +1 -0
package/dist/cjs/hooks/HookRegistry.cjs +54 -0
package/dist/cjs/hooks/HookRegistry.cjs.map +1 -1
package/dist/cjs/hooks/createToolPolicyHook.cjs +115 -0
package/dist/cjs/hooks/createToolPolicyHook.cjs.map +1 -0
package/dist/cjs/hooks/executeHooks.cjs +40 -1
package/dist/cjs/hooks/executeHooks.cjs.map +1 -1
package/dist/cjs/hooks/types.cjs +1 -0
package/dist/cjs/hooks/types.cjs.map +1 -1
package/dist/cjs/langchain/google-common.cjs +3 -0
package/dist/cjs/langchain/google-common.cjs.map +1 -0
package/dist/cjs/langchain/index.cjs +86 -0
package/dist/cjs/langchain/index.cjs.map +1 -0
package/dist/cjs/langchain/language_models/chat_models.cjs +3 -0
package/dist/cjs/langchain/language_models/chat_models.cjs.map +1 -0
package/dist/cjs/langchain/messages/tool.cjs +3 -0
package/dist/cjs/langchain/messages/tool.cjs.map +1 -0
package/dist/cjs/langchain/messages.cjs +51 -0
package/dist/cjs/langchain/messages.cjs.map +1 -0
package/dist/cjs/langchain/openai.cjs +3 -0
package/dist/cjs/langchain/openai.cjs.map +1 -0
package/dist/cjs/langchain/prompts.cjs +11 -0
package/dist/cjs/langchain/prompts.cjs.map +1 -0
package/dist/cjs/langchain/runnables.cjs +19 -0
package/dist/cjs/langchain/runnables.cjs.map +1 -0
package/dist/cjs/langchain/tools.cjs +23 -0
package/dist/cjs/langchain/tools.cjs.map +1 -0
package/dist/cjs/langchain/utils/env.cjs +11 -0
package/dist/cjs/langchain/utils/env.cjs.map +1 -0
package/dist/cjs/llm/anthropic/index.cjs +145 -52
package/dist/cjs/llm/anthropic/index.cjs.map +1 -1
package/dist/cjs/llm/anthropic/types.cjs.map +1 -1
package/dist/cjs/llm/anthropic/utils/message_inputs.cjs +21 -14
package/dist/cjs/llm/anthropic/utils/message_inputs.cjs.map +1 -1
package/dist/cjs/llm/anthropic/utils/message_outputs.cjs +84 -70
package/dist/cjs/llm/anthropic/utils/message_outputs.cjs.map +1 -1
package/dist/cjs/llm/bedrock/index.cjs +1 -1
package/dist/cjs/llm/bedrock/index.cjs.map +1 -1
package/dist/cjs/llm/bedrock/utils/message_inputs.cjs +213 -3
package/dist/cjs/llm/bedrock/utils/message_inputs.cjs.map +1 -1
package/dist/cjs/llm/bedrock/utils/message_outputs.cjs +2 -1
package/dist/cjs/llm/bedrock/utils/message_outputs.cjs.map +1 -1
package/dist/cjs/llm/google/utils/common.cjs +5 -4
package/dist/cjs/llm/google/utils/common.cjs.map +1 -1
package/dist/cjs/llm/openai/index.cjs +519 -655
package/dist/cjs/llm/openai/index.cjs.map +1 -1
package/dist/cjs/llm/openai/utils/index.cjs +20 -458
package/dist/cjs/llm/openai/utils/index.cjs.map +1 -1
package/dist/cjs/llm/openrouter/index.cjs +57 -175
package/dist/cjs/llm/openrouter/index.cjs.map +1 -1
package/dist/cjs/llm/vertexai/index.cjs +5 -3
package/dist/cjs/llm/vertexai/index.cjs.map +1 -1
package/dist/cjs/main.cjs +112 -3
package/dist/cjs/main.cjs.map +1 -1
package/dist/cjs/messages/cache.cjs +2 -1
package/dist/cjs/messages/cache.cjs.map +1 -1
package/dist/cjs/messages/core.cjs +7 -6
package/dist/cjs/messages/core.cjs.map +1 -1
package/dist/cjs/messages/format.cjs +73 -15
package/dist/cjs/messages/format.cjs.map +1 -1
package/dist/cjs/messages/langchain.cjs +26 -0
package/dist/cjs/messages/langchain.cjs.map +1 -0
package/dist/cjs/messages/prune.cjs +7 -6
package/dist/cjs/messages/prune.cjs.map +1 -1
package/dist/cjs/run.cjs +400 -42
package/dist/cjs/run.cjs.map +1 -1
package/dist/cjs/tools/ToolNode.cjs +556 -56
package/dist/cjs/tools/ToolNode.cjs.map +1 -1
package/dist/cjs/tools/search/search.cjs +55 -66
package/dist/cjs/tools/search/search.cjs.map +1 -1
package/dist/cjs/tools/search/tavily-scraper.cjs +189 -0
package/dist/cjs/tools/search/tavily-scraper.cjs.map +1 -0
package/dist/cjs/tools/search/tavily-search.cjs +372 -0
package/dist/cjs/tools/search/tavily-search.cjs.map +1 -0
package/dist/cjs/tools/search/tool.cjs +26 -4
package/dist/cjs/tools/search/tool.cjs.map +1 -1
package/dist/cjs/tools/search/utils.cjs +10 -3
package/dist/cjs/tools/search/utils.cjs.map +1 -1
package/dist/esm/graphs/Graph.mjs +22 -3
package/dist/esm/graphs/Graph.mjs.map +1 -1
package/dist/esm/hitl/askUserQuestion.mjs +65 -0
package/dist/esm/hitl/askUserQuestion.mjs.map +1 -0
package/dist/esm/hooks/HookRegistry.mjs +54 -0
package/dist/esm/hooks/HookRegistry.mjs.map +1 -1
package/dist/esm/hooks/createToolPolicyHook.mjs +113 -0
package/dist/esm/hooks/createToolPolicyHook.mjs.map +1 -0
package/dist/esm/hooks/executeHooks.mjs +40 -1
package/dist/esm/hooks/executeHooks.mjs.map +1 -1
package/dist/esm/hooks/types.mjs +1 -0
package/dist/esm/hooks/types.mjs.map +1 -1
package/dist/esm/langchain/google-common.mjs +2 -0
package/dist/esm/langchain/google-common.mjs.map +1 -0
package/dist/esm/langchain/index.mjs +5 -0
package/dist/esm/langchain/index.mjs.map +1 -0
package/dist/esm/langchain/language_models/chat_models.mjs +2 -0
package/dist/esm/langchain/language_models/chat_models.mjs.map +1 -0
package/dist/esm/langchain/messages/tool.mjs +2 -0
package/dist/esm/langchain/messages/tool.mjs.map +1 -0
package/dist/esm/langchain/messages.mjs +2 -0
package/dist/esm/langchain/messages.mjs.map +1 -0
package/dist/esm/langchain/openai.mjs +2 -0
package/dist/esm/langchain/openai.mjs.map +1 -0
package/dist/esm/langchain/prompts.mjs +2 -0
package/dist/esm/langchain/prompts.mjs.map +1 -0
package/dist/esm/langchain/runnables.mjs +2 -0
package/dist/esm/langchain/runnables.mjs.map +1 -0
package/dist/esm/langchain/tools.mjs +2 -0
package/dist/esm/langchain/tools.mjs.map +1 -0
package/dist/esm/langchain/utils/env.mjs +2 -0
package/dist/esm/langchain/utils/env.mjs.map +1 -0
package/dist/esm/llm/anthropic/index.mjs +146 -54
package/dist/esm/llm/anthropic/index.mjs.map +1 -1
package/dist/esm/llm/anthropic/types.mjs.map +1 -1
package/dist/esm/llm/anthropic/utils/message_inputs.mjs +21 -14
package/dist/esm/llm/anthropic/utils/message_inputs.mjs.map +1 -1
package/dist/esm/llm/anthropic/utils/message_outputs.mjs +84 -71
package/dist/esm/llm/anthropic/utils/message_outputs.mjs.map +1 -1
package/dist/esm/llm/bedrock/index.mjs +1 -1
package/dist/esm/llm/bedrock/index.mjs.map +1 -1
package/dist/esm/llm/bedrock/utils/message_inputs.mjs +214 -4
package/dist/esm/llm/bedrock/utils/message_inputs.mjs.map +1 -1
package/dist/esm/llm/bedrock/utils/message_outputs.mjs +2 -1
package/dist/esm/llm/bedrock/utils/message_outputs.mjs.map +1 -1
package/dist/esm/llm/google/utils/common.mjs +5 -4
package/dist/esm/llm/google/utils/common.mjs.map +1 -1
package/dist/esm/llm/openai/index.mjs +520 -656
package/dist/esm/llm/openai/index.mjs.map +1 -1
package/dist/esm/llm/openai/utils/index.mjs +23 -459
package/dist/esm/llm/openai/utils/index.mjs.map +1 -1
package/dist/esm/llm/openrouter/index.mjs +57 -175
package/dist/esm/llm/openrouter/index.mjs.map +1 -1
package/dist/esm/llm/vertexai/index.mjs +5 -3
package/dist/esm/llm/vertexai/index.mjs.map +1 -1
package/dist/esm/main.mjs +7 -0
package/dist/esm/main.mjs.map +1 -1
package/dist/esm/messages/cache.mjs +2 -1
package/dist/esm/messages/cache.mjs.map +1 -1
package/dist/esm/messages/core.mjs +7 -6
package/dist/esm/messages/core.mjs.map +1 -1
package/dist/esm/messages/format.mjs +73 -15
package/dist/esm/messages/format.mjs.map +1 -1
package/dist/esm/messages/langchain.mjs +23 -0
package/dist/esm/messages/langchain.mjs.map +1 -0
package/dist/esm/messages/prune.mjs +7 -6
package/dist/esm/messages/prune.mjs.map +1 -1
package/dist/esm/run.mjs +400 -42
package/dist/esm/run.mjs.map +1 -1
package/dist/esm/tools/ToolNode.mjs +557 -57
package/dist/esm/tools/ToolNode.mjs.map +1 -1
package/dist/esm/tools/search/search.mjs +55 -66
package/dist/esm/tools/search/search.mjs.map +1 -1
package/dist/esm/tools/search/tavily-scraper.mjs +186 -0
package/dist/esm/tools/search/tavily-scraper.mjs.map +1 -0
package/dist/esm/tools/search/tavily-search.mjs +370 -0
package/dist/esm/tools/search/tavily-search.mjs.map +1 -0
package/dist/esm/tools/search/tool.mjs +26 -4
package/dist/esm/tools/search/tool.mjs.map +1 -1
package/dist/esm/tools/search/utils.mjs +10 -3
package/dist/esm/tools/search/utils.mjs.map +1 -1
package/dist/types/graphs/Graph.d.ts +7 -0
package/dist/types/hitl/askUserQuestion.d.ts +55 -0
package/dist/types/hitl/index.d.ts +6 -0
package/dist/types/hooks/HookRegistry.d.ts +58 -0
package/dist/types/hooks/createToolPolicyHook.d.ts +87 -0
package/dist/types/hooks/index.d.ts +4 -1
package/dist/types/hooks/types.d.ts +109 -3
package/dist/types/index.d.ts +10 -0
package/dist/types/langchain/google-common.d.ts +1 -0
package/dist/types/langchain/index.d.ts +8 -0
package/dist/types/langchain/language_models/chat_models.d.ts +1 -0
package/dist/types/langchain/messages/tool.d.ts +1 -0
package/dist/types/langchain/messages.d.ts +2 -0
package/dist/types/langchain/openai.d.ts +1 -0
package/dist/types/langchain/prompts.d.ts +1 -0
package/dist/types/langchain/runnables.d.ts +2 -0
package/dist/types/langchain/tools.d.ts +2 -0
package/dist/types/langchain/utils/env.d.ts +1 -0
package/dist/types/llm/anthropic/index.d.ts +22 -9
package/dist/types/llm/anthropic/types.d.ts +5 -1
package/dist/types/llm/anthropic/utils/message_outputs.d.ts +13 -6
package/dist/types/llm/anthropic/utils/output_parsers.d.ts +1 -1
package/dist/types/llm/openai/index.d.ts +21 -24
package/dist/types/llm/openrouter/index.d.ts +11 -9
package/dist/types/llm/vertexai/index.d.ts +1 -0
package/dist/types/messages/cache.d.ts +4 -1
package/dist/types/messages/format.d.ts +4 -1
package/dist/types/messages/langchain.d.ts +27 -0
package/dist/types/run.d.ts +117 -1
package/dist/types/tools/ToolNode.d.ts +26 -1
package/dist/types/tools/search/tavily-scraper.d.ts +19 -0
package/dist/types/tools/search/tavily-search.d.ts +4 -0
package/dist/types/tools/search/types.d.ts +99 -5
package/dist/types/tools/search/utils.d.ts +2 -2
package/dist/types/types/graph.d.ts +23 -37
package/dist/types/types/hitl.d.ts +272 -0
package/dist/types/types/index.d.ts +1 -0
package/dist/types/types/llm.d.ts +3 -3
package/dist/types/types/run.d.ts +33 -0
package/dist/types/types/stream.d.ts +1 -1
package/dist/types/types/tools.d.ts +19 -0
package/package.json +80 -17
package/src/graphs/Graph.ts +33 -4
package/src/graphs/__tests__/composition.smoke.test.ts +188 -0
package/src/hitl/askUserQuestion.ts +72 -0
package/src/hitl/index.ts +7 -0
package/src/hooks/HookRegistry.ts +71 -0
package/src/hooks/__tests__/createToolPolicyHook.test.ts +259 -0
package/src/hooks/createToolPolicyHook.ts +184 -0
package/src/hooks/executeHooks.ts +50 -1
package/src/hooks/index.ts +6 -0
package/src/hooks/types.ts +112 -0
package/src/index.ts +22 -0
package/src/langchain/google-common.ts +1 -0
package/src/langchain/index.ts +8 -0
package/src/langchain/language_models/chat_models.ts +1 -0
package/src/langchain/messages/tool.ts +5 -0
package/src/langchain/messages.ts +21 -0
package/src/langchain/openai.ts +1 -0
package/src/langchain/prompts.ts +1 -0
package/src/langchain/runnables.ts +7 -0
package/src/langchain/tools.ts +8 -0
package/src/langchain/utils/env.ts +1 -0
package/src/llm/anthropic/index.ts +252 -84
package/src/llm/anthropic/llm.spec.ts +751 -102
package/src/llm/anthropic/types.ts +9 -1
package/src/llm/anthropic/utils/message_inputs.ts +37 -19
package/src/llm/anthropic/utils/message_outputs.ts +119 -101
package/src/llm/bedrock/index.ts +2 -2
package/src/llm/bedrock/llm.spec.ts +341 -0
package/src/llm/bedrock/utils/message_inputs.ts +303 -4
package/src/llm/bedrock/utils/message_outputs.ts +2 -1
package/src/llm/custom-chat-models.smoke.test.ts +836 -0
package/src/llm/google/llm.spec.ts +339 -57
package/src/llm/google/utils/common.ts +53 -48
package/src/llm/openai/contentBlocks.test.ts +346 -0
package/src/llm/openai/index.ts +856 -833
package/src/llm/openai/utils/index.ts +107 -78
package/src/llm/openai/utils/messages.test.ts +159 -0
package/src/llm/openrouter/index.ts +124 -247
package/src/llm/openrouter/reasoning.test.ts +8 -1
package/src/llm/vertexai/index.ts +11 -5
package/src/llm/vertexai/llm.spec.ts +28 -1
package/src/messages/cache.test.ts +4 -3
package/src/messages/cache.ts +3 -2
package/src/messages/core.ts +16 -9
package/src/messages/format.ts +96 -16
package/src/messages/formatAgentMessages.test.ts +166 -1
package/src/messages/langchain.ts +39 -0
package/src/messages/prune.ts +12 -8
package/src/run.ts +456 -47
package/src/scripts/caching.ts +2 -3
package/src/specs/summarization.test.ts +51 -58
package/src/tools/ToolNode.ts +706 -63
package/src/tools/__tests__/hitl.test.ts +3593 -0
package/src/tools/search/search.ts +83 -73
package/src/tools/search/tavily-scraper.ts +235 -0
package/src/tools/search/tavily-search.ts +424 -0
package/src/tools/search/tavily.test.ts +965 -0
package/src/tools/search/tool.ts +36 -26
package/src/tools/search/types.ts +133 -8
package/src/tools/search/utils.ts +13 -5
package/src/types/graph.ts +32 -87
package/src/types/hitl.ts +303 -0
package/src/types/index.ts +1 -0
package/src/types/llm.ts +3 -3
package/src/types/run.ts +33 -0
package/src/types/stream.ts +1 -1
package/src/types/tools.ts +19 -0
package/src/utils/llmConfig.ts +1 -6

package/src/llm/openai/index.ts CHANGED Viewed

@@ -1,36 +1,40 @@
 import { AzureOpenAI as AzureOpenAIClient } from 'openai';
 import { ChatXAI as OriginalChatXAI } from '@langchain/xai';
 import { ChatGenerationChunk } from '@langchain/core/outputs';
-import { AIMessage, AIMessageChunk } from '@langchain/core/messages';
+import {
+  AIMessage,
+  AIMessageChunk,
+  isAIMessage,
+} from '@langchain/core/messages';
 import { ToolDefinition } from '@langchain/core/language_models/base';
-import { isLangChainTool } from '@langchain/core/utils/function_calling';
+import {
+  convertToOpenAITool,
+  isLangChainTool,
+} from '@langchain/core/utils/function_calling';
 import { ChatDeepSeek as OriginalChatDeepSeek } from '@langchain/deepseek';
 import { CallbackManagerForLLMRun } from '@langchain/core/callbacks/manager';
 import {
   getEndpoint,
   OpenAIClient,
-  formatToOpenAITool,
+  getHeadersWithUserAgent,
   ChatOpenAI as OriginalChatOpenAI,
+  ChatOpenAIResponses as OriginalChatOpenAIResponses,
+  ChatOpenAICompletions as OriginalChatOpenAICompletions,
   AzureChatOpenAI as OriginalAzureChatOpenAI,
+  AzureChatOpenAIResponses as OriginalAzureChatOpenAIResponses,
+  AzureChatOpenAICompletions as OriginalAzureChatOpenAICompletions,
 } from '@langchain/openai';
+import type { HeaderValue, HeadersLike } from './types';
 import type {
-  OpenAIChatCallOptions,
-  OpenAIRoleEnum,
-  HeaderValue,
-  HeadersLike,
-} from './types';
+  BaseMessage,
+  BaseMessageChunk,
+  UsageMetadata,
+} from '@langchain/core/messages';
 import type { BindToolsInput } from '@langchain/core/language_models/chat_models';
-import type { BaseMessage, UsageMetadata } from '@langchain/core/messages';
-import type { ChatResult, ChatGeneration } from '@langchain/core/outputs';
+import type { ChatGeneration, ChatResult } from '@langchain/core/outputs';
 import type { ChatXAIInput } from '@langchain/xai';
 import type * as t from '@langchain/openai';
-import {
-  isReasoningModel,
-  _convertMessagesToOpenAIParams,
-  _convertMessagesToOpenAIResponsesParams,
-  _convertOpenAIResponsesDeltaToBaseMessageChunk,
-  type ResponseReturnStreamEvents,
-} from './utils';
+import { isReasoningModel, _convertMessagesToOpenAIParams } from './utils';
 import { sleep } from '@/utils';
 // eslint-disable-next-line @typescript-eslint/explicit-function-return-type
@@ -79,10 +83,274 @@ export function normalizeHeaders(
   return Object.fromEntries(output.entries());
 }
+type OpenAICoreRequestOptions = OpenAIClient.RequestOptions;
 type OpenAICompletionParam =
   OpenAIClient.Chat.Completions.ChatCompletionMessageParam;
+type OpenAIClientConfig = NonNullable<
+  ConstructorParameters<typeof OpenAIClient>[0]
+>;
+type LibreChatOpenAIFields = t.ChatOpenAIFields & {
+  _lc_stream_delay?: number;
+  includeReasoningContent?: boolean;
+  includeReasoningDetails?: boolean;
+  convertReasoningDetailsToContent?: boolean;
+};
+type LibreChatAzureOpenAIFields = t.AzureOpenAIInput & {
+  _lc_stream_delay?: number;
+};
+type ReasoningCallOptions = {
+  reasoning?: OpenAIClient.Reasoning;
+  reasoningEffort?: OpenAIClient.Reasoning['effort'];
+};
+type OpenAIDeltaWithLibreChatFields = Record<string, unknown> & {
+  reasoning?: unknown;
+  reasoning_details?: unknown;
+  provider_specific_fields?: unknown;
+};
+type OpenAIClientOwner = {
+  client?: OpenAIClient;
+  clientConfig: OpenAIClientConfig;
+  timeout?: number;
+};
+type AbortableOpenAIClient = CustomOpenAIClient | CustomAzureOpenAIClient;
+type OpenAIClientDelegate = {
+  client?: AbortableOpenAIClient;
+  _getClientOptions(
+    options: OpenAICoreRequestOptions | undefined
+  ): OpenAICoreRequestOptions;
+};
+type OpenAIChatCompletion = OpenAIClient.Chat.Completions.ChatCompletion;
+type OpenAIChatCompletionChunk =
+  OpenAIClient.Chat.Completions.ChatCompletionChunk;
+type OpenAIChatCompletionStreamItem =
+  | OpenAIChatCompletionChunk
+  | {
+      event: string;
+      data?: unknown;
+    };
+type OpenAIChatCompletionRequest =
+  | OpenAIClient.Chat.ChatCompletionCreateParamsStreaming
+  | OpenAIClient.Chat.ChatCompletionCreateParamsNonStreaming;
+type OpenAIChatCompletionResult =
+  | AsyncIterable<OpenAIChatCompletionChunk>
+  | OpenAIChatCompletion;
+type OpenAIChatCompletionRetry = (
+  request: OpenAIChatCompletionRequest,
+  requestOptions?: OpenAICoreRequestOptions
+) => Promise<
+  AsyncIterable<OpenAIChatCompletionStreamItem> | OpenAIChatCompletion
+>;
+function getExposedOpenAIClient(
+  completions: OpenAIClientDelegate,
+  responses: OpenAIClientDelegate,
+  preferResponses: boolean
+): AbortableOpenAIClient {
+  const responsesClient = responses.client;
+  if (responsesClient?.abortHandler != null) {
+    return responsesClient;
+  }
+  const completionsClient = completions.client;
+  if (completionsClient?.abortHandler != null) {
+    return completionsClient;
+  }
-type OpenAICoreRequestOptions = OpenAIClient.RequestOptions;
+  const delegate = preferResponses ? responses : completions;
+  delegate._getClientOptions(undefined);
+  return delegate.client as AbortableOpenAIClient;
+}
+function getReasoningParams(
+  baseReasoning: OpenAIClient.Reasoning | undefined,
+  options?: ReasoningCallOptions
+): OpenAIClient.Reasoning | undefined {
+  let reasoning: OpenAIClient.Reasoning | undefined;
+  if (baseReasoning !== undefined) {
+    reasoning = {
+      ...reasoning,
+      ...baseReasoning,
+    };
+  }
+  if (options?.reasoning !== undefined) {
+    reasoning = {
+      ...reasoning,
+      ...options.reasoning,
+    };
+  }
+  if (
+    options?.reasoningEffort !== undefined &&
+    reasoning?.effort === undefined
+  ) {
+    reasoning = {
+      ...reasoning,
+      effort: options.reasoningEffort,
+    };
+  }
+  return reasoning;
+}
+function getGatedReasoningParams(
+  model: string,
+  baseReasoning: OpenAIClient.Reasoning | undefined,
+  options?: ReasoningCallOptions
+): OpenAIClient.Reasoning | undefined {
+  if (!isReasoningModel(model)) {
+    return;
+  }
+  return getReasoningParams(baseReasoning, options);
+}
+function isObject(value: unknown): value is object {
+  return typeof value === 'object' && value !== null;
+}
+function isOpenAIChatCompletionChunk(
+  value: unknown
+): value is OpenAIChatCompletionChunk {
+  if (!isObject(value)) {
+    return false;
+  }
+  // Intentionally loose: downstream handlers already tolerate empty choices.
+  const { choices } = value as { choices?: unknown };
+  return Array.isArray(choices);
+}
+function getOpenAIChatCompletionChunk(
+  value: OpenAIChatCompletionStreamItem
+): OpenAIChatCompletionChunk | undefined {
+  if (isOpenAIChatCompletionChunk(value)) {
+    return value;
+  }
+  const { data } = value;
+  if (isOpenAIChatCompletionChunk(data)) {
+    return data;
+  }
+  return undefined;
+}
+async function* filterOpenAIChatCompletionStream(
+  stream: AsyncIterable<OpenAIChatCompletionStreamItem>
+): AsyncGenerator<OpenAIChatCompletionChunk> {
+  for await (const item of stream) {
+    const chunk = getOpenAIChatCompletionChunk(item);
+    if (chunk == null) {
+      continue;
+    }
+    yield chunk;
+  }
+}
+async function completionWithFilteredOpenAIStream(
+  request: OpenAIChatCompletionRequest,
+  requestOptions: OpenAICoreRequestOptions | undefined,
+  completionWithRetry: OpenAIChatCompletionRetry
+): Promise<OpenAIChatCompletionResult> {
+  if (request.stream !== true) {
+    return (await completionWithRetry(
+      request,
+      requestOptions
+    )) as OpenAIChatCompletion;
+  }
+  const stream = await completionWithRetry(request, requestOptions);
+  return filterOpenAIChatCompletionStream(
+    stream as AsyncIterable<OpenAIChatCompletionStreamItem>
+  );
+}
+function attachLibreChatDeltaFields(
+  chunk: BaseMessageChunk,
+  delta: Record<string, unknown>
+): BaseMessageChunk {
+  if (!AIMessageChunk.isInstance(chunk)) {
+    return chunk;
+  }
+  const libreChatDelta = delta as OpenAIDeltaWithLibreChatFields;
+  if (
+    libreChatDelta.reasoning != null &&
+    chunk.additional_kwargs.reasoning_content == null
+  ) {
+    chunk.additional_kwargs.reasoning_content = libreChatDelta.reasoning;
+  }
+  if (libreChatDelta.reasoning_details != null) {
+    chunk.additional_kwargs.reasoning_details =
+      libreChatDelta.reasoning_details;
+  }
+  if (libreChatDelta.provider_specific_fields != null) {
+    chunk.additional_kwargs.provider_specific_fields =
+      libreChatDelta.provider_specific_fields;
+  }
+  return chunk;
+}
+function attachLibreChatMessageFields(
+  message: BaseMessage,
+  rawMessage: Record<string, unknown>
+): BaseMessage {
+  if (!isAIMessage(message)) {
+    return message;
+  }
+  if (
+    rawMessage.reasoning != null &&
+    message.additional_kwargs.reasoning_content == null
+  ) {
+    message.additional_kwargs.reasoning_content = rawMessage.reasoning;
+  }
+  if (rawMessage.reasoning_details != null) {
+    message.additional_kwargs.reasoning_details = rawMessage.reasoning_details;
+  }
+  if (rawMessage.provider_specific_fields != null) {
+    message.additional_kwargs.provider_specific_fields =
+      rawMessage.provider_specific_fields;
+  }
+  return message;
+}
+function getCustomOpenAIClientOptions(
+  owner: OpenAIClientOwner,
+  options?: OpenAICoreRequestOptions
+): OpenAICoreRequestOptions {
+  if (!(owner.client as OpenAIClient | undefined)) {
+    const openAIEndpointConfig: t.OpenAIEndpointConfig = {
+      baseURL: owner.clientConfig.baseURL,
+    };
+    const endpoint = getEndpoint(openAIEndpointConfig);
+    const params = {
+      ...owner.clientConfig,
+      baseURL: endpoint,
+      timeout: owner.timeout,
+      maxRetries: 0,
+    };
+    if (params.baseURL == null) {
+      delete params.baseURL;
+    }
+    params.defaultHeaders = getHeadersWithUserAgent(params.defaultHeaders);
+    owner.client = new CustomOpenAIClient(params);
+  }
+  const requestOptions = {
+    ...owner.clientConfig,
+    ...options,
+  } as OpenAICoreRequestOptions;
+  return requestOptions;
+}
+async function* delayStreamChunks<T>(
+  chunks: AsyncGenerator<T>,
+  delay?: number
+): AsyncGenerator<T> {
+  for await (const chunk of chunks) {
+    yield chunk;
+    if (delay != null) {
+      await sleep(delay);
+    }
+  }
+}
 function createAbortHandler(controller: AbortController): () => void {
   return function (): void {
@@ -113,7 +381,7 @@ export function _convertToOpenAITool(
   let toolDef: OpenAIClient.ChatCompletionTool | undefined;
   if (isLangChainTool(tool)) {
-    toolDef = formatToOpenAITool(tool);
+    toolDef = convertToOpenAITool(tool);
   } else {
     toolDef = tool as ToolDefinition;
   }
@@ -195,134 +463,261 @@ export class CustomAzureOpenAIClient extends AzureOpenAIClient {
   }
 }
-/** @ts-expect-error We are intentionally overriding `getReasoningParams` */
-export class ChatOpenAI extends OriginalChatOpenAI<t.ChatOpenAICallOptions> {
-  _lc_stream_delay?: number;
+class LibreChatOpenAICompletions extends OriginalChatOpenAICompletions {
+  private includeReasoningContent?: boolean;
+  private includeReasoningDetails?: boolean;
+  private convertReasoningDetailsToContent?: boolean;
-  constructor(
-    fields?: t.ChatOpenAICallOptions & {
-      _lc_stream_delay?: number;
-    } & t.OpenAIChatInput['modelKwargs']
-  ) {
+  constructor(fields?: LibreChatOpenAIFields) {
     super(fields);
-    this._lc_stream_delay = fields?._lc_stream_delay;
+    this.includeReasoningContent = fields?.includeReasoningContent;
+    this.includeReasoningDetails = fields?.includeReasoningDetails;
+    this.convertReasoningDetailsToContent =
+      fields?.convertReasoningDetailsToContent;
   }
-  public get exposedClient(): CustomOpenAIClient {
-    return this.client;
-  }
-  static lc_name(): string {
-    return 'LibreChatOpenAI';
+  protected _getReasoningParams(
+    options?: this['ParsedCallOptions']
+  ): OpenAIClient.Reasoning | undefined {
+    return getReasoningParams(this.reasoning, options);
   }
-  protected _getClientOptions(
+  _getClientOptions(
     options?: OpenAICoreRequestOptions
   ): OpenAICoreRequestOptions {
-    if (!(this.client as OpenAIClient | undefined)) {
-      const openAIEndpointConfig: t.OpenAIEndpointConfig = {
-        baseURL: this.clientConfig.baseURL,
-      };
-      const endpoint = getEndpoint(openAIEndpointConfig);
-      const params = {
-        ...this.clientConfig,
-        baseURL: endpoint,
-        timeout: this.timeout,
-        maxRetries: 0,
-      };
-      if (params.baseURL == null) {
-        delete params.baseURL;
-      }
-      this.client = new CustomOpenAIClient(params);
-    }
-    const requestOptions = {
-      ...this.clientConfig,
-      ...options,
-    } as OpenAICoreRequestOptions;
-    return requestOptions;
+    return getCustomOpenAIClientOptions(this, options);
   }
-  /**
-   * Returns backwards compatible reasoning parameters from constructor params and call options
-   * @internal
-   */
-  getReasoningParams(
-    options?: this['ParsedCallOptions']
-  ): OpenAIClient.Reasoning | undefined {
-    // apply options in reverse order of importance -- newer options supersede older options
-    let reasoning: OpenAIClient.Reasoning | undefined;
-    if (this.reasoning !== undefined) {
-      reasoning = {
-        ...reasoning,
-        ...this.reasoning,
-      };
-    }
-    if (options?.reasoning !== undefined) {
-      reasoning = {
-        ...reasoning,
-        ...options.reasoning,
-      };
-    }
+  async completionWithRetry(
+    request: OpenAIClient.Chat.ChatCompletionCreateParamsStreaming,
+    requestOptions?: OpenAICoreRequestOptions
+  ): Promise<AsyncIterable<OpenAIChatCompletionChunk>>;
+  async completionWithRetry(
+    request: OpenAIClient.Chat.ChatCompletionCreateParamsNonStreaming,
+    requestOptions?: OpenAICoreRequestOptions
+  ): Promise<OpenAIChatCompletion>;
+  async completionWithRetry(
+    request:
+      | OpenAIClient.Chat.ChatCompletionCreateParamsStreaming
+      | OpenAIClient.Chat.ChatCompletionCreateParamsNonStreaming,
+    requestOptions?: OpenAICoreRequestOptions
+  ): Promise<AsyncIterable<OpenAIChatCompletionChunk> | OpenAIChatCompletion> {
+    return completionWithFilteredOpenAIStream(
+      request,
+      requestOptions,
+      super.completionWithRetry.bind(this) as OpenAIChatCompletionRetry
+    );
+  }
-    return reasoning;
+  protected _convertCompletionsDeltaToBaseMessageChunk(
+    delta: Record<string, unknown>,
+    rawResponse: OpenAIClient.Chat.Completions.ChatCompletionChunk,
+    defaultRole?: OpenAIClient.Chat.ChatCompletionRole
+  ): BaseMessageChunk {
+    return attachLibreChatDeltaFields(
+      super._convertCompletionsDeltaToBaseMessageChunk(
+        delta,
+        rawResponse,
+        defaultRole
+      ),
+      delta
+    );
   }
-  protected _getReasoningParams(
-    options?: this['ParsedCallOptions']
-  ): OpenAIClient.Reasoning | undefined {
-    return this.getReasoningParams(options);
+  protected _convertCompletionsMessageToBaseMessage(
+    message: OpenAIClient.ChatCompletionMessage,
+    rawResponse: OpenAIClient.ChatCompletion
+  ): BaseMessage {
+    return attachLibreChatMessageFields(
+      super._convertCompletionsMessageToBaseMessage(message, rawResponse),
+      message as unknown as Record<string, unknown>
+    );
   }
-  async *_streamResponseChunks(
+  async _generate(
     messages: BaseMessage[],
     options: this['ParsedCallOptions'],
     runManager?: CallbackManagerForLLMRun
-  ): AsyncGenerator<ChatGenerationChunk> {
-    if (!this._useResponseApi(options)) {
-      return yield* this._streamResponseChunks2(messages, options, runManager);
+  ): Promise<ChatResult> {
+    if (
+      this.includeReasoningContent !== true &&
+      this.includeReasoningDetails !== true
+    ) {
+      return super._generate(messages, options, runManager);
     }
-    const streamIterable = await this.responseApiWithRetry(
+    options.signal?.throwIfAborted();
+    const usageMetadata: Partial<UsageMetadata> = {};
+    const params = this.invocationParams(options);
+    const messagesMapped = _convertMessagesToOpenAIParams(
+      messages,
+      this.model,
       {
-        ...this.invocationParams<'responses'>(options, { streaming: true }),
-        input: _convertMessagesToOpenAIResponsesParams(
-          messages,
-          this.model,
-          this.zdrEnabled
-        ),
-        stream: true,
-      },
-      options
+        includeReasoningContent: this.includeReasoningContent,
+        includeReasoningDetails: this.includeReasoningDetails,
+        convertReasoningDetailsToContent: this.convertReasoningDetailsToContent,
+      }
     );
-    for await (const data of streamIterable) {
-      const chunk = _convertOpenAIResponsesDeltaToBaseMessageChunk(
-        data as ResponseReturnStreamEvents
-      );
-      if (chunk == null) continue;
-      yield chunk;
-      if (this._lc_stream_delay != null) {
-        await sleep(this._lc_stream_delay);
+    if (params.stream === true) {
+      const stream = this._streamResponseChunks(messages, options, runManager);
+      const finalChunks = new Map<number, ChatGenerationChunk>();
+      for await (const chunk of stream) {
+        chunk.message.response_metadata = {
+          ...chunk.generationInfo,
+          ...chunk.message.response_metadata,
+        };
+        const index =
+          typeof chunk.generationInfo?.completion === 'number'
+            ? chunk.generationInfo.completion
+            : 0;
+        const existingChunk = finalChunks.get(index);
+        if (existingChunk == null) {
+          finalChunks.set(index, chunk);
+        } else {
+          finalChunks.set(index, existingChunk.concat(chunk));
+        }
       }
-      await runManager?.handleLLMNewToken(
-        chunk.text || '',
-        undefined,
-        undefined,
-        undefined,
-        undefined,
-        { chunk }
+      const generations = Array.from(finalChunks.entries())
+        .sort(([aKey], [bKey]) => aKey - bKey)
+        .map(([, value]) => value);
+      const { functions, function_call } = this.invocationParams(options);
+      const promptTokenUsage = await this._getEstimatedTokenCountFromPrompt(
+        messages,
+        functions,
+        function_call
       );
+      const completionTokenUsage =
+        await this._getNumTokensFromGenerations(generations);
+      usageMetadata.input_tokens = promptTokenUsage;
+      usageMetadata.output_tokens = completionTokenUsage;
+      usageMetadata.total_tokens = promptTokenUsage + completionTokenUsage;
+      return {
+        generations,
+        llmOutput: {
+          estimatedTokenUsage: {
+            promptTokens: usageMetadata.input_tokens,
+            completionTokens: usageMetadata.output_tokens,
+            totalTokens: usageMetadata.total_tokens,
+          },
+        },
+      };
     }
-    return;
+    const data = await this.completionWithRetry(
+      {
+        ...params,
+        stream: false,
+        messages: messagesMapped,
+      },
+      {
+        signal: options.signal,
+        ...options.options,
+      }
+    );
+    const {
+      completion_tokens: completionTokens,
+      prompt_tokens: promptTokens,
+      total_tokens: totalTokens,
+      prompt_tokens_details: promptTokensDetails,
+      completion_tokens_details: completionTokensDetails,
+    } = data.usage ?? {};
+    if (completionTokens != null) {
+      usageMetadata.output_tokens =
+        (usageMetadata.output_tokens ?? 0) + completionTokens;
+    }
+    if (promptTokens != null) {
+      usageMetadata.input_tokens =
+        (usageMetadata.input_tokens ?? 0) + promptTokens;
+    }
+    if (totalTokens != null) {
+      usageMetadata.total_tokens =
+        (usageMetadata.total_tokens ?? 0) + totalTokens;
+    }
+    if (
+      promptTokensDetails?.audio_tokens != null ||
+      promptTokensDetails?.cached_tokens != null
+    ) {
+      usageMetadata.input_token_details = {
+        ...(promptTokensDetails.audio_tokens != null && {
+          audio: promptTokensDetails.audio_tokens,
+        }),
+        ...(promptTokensDetails.cached_tokens != null && {
+          cache_read: promptTokensDetails.cached_tokens,
+        }),
+      };
+    }
+    if (
+      completionTokensDetails?.audio_tokens != null ||
+      completionTokensDetails?.reasoning_tokens != null
+    ) {
+      usageMetadata.output_token_details = {
+        ...(completionTokensDetails.audio_tokens != null && {
+          audio: completionTokensDetails.audio_tokens,
+        }),
+        ...(completionTokensDetails.reasoning_tokens != null && {
+          reasoning: completionTokensDetails.reasoning_tokens,
+        }),
+      };
+    }
+    const generations: ChatGeneration[] = [];
+    for (const part of data.choices) {
+      const generation: ChatGeneration = {
+        text: part.message.content ?? '',
+        message: this._convertCompletionsMessageToBaseMessage(
+          part.message,
+          data
+        ),
+      };
+      generation.generationInfo = {
+        finish_reason: part.finish_reason,
+        ...(part.logprobs ? { logprobs: part.logprobs } : {}),
+      };
+      if (isAIMessage(generation.message)) {
+        generation.message.usage_metadata = usageMetadata as UsageMetadata;
+      }
+      generation.message = new AIMessage(
+        Object.fromEntries(
+          Object.entries(generation.message).filter(
+            ([key]) => !key.startsWith('lc_')
+          )
+        )
+      );
+      generations.push(generation);
+    }
+    return {
+      generations,
+      llmOutput: {
+        tokenUsage: {
+          promptTokens: usageMetadata.input_tokens,
+          completionTokens: usageMetadata.output_tokens,
+          totalTokens: usageMetadata.total_tokens,
+        },
+      },
+    };
   }
-  async *_streamResponseChunks2(
+  async *_streamResponseChunks(
     messages: BaseMessage[],
     options: this['ParsedCallOptions'],
     runManager?: CallbackManagerForLLMRun
   ): AsyncGenerator<ChatGenerationChunk> {
+    if (
+      this.includeReasoningContent !== true &&
+      this.includeReasoningDetails !== true
+    ) {
+      yield* super._streamResponseChunks(messages, options, runManager);
+      return;
+    }
     const messagesMapped: OpenAICompletionParam[] =
-      _convertMessagesToOpenAIParams(messages, this.model);
+      _convertMessagesToOpenAIParams(messages, this.model, {
+        includeReasoningContent: this.includeReasoningContent,
+        includeReasoningDetails: this.includeReasoningDetails,
+        convertReasoningDetailsToContent: this.convertReasoningDetailsToContent,
+      });
     const params = {
       ...this.invocationParams(options, {
@@ -331,43 +726,42 @@ export class ChatOpenAI extends OriginalChatOpenAI<t.ChatOpenAICallOptions> {
       messages: messagesMapped,
       stream: true as const,
     };
-    let defaultRole: OpenAIRoleEnum | undefined;
+    let defaultRole: OpenAIClient.Chat.ChatCompletionRole | undefined;
     const streamIterable = await this.completionWithRetry(params, options);
     let usage: OpenAIClient.Completions.CompletionUsage | undefined;
     for await (const data of streamIterable) {
-      const choice = data.choices[0] as
-        | Partial<OpenAIClient.Chat.Completions.ChatCompletionChunk.Choice>
-        | undefined;
-      if (data.usage) {
+      if (options.signal?.aborted === true) {
+        return;
+      }
+      type StreamChoice = Omit<
+        OpenAIClient.Chat.Completions.ChatCompletionChunk.Choice,
+        'delta'
+      > & {
+        delta?: OpenAIClient.Chat.Completions.ChatCompletionChunk.Choice['delta'];
+      };
+      const choices = data.choices as StreamChoice[] | undefined;
+      const choice = choices?.[0];
+      if (data.usage != null) {
         usage = data.usage;
       }
-      if (!choice) {
+      if (choice == null) {
         continue;
       }
       const { delta } = choice;
-      if (!delta) {
+      if (delta == null) {
         continue;
       }
-      const chunk = this._convertOpenAIDeltaToBaseMessageChunk(
-        delta,
+      const chunk = this._convertCompletionsDeltaToBaseMessageChunk(
+        delta as unknown as Record<string, unknown>,
         data,
         defaultRole
       );
-      if ('reasoning_content' in delta) {
-        chunk.additional_kwargs.reasoning_content = delta.reasoning_content;
-      } else if ('reasoning' in delta) {
-        chunk.additional_kwargs.reasoning_content = delta.reasoning;
-      }
-      if ('provider_specific_fields' in delta) {
-        chunk.additional_kwargs.provider_specific_fields =
-          delta.provider_specific_fields;
-      }
       defaultRole = delta.role ?? defaultRole;
       const newTokenIndices = {
         prompt: options.promptIndex ?? 0,
-        completion: choice.index ?? 0,
+        completion: choice.index,
       };
       if (typeof chunk.content !== 'string') {
         // eslint-disable-next-line no-console
@@ -376,17 +770,14 @@ export class ChatOpenAI extends OriginalChatOpenAI<t.ChatOpenAICallOptions> {
         );
         continue;
       }
-      // eslint-disable-next-line @typescript-eslint/no-explicit-any
-      const generationInfo: Record<string, any> = { ...newTokenIndices };
+      const generationInfo: Record<string, unknown> = { ...newTokenIndices };
       if (choice.finish_reason != null) {
         generationInfo.finish_reason = choice.finish_reason;
-        // Only include system fingerprint in the last chunk for now
-        // to avoid concatenation issues
         generationInfo.system_fingerprint = data.system_fingerprint;
         generationInfo.model_name = data.model;
         generationInfo.service_tier = data.service_tier;
       }
-      if (this.logprobs == true) {
+      if (this.logprobs === true) {
         generationInfo.logprobs = choice.logprobs;
       }
       const generationChunk = new ChatGenerationChunk({
@@ -395,11 +786,8 @@ export class ChatOpenAI extends OriginalChatOpenAI<t.ChatOpenAICallOptions> {
         generationInfo,
       });
       yield generationChunk;
-      if (this._lc_stream_delay != null) {
-        await sleep(this._lc_stream_delay);
-      }
       await runManager?.handleLLMNewToken(
-        generationChunk.text || '',
+        generationChunk.text,
         newTokenIndices,
         undefined,
         undefined,
@@ -427,9 +815,7 @@ export class ChatOpenAI extends OriginalChatOpenAI<t.ChatOpenAICallOptions> {
       const generationChunk = new ChatGenerationChunk({
         message: new AIMessageChunk({
           content: '',
-          response_metadata: {
-            usage: { ...usage },
-          },
+          response_metadata: { usage: { ...usage } },
           usage_metadata: {
             input_tokens: usage.prompt_tokens,
             output_tokens: usage.completion_tokens,
@@ -445,9 +831,17 @@ export class ChatOpenAI extends OriginalChatOpenAI<t.ChatOpenAICallOptions> {
         text: '',
       });
       yield generationChunk;
-      if (this._lc_stream_delay != null) {
-        await sleep(this._lc_stream_delay);
-      }
+      await runManager?.handleLLMNewToken(
+        generationChunk.text,
+        {
+          prompt: 0,
+          completion: 0,
+        },
+        undefined,
+        undefined,
+        undefined,
+        { chunk: generationChunk }
+      );
     }
     if (options.signal?.aborted === true) {
       throw new Error('AbortError');
@@ -455,57 +849,28 @@ export class ChatOpenAI extends OriginalChatOpenAI<t.ChatOpenAICallOptions> {
   }
 }
-/** @ts-expect-error We are intentionally overriding `getReasoningParams` */
-export class AzureChatOpenAI extends OriginalAzureChatOpenAI {
-  _lc_stream_delay?: number;
-  constructor(fields?: t.AzureOpenAIInput & { _lc_stream_delay?: number }) {
-    super(fields);
-    this._lc_stream_delay = fields?._lc_stream_delay;
+class LibreChatOpenAIResponses extends OriginalChatOpenAIResponses {
+  protected _getReasoningParams(
+    options?: this['ParsedCallOptions']
+  ): OpenAIClient.Reasoning | undefined {
+    return getReasoningParams(this.reasoning, options);
   }
-  public get exposedClient(): CustomOpenAIClient {
-    return this.client;
-  }
-  static lc_name(): 'LibreChatAzureOpenAI' {
-    return 'LibreChatAzureOpenAI';
+  _getClientOptions(
+    options?: OpenAICoreRequestOptions
+  ): OpenAICoreRequestOptions {
+    return getCustomOpenAIClientOptions(this, options);
   }
-  /**
-   * Returns backwards compatible reasoning parameters from constructor params and call options
-   * @internal
-   */
-  getReasoningParams(
+}
+class LibreChatAzureOpenAICompletions extends OriginalAzureChatOpenAICompletions {
+  protected _getReasoningParams(
     options?: this['ParsedCallOptions']
   ): OpenAIClient.Reasoning | undefined {
-    if (!isReasoningModel(this.model)) {
-      return;
-    }
+    return getGatedReasoningParams(this.model, this.reasoning, options);
+  }
-    // apply options in reverse order of importance -- newer options supersede older options
-    let reasoning: OpenAIClient.Reasoning | undefined;
-    if (this.reasoning !== undefined) {
-      reasoning = {
-        ...reasoning,
-        ...this.reasoning,
-      };
-    }
-    if (options?.reasoning !== undefined) {
-      reasoning = {
-        ...reasoning,
-        ...options.reasoning,
-      };
-    }
-    return reasoning;
-  }
-  protected _getReasoningParams(
-    options?: this['ParsedCallOptions']
-  ): OpenAIClient.Reasoning | undefined {
-    return this.getReasoningParams(options);
-  }
-  protected _getClientOptions(
+  _getClientOptions(
     options: OpenAICoreRequestOptions | undefined
   ): OpenAICoreRequestOptions {
     if (!(this.client as unknown as AzureOpenAIClient | undefined)) {
@@ -567,162 +932,133 @@ export class AzureChatOpenAI extends OriginalAzureChatOpenAI {
     }
     return requestOptions;
   }
-  async *_streamResponseChunks(
-    messages: BaseMessage[],
-    options: this['ParsedCallOptions'],
-    runManager?: CallbackManagerForLLMRun
-  ): AsyncGenerator<ChatGenerationChunk> {
-    if (!this._useResponseApi(options)) {
-      return yield* super._streamResponseChunks(messages, options, runManager);
-    }
-    const streamIterable = await this.responseApiWithRetry(
-      {
-        ...this.invocationParams<'responses'>(options, { streaming: true }),
-        input: _convertMessagesToOpenAIResponsesParams(
-          messages,
-          this.model,
-          this.zdrEnabled
-        ),
-        stream: true,
-      },
-      options
-    );
-    for await (const data of streamIterable) {
-      const chunk = _convertOpenAIResponsesDeltaToBaseMessageChunk(
-        data as ResponseReturnStreamEvents
-      );
-      if (chunk == null) continue;
-      yield chunk;
-      if (this._lc_stream_delay != null) {
-        await sleep(this._lc_stream_delay);
-      }
-      await runManager?.handleLLMNewToken(
-        chunk.text || '',
-        undefined,
-        undefined,
-        undefined,
-        undefined,
-        { chunk }
-      );
-    }
-    return;
+  async completionWithRetry(
+    request: OpenAIClient.Chat.ChatCompletionCreateParamsStreaming,
+    requestOptions?: OpenAICoreRequestOptions
+  ): Promise<AsyncIterable<OpenAIChatCompletionChunk>>;
+  async completionWithRetry(
+    request: OpenAIClient.Chat.ChatCompletionCreateParamsNonStreaming,
+    requestOptions?: OpenAICoreRequestOptions
+  ): Promise<OpenAIChatCompletion>;
+  async completionWithRetry(
+    request:
+      | OpenAIClient.Chat.ChatCompletionCreateParamsStreaming
+      | OpenAIClient.Chat.ChatCompletionCreateParamsNonStreaming,
+    requestOptions?: OpenAICoreRequestOptions
+  ): Promise<AsyncIterable<OpenAIChatCompletionChunk> | OpenAIChatCompletion> {
+    return completionWithFilteredOpenAIStream(
+      request,
+      requestOptions,
+      super.completionWithRetry.bind(this) as OpenAIChatCompletionRetry
+    );
   }
 }
-export class ChatDeepSeek extends OriginalChatDeepSeek {
-  public get exposedClient(): CustomOpenAIClient {
-    return this.client;
-  }
-  static lc_name(): 'LibreChatDeepSeek' {
-    return 'LibreChatDeepSeek';
-  }
-  protected _convertMessages(messages: BaseMessage[]): OpenAICompletionParam[] {
-    return _convertMessagesToOpenAIParams(messages, this.model, {
-      includeReasoningContent: true,
-    });
+class LibreChatAzureOpenAIResponses extends OriginalAzureChatOpenAIResponses {
+  protected _getReasoningParams(
+    options?: this['ParsedCallOptions']
+  ): OpenAIClient.Reasoning | undefined {
+    return getGatedReasoningParams(this.model, this.reasoning, options);
   }
-  async _generate(
-    messages: BaseMessage[],
-    options: this['ParsedCallOptions'] | undefined,
-    runManager?: CallbackManagerForLLMRun
-  ): Promise<ChatResult> {
-    const params = this.invocationParams(options);
+  _getClientOptions(
+    options: OpenAICoreRequestOptions | undefined
+  ): OpenAICoreRequestOptions {
+    if (!(this.client as unknown as AzureOpenAIClient | undefined)) {
+      const openAIEndpointConfig: t.OpenAIEndpointConfig = {
+        azureOpenAIApiDeploymentName: this.azureOpenAIApiDeploymentName,
+        azureOpenAIApiInstanceName: this.azureOpenAIApiInstanceName,
+        azureOpenAIApiKey: this.azureOpenAIApiKey,
+        azureOpenAIBasePath: this.azureOpenAIBasePath,
+        azureADTokenProvider: this.azureADTokenProvider,
+        baseURL: this.clientConfig.baseURL,
+      };
-    if (params.stream === true) {
-      return super._generate(messages, options ?? {}, runManager);
-    }
+      const endpoint = getEndpoint(openAIEndpointConfig);
-    const messagesMapped = this._convertMessages(messages);
-    const data = await this.completionWithRetry(
-      {
-        ...params,
-        stream: false,
-        messages: messagesMapped,
-      },
-      {
-        signal: options?.signal,
-        ...options?.options,
+      const params = {
+        ...this.clientConfig,
+        baseURL: endpoint,
+        timeout: this.timeout,
+        maxRetries: 0,
+      };
+      if (!this.azureADTokenProvider) {
+        params.apiKey = openAIEndpointConfig.azureOpenAIApiKey;
       }
-    );
-    const { completion_tokens, prompt_tokens, total_tokens } = data.usage ?? {};
+      if (params.baseURL == null) {
+        delete params.baseURL;
+      }
-    const generations = [];
-    for (const part of data.choices ?? []) {
-      const text = part.message.content ?? '';
-      const generation: ChatGeneration = {
-        text: typeof text === 'string' ? text : '',
-        message: this._convertResponseToMessage(part, data),
-      };
-      generation.generationInfo = {
-        ...(part.finish_reason != null
-          ? { finish_reason: part.finish_reason }
-          : {}),
-        ...(part.logprobs ? { logprobs: part.logprobs } : {}),
+      const defaultHeaders = normalizeHeaders(params.defaultHeaders);
+      params.defaultHeaders = {
+        ...params.defaultHeaders,
+        'User-Agent':
+          defaultHeaders['User-Agent'] != null
+            ? `${defaultHeaders['User-Agent']}: librechat-azure-openai-v2`
+            : 'librechat-azure-openai-v2',
       };
-      generations.push(generation);
+      this.client = new CustomAzureOpenAIClient({
+        apiVersion: this.azureOpenAIApiVersion,
+        azureADTokenProvider: this.azureADTokenProvider,
+        ...(params as t.AzureOpenAIInput),
+      }) as unknown as CustomOpenAIClient;
     }
-    return {
-      generations,
-      llmOutput: {
-        tokenUsage: {
-          completionTokens: completion_tokens,
-          promptTokens: prompt_tokens,
-          totalTokens: total_tokens,
-        },
-      },
-    };
+    const requestOptions = {
+      ...this.clientConfig,
+      ...options,
+    } as OpenAICoreRequestOptions;
+    if (this.azureOpenAIApiKey != null) {
+      requestOptions.headers = {
+        'api-key': this.azureOpenAIApiKey,
+        ...requestOptions.headers,
+      };
+      requestOptions.query = {
+        'api-version': this.azureOpenAIApiVersion,
+        ...requestOptions.query,
+      };
+    }
+    return requestOptions;
   }
+}
-  protected _convertResponseToMessage(
-    choice: OpenAIClient.Chat.Completions.ChatCompletion.Choice,
-    data: OpenAIClient.Chat.Completions.ChatCompletion
-  ): AIMessage {
-    const { message } = choice;
-    const rawToolCalls = message.tool_calls;
-    const toolCalls = rawToolCalls?.map((tc) => ({
-      id: tc.id,
-      name: tc.function.name,
-      args: JSON.parse(tc.function.arguments || '{}'),
-      type: 'tool_call' as const,
-    }));
-    const additional_kwargs: Record<string, unknown> = {};
-    if (rawToolCalls) {
-      additional_kwargs.tool_calls = rawToolCalls;
-    }
-    if (
-      'reasoning_content' in message &&
-      message.reasoning_content != null &&
-      message.reasoning_content !== ''
-    ) {
-      additional_kwargs.reasoning_content = message.reasoning_content;
-    }
+function withLibreChatOpenAIFields(
+  fields?: LibreChatOpenAIFields
+): LibreChatOpenAIFields {
+  const nextFields = fields ?? {};
+  return {
+    ...nextFields,
+    completions:
+      nextFields.completions ?? new LibreChatOpenAICompletions(nextFields),
+    responses: nextFields.responses ?? new LibreChatOpenAIResponses(nextFields),
+  };
+}
-    return new AIMessage({
-      content: message.content ?? '',
-      tool_calls: toolCalls,
-      additional_kwargs,
-      usage_metadata: data.usage
-        ? {
-          input_tokens: data.usage.prompt_tokens,
-          output_tokens: data.usage.completion_tokens,
-          total_tokens: data.usage.total_tokens,
-        }
-        : undefined,
-      response_metadata: {
-        model_name: data.model,
-        system_fingerprint: data.system_fingerprint,
-        finish_reason: choice.finish_reason,
-      },
-    });
+export class ChatOpenAI extends OriginalChatOpenAI<t.ChatOpenAICallOptions> {
+  _lc_stream_delay?: number;
+  constructor(
+    fields?: LibreChatOpenAIFields & t.OpenAIChatInput['modelKwargs']
+  ) {
+    super(withLibreChatOpenAIFields(fields));
+    this._lc_stream_delay = fields?._lc_stream_delay;
   }
-  protected _getClientOptions(
+  public get exposedClient(): CustomOpenAIClient {
+    return getExposedOpenAIClient(
+      this.completions as OpenAIClientDelegate,
+      this.responses as OpenAIClientDelegate,
+      this._useResponsesApi(undefined)
+    ) as CustomOpenAIClient;
+  }
+  static lc_name(): string {
+    return 'LibreChatOpenAI';
+  }
+  _getClientOptions(
     options?: OpenAICoreRequestOptions
   ): OpenAICoreRequestOptions {
     if (!(this.client as OpenAIClient | undefined)) {
@@ -750,130 +1086,199 @@ export class ChatDeepSeek extends OriginalChatDeepSeek {
     return requestOptions;
   }
+  /**
+   * Returns backwards compatible reasoning parameters from constructor params and call options
+   * @internal
+   */
+  getReasoningParams(
+    options?: this['ParsedCallOptions']
+  ): OpenAIClient.Reasoning | undefined {
+    return getReasoningParams(this.reasoning, options);
+  }
+  protected _getReasoningParams(
+    options?: this['ParsedCallOptions']
+  ): OpenAIClient.Reasoning | undefined {
+    return this.getReasoningParams(options);
+  }
   async *_streamResponseChunks(
     messages: BaseMessage[],
     options: this['ParsedCallOptions'],
     runManager?: CallbackManagerForLLMRun
   ): AsyncGenerator<ChatGenerationChunk> {
-    const messagesMapped: OpenAICompletionParam[] =
-      _convertMessagesToOpenAIParams(messages, this.model, {
-        includeReasoningContent: true,
-      });
+    yield* delayStreamChunks(
+      super._streamResponseChunks(messages, options, runManager),
+      this._lc_stream_delay
+    );
+  }
+}
-    const params = {
-      ...this.invocationParams(options, {
-        streaming: true,
-      }),
-      messages: messagesMapped,
-      stream: true as const,
-    };
-    let defaultRole: OpenAIRoleEnum | undefined;
+export class AzureChatOpenAI extends OriginalAzureChatOpenAI {
+  _lc_stream_delay?: number;
-    const streamIterable = await this.completionWithRetry(params, options);
-    let usage: OpenAIClient.Completions.CompletionUsage | undefined;
-    for await (const data of streamIterable) {
-      const choice = data.choices[0] as
-        | Partial<OpenAIClient.Chat.Completions.ChatCompletionChunk.Choice>
-        | undefined;
-      if (data.usage) {
-        usage = data.usage;
-      }
-      if (!choice) {
-        continue;
-      }
+  constructor(fields?: LibreChatAzureOpenAIFields) {
+    super(fields);
+    this.completions = new LibreChatAzureOpenAICompletions(fields);
+    this.responses = new LibreChatAzureOpenAIResponses(fields);
+    this._lc_stream_delay = fields?._lc_stream_delay;
+  }
-      const { delta } = choice;
-      if (!delta) {
-        continue;
-      }
-      const chunk = this._convertOpenAIDeltaToBaseMessageChunk(
-        delta,
-        data,
-        defaultRole
-      );
-      if ('reasoning_content' in delta) {
-        chunk.additional_kwargs.reasoning_content = delta.reasoning_content;
-      }
-      defaultRole = delta.role ?? defaultRole;
-      const newTokenIndices = {
-        prompt: (options as OpenAIChatCallOptions).promptIndex ?? 0,
-        completion: choice.index ?? 0,
+  public get exposedClient(): CustomOpenAIClient {
+    return getExposedOpenAIClient(
+      this.completions as OpenAIClientDelegate,
+      this.responses as OpenAIClientDelegate,
+      this._useResponsesApi(undefined)
+    ) as CustomOpenAIClient;
+  }
+  static lc_name(): 'LibreChatAzureOpenAI' {
+    return 'LibreChatAzureOpenAI';
+  }
+  /**
+   * Returns backwards compatible reasoning parameters from constructor params and call options
+   * @internal
+   */
+  getReasoningParams(
+    options?: this['ParsedCallOptions']
+  ): OpenAIClient.Reasoning | undefined {
+    return getGatedReasoningParams(this.model, this.reasoning, options);
+  }
+  protected _getReasoningParams(
+    options?: this['ParsedCallOptions']
+  ): OpenAIClient.Reasoning | undefined {
+    return this.getReasoningParams(options);
+  }
+  _getClientOptions(
+    options: OpenAICoreRequestOptions | undefined
+  ): OpenAICoreRequestOptions {
+    if (!(this.client as unknown as AzureOpenAIClient | undefined)) {
+      const openAIEndpointConfig: t.OpenAIEndpointConfig = {
+        azureOpenAIApiDeploymentName: this.azureOpenAIApiDeploymentName,
+        azureOpenAIApiInstanceName: this.azureOpenAIApiInstanceName,
+        azureOpenAIApiKey: this.azureOpenAIApiKey,
+        azureOpenAIBasePath: this.azureOpenAIBasePath,
+        azureADTokenProvider: this.azureADTokenProvider,
+        baseURL: this.clientConfig.baseURL,
       };
-      if (typeof chunk.content !== 'string') {
-        // eslint-disable-next-line no-console
-        console.log(
-          '[WARNING]: Received non-string content from OpenAI. This is currently not supported.'
-        );
-        continue;
-      }
-      // eslint-disable-next-line @typescript-eslint/no-explicit-any
-      const generationInfo: Record<string, any> = { ...newTokenIndices };
-      if (choice.finish_reason != null) {
-        generationInfo.finish_reason = choice.finish_reason;
-        generationInfo.system_fingerprint = data.system_fingerprint;
-        generationInfo.model_name = data.model;
-        generationInfo.service_tier = data.service_tier;
+      const endpoint = getEndpoint(openAIEndpointConfig);
+      const params = {
+        ...this.clientConfig,
+        baseURL: endpoint,
+        timeout: this.timeout,
+        maxRetries: 0,
+      };
+      if (!this.azureADTokenProvider) {
+        params.apiKey = openAIEndpointConfig.azureOpenAIApiKey;
       }
-      if (this.logprobs == true) {
-        generationInfo.logprobs = choice.logprobs;
+      if (params.baseURL == null) {
+        delete params.baseURL;
       }
-      const generationChunk = new ChatGenerationChunk({
-        message: chunk,
-        text: chunk.content,
-        generationInfo,
-      });
-      yield generationChunk;
-      await runManager?.handleLLMNewToken(
-        generationChunk.text || '',
-        newTokenIndices,
-        undefined,
-        undefined,
-        undefined,
-        { chunk: generationChunk }
-      );
+      const defaultHeaders = normalizeHeaders(params.defaultHeaders);
+      params.defaultHeaders = {
+        ...params.defaultHeaders,
+        'User-Agent':
+          defaultHeaders['User-Agent'] != null
+            ? `${defaultHeaders['User-Agent']}: librechat-azure-openai-v2`
+            : 'librechat-azure-openai-v2',
+      };
+      this.client = new CustomAzureOpenAIClient({
+        apiVersion: this.azureOpenAIApiVersion,
+        azureADTokenProvider: this.azureADTokenProvider,
+        ...(params as t.AzureOpenAIInput),
+      }) as unknown as CustomOpenAIClient;
     }
-    if (usage) {
-      const inputTokenDetails = {
-        ...(usage.prompt_tokens_details?.audio_tokens != null && {
-          audio: usage.prompt_tokens_details.audio_tokens,
-        }),
-        ...(usage.prompt_tokens_details?.cached_tokens != null && {
-          cache_read: usage.prompt_tokens_details.cached_tokens,
-        }),
+    const requestOptions = {
+      ...this.clientConfig,
+      ...options,
+    } as OpenAICoreRequestOptions;
+    if (this.azureOpenAIApiKey != null) {
+      requestOptions.headers = {
+        'api-key': this.azureOpenAIApiKey,
+        ...requestOptions.headers,
       };
-      const outputTokenDetails = {
-        ...(usage.completion_tokens_details?.audio_tokens != null && {
-          audio: usage.completion_tokens_details.audio_tokens,
-        }),
-        ...(usage.completion_tokens_details?.reasoning_tokens != null && {
-          reasoning: usage.completion_tokens_details.reasoning_tokens,
-        }),
+      requestOptions.query = {
+        'api-version': this.azureOpenAIApiVersion,
+        ...requestOptions.query,
       };
-      const generationChunk = new ChatGenerationChunk({
-        message: new AIMessageChunk({
-          content: '',
-          response_metadata: {
-            usage: { ...usage },
-          },
-          usage_metadata: {
-            input_tokens: usage.prompt_tokens,
-            output_tokens: usage.completion_tokens,
-            total_tokens: usage.total_tokens,
-            ...(Object.keys(inputTokenDetails).length > 0 && {
-              input_token_details: inputTokenDetails,
-            }),
-            ...(Object.keys(outputTokenDetails).length > 0 && {
-              output_token_details: outputTokenDetails,
-            }),
-          },
-        }),
-        text: '',
-      });
-      yield generationChunk;
     }
-    if (options.signal?.aborted === true) {
-      throw new Error('AbortError');
+    return requestOptions;
+  }
+  async *_streamResponseChunks(
+    messages: BaseMessage[],
+    options: this['ParsedCallOptions'],
+    runManager?: CallbackManagerForLLMRun
+  ): AsyncGenerator<ChatGenerationChunk> {
+    yield* delayStreamChunks(
+      super._streamResponseChunks(messages, options, runManager),
+      this._lc_stream_delay
+    );
+  }
+}
+export class ChatDeepSeek extends OriginalChatDeepSeek {
+  _lc_stream_delay?: number;
+  constructor(
+    fields?: ConstructorParameters<typeof OriginalChatDeepSeek>[0] & {
+      _lc_stream_delay?: number;
     }
+  ) {
+    super(fields);
+    this._lc_stream_delay = fields?._lc_stream_delay;
+  }
+  public get exposedClient(): CustomOpenAIClient {
+    return this.client;
+  }
+  static lc_name(): 'LibreChatDeepSeek' {
+    return 'LibreChatDeepSeek';
+  }
+  _getClientOptions(
+    options?: OpenAICoreRequestOptions
+  ): OpenAICoreRequestOptions {
+    if (!(this.client as OpenAIClient | undefined)) {
+      const openAIEndpointConfig: t.OpenAIEndpointConfig = {
+        baseURL: this.clientConfig.baseURL,
+      };
+      const endpoint = getEndpoint(openAIEndpointConfig);
+      const params = {
+        ...this.clientConfig,
+        baseURL: endpoint,
+        timeout: this.timeout,
+        maxRetries: 0,
+      };
+      if (params.baseURL == null) {
+        delete params.baseURL;
+      }
+      this.client = new CustomOpenAIClient(params);
+    }
+    const requestOptions = {
+      ...this.clientConfig,
+      ...options,
+    } as OpenAICoreRequestOptions;
+    return requestOptions;
+  }
+  async *_streamResponseChunks(
+    messages: BaseMessage[],
+    options: this['ParsedCallOptions'],
+    runManager?: CallbackManagerForLLMRun
+  ): AsyncGenerator<ChatGenerationChunk> {
+    yield* delayStreamChunks(
+      super._streamResponseChunks(messages, options, runManager),
+      this._lc_stream_delay
+    );
   }
 }
@@ -896,242 +1301,17 @@ export interface XAIUsageMetadata
 }
 export class ChatMoonshot extends ChatOpenAI {
-  static lc_name(): 'LibreChatMoonshot' {
-    return 'LibreChatMoonshot';
-  }
-  protected _convertMessages(messages: BaseMessage[]): OpenAICompletionParam[] {
-    return _convertMessagesToOpenAIParams(messages, this.model, {
+  constructor(
+    fields?: LibreChatOpenAIFields & t.OpenAIChatInput['modelKwargs']
+  ) {
+    super({
+      ...fields,
       includeReasoningContent: true,
     });
   }
-  async _generate(
-    messages: BaseMessage[],
-    options: this['ParsedCallOptions'],
-    runManager?: CallbackManagerForLLMRun
-  ): Promise<ChatResult> {
-    const params = this.invocationParams(options);
-    if (params.stream === true) {
-      return super._generate(messages, options, runManager);
-    }
-    const messagesMapped = this._convertMessages(messages);
-    const data = await this.completionWithRetry(
-      {
-        ...params,
-        stream: false,
-        messages: messagesMapped,
-      },
-      {
-        signal: options.signal,
-        ...options.options,
-      }
-    );
-    const { completion_tokens, prompt_tokens, total_tokens } = data.usage ?? {};
-    const generations = [];
-    for (const part of data.choices ?? []) {
-      const text = part.message.content ?? '';
-      const generation: ChatGeneration = {
-        text: typeof text === 'string' ? text : '',
-        message: this._convertResponseToMessage(part, data),
-      };
-      generation.generationInfo = {
-        ...(part.finish_reason ? { finish_reason: part.finish_reason } : {}),
-        ...(part.logprobs ? { logprobs: part.logprobs } : {}),
-      };
-      generations.push(generation);
-    }
-    return {
-      generations,
-      llmOutput: {
-        tokenUsage: {
-          completionTokens: completion_tokens,
-          promptTokens: prompt_tokens,
-          totalTokens: total_tokens,
-        },
-      },
-    };
-  }
-  protected _convertResponseToMessage(
-    choice: OpenAIClient.Chat.Completions.ChatCompletion.Choice,
-    data: OpenAIClient.Chat.Completions.ChatCompletion
-  ): AIMessage {
-    const { message } = choice;
-    const rawToolCalls = message.tool_calls;
-    const toolCalls = rawToolCalls?.map((tc) => ({
-      id: tc.id,
-      name: tc.function.name,
-      args: JSON.parse(tc.function.arguments || '{}'),
-      type: 'tool_call' as const,
-    }));
-    const additional_kwargs: Record<string, unknown> = {};
-    if (rawToolCalls) {
-      additional_kwargs.tool_calls = rawToolCalls;
-    }
-    if (
-      'reasoning_content' in message &&
-      message.reasoning_content != null &&
-      message.reasoning_content !== ''
-    ) {
-      additional_kwargs.reasoning_content = message.reasoning_content;
-    }
-    return new AIMessage({
-      content: message.content ?? '',
-      tool_calls: toolCalls,
-      additional_kwargs,
-      usage_metadata: data.usage
-        ? {
-          input_tokens: data.usage.prompt_tokens,
-          output_tokens: data.usage.completion_tokens,
-          total_tokens: data.usage.total_tokens,
-        }
-        : undefined,
-      response_metadata: {
-        model_name: data.model,
-        system_fingerprint: data.system_fingerprint,
-        finish_reason: choice.finish_reason,
-      },
-    });
-  }
-  async *_streamResponseChunks(
-    messages: BaseMessage[],
-    options: this['ParsedCallOptions'],
-    runManager?: CallbackManagerForLLMRun
-  ): AsyncGenerator<ChatGenerationChunk> {
-    const messagesMapped: OpenAICompletionParam[] =
-      _convertMessagesToOpenAIParams(messages, this.model, {
-        includeReasoningContent: true,
-      });
-    const params = {
-      ...this.invocationParams(options, {
-        streaming: true,
-      }),
-      messages: messagesMapped,
-      stream: true as const,
-    };
-    let defaultRole: OpenAIRoleEnum | undefined;
-    const streamIterable = await this.completionWithRetry(params, options);
-    let usage: OpenAIClient.Completions.CompletionUsage | undefined;
-    for await (const data of streamIterable) {
-      const choice = data.choices[0] as
-        | Partial<OpenAIClient.Chat.Completions.ChatCompletionChunk.Choice>
-        | undefined;
-      if (data.usage) {
-        usage = data.usage;
-      }
-      if (!choice) {
-        continue;
-      }
-      const { delta } = choice;
-      if (!delta) {
-        continue;
-      }
-      const chunk = this._convertOpenAIDeltaToBaseMessageChunk(
-        delta,
-        data,
-        defaultRole
-      );
-      if ('reasoning_content' in delta) {
-        chunk.additional_kwargs.reasoning_content = delta.reasoning_content;
-      }
-      defaultRole = delta.role ?? defaultRole;
-      const newTokenIndices = {
-        prompt: (options as OpenAIChatCallOptions).promptIndex ?? 0,
-        completion: choice.index ?? 0,
-      };
-      if (typeof chunk.content !== 'string') {
-        // eslint-disable-next-line no-console
-        console.log(
-          '[WARNING]: Received non-string content from OpenAI. This is currently not supported.'
-        );
-        continue;
-      }
-      // eslint-disable-next-line @typescript-eslint/no-explicit-any
-      const generationInfo: Record<string, any> = { ...newTokenIndices };
-      if (choice.finish_reason != null) {
-        generationInfo.finish_reason = choice.finish_reason;
-        generationInfo.system_fingerprint = data.system_fingerprint;
-        generationInfo.model_name = data.model;
-        generationInfo.service_tier = data.service_tier;
-      }
-      if (this.logprobs == true) {
-        generationInfo.logprobs = choice.logprobs;
-      }
-      const generationChunk = new ChatGenerationChunk({
-        message: chunk,
-        text: chunk.content,
-        generationInfo,
-      });
-      yield generationChunk;
-      if (this._lc_stream_delay != null) {
-        await sleep(this._lc_stream_delay);
-      }
-      await runManager?.handleLLMNewToken(
-        generationChunk.text || '',
-        newTokenIndices,
-        undefined,
-        undefined,
-        undefined,
-        { chunk: generationChunk }
-      );
-    }
-    if (usage) {
-      const inputTokenDetails = {
-        ...(usage.prompt_tokens_details?.audio_tokens != null && {
-          audio: usage.prompt_tokens_details.audio_tokens,
-        }),
-        ...(usage.prompt_tokens_details?.cached_tokens != null && {
-          cache_read: usage.prompt_tokens_details.cached_tokens,
-        }),
-      };
-      const outputTokenDetails = {
-        ...(usage.completion_tokens_details?.audio_tokens != null && {
-          audio: usage.completion_tokens_details.audio_tokens,
-        }),
-        ...(usage.completion_tokens_details?.reasoning_tokens != null && {
-          reasoning: usage.completion_tokens_details.reasoning_tokens,
-        }),
-      };
-      const generationChunk = new ChatGenerationChunk({
-        message: new AIMessageChunk({
-          content: '',
-          response_metadata: {
-            usage: { ...usage },
-          },
-          usage_metadata: {
-            input_tokens: usage.prompt_tokens,
-            output_tokens: usage.completion_tokens,
-            total_tokens: usage.total_tokens,
-            ...(Object.keys(inputTokenDetails).length > 0 && {
-              input_token_details: inputTokenDetails,
-            }),
-            ...(Object.keys(outputTokenDetails).length > 0 && {
-              output_token_details: outputTokenDetails,
-            }),
-          },
-        }),
-        text: '',
-      });
-      yield generationChunk;
-      if (this._lc_stream_delay != null) {
-        await sleep(this._lc_stream_delay);
-      }
-    }
-    if (options.signal?.aborted === true) {
-      throw new Error('AbortError');
-    }
+  static lc_name(): 'LibreChatMoonshot' {
+    return 'LibreChatMoonshot';
   }
 }
@@ -1168,7 +1348,7 @@ export class ChatXAI extends OriginalChatXAI {
     return this.client;
   }
-  protected _getClientOptions(
+  _getClientOptions(
     options?: OpenAICoreRequestOptions
   ): OpenAICoreRequestOptions {
     if (!(this.client as OpenAIClient | undefined)) {
@@ -1201,166 +1381,9 @@ export class ChatXAI extends OriginalChatXAI {
     options: this['ParsedCallOptions'],
     runManager?: CallbackManagerForLLMRun
   ): AsyncGenerator<ChatGenerationChunk> {
-    const messagesMapped: OpenAICompletionParam[] =
-      _convertMessagesToOpenAIParams(messages, this.model);
-    const params = {
-      ...this.invocationParams(options, {
-        streaming: true,
-      }),
-      messages: messagesMapped,
-      stream: true as const,
-    };
-    let defaultRole: OpenAIRoleEnum | undefined;
-    const streamIterable = await this.completionWithRetry(params, options);
-    let usage: OpenAIClient.Completions.CompletionUsage | undefined;
-    for await (const data of streamIterable) {
-      const choice = data.choices[0] as
-        | Partial<OpenAIClient.Chat.Completions.ChatCompletionChunk.Choice>
-        | undefined;
-      if (data.usage) {
-        usage = data.usage;
-      }
-      if (!choice) {
-        continue;
-      }
-      const { delta } = choice;
-      if (!delta) {
-        continue;
-      }
-      const chunk = this._convertOpenAIDeltaToBaseMessageChunk(
-        delta,
-        data,
-        defaultRole
-      );
-      if (chunk.usage_metadata != null) {
-        chunk.usage_metadata = {
-          input_tokens:
-            (chunk.usage_metadata as Partial<UsageMetadata>).input_tokens ?? 0,
-          output_tokens:
-            (chunk.usage_metadata as Partial<UsageMetadata>).output_tokens ?? 0,
-          total_tokens:
-            (chunk.usage_metadata as Partial<UsageMetadata>).total_tokens ?? 0,
-        };
-      }
-      if ('reasoning_content' in delta) {
-        chunk.additional_kwargs.reasoning_content = delta.reasoning_content;
-      }
-      defaultRole = delta.role ?? defaultRole;
-      const newTokenIndices = {
-        prompt: (options as OpenAIChatCallOptions).promptIndex ?? 0,
-        completion: choice.index ?? 0,
-      };
-      if (typeof chunk.content !== 'string') {
-        // eslint-disable-next-line no-console
-        console.log(
-          '[WARNING]: Received non-string content from OpenAI. This is currently not supported.'
-        );
-        continue;
-      }
-      // eslint-disable-next-line @typescript-eslint/no-explicit-any
-      const generationInfo: Record<string, any> = { ...newTokenIndices };
-      if (choice.finish_reason != null) {
-        generationInfo.finish_reason = choice.finish_reason;
-        // Only include system fingerprint in the last chunk for now
-        // to avoid concatenation issues
-        generationInfo.system_fingerprint = data.system_fingerprint;
-        generationInfo.model_name = data.model;
-        generationInfo.service_tier = data.service_tier;
-      }
-      if (this.logprobs == true) {
-        generationInfo.logprobs = choice.logprobs;
-      }
-      const generationChunk = new ChatGenerationChunk({
-        message: chunk,
-        text: chunk.content,
-        generationInfo,
-      });
-      yield generationChunk;
-      if (this._lc_stream_delay != null) {
-        await sleep(this._lc_stream_delay);
-      }
-      await runManager?.handleLLMNewToken(
-        generationChunk.text || '',
-        newTokenIndices,
-        undefined,
-        undefined,
-        undefined,
-        { chunk: generationChunk }
-      );
-    }
-    if (usage) {
-      // Type assertion for xAI-specific usage structure
-      const xaiUsage = usage as XAIUsageMetadata;
-      const inputTokenDetails = {
-        // Standard OpenAI fields
-        ...(usage.prompt_tokens_details?.audio_tokens != null && {
-          audio: usage.prompt_tokens_details.audio_tokens,
-        }),
-        ...(usage.prompt_tokens_details?.cached_tokens != null && {
-          cache_read: usage.prompt_tokens_details.cached_tokens,
-        }),
-        // Add xAI-specific prompt token details if they exist
-        ...(xaiUsage.prompt_tokens_details?.text_tokens != null && {
-          text: xaiUsage.prompt_tokens_details.text_tokens,
-        }),
-        ...(xaiUsage.prompt_tokens_details?.image_tokens != null && {
-          image: xaiUsage.prompt_tokens_details.image_tokens,
-        }),
-      };
-      const outputTokenDetails = {
-        // Standard OpenAI fields
-        ...(usage.completion_tokens_details?.audio_tokens != null && {
-          audio: usage.completion_tokens_details.audio_tokens,
-        }),
-        ...(usage.completion_tokens_details?.reasoning_tokens != null && {
-          reasoning: usage.completion_tokens_details.reasoning_tokens,
-        }),
-        // Add xAI-specific completion token details if they exist
-        ...(xaiUsage.completion_tokens_details?.accepted_prediction_tokens !=
-          null && {
-          accepted_prediction:
-            xaiUsage.completion_tokens_details.accepted_prediction_tokens,
-        }),
-        ...(xaiUsage.completion_tokens_details?.rejected_prediction_tokens !=
-          null && {
-          rejected_prediction:
-            xaiUsage.completion_tokens_details.rejected_prediction_tokens,
-        }),
-      };
-      const generationChunk = new ChatGenerationChunk({
-        message: new AIMessageChunk({
-          content: '',
-          response_metadata: {
-            usage: { ...usage },
-            // Include xAI-specific metadata if it exists
-            ...(xaiUsage.num_sources_used != null && {
-              num_sources_used: xaiUsage.num_sources_used,
-            }),
-          },
-          usage_metadata: {
-            input_tokens: usage.prompt_tokens,
-            output_tokens: usage.completion_tokens,
-            total_tokens: usage.total_tokens,
-            ...(Object.keys(inputTokenDetails).length > 0 && {
-              input_token_details: inputTokenDetails,
-            }),
-            ...(Object.keys(outputTokenDetails).length > 0 && {
-              output_token_details: outputTokenDetails,
-            }),
-          },
-        }),
-        text: '',
-      });
-      yield generationChunk;
-      if (this._lc_stream_delay != null) {
-        await sleep(this._lc_stream_delay);
-      }
-    }
-    if (options.signal?.aborted === true) {
-      throw new Error('AbortError');
-    }
+    yield* delayStreamChunks(
+      super._streamResponseChunks(messages, options, runManager),
+      this._lc_stream_delay
+    );
   }
 }