npm - @librechat/agents - Versions diffs - 3.1.75 → 3.1.77-dev.1 - Mend

@librechat/agents 3.1.75 → 3.1.77-dev.1

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (272) hide show

package/dist/cjs/graphs/Graph.cjs +22 -3
package/dist/cjs/graphs/Graph.cjs.map +1 -1
package/dist/cjs/hitl/askUserQuestion.cjs +67 -0
package/dist/cjs/hitl/askUserQuestion.cjs.map +1 -0
package/dist/cjs/hooks/HookRegistry.cjs +54 -0
package/dist/cjs/hooks/HookRegistry.cjs.map +1 -1
package/dist/cjs/hooks/createToolPolicyHook.cjs +115 -0
package/dist/cjs/hooks/createToolPolicyHook.cjs.map +1 -0
package/dist/cjs/hooks/executeHooks.cjs +40 -1
package/dist/cjs/hooks/executeHooks.cjs.map +1 -1
package/dist/cjs/hooks/types.cjs +1 -0
package/dist/cjs/hooks/types.cjs.map +1 -1
package/dist/cjs/langchain/google-common.cjs +3 -0
package/dist/cjs/langchain/google-common.cjs.map +1 -0
package/dist/cjs/langchain/index.cjs +86 -0
package/dist/cjs/langchain/index.cjs.map +1 -0
package/dist/cjs/langchain/language_models/chat_models.cjs +3 -0
package/dist/cjs/langchain/language_models/chat_models.cjs.map +1 -0
package/dist/cjs/langchain/messages/tool.cjs +3 -0
package/dist/cjs/langchain/messages/tool.cjs.map +1 -0
package/dist/cjs/langchain/messages.cjs +51 -0
package/dist/cjs/langchain/messages.cjs.map +1 -0
package/dist/cjs/langchain/openai.cjs +3 -0
package/dist/cjs/langchain/openai.cjs.map +1 -0
package/dist/cjs/langchain/prompts.cjs +11 -0
package/dist/cjs/langchain/prompts.cjs.map +1 -0
package/dist/cjs/langchain/runnables.cjs +19 -0
package/dist/cjs/langchain/runnables.cjs.map +1 -0
package/dist/cjs/langchain/tools.cjs +23 -0
package/dist/cjs/langchain/tools.cjs.map +1 -0
package/dist/cjs/langchain/utils/env.cjs +11 -0
package/dist/cjs/langchain/utils/env.cjs.map +1 -0
package/dist/cjs/llm/anthropic/index.cjs +145 -52
package/dist/cjs/llm/anthropic/index.cjs.map +1 -1
package/dist/cjs/llm/anthropic/types.cjs.map +1 -1
package/dist/cjs/llm/anthropic/utils/message_inputs.cjs +21 -14
package/dist/cjs/llm/anthropic/utils/message_inputs.cjs.map +1 -1
package/dist/cjs/llm/anthropic/utils/message_outputs.cjs +84 -70
package/dist/cjs/llm/anthropic/utils/message_outputs.cjs.map +1 -1
package/dist/cjs/llm/bedrock/index.cjs +1 -1
package/dist/cjs/llm/bedrock/index.cjs.map +1 -1
package/dist/cjs/llm/bedrock/utils/message_inputs.cjs +213 -3
package/dist/cjs/llm/bedrock/utils/message_inputs.cjs.map +1 -1
package/dist/cjs/llm/bedrock/utils/message_outputs.cjs +2 -1
package/dist/cjs/llm/bedrock/utils/message_outputs.cjs.map +1 -1
package/dist/cjs/llm/google/utils/common.cjs +5 -4
package/dist/cjs/llm/google/utils/common.cjs.map +1 -1
package/dist/cjs/llm/openai/index.cjs +519 -655
package/dist/cjs/llm/openai/index.cjs.map +1 -1
package/dist/cjs/llm/openai/utils/index.cjs +20 -458
package/dist/cjs/llm/openai/utils/index.cjs.map +1 -1
package/dist/cjs/llm/openrouter/index.cjs +57 -175
package/dist/cjs/llm/openrouter/index.cjs.map +1 -1
package/dist/cjs/llm/vertexai/index.cjs +5 -3
package/dist/cjs/llm/vertexai/index.cjs.map +1 -1
package/dist/cjs/main.cjs +112 -3
package/dist/cjs/main.cjs.map +1 -1
package/dist/cjs/messages/cache.cjs +2 -1
package/dist/cjs/messages/cache.cjs.map +1 -1
package/dist/cjs/messages/core.cjs +7 -6
package/dist/cjs/messages/core.cjs.map +1 -1
package/dist/cjs/messages/format.cjs +73 -15
package/dist/cjs/messages/format.cjs.map +1 -1
package/dist/cjs/messages/langchain.cjs +26 -0
package/dist/cjs/messages/langchain.cjs.map +1 -0
package/dist/cjs/messages/prune.cjs +7 -6
package/dist/cjs/messages/prune.cjs.map +1 -1
package/dist/cjs/run.cjs +400 -42
package/dist/cjs/run.cjs.map +1 -1
package/dist/cjs/tools/ToolNode.cjs +556 -56
package/dist/cjs/tools/ToolNode.cjs.map +1 -1
package/dist/cjs/tools/search/search.cjs +55 -66
package/dist/cjs/tools/search/search.cjs.map +1 -1
package/dist/cjs/tools/search/tavily-scraper.cjs +189 -0
package/dist/cjs/tools/search/tavily-scraper.cjs.map +1 -0
package/dist/cjs/tools/search/tavily-search.cjs +372 -0
package/dist/cjs/tools/search/tavily-search.cjs.map +1 -0
package/dist/cjs/tools/search/tool.cjs +26 -4
package/dist/cjs/tools/search/tool.cjs.map +1 -1
package/dist/cjs/tools/search/utils.cjs +10 -3
package/dist/cjs/tools/search/utils.cjs.map +1 -1
package/dist/esm/graphs/Graph.mjs +22 -3
package/dist/esm/graphs/Graph.mjs.map +1 -1
package/dist/esm/hitl/askUserQuestion.mjs +65 -0
package/dist/esm/hitl/askUserQuestion.mjs.map +1 -0
package/dist/esm/hooks/HookRegistry.mjs +54 -0
package/dist/esm/hooks/HookRegistry.mjs.map +1 -1
package/dist/esm/hooks/createToolPolicyHook.mjs +113 -0
package/dist/esm/hooks/createToolPolicyHook.mjs.map +1 -0
package/dist/esm/hooks/executeHooks.mjs +40 -1
package/dist/esm/hooks/executeHooks.mjs.map +1 -1
package/dist/esm/hooks/types.mjs +1 -0
package/dist/esm/hooks/types.mjs.map +1 -1
package/dist/esm/langchain/google-common.mjs +2 -0
package/dist/esm/langchain/google-common.mjs.map +1 -0
package/dist/esm/langchain/index.mjs +5 -0
package/dist/esm/langchain/index.mjs.map +1 -0
package/dist/esm/langchain/language_models/chat_models.mjs +2 -0
package/dist/esm/langchain/language_models/chat_models.mjs.map +1 -0
package/dist/esm/langchain/messages/tool.mjs +2 -0
package/dist/esm/langchain/messages/tool.mjs.map +1 -0
package/dist/esm/langchain/messages.mjs +2 -0
package/dist/esm/langchain/messages.mjs.map +1 -0
package/dist/esm/langchain/openai.mjs +2 -0
package/dist/esm/langchain/openai.mjs.map +1 -0
package/dist/esm/langchain/prompts.mjs +2 -0
package/dist/esm/langchain/prompts.mjs.map +1 -0
package/dist/esm/langchain/runnables.mjs +2 -0
package/dist/esm/langchain/runnables.mjs.map +1 -0
package/dist/esm/langchain/tools.mjs +2 -0
package/dist/esm/langchain/tools.mjs.map +1 -0
package/dist/esm/langchain/utils/env.mjs +2 -0
package/dist/esm/langchain/utils/env.mjs.map +1 -0
package/dist/esm/llm/anthropic/index.mjs +146 -54
package/dist/esm/llm/anthropic/index.mjs.map +1 -1
package/dist/esm/llm/anthropic/types.mjs.map +1 -1
package/dist/esm/llm/anthropic/utils/message_inputs.mjs +21 -14
package/dist/esm/llm/anthropic/utils/message_inputs.mjs.map +1 -1
package/dist/esm/llm/anthropic/utils/message_outputs.mjs +84 -71
package/dist/esm/llm/anthropic/utils/message_outputs.mjs.map +1 -1
package/dist/esm/llm/bedrock/index.mjs +1 -1
package/dist/esm/llm/bedrock/index.mjs.map +1 -1
package/dist/esm/llm/bedrock/utils/message_inputs.mjs +214 -4
package/dist/esm/llm/bedrock/utils/message_inputs.mjs.map +1 -1
package/dist/esm/llm/bedrock/utils/message_outputs.mjs +2 -1
package/dist/esm/llm/bedrock/utils/message_outputs.mjs.map +1 -1
package/dist/esm/llm/google/utils/common.mjs +5 -4
package/dist/esm/llm/google/utils/common.mjs.map +1 -1
package/dist/esm/llm/openai/index.mjs +520 -656
package/dist/esm/llm/openai/index.mjs.map +1 -1
package/dist/esm/llm/openai/utils/index.mjs +23 -459
package/dist/esm/llm/openai/utils/index.mjs.map +1 -1
package/dist/esm/llm/openrouter/index.mjs +57 -175
package/dist/esm/llm/openrouter/index.mjs.map +1 -1
package/dist/esm/llm/vertexai/index.mjs +5 -3
package/dist/esm/llm/vertexai/index.mjs.map +1 -1
package/dist/esm/main.mjs +7 -0
package/dist/esm/main.mjs.map +1 -1
package/dist/esm/messages/cache.mjs +2 -1
package/dist/esm/messages/cache.mjs.map +1 -1
package/dist/esm/messages/core.mjs +7 -6
package/dist/esm/messages/core.mjs.map +1 -1
package/dist/esm/messages/format.mjs +73 -15
package/dist/esm/messages/format.mjs.map +1 -1
package/dist/esm/messages/langchain.mjs +23 -0
package/dist/esm/messages/langchain.mjs.map +1 -0
package/dist/esm/messages/prune.mjs +7 -6
package/dist/esm/messages/prune.mjs.map +1 -1
package/dist/esm/run.mjs +400 -42
package/dist/esm/run.mjs.map +1 -1
package/dist/esm/tools/ToolNode.mjs +557 -57
package/dist/esm/tools/ToolNode.mjs.map +1 -1
package/dist/esm/tools/search/search.mjs +55 -66
package/dist/esm/tools/search/search.mjs.map +1 -1
package/dist/esm/tools/search/tavily-scraper.mjs +186 -0
package/dist/esm/tools/search/tavily-scraper.mjs.map +1 -0
package/dist/esm/tools/search/tavily-search.mjs +370 -0
package/dist/esm/tools/search/tavily-search.mjs.map +1 -0
package/dist/esm/tools/search/tool.mjs +26 -4
package/dist/esm/tools/search/tool.mjs.map +1 -1
package/dist/esm/tools/search/utils.mjs +10 -3
package/dist/esm/tools/search/utils.mjs.map +1 -1
package/dist/types/graphs/Graph.d.ts +7 -0
package/dist/types/hitl/askUserQuestion.d.ts +55 -0
package/dist/types/hitl/index.d.ts +6 -0
package/dist/types/hooks/HookRegistry.d.ts +58 -0
package/dist/types/hooks/createToolPolicyHook.d.ts +87 -0
package/dist/types/hooks/index.d.ts +4 -1
package/dist/types/hooks/types.d.ts +109 -3
package/dist/types/index.d.ts +10 -0
package/dist/types/langchain/google-common.d.ts +1 -0
package/dist/types/langchain/index.d.ts +8 -0
package/dist/types/langchain/language_models/chat_models.d.ts +1 -0
package/dist/types/langchain/messages/tool.d.ts +1 -0
package/dist/types/langchain/messages.d.ts +2 -0
package/dist/types/langchain/openai.d.ts +1 -0
package/dist/types/langchain/prompts.d.ts +1 -0
package/dist/types/langchain/runnables.d.ts +2 -0
package/dist/types/langchain/tools.d.ts +2 -0
package/dist/types/langchain/utils/env.d.ts +1 -0
package/dist/types/llm/anthropic/index.d.ts +22 -9
package/dist/types/llm/anthropic/types.d.ts +5 -1
package/dist/types/llm/anthropic/utils/message_outputs.d.ts +13 -6
package/dist/types/llm/anthropic/utils/output_parsers.d.ts +1 -1
package/dist/types/llm/openai/index.d.ts +21 -24
package/dist/types/llm/openrouter/index.d.ts +11 -9
package/dist/types/llm/vertexai/index.d.ts +1 -0
package/dist/types/messages/cache.d.ts +4 -1
package/dist/types/messages/format.d.ts +4 -1
package/dist/types/messages/langchain.d.ts +27 -0
package/dist/types/run.d.ts +117 -1
package/dist/types/tools/ToolNode.d.ts +26 -1
package/dist/types/tools/search/tavily-scraper.d.ts +19 -0
package/dist/types/tools/search/tavily-search.d.ts +4 -0
package/dist/types/tools/search/types.d.ts +99 -5
package/dist/types/tools/search/utils.d.ts +2 -2
package/dist/types/types/graph.d.ts +23 -37
package/dist/types/types/hitl.d.ts +272 -0
package/dist/types/types/index.d.ts +1 -0
package/dist/types/types/llm.d.ts +3 -3
package/dist/types/types/run.d.ts +33 -0
package/dist/types/types/stream.d.ts +1 -1
package/dist/types/types/tools.d.ts +19 -0
package/package.json +80 -17
package/src/graphs/Graph.ts +33 -4
package/src/graphs/__tests__/composition.smoke.test.ts +188 -0
package/src/hitl/askUserQuestion.ts +72 -0
package/src/hitl/index.ts +7 -0
package/src/hooks/HookRegistry.ts +71 -0
package/src/hooks/__tests__/createToolPolicyHook.test.ts +259 -0
package/src/hooks/createToolPolicyHook.ts +184 -0
package/src/hooks/executeHooks.ts +50 -1
package/src/hooks/index.ts +6 -0
package/src/hooks/types.ts +112 -0
package/src/index.ts +22 -0
package/src/langchain/google-common.ts +1 -0
package/src/langchain/index.ts +8 -0
package/src/langchain/language_models/chat_models.ts +1 -0
package/src/langchain/messages/tool.ts +5 -0
package/src/langchain/messages.ts +21 -0
package/src/langchain/openai.ts +1 -0
package/src/langchain/prompts.ts +1 -0
package/src/langchain/runnables.ts +7 -0
package/src/langchain/tools.ts +8 -0
package/src/langchain/utils/env.ts +1 -0
package/src/llm/anthropic/index.ts +252 -84
package/src/llm/anthropic/llm.spec.ts +751 -102
package/src/llm/anthropic/types.ts +9 -1
package/src/llm/anthropic/utils/message_inputs.ts +37 -19
package/src/llm/anthropic/utils/message_outputs.ts +119 -101
package/src/llm/bedrock/index.ts +2 -2
package/src/llm/bedrock/llm.spec.ts +341 -0
package/src/llm/bedrock/utils/message_inputs.ts +303 -4
package/src/llm/bedrock/utils/message_outputs.ts +2 -1
package/src/llm/custom-chat-models.smoke.test.ts +836 -0
package/src/llm/google/llm.spec.ts +339 -57
package/src/llm/google/utils/common.ts +53 -48
package/src/llm/openai/contentBlocks.test.ts +346 -0
package/src/llm/openai/index.ts +856 -833
package/src/llm/openai/utils/index.ts +107 -78
package/src/llm/openai/utils/messages.test.ts +159 -0
package/src/llm/openrouter/index.ts +124 -247
package/src/llm/openrouter/reasoning.test.ts +8 -1
package/src/llm/vertexai/index.ts +11 -5
package/src/llm/vertexai/llm.spec.ts +28 -1
package/src/messages/cache.test.ts +4 -3
package/src/messages/cache.ts +3 -2
package/src/messages/core.ts +16 -9
package/src/messages/format.ts +96 -16
package/src/messages/formatAgentMessages.test.ts +166 -1
package/src/messages/langchain.ts +39 -0
package/src/messages/prune.ts +12 -8
package/src/run.ts +456 -47
package/src/scripts/caching.ts +2 -3
package/src/specs/summarization.test.ts +51 -58
package/src/tools/ToolNode.ts +706 -63
package/src/tools/__tests__/hitl.test.ts +3593 -0
package/src/tools/search/search.ts +83 -73
package/src/tools/search/tavily-scraper.ts +235 -0
package/src/tools/search/tavily-search.ts +424 -0
package/src/tools/search/tavily.test.ts +965 -0
package/src/tools/search/tool.ts +36 -26
package/src/tools/search/types.ts +133 -8
package/src/tools/search/utils.ts +13 -5
package/src/types/graph.ts +32 -87
package/src/types/hitl.ts +303 -0
package/src/types/index.ts +1 -0
package/src/types/llm.ts +3 -3
package/src/types/run.ts +33 -0
package/src/types/stream.ts +1 -1
package/src/types/tools.ts +19 -0
package/src/utils/llmConfig.ts +1 -6

package/dist/esm/llm/openai/index.mjs CHANGED Viewed

@@ -1,11 +1,11 @@
 import { AzureOpenAI } from 'openai';
 import { ChatXAI as ChatXAI$1 } from '@langchain/xai';
 import { ChatGenerationChunk } from '@langchain/core/outputs';
-import { AIMessage, AIMessageChunk } from '@langchain/core/messages';
+import { isAIMessage, AIMessage, AIMessageChunk } from '@langchain/core/messages';
 import '@langchain/core/utils/function_calling';
 import { ChatDeepSeek as ChatDeepSeek$1 } from '@langchain/deepseek';
-import { getEndpoint, AzureChatOpenAI as AzureChatOpenAI$1, ChatOpenAI as ChatOpenAI$1, OpenAIClient } from '@langchain/openai';
-import { _convertMessagesToOpenAIParams, isReasoningModel, _convertMessagesToOpenAIResponsesParams, _convertOpenAIResponsesDeltaToBaseMessageChunk } from './utils/index.mjs';
+import { getEndpoint, AzureChatOpenAI as AzureChatOpenAI$1, ChatOpenAI as ChatOpenAI$1, OpenAIClient, AzureChatOpenAICompletions, AzureChatOpenAIResponses, ChatOpenAIResponses, ChatOpenAICompletions, getHeadersWithUserAgent } from '@langchain/openai';
+import { isReasoningModel, _convertMessagesToOpenAIParams } from './utils/index.mjs';
 import '../../common/enum.mjs';
 import 'nanoid';
 import '../../messages/core.mjs';
@@ -51,6 +51,153 @@ function normalizeHeaders(headers) {
     });
     return Object.fromEntries(output.entries());
 }
+function getExposedOpenAIClient(completions, responses, preferResponses) {
+    const responsesClient = responses.client;
+    if (responsesClient?.abortHandler != null) {
+        return responsesClient;
+    }
+    const completionsClient = completions.client;
+    if (completionsClient?.abortHandler != null) {
+        return completionsClient;
+    }
+    const delegate = preferResponses ? responses : completions;
+    delegate._getClientOptions(undefined);
+    return delegate.client;
+}
+function getReasoningParams(baseReasoning, options) {
+    let reasoning;
+    if (baseReasoning !== undefined) {
+        reasoning = {
+            ...reasoning,
+            ...baseReasoning,
+        };
+    }
+    if (options?.reasoning !== undefined) {
+        reasoning = {
+            ...reasoning,
+            ...options.reasoning,
+        };
+    }
+    if (options?.reasoningEffort !== undefined &&
+        reasoning?.effort === undefined) {
+        reasoning = {
+            ...reasoning,
+            effort: options.reasoningEffort,
+        };
+    }
+    return reasoning;
+}
+function getGatedReasoningParams(model, baseReasoning, options) {
+    if (!isReasoningModel(model)) {
+        return;
+    }
+    return getReasoningParams(baseReasoning, options);
+}
+function isObject(value) {
+    return typeof value === 'object' && value !== null;
+}
+function isOpenAIChatCompletionChunk(value) {
+    if (!isObject(value)) {
+        return false;
+    }
+    // Intentionally loose: downstream handlers already tolerate empty choices.
+    const { choices } = value;
+    return Array.isArray(choices);
+}
+function getOpenAIChatCompletionChunk(value) {
+    if (isOpenAIChatCompletionChunk(value)) {
+        return value;
+    }
+    const { data } = value;
+    if (isOpenAIChatCompletionChunk(data)) {
+        return data;
+    }
+    return undefined;
+}
+async function* filterOpenAIChatCompletionStream(stream) {
+    for await (const item of stream) {
+        const chunk = getOpenAIChatCompletionChunk(item);
+        if (chunk == null) {
+            continue;
+        }
+        yield chunk;
+    }
+}
+async function completionWithFilteredOpenAIStream(request, requestOptions, completionWithRetry) {
+    if (request.stream !== true) {
+        return (await completionWithRetry(request, requestOptions));
+    }
+    const stream = await completionWithRetry(request, requestOptions);
+    return filterOpenAIChatCompletionStream(stream);
+}
+function attachLibreChatDeltaFields(chunk, delta) {
+    if (!AIMessageChunk.isInstance(chunk)) {
+        return chunk;
+    }
+    const libreChatDelta = delta;
+    if (libreChatDelta.reasoning != null &&
+        chunk.additional_kwargs.reasoning_content == null) {
+        chunk.additional_kwargs.reasoning_content = libreChatDelta.reasoning;
+    }
+    if (libreChatDelta.reasoning_details != null) {
+        chunk.additional_kwargs.reasoning_details =
+            libreChatDelta.reasoning_details;
+    }
+    if (libreChatDelta.provider_specific_fields != null) {
+        chunk.additional_kwargs.provider_specific_fields =
+            libreChatDelta.provider_specific_fields;
+    }
+    return chunk;
+}
+function attachLibreChatMessageFields(message, rawMessage) {
+    if (!isAIMessage(message)) {
+        return message;
+    }
+    if (rawMessage.reasoning != null &&
+        message.additional_kwargs.reasoning_content == null) {
+        message.additional_kwargs.reasoning_content = rawMessage.reasoning;
+    }
+    if (rawMessage.reasoning_details != null) {
+        message.additional_kwargs.reasoning_details = rawMessage.reasoning_details;
+    }
+    if (rawMessage.provider_specific_fields != null) {
+        message.additional_kwargs.provider_specific_fields =
+            rawMessage.provider_specific_fields;
+    }
+    return message;
+}
+function getCustomOpenAIClientOptions(owner, options) {
+    if (!owner.client) {
+        const openAIEndpointConfig = {
+            baseURL: owner.clientConfig.baseURL,
+        };
+        const endpoint = getEndpoint(openAIEndpointConfig);
+        const params = {
+            ...owner.clientConfig,
+            baseURL: endpoint,
+            timeout: owner.timeout,
+            maxRetries: 0,
+        };
+        if (params.baseURL == null) {
+            delete params.baseURL;
+        }
+        params.defaultHeaders = getHeadersWithUserAgent(params.defaultHeaders);
+        owner.client = new CustomOpenAIClient(params);
+    }
+    const requestOptions = {
+        ...owner.clientConfig,
+        ...options,
+    };
+    return requestOptions;
+}
+async function* delayStreamChunks(chunks, delay) {
+    for await (const chunk of chunks) {
+        yield chunk;
+        if (delay != null) {
+            await sleep(delay);
+        }
+    }
+}
 function createAbortHandler(controller) {
     return function () {
         controller.abort();
@@ -110,89 +257,165 @@ class CustomAzureOpenAIClient extends AzureOpenAI {
         }));
     }
 }
-/** @ts-expect-error We are intentionally overriding `getReasoningParams` */
-class ChatOpenAI extends ChatOpenAI$1 {
-    _lc_stream_delay;
+class LibreChatOpenAICompletions extends ChatOpenAICompletions {
+    includeReasoningContent;
+    includeReasoningDetails;
+    convertReasoningDetailsToContent;
     constructor(fields) {
         super(fields);
-        this._lc_stream_delay = fields?._lc_stream_delay;
-    }
-    get exposedClient() {
-        return this.client;
+        this.includeReasoningContent = fields?.includeReasoningContent;
+        this.includeReasoningDetails = fields?.includeReasoningDetails;
+        this.convertReasoningDetailsToContent =
+            fields?.convertReasoningDetailsToContent;
     }
-    static lc_name() {
-        return 'LibreChatOpenAI';
+    _getReasoningParams(options) {
+        return getReasoningParams(this.reasoning, options);
     }
     _getClientOptions(options) {
-        if (!this.client) {
-            const openAIEndpointConfig = {
-                baseURL: this.clientConfig.baseURL,
+        return getCustomOpenAIClientOptions(this, options);
+    }
+    async completionWithRetry(request, requestOptions) {
+        return completionWithFilteredOpenAIStream(request, requestOptions, super.completionWithRetry.bind(this));
+    }
+    _convertCompletionsDeltaToBaseMessageChunk(delta, rawResponse, defaultRole) {
+        return attachLibreChatDeltaFields(super._convertCompletionsDeltaToBaseMessageChunk(delta, rawResponse, defaultRole), delta);
+    }
+    _convertCompletionsMessageToBaseMessage(message, rawResponse) {
+        return attachLibreChatMessageFields(super._convertCompletionsMessageToBaseMessage(message, rawResponse), message);
+    }
+    async _generate(messages, options, runManager) {
+        if (this.includeReasoningContent !== true &&
+            this.includeReasoningDetails !== true) {
+            return super._generate(messages, options, runManager);
+        }
+        options.signal?.throwIfAborted();
+        const usageMetadata = {};
+        const params = this.invocationParams(options);
+        const messagesMapped = _convertMessagesToOpenAIParams(messages, this.model, {
+            includeReasoningContent: this.includeReasoningContent,
+            includeReasoningDetails: this.includeReasoningDetails,
+            convertReasoningDetailsToContent: this.convertReasoningDetailsToContent,
+        });
+        if (params.stream === true) {
+            const stream = this._streamResponseChunks(messages, options, runManager);
+            const finalChunks = new Map();
+            for await (const chunk of stream) {
+                chunk.message.response_metadata = {
+                    ...chunk.generationInfo,
+                    ...chunk.message.response_metadata,
+                };
+                const index = typeof chunk.generationInfo?.completion === 'number'
+                    ? chunk.generationInfo.completion
+                    : 0;
+                const existingChunk = finalChunks.get(index);
+                if (existingChunk == null) {
+                    finalChunks.set(index, chunk);
+                }
+                else {
+                    finalChunks.set(index, existingChunk.concat(chunk));
+                }
+            }
+            const generations = Array.from(finalChunks.entries())
+                .sort(([aKey], [bKey]) => aKey - bKey)
+                .map(([, value]) => value);
+            const { functions, function_call } = this.invocationParams(options);
+            const promptTokenUsage = await this._getEstimatedTokenCountFromPrompt(messages, functions, function_call);
+            const completionTokenUsage = await this._getNumTokensFromGenerations(generations);
+            usageMetadata.input_tokens = promptTokenUsage;
+            usageMetadata.output_tokens = completionTokenUsage;
+            usageMetadata.total_tokens = promptTokenUsage + completionTokenUsage;
+            return {
+                generations,
+                llmOutput: {
+                    estimatedTokenUsage: {
+                        promptTokens: usageMetadata.input_tokens,
+                        completionTokens: usageMetadata.output_tokens,
+                        totalTokens: usageMetadata.total_tokens,
+                    },
+                },
             };
-            const endpoint = getEndpoint(openAIEndpointConfig);
-            const params = {
-                ...this.clientConfig,
-                baseURL: endpoint,
-                timeout: this.timeout,
-                maxRetries: 0,
+        }
+        const data = await this.completionWithRetry({
+            ...params,
+            stream: false,
+            messages: messagesMapped,
+        }, {
+            signal: options.signal,
+            ...options.options,
+        });
+        const { completion_tokens: completionTokens, prompt_tokens: promptTokens, total_tokens: totalTokens, prompt_tokens_details: promptTokensDetails, completion_tokens_details: completionTokensDetails, } = data.usage ?? {};
+        if (completionTokens != null) {
+            usageMetadata.output_tokens =
+                (usageMetadata.output_tokens ?? 0) + completionTokens;
+        }
+        if (promptTokens != null) {
+            usageMetadata.input_tokens =
+                (usageMetadata.input_tokens ?? 0) + promptTokens;
+        }
+        if (totalTokens != null) {
+            usageMetadata.total_tokens =
+                (usageMetadata.total_tokens ?? 0) + totalTokens;
+        }
+        if (promptTokensDetails?.audio_tokens != null ||
+            promptTokensDetails?.cached_tokens != null) {
+            usageMetadata.input_token_details = {
+                ...(promptTokensDetails.audio_tokens != null && {
+                    audio: promptTokensDetails.audio_tokens,
+                }),
+                ...(promptTokensDetails.cached_tokens != null && {
+                    cache_read: promptTokensDetails.cached_tokens,
+                }),
             };
-            if (params.baseURL == null) {
-                delete params.baseURL;
-            }
-            this.client = new CustomOpenAIClient(params);
         }
-        const requestOptions = {
-            ...this.clientConfig,
-            ...options,
-        };
-        return requestOptions;
-    }
-    /**
-     * Returns backwards compatible reasoning parameters from constructor params and call options
-     * @internal
-     */
-    getReasoningParams(options) {
-        // apply options in reverse order of importance -- newer options supersede older options
-        let reasoning;
-        if (this.reasoning !== undefined) {
-            reasoning = {
-                ...reasoning,
-                ...this.reasoning,
+        if (completionTokensDetails?.audio_tokens != null ||
+            completionTokensDetails?.reasoning_tokens != null) {
+            usageMetadata.output_token_details = {
+                ...(completionTokensDetails.audio_tokens != null && {
+                    audio: completionTokensDetails.audio_tokens,
+                }),
+                ...(completionTokensDetails.reasoning_tokens != null && {
+                    reasoning: completionTokensDetails.reasoning_tokens,
+                }),
             };
         }
-        if (options?.reasoning !== undefined) {
-            reasoning = {
-                ...reasoning,
-                ...options.reasoning,
+        const generations = [];
+        for (const part of data.choices) {
+            const generation = {
+                text: part.message.content ?? '',
+                message: this._convertCompletionsMessageToBaseMessage(part.message, data),
+            };
+            generation.generationInfo = {
+                finish_reason: part.finish_reason,
+                ...(part.logprobs ? { logprobs: part.logprobs } : {}),
             };
+            if (isAIMessage(generation.message)) {
+                generation.message.usage_metadata = usageMetadata;
+            }
+            generation.message = new AIMessage(Object.fromEntries(Object.entries(generation.message).filter(([key]) => !key.startsWith('lc_'))));
+            generations.push(generation);
         }
-        return reasoning;
-    }
-    _getReasoningParams(options) {
-        return this.getReasoningParams(options);
+        return {
+            generations,
+            llmOutput: {
+                tokenUsage: {
+                    promptTokens: usageMetadata.input_tokens,
+                    completionTokens: usageMetadata.output_tokens,
+                    totalTokens: usageMetadata.total_tokens,
+                },
+            },
+        };
     }
     async *_streamResponseChunks(messages, options, runManager) {
-        if (!this._useResponseApi(options)) {
-            return yield* this._streamResponseChunks2(messages, options, runManager);
-        }
-        const streamIterable = await this.responseApiWithRetry({
-            ...this.invocationParams(options, { streaming: true }),
-            input: _convertMessagesToOpenAIResponsesParams(messages, this.model, this.zdrEnabled),
-            stream: true,
-        }, options);
-        for await (const data of streamIterable) {
-            const chunk = _convertOpenAIResponsesDeltaToBaseMessageChunk(data);
-            if (chunk == null)
-                continue;
-            yield chunk;
-            if (this._lc_stream_delay != null) {
-                await sleep(this._lc_stream_delay);
-            }
-            await runManager?.handleLLMNewToken(chunk.text || '', undefined, undefined, undefined, undefined, { chunk });
+        if (this.includeReasoningContent !== true &&
+            this.includeReasoningDetails !== true) {
+            yield* super._streamResponseChunks(messages, options, runManager);
+            return;
         }
-        return;
-    }
-    async *_streamResponseChunks2(messages, options, runManager) {
-        const messagesMapped = _convertMessagesToOpenAIParams(messages, this.model);
+        const messagesMapped = _convertMessagesToOpenAIParams(messages, this.model, {
+            includeReasoningContent: this.includeReasoningContent,
+            includeReasoningDetails: this.includeReasoningDetails,
+            convertReasoningDetailsToContent: this.convertReasoningDetailsToContent,
+        });
         const params = {
             ...this.invocationParams(options, {
                 streaming: true,
@@ -204,49 +427,40 @@ class ChatOpenAI extends ChatOpenAI$1 {
         const streamIterable = await this.completionWithRetry(params, options);
         let usage;
         for await (const data of streamIterable) {
-            const choice = data.choices[0];
-            if (data.usage) {
+            if (options.signal?.aborted === true) {
+                return;
+            }
+            const choices = data.choices;
+            const choice = choices?.[0];
+            if (data.usage != null) {
                 usage = data.usage;
             }
-            if (!choice) {
+            if (choice == null) {
                 continue;
             }
             const { delta } = choice;
-            if (!delta) {
+            if (delta == null) {
                 continue;
             }
-            const chunk = this._convertOpenAIDeltaToBaseMessageChunk(delta, data, defaultRole);
-            if ('reasoning_content' in delta) {
-                chunk.additional_kwargs.reasoning_content = delta.reasoning_content;
-            }
-            else if ('reasoning' in delta) {
-                chunk.additional_kwargs.reasoning_content = delta.reasoning;
-            }
-            if ('provider_specific_fields' in delta) {
-                chunk.additional_kwargs.provider_specific_fields =
-                    delta.provider_specific_fields;
-            }
+            const chunk = this._convertCompletionsDeltaToBaseMessageChunk(delta, data, defaultRole);
             defaultRole = delta.role ?? defaultRole;
             const newTokenIndices = {
                 prompt: options.promptIndex ?? 0,
-                completion: choice.index ?? 0,
+                completion: choice.index,
             };
             if (typeof chunk.content !== 'string') {
                 // eslint-disable-next-line no-console
                 console.log('[WARNING]: Received non-string content from OpenAI. This is currently not supported.');
                 continue;
             }
-            // eslint-disable-next-line @typescript-eslint/no-explicit-any
             const generationInfo = { ...newTokenIndices };
             if (choice.finish_reason != null) {
                 generationInfo.finish_reason = choice.finish_reason;
-                // Only include system fingerprint in the last chunk for now
-                // to avoid concatenation issues
                 generationInfo.system_fingerprint = data.system_fingerprint;
                 generationInfo.model_name = data.model;
                 generationInfo.service_tier = data.service_tier;
             }
-            if (this.logprobs == true) {
+            if (this.logprobs === true) {
                 generationInfo.logprobs = choice.logprobs;
             }
             const generationChunk = new ChatGenerationChunk({
@@ -255,10 +469,7 @@ class ChatOpenAI extends ChatOpenAI$1 {
                 generationInfo,
             });
             yield generationChunk;
-            if (this._lc_stream_delay != null) {
-                await sleep(this._lc_stream_delay);
-            }
-            await runManager?.handleLLMNewToken(generationChunk.text || '', newTokenIndices, undefined, undefined, undefined, { chunk: generationChunk });
+            await runManager?.handleLLMNewToken(generationChunk.text, newTokenIndices, undefined, undefined, undefined, { chunk: generationChunk });
         }
         if (usage) {
             const inputTokenDetails = {
@@ -280,9 +491,7 @@ class ChatOpenAI extends ChatOpenAI$1 {
             const generationChunk = new ChatGenerationChunk({
                 message: new AIMessageChunk({
                     content: '',
-                    response_metadata: {
-                        usage: { ...usage },
-                    },
+                    response_metadata: { usage: { ...usage } },
                     usage_metadata: {
                         input_tokens: usage.prompt_tokens,
                         output_tokens: usage.completion_tokens,
@@ -298,54 +507,27 @@ class ChatOpenAI extends ChatOpenAI$1 {
                 text: '',
             });
             yield generationChunk;
-            if (this._lc_stream_delay != null) {
-                await sleep(this._lc_stream_delay);
-            }
+            await runManager?.handleLLMNewToken(generationChunk.text, {
+                prompt: 0,
+                completion: 0,
+            }, undefined, undefined, undefined, { chunk: generationChunk });
         }
         if (options.signal?.aborted === true) {
             throw new Error('AbortError');
         }
     }
 }
-/** @ts-expect-error We are intentionally overriding `getReasoningParams` */
-class AzureChatOpenAI extends AzureChatOpenAI$1 {
-    _lc_stream_delay;
-    constructor(fields) {
-        super(fields);
-        this._lc_stream_delay = fields?._lc_stream_delay;
-    }
-    get exposedClient() {
-        return this.client;
-    }
-    static lc_name() {
-        return 'LibreChatAzureOpenAI';
+class LibreChatOpenAIResponses extends ChatOpenAIResponses {
+    _getReasoningParams(options) {
+        return getReasoningParams(this.reasoning, options);
     }
-    /**
-     * Returns backwards compatible reasoning parameters from constructor params and call options
-     * @internal
-     */
-    getReasoningParams(options) {
-        if (!isReasoningModel(this.model)) {
-            return;
-        }
-        // apply options in reverse order of importance -- newer options supersede older options
-        let reasoning;
-        if (this.reasoning !== undefined) {
-            reasoning = {
-                ...reasoning,
-                ...this.reasoning,
-            };
-        }
-        if (options?.reasoning !== undefined) {
-            reasoning = {
-                ...reasoning,
-                ...options.reasoning,
-            };
-        }
-        return reasoning;
+    _getClientOptions(options) {
+        return getCustomOpenAIClientOptions(this, options);
     }
+}
+class LibreChatAzureOpenAICompletions extends AzureChatOpenAICompletions {
     _getReasoningParams(options) {
-        return this.getReasoningParams(options);
+        return getGatedReasoningParams(this.model, this.reasoning, options);
     }
     _getClientOptions(options) {
         if (!this.client) {
@@ -399,120 +581,22 @@ class AzureChatOpenAI extends AzureChatOpenAI$1 {
         }
         return requestOptions;
     }
-    async *_streamResponseChunks(messages, options, runManager) {
-        if (!this._useResponseApi(options)) {
-            return yield* super._streamResponseChunks(messages, options, runManager);
-        }
-        const streamIterable = await this.responseApiWithRetry({
-            ...this.invocationParams(options, { streaming: true }),
-            input: _convertMessagesToOpenAIResponsesParams(messages, this.model, this.zdrEnabled),
-            stream: true,
-        }, options);
-        for await (const data of streamIterable) {
-            const chunk = _convertOpenAIResponsesDeltaToBaseMessageChunk(data);
-            if (chunk == null)
-                continue;
-            yield chunk;
-            if (this._lc_stream_delay != null) {
-                await sleep(this._lc_stream_delay);
-            }
-            await runManager?.handleLLMNewToken(chunk.text || '', undefined, undefined, undefined, undefined, { chunk });
-        }
-        return;
+    async completionWithRetry(request, requestOptions) {
+        return completionWithFilteredOpenAIStream(request, requestOptions, super.completionWithRetry.bind(this));
     }
 }
-class ChatDeepSeek extends ChatDeepSeek$1 {
-    get exposedClient() {
-        return this.client;
-    }
-    static lc_name() {
-        return 'LibreChatDeepSeek';
-    }
-    _convertMessages(messages) {
-        return _convertMessagesToOpenAIParams(messages, this.model, {
-            includeReasoningContent: true,
-        });
-    }
-    async _generate(messages, options, runManager) {
-        const params = this.invocationParams(options);
-        if (params.stream === true) {
-            return super._generate(messages, options ?? {}, runManager);
-        }
-        const messagesMapped = this._convertMessages(messages);
-        const data = await this.completionWithRetry({
-            ...params,
-            stream: false,
-            messages: messagesMapped,
-        }, {
-            signal: options?.signal,
-            ...options?.options,
-        });
-        const { completion_tokens, prompt_tokens, total_tokens } = data.usage ?? {};
-        const generations = [];
-        for (const part of data.choices ?? []) {
-            const text = part.message.content ?? '';
-            const generation = {
-                text: typeof text === 'string' ? text : '',
-                message: this._convertResponseToMessage(part, data),
-            };
-            generation.generationInfo = {
-                ...(part.finish_reason != null
-                    ? { finish_reason: part.finish_reason }
-                    : {}),
-                ...(part.logprobs ? { logprobs: part.logprobs } : {}),
-            };
-            generations.push(generation);
-        }
-        return {
-            generations,
-            llmOutput: {
-                tokenUsage: {
-                    completionTokens: completion_tokens,
-                    promptTokens: prompt_tokens,
-                    totalTokens: total_tokens,
-                },
-            },
-        };
-    }
-    _convertResponseToMessage(choice, data) {
-        const { message } = choice;
-        const rawToolCalls = message.tool_calls;
-        const toolCalls = rawToolCalls?.map((tc) => ({
-            id: tc.id,
-            name: tc.function.name,
-            args: JSON.parse(tc.function.arguments || '{}'),
-            type: 'tool_call',
-        }));
-        const additional_kwargs = {};
-        if (rawToolCalls) {
-            additional_kwargs.tool_calls = rawToolCalls;
-        }
-        if ('reasoning_content' in message &&
-            message.reasoning_content != null &&
-            message.reasoning_content !== '') {
-            additional_kwargs.reasoning_content = message.reasoning_content;
-        }
-        return new AIMessage({
-            content: message.content ?? '',
-            tool_calls: toolCalls,
-            additional_kwargs,
-            usage_metadata: data.usage
-                ? {
-                    input_tokens: data.usage.prompt_tokens,
-                    output_tokens: data.usage.completion_tokens,
-                    total_tokens: data.usage.total_tokens,
-                }
-                : undefined,
-            response_metadata: {
-                model_name: data.model,
-                system_fingerprint: data.system_fingerprint,
-                finish_reason: choice.finish_reason,
-            },
-        });
+class LibreChatAzureOpenAIResponses extends AzureChatOpenAIResponses {
+    _getReasoningParams(options) {
+        return getGatedReasoningParams(this.model, this.reasoning, options);
     }
     _getClientOptions(options) {
         if (!this.client) {
             const openAIEndpointConfig = {
+                azureOpenAIApiDeploymentName: this.azureOpenAIApiDeploymentName,
+                azureOpenAIApiInstanceName: this.azureOpenAIApiInstanceName,
+                azureOpenAIApiKey: this.azureOpenAIApiKey,
+                azureOpenAIBasePath: this.azureOpenAIBasePath,
+                azureADTokenProvider: this.azureADTokenProvider,
                 baseURL: this.clientConfig.baseURL,
             };
             const endpoint = getEndpoint(openAIEndpointConfig);
@@ -522,311 +606,227 @@ class ChatDeepSeek extends ChatDeepSeek$1 {
                 timeout: this.timeout,
                 maxRetries: 0,
             };
+            if (!this.azureADTokenProvider) {
+                params.apiKey = openAIEndpointConfig.azureOpenAIApiKey;
+            }
             if (params.baseURL == null) {
                 delete params.baseURL;
             }
-            this.client = new CustomOpenAIClient(params);
+            const defaultHeaders = normalizeHeaders(params.defaultHeaders);
+            params.defaultHeaders = {
+                ...params.defaultHeaders,
+                'User-Agent': defaultHeaders['User-Agent'] != null
+                    ? `${defaultHeaders['User-Agent']}: librechat-azure-openai-v2`
+                    : 'librechat-azure-openai-v2',
+            };
+            this.client = new CustomAzureOpenAIClient({
+                apiVersion: this.azureOpenAIApiVersion,
+                azureADTokenProvider: this.azureADTokenProvider,
+                ...params,
+            });
         }
         const requestOptions = {
             ...this.clientConfig,
             ...options,
         };
+        if (this.azureOpenAIApiKey != null) {
+            requestOptions.headers = {
+                'api-key': this.azureOpenAIApiKey,
+                ...requestOptions.headers,
+            };
+            requestOptions.query = {
+                'api-version': this.azureOpenAIApiVersion,
+                ...requestOptions.query,
+            };
+        }
         return requestOptions;
     }
-    async *_streamResponseChunks(messages, options, runManager) {
-        const messagesMapped = _convertMessagesToOpenAIParams(messages, this.model, {
-            includeReasoningContent: true,
-        });
-        const params = {
-            ...this.invocationParams(options, {
-                streaming: true,
-            }),
-            messages: messagesMapped,
-            stream: true,
-        };
-        let defaultRole;
-        const streamIterable = await this.completionWithRetry(params, options);
-        let usage;
-        for await (const data of streamIterable) {
-            const choice = data.choices[0];
-            if (data.usage) {
-                usage = data.usage;
-            }
-            if (!choice) {
-                continue;
-            }
-            const { delta } = choice;
-            if (!delta) {
-                continue;
-            }
-            const chunk = this._convertOpenAIDeltaToBaseMessageChunk(delta, data, defaultRole);
-            if ('reasoning_content' in delta) {
-                chunk.additional_kwargs.reasoning_content = delta.reasoning_content;
-            }
-            defaultRole = delta.role ?? defaultRole;
-            const newTokenIndices = {
-                prompt: options.promptIndex ?? 0,
-                completion: choice.index ?? 0,
+}
+function withLibreChatOpenAIFields(fields) {
+    const nextFields = fields ?? {};
+    return {
+        ...nextFields,
+        completions: nextFields.completions ?? new LibreChatOpenAICompletions(nextFields),
+        responses: nextFields.responses ?? new LibreChatOpenAIResponses(nextFields),
+    };
+}
+class ChatOpenAI extends ChatOpenAI$1 {
+    _lc_stream_delay;
+    constructor(fields) {
+        super(withLibreChatOpenAIFields(fields));
+        this._lc_stream_delay = fields?._lc_stream_delay;
+    }
+    get exposedClient() {
+        return getExposedOpenAIClient(this.completions, this.responses, this._useResponsesApi(undefined));
+    }
+    static lc_name() {
+        return 'LibreChatOpenAI';
+    }
+    _getClientOptions(options) {
+        if (!this.client) {
+            const openAIEndpointConfig = {
+                baseURL: this.clientConfig.baseURL,
             };
-            if (typeof chunk.content !== 'string') {
-                // eslint-disable-next-line no-console
-                console.log('[WARNING]: Received non-string content from OpenAI. This is currently not supported.');
-                continue;
+            const endpoint = getEndpoint(openAIEndpointConfig);
+            const params = {
+                ...this.clientConfig,
+                baseURL: endpoint,
+                timeout: this.timeout,
+                maxRetries: 0,
+            };
+            if (params.baseURL == null) {
+                delete params.baseURL;
             }
-            // eslint-disable-next-line @typescript-eslint/no-explicit-any
-            const generationInfo = { ...newTokenIndices };
-            if (choice.finish_reason != null) {
-                generationInfo.finish_reason = choice.finish_reason;
-                generationInfo.system_fingerprint = data.system_fingerprint;
-                generationInfo.model_name = data.model;
-                generationInfo.service_tier = data.service_tier;
+            this.client = new CustomOpenAIClient(params);
+        }
+        const requestOptions = {
+            ...this.clientConfig,
+            ...options,
+        };
+        return requestOptions;
+    }
+    /**
+     * Returns backwards compatible reasoning parameters from constructor params and call options
+     * @internal
+     */
+    getReasoningParams(options) {
+        return getReasoningParams(this.reasoning, options);
+    }
+    _getReasoningParams(options) {
+        return this.getReasoningParams(options);
+    }
+    async *_streamResponseChunks(messages, options, runManager) {
+        yield* delayStreamChunks(super._streamResponseChunks(messages, options, runManager), this._lc_stream_delay);
+    }
+}
+class AzureChatOpenAI extends AzureChatOpenAI$1 {
+    _lc_stream_delay;
+    constructor(fields) {
+        super(fields);
+        this.completions = new LibreChatAzureOpenAICompletions(fields);
+        this.responses = new LibreChatAzureOpenAIResponses(fields);
+        this._lc_stream_delay = fields?._lc_stream_delay;
+    }
+    get exposedClient() {
+        return getExposedOpenAIClient(this.completions, this.responses, this._useResponsesApi(undefined));
+    }
+    static lc_name() {
+        return 'LibreChatAzureOpenAI';
+    }
+    /**
+     * Returns backwards compatible reasoning parameters from constructor params and call options
+     * @internal
+     */
+    getReasoningParams(options) {
+        return getGatedReasoningParams(this.model, this.reasoning, options);
+    }
+    _getReasoningParams(options) {
+        return this.getReasoningParams(options);
+    }
+    _getClientOptions(options) {
+        if (!this.client) {
+            const openAIEndpointConfig = {
+                azureOpenAIApiDeploymentName: this.azureOpenAIApiDeploymentName,
+                azureOpenAIApiInstanceName: this.azureOpenAIApiInstanceName,
+                azureOpenAIApiKey: this.azureOpenAIApiKey,
+                azureOpenAIBasePath: this.azureOpenAIBasePath,
+                azureADTokenProvider: this.azureADTokenProvider,
+                baseURL: this.clientConfig.baseURL,
+            };
+            const endpoint = getEndpoint(openAIEndpointConfig);
+            const params = {
+                ...this.clientConfig,
+                baseURL: endpoint,
+                timeout: this.timeout,
+                maxRetries: 0,
+            };
+            if (!this.azureADTokenProvider) {
+                params.apiKey = openAIEndpointConfig.azureOpenAIApiKey;
             }
-            if (this.logprobs == true) {
-                generationInfo.logprobs = choice.logprobs;
+            if (params.baseURL == null) {
+                delete params.baseURL;
             }
-            const generationChunk = new ChatGenerationChunk({
-                message: chunk,
-                text: chunk.content,
-                generationInfo,
+            const defaultHeaders = normalizeHeaders(params.defaultHeaders);
+            params.defaultHeaders = {
+                ...params.defaultHeaders,
+                'User-Agent': defaultHeaders['User-Agent'] != null
+                    ? `${defaultHeaders['User-Agent']}: librechat-azure-openai-v2`
+                    : 'librechat-azure-openai-v2',
+            };
+            this.client = new CustomAzureOpenAIClient({
+                apiVersion: this.azureOpenAIApiVersion,
+                azureADTokenProvider: this.azureADTokenProvider,
+                ...params,
             });
-            yield generationChunk;
-            await runManager?.handleLLMNewToken(generationChunk.text || '', newTokenIndices, undefined, undefined, undefined, { chunk: generationChunk });
         }
-        if (usage) {
-            const inputTokenDetails = {
-                ...(usage.prompt_tokens_details?.audio_tokens != null && {
-                    audio: usage.prompt_tokens_details.audio_tokens,
-                }),
-                ...(usage.prompt_tokens_details?.cached_tokens != null && {
-                    cache_read: usage.prompt_tokens_details.cached_tokens,
-                }),
+        const requestOptions = {
+            ...this.clientConfig,
+            ...options,
+        };
+        if (this.azureOpenAIApiKey != null) {
+            requestOptions.headers = {
+                'api-key': this.azureOpenAIApiKey,
+                ...requestOptions.headers,
             };
-            const outputTokenDetails = {
-                ...(usage.completion_tokens_details?.audio_tokens != null && {
-                    audio: usage.completion_tokens_details.audio_tokens,
-                }),
-                ...(usage.completion_tokens_details?.reasoning_tokens != null && {
-                    reasoning: usage.completion_tokens_details.reasoning_tokens,
-                }),
+            requestOptions.query = {
+                'api-version': this.azureOpenAIApiVersion,
+                ...requestOptions.query,
             };
-            const generationChunk = new ChatGenerationChunk({
-                message: new AIMessageChunk({
-                    content: '',
-                    response_metadata: {
-                        usage: { ...usage },
-                    },
-                    usage_metadata: {
-                        input_tokens: usage.prompt_tokens,
-                        output_tokens: usage.completion_tokens,
-                        total_tokens: usage.total_tokens,
-                        ...(Object.keys(inputTokenDetails).length > 0 && {
-                            input_token_details: inputTokenDetails,
-                        }),
-                        ...(Object.keys(outputTokenDetails).length > 0 && {
-                            output_token_details: outputTokenDetails,
-                        }),
-                    },
-                }),
-                text: '',
-            });
-            yield generationChunk;
-        }
-        if (options.signal?.aborted === true) {
-            throw new Error('AbortError');
         }
+        return requestOptions;
+    }
+    async *_streamResponseChunks(messages, options, runManager) {
+        yield* delayStreamChunks(super._streamResponseChunks(messages, options, runManager), this._lc_stream_delay);
     }
 }
-class ChatMoonshot extends ChatOpenAI {
-    static lc_name() {
-        return 'LibreChatMoonshot';
+class ChatDeepSeek extends ChatDeepSeek$1 {
+    _lc_stream_delay;
+    constructor(fields) {
+        super(fields);
+        this._lc_stream_delay = fields?._lc_stream_delay;
     }
-    _convertMessages(messages) {
-        return _convertMessagesToOpenAIParams(messages, this.model, {
-            includeReasoningContent: true,
-        });
+    get exposedClient() {
+        return this.client;
     }
-    async _generate(messages, options, runManager) {
-        const params = this.invocationParams(options);
-        if (params.stream === true) {
-            return super._generate(messages, options, runManager);
-        }
-        const messagesMapped = this._convertMessages(messages);
-        const data = await this.completionWithRetry({
-            ...params,
-            stream: false,
-            messages: messagesMapped,
-        }, {
-            signal: options.signal,
-            ...options.options,
-        });
-        const { completion_tokens, prompt_tokens, total_tokens } = data.usage ?? {};
-        const generations = [];
-        for (const part of data.choices ?? []) {
-            const text = part.message.content ?? '';
-            const generation = {
-                text: typeof text === 'string' ? text : '',
-                message: this._convertResponseToMessage(part, data),
+    static lc_name() {
+        return 'LibreChatDeepSeek';
+    }
+    _getClientOptions(options) {
+        if (!this.client) {
+            const openAIEndpointConfig = {
+                baseURL: this.clientConfig.baseURL,
             };
-            generation.generationInfo = {
-                ...(part.finish_reason ? { finish_reason: part.finish_reason } : {}),
-                ...(part.logprobs ? { logprobs: part.logprobs } : {}),
+            const endpoint = getEndpoint(openAIEndpointConfig);
+            const params = {
+                ...this.clientConfig,
+                baseURL: endpoint,
+                timeout: this.timeout,
+                maxRetries: 0,
             };
-            generations.push(generation);
+            if (params.baseURL == null) {
+                delete params.baseURL;
+            }
+            this.client = new CustomOpenAIClient(params);
         }
-        return {
-            generations,
-            llmOutput: {
-                tokenUsage: {
-                    completionTokens: completion_tokens,
-                    promptTokens: prompt_tokens,
-                    totalTokens: total_tokens,
-                },
-            },
+        const requestOptions = {
+            ...this.clientConfig,
+            ...options,
         };
-    }
-    _convertResponseToMessage(choice, data) {
-        const { message } = choice;
-        const rawToolCalls = message.tool_calls;
-        const toolCalls = rawToolCalls?.map((tc) => ({
-            id: tc.id,
-            name: tc.function.name,
-            args: JSON.parse(tc.function.arguments || '{}'),
-            type: 'tool_call',
-        }));
-        const additional_kwargs = {};
-        if (rawToolCalls) {
-            additional_kwargs.tool_calls = rawToolCalls;
-        }
-        if ('reasoning_content' in message &&
-            message.reasoning_content != null &&
-            message.reasoning_content !== '') {
-            additional_kwargs.reasoning_content = message.reasoning_content;
-        }
-        return new AIMessage({
-            content: message.content ?? '',
-            tool_calls: toolCalls,
-            additional_kwargs,
-            usage_metadata: data.usage
-                ? {
-                    input_tokens: data.usage.prompt_tokens,
-                    output_tokens: data.usage.completion_tokens,
-                    total_tokens: data.usage.total_tokens,
-                }
-                : undefined,
-            response_metadata: {
-                model_name: data.model,
-                system_fingerprint: data.system_fingerprint,
-                finish_reason: choice.finish_reason,
-            },
-        });
+        return requestOptions;
     }
     async *_streamResponseChunks(messages, options, runManager) {
-        const messagesMapped = _convertMessagesToOpenAIParams(messages, this.model, {
+        yield* delayStreamChunks(super._streamResponseChunks(messages, options, runManager), this._lc_stream_delay);
+    }
+}
+class ChatMoonshot extends ChatOpenAI {
+    constructor(fields) {
+        super({
+            ...fields,
             includeReasoningContent: true,
         });
-        const params = {
-            ...this.invocationParams(options, {
-                streaming: true,
-            }),
-            messages: messagesMapped,
-            stream: true,
-        };
-        let defaultRole;
-        const streamIterable = await this.completionWithRetry(params, options);
-        let usage;
-        for await (const data of streamIterable) {
-            const choice = data.choices[0];
-            if (data.usage) {
-                usage = data.usage;
-            }
-            if (!choice) {
-                continue;
-            }
-            const { delta } = choice;
-            if (!delta) {
-                continue;
-            }
-            const chunk = this._convertOpenAIDeltaToBaseMessageChunk(delta, data, defaultRole);
-            if ('reasoning_content' in delta) {
-                chunk.additional_kwargs.reasoning_content = delta.reasoning_content;
-            }
-            defaultRole = delta.role ?? defaultRole;
-            const newTokenIndices = {
-                prompt: options.promptIndex ?? 0,
-                completion: choice.index ?? 0,
-            };
-            if (typeof chunk.content !== 'string') {
-                // eslint-disable-next-line no-console
-                console.log('[WARNING]: Received non-string content from OpenAI. This is currently not supported.');
-                continue;
-            }
-            // eslint-disable-next-line @typescript-eslint/no-explicit-any
-            const generationInfo = { ...newTokenIndices };
-            if (choice.finish_reason != null) {
-                generationInfo.finish_reason = choice.finish_reason;
-                generationInfo.system_fingerprint = data.system_fingerprint;
-                generationInfo.model_name = data.model;
-                generationInfo.service_tier = data.service_tier;
-            }
-            if (this.logprobs == true) {
-                generationInfo.logprobs = choice.logprobs;
-            }
-            const generationChunk = new ChatGenerationChunk({
-                message: chunk,
-                text: chunk.content,
-                generationInfo,
-            });
-            yield generationChunk;
-            if (this._lc_stream_delay != null) {
-                await sleep(this._lc_stream_delay);
-            }
-            await runManager?.handleLLMNewToken(generationChunk.text || '', newTokenIndices, undefined, undefined, undefined, { chunk: generationChunk });
-        }
-        if (usage) {
-            const inputTokenDetails = {
-                ...(usage.prompt_tokens_details?.audio_tokens != null && {
-                    audio: usage.prompt_tokens_details.audio_tokens,
-                }),
-                ...(usage.prompt_tokens_details?.cached_tokens != null && {
-                    cache_read: usage.prompt_tokens_details.cached_tokens,
-                }),
-            };
-            const outputTokenDetails = {
-                ...(usage.completion_tokens_details?.audio_tokens != null && {
-                    audio: usage.completion_tokens_details.audio_tokens,
-                }),
-                ...(usage.completion_tokens_details?.reasoning_tokens != null && {
-                    reasoning: usage.completion_tokens_details.reasoning_tokens,
-                }),
-            };
-            const generationChunk = new ChatGenerationChunk({
-                message: new AIMessageChunk({
-                    content: '',
-                    response_metadata: {
-                        usage: { ...usage },
-                    },
-                    usage_metadata: {
-                        input_tokens: usage.prompt_tokens,
-                        output_tokens: usage.completion_tokens,
-                        total_tokens: usage.total_tokens,
-                        ...(Object.keys(inputTokenDetails).length > 0 && {
-                            input_token_details: inputTokenDetails,
-                        }),
-                        ...(Object.keys(outputTokenDetails).length > 0 && {
-                            output_token_details: outputTokenDetails,
-                        }),
-                    },
-                }),
-                text: '',
-            });
-            yield generationChunk;
-            if (this._lc_stream_delay != null) {
-                await sleep(this._lc_stream_delay);
-            }
-        }
-        if (options.signal?.aborted === true) {
-            throw new Error('AbortError');
-        }
+    }
+    static lc_name() {
+        return 'LibreChatMoonshot';
     }
 }
 class ChatXAI extends ChatXAI$1 {
@@ -875,143 +875,7 @@ class ChatXAI extends ChatXAI$1 {
         return requestOptions;
     }
     async *_streamResponseChunks(messages, options, runManager) {
-        const messagesMapped = _convertMessagesToOpenAIParams(messages, this.model);
-        const params = {
-            ...this.invocationParams(options, {
-                streaming: true,
-            }),
-            messages: messagesMapped,
-            stream: true,
-        };
-        let defaultRole;
-        const streamIterable = await this.completionWithRetry(params, options);
-        let usage;
-        for await (const data of streamIterable) {
-            const choice = data.choices[0];
-            if (data.usage) {
-                usage = data.usage;
-            }
-            if (!choice) {
-                continue;
-            }
-            const { delta } = choice;
-            if (!delta) {
-                continue;
-            }
-            const chunk = this._convertOpenAIDeltaToBaseMessageChunk(delta, data, defaultRole);
-            if (chunk.usage_metadata != null) {
-                chunk.usage_metadata = {
-                    input_tokens: chunk.usage_metadata.input_tokens ?? 0,
-                    output_tokens: chunk.usage_metadata.output_tokens ?? 0,
-                    total_tokens: chunk.usage_metadata.total_tokens ?? 0,
-                };
-            }
-            if ('reasoning_content' in delta) {
-                chunk.additional_kwargs.reasoning_content = delta.reasoning_content;
-            }
-            defaultRole = delta.role ?? defaultRole;
-            const newTokenIndices = {
-                prompt: options.promptIndex ?? 0,
-                completion: choice.index ?? 0,
-            };
-            if (typeof chunk.content !== 'string') {
-                // eslint-disable-next-line no-console
-                console.log('[WARNING]: Received non-string content from OpenAI. This is currently not supported.');
-                continue;
-            }
-            // eslint-disable-next-line @typescript-eslint/no-explicit-any
-            const generationInfo = { ...newTokenIndices };
-            if (choice.finish_reason != null) {
-                generationInfo.finish_reason = choice.finish_reason;
-                // Only include system fingerprint in the last chunk for now
-                // to avoid concatenation issues
-                generationInfo.system_fingerprint = data.system_fingerprint;
-                generationInfo.model_name = data.model;
-                generationInfo.service_tier = data.service_tier;
-            }
-            if (this.logprobs == true) {
-                generationInfo.logprobs = choice.logprobs;
-            }
-            const generationChunk = new ChatGenerationChunk({
-                message: chunk,
-                text: chunk.content,
-                generationInfo,
-            });
-            yield generationChunk;
-            if (this._lc_stream_delay != null) {
-                await sleep(this._lc_stream_delay);
-            }
-            await runManager?.handleLLMNewToken(generationChunk.text || '', newTokenIndices, undefined, undefined, undefined, { chunk: generationChunk });
-        }
-        if (usage) {
-            // Type assertion for xAI-specific usage structure
-            const xaiUsage = usage;
-            const inputTokenDetails = {
-                // Standard OpenAI fields
-                ...(usage.prompt_tokens_details?.audio_tokens != null && {
-                    audio: usage.prompt_tokens_details.audio_tokens,
-                }),
-                ...(usage.prompt_tokens_details?.cached_tokens != null && {
-                    cache_read: usage.prompt_tokens_details.cached_tokens,
-                }),
-                // Add xAI-specific prompt token details if they exist
-                ...(xaiUsage.prompt_tokens_details?.text_tokens != null && {
-                    text: xaiUsage.prompt_tokens_details.text_tokens,
-                }),
-                ...(xaiUsage.prompt_tokens_details?.image_tokens != null && {
-                    image: xaiUsage.prompt_tokens_details.image_tokens,
-                }),
-            };
-            const outputTokenDetails = {
-                // Standard OpenAI fields
-                ...(usage.completion_tokens_details?.audio_tokens != null && {
-                    audio: usage.completion_tokens_details.audio_tokens,
-                }),
-                ...(usage.completion_tokens_details?.reasoning_tokens != null && {
-                    reasoning: usage.completion_tokens_details.reasoning_tokens,
-                }),
-                // Add xAI-specific completion token details if they exist
-                ...(xaiUsage.completion_tokens_details?.accepted_prediction_tokens !=
-                    null && {
-                    accepted_prediction: xaiUsage.completion_tokens_details.accepted_prediction_tokens,
-                }),
-                ...(xaiUsage.completion_tokens_details?.rejected_prediction_tokens !=
-                    null && {
-                    rejected_prediction: xaiUsage.completion_tokens_details.rejected_prediction_tokens,
-                }),
-            };
-            const generationChunk = new ChatGenerationChunk({
-                message: new AIMessageChunk({
-                    content: '',
-                    response_metadata: {
-                        usage: { ...usage },
-                        // Include xAI-specific metadata if it exists
-                        ...(xaiUsage.num_sources_used != null && {
-                            num_sources_used: xaiUsage.num_sources_used,
-                        }),
-                    },
-                    usage_metadata: {
-                        input_tokens: usage.prompt_tokens,
-                        output_tokens: usage.completion_tokens,
-                        total_tokens: usage.total_tokens,
-                        ...(Object.keys(inputTokenDetails).length > 0 && {
-                            input_token_details: inputTokenDetails,
-                        }),
-                        ...(Object.keys(outputTokenDetails).length > 0 && {
-                            output_token_details: outputTokenDetails,
-                        }),
-                    },
-                }),
-                text: '',
-            });
-            yield generationChunk;
-            if (this._lc_stream_delay != null) {
-                await sleep(this._lc_stream_delay);
-            }
-        }
-        if (options.signal?.aborted === true) {
-            throw new Error('AbortError');
-        }
+        yield* delayStreamChunks(super._streamResponseChunks(messages, options, runManager), this._lc_stream_delay);
     }
 }