npm - illuma-agents - Versions diffs - 1.0.2 → 1.0.4 - Mend

illuma-agents 1.0.2 → 1.0.4

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (225) hide show

package/LICENSE +25 -21
package/dist/cjs/agents/AgentContext.cjs +222 -0
package/dist/cjs/agents/AgentContext.cjs.map +1 -0
package/dist/cjs/common/enum.cjs +5 -4
package/dist/cjs/common/enum.cjs.map +1 -1
package/dist/cjs/events.cjs +7 -5
package/dist/cjs/events.cjs.map +1 -1
package/dist/cjs/graphs/Graph.cjs +328 -207
package/dist/cjs/graphs/Graph.cjs.map +1 -1
package/dist/cjs/graphs/MultiAgentGraph.cjs +507 -0
package/dist/cjs/graphs/MultiAgentGraph.cjs.map +1 -0
package/dist/cjs/llm/anthropic/index.cjs.map +1 -1
package/dist/cjs/llm/google/index.cjs.map +1 -1
package/dist/cjs/llm/ollama/index.cjs.map +1 -1
package/dist/cjs/llm/openai/index.cjs +35 -0
package/dist/cjs/llm/openai/index.cjs.map +1 -1
package/dist/cjs/llm/openai/utils/index.cjs +3 -1
package/dist/cjs/llm/openai/utils/index.cjs.map +1 -1
package/dist/cjs/llm/openrouter/index.cjs.map +1 -1
package/dist/cjs/llm/providers.cjs +0 -2
package/dist/cjs/llm/providers.cjs.map +1 -1
package/dist/cjs/llm/vertexai/index.cjs.map +1 -1
package/dist/cjs/main.cjs +12 -1
package/dist/cjs/main.cjs.map +1 -1
package/dist/cjs/messages/cache.cjs +123 -0
package/dist/cjs/messages/cache.cjs.map +1 -0
package/dist/cjs/messages/content.cjs +53 -0
package/dist/cjs/messages/content.cjs.map +1 -0
package/dist/cjs/messages/format.cjs +17 -29
package/dist/cjs/messages/format.cjs.map +1 -1
package/dist/cjs/run.cjs +119 -74
package/dist/cjs/run.cjs.map +1 -1
package/dist/cjs/stream.cjs +77 -73
package/dist/cjs/stream.cjs.map +1 -1
package/dist/cjs/tools/Calculator.cjs +45 -0
package/dist/cjs/tools/Calculator.cjs.map +1 -0
package/dist/cjs/tools/CodeExecutor.cjs +22 -22
package/dist/cjs/tools/CodeExecutor.cjs.map +1 -1
package/dist/cjs/tools/ToolNode.cjs +5 -3
package/dist/cjs/tools/ToolNode.cjs.map +1 -1
package/dist/cjs/tools/handlers.cjs +20 -20
package/dist/cjs/tools/handlers.cjs.map +1 -1
package/dist/cjs/utils/events.cjs +31 -0
package/dist/cjs/utils/events.cjs.map +1 -0
package/dist/cjs/utils/handlers.cjs +70 -0
package/dist/cjs/utils/handlers.cjs.map +1 -0
package/dist/cjs/utils/tokens.cjs +54 -7
package/dist/cjs/utils/tokens.cjs.map +1 -1
package/dist/esm/agents/AgentContext.mjs +220 -0
package/dist/esm/agents/AgentContext.mjs.map +1 -0
package/dist/esm/common/enum.mjs +5 -4
package/dist/esm/common/enum.mjs.map +1 -1
package/dist/esm/events.mjs +7 -5
package/dist/esm/events.mjs.map +1 -1
package/dist/esm/graphs/Graph.mjs +330 -209
package/dist/esm/graphs/Graph.mjs.map +1 -1
package/dist/esm/graphs/MultiAgentGraph.mjs +505 -0
package/dist/esm/graphs/MultiAgentGraph.mjs.map +1 -0
package/dist/esm/llm/anthropic/index.mjs.map +1 -1
package/dist/esm/llm/google/index.mjs.map +1 -1
package/dist/esm/llm/ollama/index.mjs.map +1 -1
package/dist/esm/llm/openai/index.mjs +35 -0
package/dist/esm/llm/openai/index.mjs.map +1 -1
package/dist/esm/llm/openai/utils/index.mjs +3 -1
package/dist/esm/llm/openai/utils/index.mjs.map +1 -1
package/dist/esm/llm/openrouter/index.mjs.map +1 -1
package/dist/esm/llm/providers.mjs +0 -2
package/dist/esm/llm/providers.mjs.map +1 -1
package/dist/esm/llm/vertexai/index.mjs.map +1 -1
package/dist/esm/main.mjs +7 -2
package/dist/esm/main.mjs.map +1 -1
package/dist/esm/messages/cache.mjs +120 -0
package/dist/esm/messages/cache.mjs.map +1 -0
package/dist/esm/messages/content.mjs +51 -0
package/dist/esm/messages/content.mjs.map +1 -0
package/dist/esm/messages/format.mjs +18 -29
package/dist/esm/messages/format.mjs.map +1 -1
package/dist/esm/run.mjs +119 -74
package/dist/esm/run.mjs.map +1 -1
package/dist/esm/stream.mjs +77 -73
package/dist/esm/stream.mjs.map +1 -1
package/dist/esm/tools/Calculator.mjs +24 -0
package/dist/esm/tools/Calculator.mjs.map +1 -0
package/dist/esm/tools/CodeExecutor.mjs +22 -22
package/dist/esm/tools/CodeExecutor.mjs.map +1 -1
package/dist/esm/tools/ToolNode.mjs +5 -3
package/dist/esm/tools/ToolNode.mjs.map +1 -1
package/dist/esm/tools/handlers.mjs +20 -20
package/dist/esm/tools/handlers.mjs.map +1 -1
package/dist/esm/utils/events.mjs +29 -0
package/dist/esm/utils/events.mjs.map +1 -0
package/dist/esm/utils/handlers.mjs +68 -0
package/dist/esm/utils/handlers.mjs.map +1 -0
package/dist/esm/utils/tokens.mjs +54 -8
package/dist/esm/utils/tokens.mjs.map +1 -1
package/dist/types/agents/AgentContext.d.ts +94 -0
package/dist/types/common/enum.d.ts +7 -5
package/dist/types/events.d.ts +3 -3
package/dist/types/graphs/Graph.d.ts +60 -66
package/dist/types/graphs/MultiAgentGraph.d.ts +47 -0
package/dist/types/graphs/index.d.ts +1 -0
package/dist/types/index.d.ts +1 -0
package/dist/types/llm/openai/index.d.ts +10 -0
package/dist/types/messages/cache.d.ts +20 -0
package/dist/types/messages/content.d.ts +7 -0
package/dist/types/messages/format.d.ts +1 -7
package/dist/types/messages/index.d.ts +2 -0
package/dist/types/messages/reducer.d.ts +9 -0
package/dist/types/run.d.ts +16 -10
package/dist/types/stream.d.ts +4 -3
package/dist/types/tools/Calculator.d.ts +8 -0
package/dist/types/tools/ToolNode.d.ts +1 -1
package/dist/types/tools/handlers.d.ts +9 -7
package/dist/types/tools/search/tool.d.ts +4 -4
package/dist/types/types/graph.d.ts +124 -11
package/dist/types/types/llm.d.ts +13 -9
package/dist/types/types/messages.d.ts +4 -0
package/dist/types/types/run.d.ts +46 -8
package/dist/types/types/stream.d.ts +3 -2
package/dist/types/utils/events.d.ts +6 -0
package/dist/types/utils/handlers.d.ts +34 -0
package/dist/types/utils/index.d.ts +1 -0
package/dist/types/utils/tokens.d.ts +24 -0
package/package.json +162 -145
package/src/agents/AgentContext.ts +323 -0
package/src/common/enum.ts +177 -176
package/src/events.ts +197 -191
package/src/graphs/Graph.ts +1058 -846
package/src/graphs/MultiAgentGraph.ts +598 -0
package/src/graphs/index.ts +2 -1
package/src/index.ts +25 -24
package/src/llm/anthropic/index.ts +413 -413
package/src/llm/google/index.ts +222 -222
package/src/llm/google/utils/zod_to_genai_parameters.ts +86 -88
package/src/llm/ollama/index.ts +92 -92
package/src/llm/openai/index.ts +894 -853
package/src/llm/openai/utils/index.ts +920 -918
package/src/llm/openrouter/index.ts +60 -60
package/src/llm/providers.ts +55 -57
package/src/llm/vertexai/index.ts +360 -360
package/src/messages/cache.test.ts +461 -0
package/src/messages/cache.ts +151 -0
package/src/messages/content.test.ts +362 -0
package/src/messages/content.ts +63 -0
package/src/messages/format.ts +611 -625
package/src/messages/formatAgentMessages.test.ts +1144 -917
package/src/messages/index.ts +6 -4
package/src/messages/reducer.ts +80 -0
package/src/run.ts +447 -381
package/src/scripts/abort.ts +157 -138
package/src/scripts/ant_web_search.ts +158 -158
package/src/scripts/cli.ts +172 -167
package/src/scripts/cli2.ts +133 -125
package/src/scripts/cli3.ts +184 -178
package/src/scripts/cli4.ts +191 -184
package/src/scripts/cli5.ts +191 -184
package/src/scripts/code_exec.ts +213 -214
package/src/scripts/code_exec_simple.ts +147 -129
package/src/scripts/content.ts +138 -120
package/src/scripts/handoff-test.ts +135 -0
package/src/scripts/multi-agent-chain.ts +278 -0
package/src/scripts/multi-agent-conditional.ts +220 -0
package/src/scripts/multi-agent-document-review-chain.ts +197 -0
package/src/scripts/multi-agent-hybrid-flow.ts +310 -0
package/src/scripts/multi-agent-parallel.ts +343 -0
package/src/scripts/multi-agent-sequence.ts +212 -0
package/src/scripts/multi-agent-supervisor.ts +364 -0
package/src/scripts/multi-agent-test.ts +186 -0
package/src/scripts/search.ts +146 -150
package/src/scripts/simple.ts +225 -225
package/src/scripts/stream.ts +140 -122
package/src/scripts/test-custom-prompt-key.ts +145 -0
package/src/scripts/test-handoff-input.ts +170 -0
package/src/scripts/test-multi-agent-list-handoff.ts +261 -0
package/src/scripts/test-tools-before-handoff.ts +222 -0
package/src/scripts/tools.ts +153 -155
package/src/specs/agent-handoffs.test.ts +889 -0
package/src/specs/anthropic.simple.test.ts +320 -317
package/src/specs/azure.simple.test.ts +325 -316
package/src/specs/openai.simple.test.ts +311 -316
package/src/specs/openrouter.simple.test.ts +107 -0
package/src/specs/prune.test.ts +758 -763
package/src/specs/reasoning.test.ts +201 -165
package/src/specs/thinking-prune.test.ts +769 -703
package/src/specs/token-memoization.test.ts +39 -0
package/src/stream.ts +664 -651
package/src/tools/Calculator.test.ts +278 -0
package/src/tools/Calculator.ts +25 -0
package/src/tools/CodeExecutor.ts +220 -220
package/src/tools/ToolNode.ts +170 -170
package/src/tools/handlers.ts +341 -336
package/src/types/graph.ts +372 -185
package/src/types/llm.ts +141 -140
package/src/types/messages.ts +4 -0
package/src/types/run.ts +128 -89
package/src/types/stream.ts +401 -400
package/src/utils/events.ts +32 -0
package/src/utils/handlers.ts +107 -0
package/src/utils/index.ts +6 -5
package/src/utils/llmConfig.ts +183 -183
package/src/utils/tokens.ts +129 -70
package/dist/types/scripts/abort.d.ts +0 -1
package/dist/types/scripts/ant_web_search.d.ts +0 -1
package/dist/types/scripts/args.d.ts +0 -7
package/dist/types/scripts/caching.d.ts +0 -1
package/dist/types/scripts/cli.d.ts +0 -1
package/dist/types/scripts/cli2.d.ts +0 -1
package/dist/types/scripts/cli3.d.ts +0 -1
package/dist/types/scripts/cli4.d.ts +0 -1
package/dist/types/scripts/cli5.d.ts +0 -1
package/dist/types/scripts/code_exec.d.ts +0 -1
package/dist/types/scripts/code_exec_files.d.ts +0 -1
package/dist/types/scripts/code_exec_simple.d.ts +0 -1
package/dist/types/scripts/content.d.ts +0 -1
package/dist/types/scripts/empty_input.d.ts +0 -1
package/dist/types/scripts/image.d.ts +0 -1
package/dist/types/scripts/memory.d.ts +0 -1
package/dist/types/scripts/search.d.ts +0 -1
package/dist/types/scripts/simple.d.ts +0 -1
package/dist/types/scripts/stream.d.ts +0 -1
package/dist/types/scripts/thinking.d.ts +0 -1
package/dist/types/scripts/tools.d.ts +0 -1
package/dist/types/specs/spec.utils.d.ts +0 -1
package/dist/types/tools/example.d.ts +0 -78
package/src/tools/example.ts +0 -129

package/src/llm/openai/index.ts CHANGED Viewed

@@ -1,853 +1,894 @@
-import { AzureOpenAI as AzureOpenAIClient } from 'openai';
-import { AIMessageChunk } from '@langchain/core/messages';
-import { ChatXAI as OriginalChatXAI } from '@langchain/xai';
-import { ChatGenerationChunk } from '@langchain/core/outputs';
-import { ToolDefinition } from '@langchain/core/language_models/base';
-import { isLangChainTool } from '@langchain/core/utils/function_calling';
-import { ChatDeepSeek as OriginalChatDeepSeek } from '@langchain/deepseek';
-import { CallbackManagerForLLMRun } from '@langchain/core/callbacks/manager';
-import {
-  getEndpoint,
-  OpenAIClient,
-  formatToOpenAITool,
-  ChatOpenAI as OriginalChatOpenAI,
-  AzureChatOpenAI as OriginalAzureChatOpenAI,
-} from '@langchain/openai';
-import type {
-  OpenAIChatCallOptions,
-  OpenAIRoleEnum,
-  HeaderValue,
-  HeadersLike,
-} from './types';
-import type { BindToolsInput } from '@langchain/core/language_models/chat_models';
-import type { BaseMessage, UsageMetadata } from '@langchain/core/messages';
-import type { ChatXAIInput } from '@langchain/xai';
-import type * as t from '@langchain/openai';
-import {
-  isReasoningModel,
-  _convertMessagesToOpenAIParams,
-  _convertMessagesToOpenAIResponsesParams,
-  _convertOpenAIResponsesDeltaToBaseMessageChunk,
-  type ResponseReturnStreamEvents,
-} from './utils';
-// eslint-disable-next-line @typescript-eslint/explicit-function-return-type
-const iife = <T>(fn: () => T) => fn();
-export function isHeaders(headers: unknown): headers is Headers {
-  return (
-    typeof Headers !== 'undefined' &&
-    headers !== null &&
-    typeof headers === 'object' &&
-    Object.prototype.toString.call(headers) === '[object Headers]'
-  );
-}
-export function normalizeHeaders(
-  headers: HeadersLike
-): Record<string, HeaderValue | readonly HeaderValue[]> {
-  const output = iife(() => {
-    // If headers is a Headers instance
-    if (isHeaders(headers)) {
-      return headers;
-    }
-    // If headers is an array of [key, value] pairs
-    else if (Array.isArray(headers)) {
-      return new Headers(headers);
-    }
-    // If headers is a NullableHeaders-like object (has 'values' property that is a Headers)
-    else if (
-      typeof headers === 'object' &&
-      headers !== null &&
-      'values' in headers &&
-      isHeaders(headers.values)
-    ) {
-      return headers.values;
-    }
-    // If headers is a plain object
-    else if (typeof headers === 'object' && headers !== null) {
-      const entries: [string, string][] = Object.entries(headers)
-        .filter(([, v]) => typeof v === 'string')
-        .map(([k, v]) => [k, v as string]);
-      return new Headers(entries);
-    }
-    return new Headers();
-  });
-  return Object.fromEntries(output.entries());
-}
-type OpenAICompletionParam =
-  OpenAIClient.Chat.Completions.ChatCompletionMessageParam;
-type OpenAICoreRequestOptions = OpenAIClient.RequestOptions;
-function createAbortHandler(controller: AbortController): () => void {
-  return function (): void {
-    controller.abort();
-  };
-}
-/**
- * Formats a tool in either OpenAI format, or LangChain structured tool format
- * into an OpenAI tool format. If the tool is already in OpenAI format, return without
- * any changes. If it is in LangChain structured tool format, convert it to OpenAI tool format
- * using OpenAI's `zodFunction` util, falling back to `convertToOpenAIFunction` if the parameters
- * returned from the `zodFunction` util are not defined.
- *
- * @param {BindToolsInput} tool The tool to convert to an OpenAI tool.
- * @param {Object} [fields] Additional fields to add to the OpenAI tool.
- * @returns {ToolDefinition} The inputted tool in OpenAI tool format.
- */
-export function _convertToOpenAITool(
-  tool: BindToolsInput,
-  fields?: {
-    /**
-     * If `true`, model output is guaranteed to exactly match the JSON Schema
-     * provided in the function definition.
-     */
-    strict?: boolean;
-  }
-): OpenAIClient.ChatCompletionTool {
-  let toolDef: OpenAIClient.ChatCompletionTool | undefined;
-  if (isLangChainTool(tool)) {
-    toolDef = formatToOpenAITool(tool);
-  } else {
-    toolDef = tool as ToolDefinition;
-  }
-  if (fields?.strict !== undefined) {
-    toolDef.function.strict = fields.strict;
-  }
-  return toolDef;
-}
-export class CustomOpenAIClient extends OpenAIClient {
-  abortHandler?: () => void;
-  async fetchWithTimeout(
-    url: RequestInfo,
-    init: RequestInit | undefined,
-    ms: number,
-    controller: AbortController
-  ): Promise<Response> {
-    const { signal, ...options } = init || {};
-    const handler = createAbortHandler(controller);
-    this.abortHandler = handler;
-    if (signal) signal.addEventListener('abort', handler, { once: true });
-    const timeout = setTimeout(() => handler, ms);
-    const fetchOptions = {
-      signal: controller.signal as AbortSignal,
-      ...options,
-    };
-    if (fetchOptions.method != null) {
-      // Custom methods like 'patch' need to be uppercased
-      // See https://github.com/nodejs/undici/issues/2294
-      fetchOptions.method = fetchOptions.method.toUpperCase();
-    }
-    return (
-      // use undefined this binding; fetch errors if bound to something else in browser/cloudflare
-      // eslint-disable-next-line @typescript-eslint/ban-ts-comment
-      /** @ts-ignore */
-      this.fetch.call(undefined, url, fetchOptions).finally(() => {
-        clearTimeout(timeout);
-      })
-    );
-  }
-}
-export class CustomAzureOpenAIClient extends AzureOpenAIClient {
-  abortHandler?: () => void;
-  async fetchWithTimeout(
-    url: RequestInfo,
-    init: RequestInit | undefined,
-    ms: number,
-    controller: AbortController
-  ): Promise<Response> {
-    const { signal, ...options } = init || {};
-    const handler = createAbortHandler(controller);
-    this.abortHandler = handler;
-    if (signal) signal.addEventListener('abort', handler, { once: true });
-    const timeout = setTimeout(() => handler, ms);
-    const fetchOptions = {
-      signal: controller.signal as AbortSignal,
-      ...options,
-    };
-    if (fetchOptions.method != null) {
-      // Custom methods like 'patch' need to be uppercased
-      // See https://github.com/nodejs/undici/issues/2294
-      fetchOptions.method = fetchOptions.method.toUpperCase();
-    }
-    return (
-      // use undefined this binding; fetch errors if bound to something else in browser/cloudflare
-      // eslint-disable-next-line @typescript-eslint/ban-ts-comment
-      /** @ts-ignore */
-      this.fetch.call(undefined, url, fetchOptions).finally(() => {
-        clearTimeout(timeout);
-      })
-    );
-  }
-}
-/** @ts-expect-error We are intentionally overriding `getReasoningParams` */
-export class ChatOpenAI extends OriginalChatOpenAI<t.ChatOpenAICallOptions> {
-  public get exposedClient(): CustomOpenAIClient {
-    return this.client;
-  }
-  static lc_name(): string {
-    return 'IllumaOpenAI';
-  }
-  protected _getClientOptions(
-    options?: OpenAICoreRequestOptions
-  ): OpenAICoreRequestOptions {
-    if (!(this.client as OpenAIClient | undefined)) {
-      const openAIEndpointConfig: t.OpenAIEndpointConfig = {
-        baseURL: this.clientConfig.baseURL,
-      };
-      const endpoint = getEndpoint(openAIEndpointConfig);
-      const params = {
-        ...this.clientConfig,
-        baseURL: endpoint,
-        timeout: this.timeout,
-        maxRetries: 0,
-      };
-      if (params.baseURL == null) {
-        delete params.baseURL;
-      }
-      this.client = new CustomOpenAIClient(params);
-    }
-    const requestOptions = {
-      ...this.clientConfig,
-      ...options,
-    } as OpenAICoreRequestOptions;
-    return requestOptions;
-  }
-  /**
-   * Returns backwards compatible reasoning parameters from constructor params and call options
-   * @internal
-   */
-  getReasoningParams(
-    options?: this['ParsedCallOptions']
-  ): OpenAIClient.Reasoning | undefined {
-    // apply options in reverse order of importance -- newer options supersede older options
-    let reasoning: OpenAIClient.Reasoning | undefined;
-    if (this.reasoning !== undefined) {
-      reasoning = {
-        ...reasoning,
-        ...this.reasoning,
-      };
-    }
-    if (options?.reasoning !== undefined) {
-      reasoning = {
-        ...reasoning,
-        ...options.reasoning,
-      };
-    }
-    return reasoning;
-  }
-  protected _getReasoningParams(
-    options?: this['ParsedCallOptions']
-  ): OpenAIClient.Reasoning | undefined {
-    return this.getReasoningParams(options);
-  }
-  async *_streamResponseChunks(
-    messages: BaseMessage[],
-    options: this['ParsedCallOptions'],
-    runManager?: CallbackManagerForLLMRun
-  ): AsyncGenerator<ChatGenerationChunk> {
-    if (!this._useResponseApi(options)) {
-      return yield* this._streamResponseChunks2(messages, options, runManager);
-    }
-    const streamIterable = await this.responseApiWithRetry(
-      {
-        ...this.invocationParams<'responses'>(options, { streaming: true }),
-        input: _convertMessagesToOpenAIResponsesParams(
-          messages,
-          this.model,
-          this.zdrEnabled
-        ),
-        stream: true,
-      },
-      options
-    );
-    for await (const data of streamIterable) {
-      const chunk = _convertOpenAIResponsesDeltaToBaseMessageChunk(
-        data as ResponseReturnStreamEvents
-      );
-      if (chunk == null) continue;
-      yield chunk;
-      await runManager?.handleLLMNewToken(
-        chunk.text || '',
-        undefined,
-        undefined,
-        undefined,
-        undefined,
-        { chunk }
-      );
-    }
-    return;
-  }
-  async *_streamResponseChunks2(
-    messages: BaseMessage[],
-    options: this['ParsedCallOptions'],
-    runManager?: CallbackManagerForLLMRun
-  ): AsyncGenerator<ChatGenerationChunk> {
-    const messagesMapped: OpenAICompletionParam[] =
-      _convertMessagesToOpenAIParams(messages, this.model);
-    const params = {
-      ...this.invocationParams(options, {
-        streaming: true,
-      }),
-      messages: messagesMapped,
-      stream: true as const,
-    };
-    let defaultRole: OpenAIRoleEnum | undefined;
-    const streamIterable = await this.completionWithRetry(params, options);
-    let usage: OpenAIClient.Completions.CompletionUsage | undefined;
-    for await (const data of streamIterable) {
-      const choice = data.choices[0] as
-        | Partial<OpenAIClient.Chat.Completions.ChatCompletionChunk.Choice>
-        | undefined;
-      if (data.usage) {
-        usage = data.usage;
-      }
-      if (!choice) {
-        continue;
-      }
-      const { delta } = choice;
-      if (!delta) {
-        continue;
-      }
-      const chunk = this._convertOpenAIDeltaToBaseMessageChunk(
-        delta,
-        data,
-        defaultRole
-      );
-      if ('reasoning_content' in delta) {
-        chunk.additional_kwargs.reasoning_content = delta.reasoning_content;
-      } else if ('reasoning' in delta) {
-        chunk.additional_kwargs.reasoning_content = delta.reasoning;
-      }
-      if ('provider_specific_fields' in delta) {
-        chunk.additional_kwargs.provider_specific_fields =
-          delta.provider_specific_fields;
-      }
-      defaultRole = delta.role ?? defaultRole;
-      const newTokenIndices = {
-        prompt: options.promptIndex ?? 0,
-        completion: choice.index ?? 0,
-      };
-      if (typeof chunk.content !== 'string') {
-        // eslint-disable-next-line no-console
-        console.log(
-          '[WARNING]: Received non-string content from OpenAI. This is currently not supported.'
-        );
-        continue;
-      }
-      // eslint-disable-next-line @typescript-eslint/no-explicit-any
-      const generationInfo: Record<string, any> = { ...newTokenIndices };
-      if (choice.finish_reason != null) {
-        generationInfo.finish_reason = choice.finish_reason;
-        // Only include system fingerprint in the last chunk for now
-        // to avoid concatenation issues
-        generationInfo.system_fingerprint = data.system_fingerprint;
-        generationInfo.model_name = data.model;
-        generationInfo.service_tier = data.service_tier;
-      }
-      if (this.logprobs == true) {
-        generationInfo.logprobs = choice.logprobs;
-      }
-      const generationChunk = new ChatGenerationChunk({
-        message: chunk,
-        text: chunk.content,
-        generationInfo,
-      });
-      yield generationChunk;
-      await runManager?.handleLLMNewToken(
-        generationChunk.text || '',
-        newTokenIndices,
-        undefined,
-        undefined,
-        undefined,
-        { chunk: generationChunk }
-      );
-    }
-    if (usage) {
-      const inputTokenDetails = {
-        ...(usage.prompt_tokens_details?.audio_tokens != null && {
-          audio: usage.prompt_tokens_details.audio_tokens,
-        }),
-        ...(usage.prompt_tokens_details?.cached_tokens != null && {
-          cache_read: usage.prompt_tokens_details.cached_tokens,
-        }),
-      };
-      const outputTokenDetails = {
-        ...(usage.completion_tokens_details?.audio_tokens != null && {
-          audio: usage.completion_tokens_details.audio_tokens,
-        }),
-        ...(usage.completion_tokens_details?.reasoning_tokens != null && {
-          reasoning: usage.completion_tokens_details.reasoning_tokens,
-        }),
-      };
-      const generationChunk = new ChatGenerationChunk({
-        message: new AIMessageChunk({
-          content: '',
-          response_metadata: {
-            usage: { ...usage },
-          },
-          usage_metadata: {
-            input_tokens: usage.prompt_tokens,
-            output_tokens: usage.completion_tokens,
-            total_tokens: usage.total_tokens,
-            ...(Object.keys(inputTokenDetails).length > 0 && {
-              input_token_details: inputTokenDetails,
-            }),
-            ...(Object.keys(outputTokenDetails).length > 0 && {
-              output_token_details: outputTokenDetails,
-            }),
-          },
-        }),
-        text: '',
-      });
-      yield generationChunk;
-    }
-    if (options.signal?.aborted === true) {
-      throw new Error('AbortError');
-    }
-  }
-}
-/** @ts-expect-error We are intentionally overriding `getReasoningParams` */
-export class AzureChatOpenAI extends OriginalAzureChatOpenAI {
-  public get exposedClient(): CustomOpenAIClient {
-    return this.client;
-  }
-  static lc_name(): 'IllumaAzureOpenAI' {
-    return 'IllumaAzureOpenAI';
-  }
-  /**
-   * Returns backwards compatible reasoning parameters from constructor params and call options
-   * @internal
-   */
-  getReasoningParams(
-    options?: this['ParsedCallOptions']
-  ): OpenAIClient.Reasoning | undefined {
-    if (!isReasoningModel(this.model)) {
-      return;
-    }
-    // apply options in reverse order of importance -- newer options supersede older options
-    let reasoning: OpenAIClient.Reasoning | undefined;
-    if (this.reasoning !== undefined) {
-      reasoning = {
-        ...reasoning,
-        ...this.reasoning,
-      };
-    }
-    if (options?.reasoning !== undefined) {
-      reasoning = {
-        ...reasoning,
-        ...options.reasoning,
-      };
-    }
-    return reasoning;
-  }
-  protected _getReasoningParams(
-    options?: this['ParsedCallOptions']
-  ): OpenAIClient.Reasoning | undefined {
-    return this.getReasoningParams(options);
-  }
-  protected _getClientOptions(
-    options: OpenAICoreRequestOptions | undefined
-  ): OpenAICoreRequestOptions {
-    if (!(this.client as unknown as AzureOpenAIClient | undefined)) {
-      const openAIEndpointConfig: t.OpenAIEndpointConfig = {
-        azureOpenAIApiDeploymentName: this.azureOpenAIApiDeploymentName,
-        azureOpenAIApiInstanceName: this.azureOpenAIApiInstanceName,
-        azureOpenAIApiKey: this.azureOpenAIApiKey,
-        azureOpenAIBasePath: this.azureOpenAIBasePath,
-        azureADTokenProvider: this.azureADTokenProvider,
-        baseURL: this.clientConfig.baseURL,
-      };
-      const endpoint = getEndpoint(openAIEndpointConfig);
-      const params = {
-        ...this.clientConfig,
-        baseURL: endpoint,
-        timeout: this.timeout,
-        maxRetries: 0,
-      };
-      if (!this.azureADTokenProvider) {
-        params.apiKey = openAIEndpointConfig.azureOpenAIApiKey;
-      }
-      if (params.baseURL == null) {
-        delete params.baseURL;
-      }
-      const defaultHeaders = normalizeHeaders(params.defaultHeaders);
-      params.defaultHeaders = {
-        ...params.defaultHeaders,
-        'User-Agent':
-          defaultHeaders['User-Agent'] != null
-            ? `${defaultHeaders['User-Agent']}: illuma-azure-openai-v2`
-            : 'illuma-azure-openai-v2',
-      };
-      this.client = new CustomAzureOpenAIClient({
-        apiVersion: this.azureOpenAIApiVersion,
-        azureADTokenProvider: this.azureADTokenProvider,
-        ...(params as t.AzureOpenAIInput),
-      }) as unknown as CustomOpenAIClient;
-    }
-    const requestOptions = {
-      ...this.clientConfig,
-      ...options,
-    } as OpenAICoreRequestOptions;
-    if (this.azureOpenAIApiKey != null) {
-      requestOptions.headers = {
-        'api-key': this.azureOpenAIApiKey,
-        ...requestOptions.headers,
-      };
-      requestOptions.query = {
-        'api-version': this.azureOpenAIApiVersion,
-        ...requestOptions.query,
-      };
-    }
-    return requestOptions;
-  }
-  async *_streamResponseChunks(
-    messages: BaseMessage[],
-    options: this['ParsedCallOptions'],
-    runManager?: CallbackManagerForLLMRun
-  ): AsyncGenerator<ChatGenerationChunk> {
-    if (!this._useResponseApi(options)) {
-      return yield* super._streamResponseChunks(messages, options, runManager);
-    }
-    const streamIterable = await this.responseApiWithRetry(
-      {
-        ...this.invocationParams<'responses'>(options, { streaming: true }),
-        input: _convertMessagesToOpenAIResponsesParams(
-          messages,
-          this.model,
-          this.zdrEnabled
-        ),
-        stream: true,
-      },
-      options
-    );
-    for await (const data of streamIterable) {
-      const chunk = _convertOpenAIResponsesDeltaToBaseMessageChunk(
-        data as ResponseReturnStreamEvents
-      );
-      if (chunk == null) continue;
-      yield chunk;
-      await runManager?.handleLLMNewToken(
-        chunk.text || '',
-        undefined,
-        undefined,
-        undefined,
-        undefined,
-        { chunk }
-      );
-    }
-    return;
-  }
-}
-export class ChatDeepSeek extends OriginalChatDeepSeek {
-  public get exposedClient(): CustomOpenAIClient {
-    return this.client;
-  }
-  static lc_name(): 'IllumaDeepSeek' {
-    return 'IllumaDeepSeek';
-  }
-  protected _getClientOptions(
-    options?: OpenAICoreRequestOptions
-  ): OpenAICoreRequestOptions {
-    if (!(this.client as OpenAIClient | undefined)) {
-      const openAIEndpointConfig: t.OpenAIEndpointConfig = {
-        baseURL: this.clientConfig.baseURL,
-      };
-      const endpoint = getEndpoint(openAIEndpointConfig);
-      const params = {
-        ...this.clientConfig,
-        baseURL: endpoint,
-        timeout: this.timeout,
-        maxRetries: 0,
-      };
-      if (params.baseURL == null) {
-        delete params.baseURL;
-      }
-      this.client = new CustomOpenAIClient(params);
-    }
-    const requestOptions = {
-      ...this.clientConfig,
-      ...options,
-    } as OpenAICoreRequestOptions;
-    return requestOptions;
-  }
-}
-/** xAI-specific usage metadata type */
-export interface XAIUsageMetadata
-  extends OpenAIClient.Completions.CompletionUsage {
-  prompt_tokens_details?: {
-    audio_tokens?: number;
-    cached_tokens?: number;
-    text_tokens?: number;
-    image_tokens?: number;
-  };
-  completion_tokens_details?: {
-    audio_tokens?: number;
-    reasoning_tokens?: number;
-    accepted_prediction_tokens?: number;
-    rejected_prediction_tokens?: number;
-  };
-  num_sources_used?: number;
-}
-export class ChatXAI extends OriginalChatXAI {
-  constructor(
-    fields?: Partial<ChatXAIInput> & {
-      configuration?: { baseURL?: string };
-      clientConfig?: { baseURL?: string };
-    }
-  ) {
-    super(fields);
-    const customBaseURL =
-      fields?.configuration?.baseURL ?? fields?.clientConfig?.baseURL;
-    if (customBaseURL != null && customBaseURL) {
-      this.clientConfig = {
-        ...this.clientConfig,
-        baseURL: customBaseURL,
-      };
-      // Reset the client to force recreation with new config
-      // eslint-disable-next-line @typescript-eslint/no-explicit-any
-      this.client = undefined as any;
-    }
-  }
-  static lc_name(): 'IllumaXAI' {
-    return 'IllumaXAI';
-  }
-  public get exposedClient(): CustomOpenAIClient {
-    return this.client;
-  }
-  protected _getClientOptions(
-    options?: OpenAICoreRequestOptions
-  ): OpenAICoreRequestOptions {
-    if (!(this.client as OpenAIClient | undefined)) {
-      const openAIEndpointConfig: t.OpenAIEndpointConfig = {
-        baseURL: this.clientConfig.baseURL,
-      };
-      const endpoint = getEndpoint(openAIEndpointConfig);
-      const params = {
-        ...this.clientConfig,
-        baseURL: endpoint,
-        timeout: this.timeout,
-        maxRetries: 0,
-      };
-      if (params.baseURL == null) {
-        delete params.baseURL;
-      }
-      this.client = new CustomOpenAIClient(params);
-    }
-    const requestOptions = {
-      ...this.clientConfig,
-      ...options,
-    } as OpenAICoreRequestOptions;
-    return requestOptions;
-  }
-  async *_streamResponseChunks(
-    messages: BaseMessage[],
-    options: this['ParsedCallOptions'],
-    runManager?: CallbackManagerForLLMRun
-  ): AsyncGenerator<ChatGenerationChunk> {
-    const messagesMapped: OpenAICompletionParam[] =
-      _convertMessagesToOpenAIParams(messages, this.model);
-    const params = {
-      ...this.invocationParams(options, {
-        streaming: true,
-      }),
-      messages: messagesMapped,
-      stream: true as const,
-    };
-    let defaultRole: OpenAIRoleEnum | undefined;
-    const streamIterable = await this.completionWithRetry(params, options);
-    let usage: OpenAIClient.Completions.CompletionUsage | undefined;
-    for await (const data of streamIterable) {
-      const choice = data.choices[0] as
-        | Partial<OpenAIClient.Chat.Completions.ChatCompletionChunk.Choice>
-        | undefined;
-      if (data.usage) {
-        usage = data.usage;
-      }
-      if (!choice) {
-        continue;
-      }
-      const { delta } = choice;
-      if (!delta) {
-        continue;
-      }
-      const chunk = this._convertOpenAIDeltaToBaseMessageChunk(
-        delta,
-        data,
-        defaultRole
-      );
-      if (chunk.usage_metadata != null) {
-        chunk.usage_metadata = {
-          input_tokens:
-            (chunk.usage_metadata as Partial<UsageMetadata>).input_tokens ?? 0,
-          output_tokens:
-            (chunk.usage_metadata as Partial<UsageMetadata>).output_tokens ?? 0,
-          total_tokens:
-            (chunk.usage_metadata as Partial<UsageMetadata>).total_tokens ?? 0,
-        };
-      }
-      if ('reasoning_content' in delta) {
-        chunk.additional_kwargs.reasoning_content = delta.reasoning_content;
-      }
-      defaultRole = delta.role ?? defaultRole;
-      const newTokenIndices = {
-        prompt: (options as OpenAIChatCallOptions).promptIndex ?? 0,
-        completion: choice.index ?? 0,
-      };
-      if (typeof chunk.content !== 'string') {
-        // eslint-disable-next-line no-console
-        console.log(
-          '[WARNING]: Received non-string content from OpenAI. This is currently not supported.'
-        );
-        continue;
-      }
-      // eslint-disable-next-line @typescript-eslint/no-explicit-any
-      const generationInfo: Record<string, any> = { ...newTokenIndices };
-      if (choice.finish_reason != null) {
-        generationInfo.finish_reason = choice.finish_reason;
-        // Only include system fingerprint in the last chunk for now
-        // to avoid concatenation issues
-        generationInfo.system_fingerprint = data.system_fingerprint;
-        generationInfo.model_name = data.model;
-        generationInfo.service_tier = data.service_tier;
-      }
-      if (this.logprobs == true) {
-        generationInfo.logprobs = choice.logprobs;
-      }
-      const generationChunk = new ChatGenerationChunk({
-        message: chunk,
-        text: chunk.content,
-        generationInfo,
-      });
-      yield generationChunk;
-      await runManager?.handleLLMNewToken(
-        generationChunk.text || '',
-        newTokenIndices,
-        undefined,
-        undefined,
-        undefined,
-        { chunk: generationChunk }
-      );
-    }
-    if (usage) {
-      // Type assertion for xAI-specific usage structure
-      const xaiUsage = usage as XAIUsageMetadata;
-      const inputTokenDetails = {
-        // Standard OpenAI fields
-        ...(usage.prompt_tokens_details?.audio_tokens != null && {
-          audio: usage.prompt_tokens_details.audio_tokens,
-        }),
-        ...(usage.prompt_tokens_details?.cached_tokens != null && {
-          cache_read: usage.prompt_tokens_details.cached_tokens,
-        }),
-        // Add xAI-specific prompt token details if they exist
-        ...(xaiUsage.prompt_tokens_details?.text_tokens != null && {
-          text: xaiUsage.prompt_tokens_details.text_tokens,
-        }),
-        ...(xaiUsage.prompt_tokens_details?.image_tokens != null && {
-          image: xaiUsage.prompt_tokens_details.image_tokens,
-        }),
-      };
-      const outputTokenDetails = {
-        // Standard OpenAI fields
-        ...(usage.completion_tokens_details?.audio_tokens != null && {
-          audio: usage.completion_tokens_details.audio_tokens,
-        }),
-        ...(usage.completion_tokens_details?.reasoning_tokens != null && {
-          reasoning: usage.completion_tokens_details.reasoning_tokens,
-        }),
-        // Add xAI-specific completion token details if they exist
-        ...(xaiUsage.completion_tokens_details?.accepted_prediction_tokens !=
-          null && {
-          accepted_prediction:
-            xaiUsage.completion_tokens_details.accepted_prediction_tokens,
-        }),
-        ...(xaiUsage.completion_tokens_details?.rejected_prediction_tokens !=
-          null && {
-          rejected_prediction:
-            xaiUsage.completion_tokens_details.rejected_prediction_tokens,
-        }),
-      };
-      const generationChunk = new ChatGenerationChunk({
-        message: new AIMessageChunk({
-          content: '',
-          response_metadata: {
-            usage: { ...usage },
-            // Include xAI-specific metadata if it exists
-            ...(xaiUsage.num_sources_used != null && {
-              num_sources_used: xaiUsage.num_sources_used,
-            }),
-          },
-          usage_metadata: {
-            input_tokens: usage.prompt_tokens,
-            output_tokens: usage.completion_tokens,
-            total_tokens: usage.total_tokens,
-            ...(Object.keys(inputTokenDetails).length > 0 && {
-              input_token_details: inputTokenDetails,
-            }),
-            ...(Object.keys(outputTokenDetails).length > 0 && {
-              output_token_details: outputTokenDetails,
-            }),
-          },
-        }),
-        text: '',
-      });
-      yield generationChunk;
-    }
-    if (options.signal?.aborted === true) {
-      throw new Error('AbortError');
-    }
-  }
-}
+import { AzureOpenAI as AzureOpenAIClient } from 'openai';
+import { AIMessageChunk } from '@langchain/core/messages';
+import { ChatXAI as OriginalChatXAI } from '@langchain/xai';
+import { ChatGenerationChunk } from '@langchain/core/outputs';
+import { ToolDefinition } from '@langchain/core/language_models/base';
+import { isLangChainTool } from '@langchain/core/utils/function_calling';
+import { ChatDeepSeek as OriginalChatDeepSeek } from '@langchain/deepseek';
+import { CallbackManagerForLLMRun } from '@langchain/core/callbacks/manager';
+import {
+  getEndpoint,
+  OpenAIClient,
+  formatToOpenAITool,
+  ChatOpenAI as OriginalChatOpenAI,
+  AzureChatOpenAI as OriginalAzureChatOpenAI,
+} from '@langchain/openai';
+import type {
+  OpenAIChatCallOptions,
+  OpenAIRoleEnum,
+  HeaderValue,
+  HeadersLike,
+} from './types';
+import type { BindToolsInput } from '@langchain/core/language_models/chat_models';
+import type { BaseMessage, UsageMetadata } from '@langchain/core/messages';
+import type { ChatXAIInput } from '@langchain/xai';
+import type * as t from '@langchain/openai';
+import {
+  isReasoningModel,
+  _convertMessagesToOpenAIParams,
+  _convertMessagesToOpenAIResponsesParams,
+  _convertOpenAIResponsesDeltaToBaseMessageChunk,
+  type ResponseReturnStreamEvents,
+} from './utils';
+import { sleep } from '@/utils';
+// eslint-disable-next-line @typescript-eslint/explicit-function-return-type
+const iife = <T>(fn: () => T) => fn();
+export function isHeaders(headers: unknown): headers is Headers {
+  return (
+    typeof Headers !== 'undefined' &&
+    headers !== null &&
+    typeof headers === 'object' &&
+    Object.prototype.toString.call(headers) === '[object Headers]'
+  );
+}
+export function normalizeHeaders(
+  headers: HeadersLike
+): Record<string, HeaderValue | readonly HeaderValue[]> {
+  const output = iife(() => {
+    // If headers is a Headers instance
+    if (isHeaders(headers)) {
+      return headers;
+    }
+    // If headers is an array of [key, value] pairs
+    else if (Array.isArray(headers)) {
+      return new Headers(headers);
+    }
+    // If headers is a NullableHeaders-like object (has 'values' property that is a Headers)
+    else if (
+      typeof headers === 'object' &&
+      headers !== null &&
+      'values' in headers &&
+      isHeaders(headers.values)
+    ) {
+      return headers.values;
+    }
+    // If headers is a plain object
+    else if (typeof headers === 'object' && headers !== null) {
+      const entries: [string, string][] = Object.entries(headers)
+        .filter(([, v]) => typeof v === 'string')
+        .map(([k, v]) => [k, v as string]);
+      return new Headers(entries);
+    }
+    return new Headers();
+  });
+  return Object.fromEntries(output.entries());
+}
+type OpenAICompletionParam =
+  OpenAIClient.Chat.Completions.ChatCompletionMessageParam;
+type OpenAICoreRequestOptions = OpenAIClient.RequestOptions;
+function createAbortHandler(controller: AbortController): () => void {
+  return function (): void {
+    controller.abort();
+  };
+}
+/**
+ * Formats a tool in either OpenAI format, or LangChain structured tool format
+ * into an OpenAI tool format. If the tool is already in OpenAI format, return without
+ * any changes. If it is in LangChain structured tool format, convert it to OpenAI tool format
+ * using OpenAI's `zodFunction` util, falling back to `convertToOpenAIFunction` if the parameters
+ * returned from the `zodFunction` util are not defined.
+ *
+ * @param {BindToolsInput} tool The tool to convert to an OpenAI tool.
+ * @param {Object} [fields] Additional fields to add to the OpenAI tool.
+ * @returns {ToolDefinition} The inputted tool in OpenAI tool format.
+ */
+export function _convertToOpenAITool(
+  tool: BindToolsInput,
+  fields?: {
+    /**
+     * If `true`, model output is guaranteed to exactly match the JSON Schema
+     * provided in the function definition.
+     */
+    strict?: boolean;
+  }
+): OpenAIClient.ChatCompletionTool {
+  let toolDef: OpenAIClient.ChatCompletionTool | undefined;
+  if (isLangChainTool(tool)) {
+    toolDef = formatToOpenAITool(tool);
+  } else {
+    toolDef = tool as ToolDefinition;
+  }
+  if (fields?.strict !== undefined) {
+    toolDef.function.strict = fields.strict;
+  }
+  return toolDef;
+}
+export class CustomOpenAIClient extends OpenAIClient {
+  abortHandler?: () => void;
+  async fetchWithTimeout(
+    url: RequestInfo,
+    init: RequestInit | undefined,
+    ms: number,
+    controller: AbortController
+  ): Promise<Response> {
+    const { signal, ...options } = init || {};
+    const handler = createAbortHandler(controller);
+    this.abortHandler = handler;
+    if (signal) signal.addEventListener('abort', handler, { once: true });
+    const timeout = setTimeout(() => handler, ms);
+    const fetchOptions = {
+      signal: controller.signal as AbortSignal,
+      ...options,
+    };
+    if (fetchOptions.method != null) {
+      // Custom methods like 'patch' need to be uppercased
+      // See https://github.com/nodejs/undici/issues/2294
+      fetchOptions.method = fetchOptions.method.toUpperCase();
+    }
+    return (
+      // use undefined this binding; fetch errors if bound to something else in browser/cloudflare
+      // eslint-disable-next-line @typescript-eslint/ban-ts-comment
+      /** @ts-ignore */
+      this.fetch.call(undefined, url, fetchOptions).finally(() => {
+        clearTimeout(timeout);
+      })
+    );
+  }
+}
+export class CustomAzureOpenAIClient extends AzureOpenAIClient {
+  abortHandler?: () => void;
+  async fetchWithTimeout(
+    url: RequestInfo,
+    init: RequestInit | undefined,
+    ms: number,
+    controller: AbortController
+  ): Promise<Response> {
+    const { signal, ...options } = init || {};
+    const handler = createAbortHandler(controller);
+    this.abortHandler = handler;
+    if (signal) signal.addEventListener('abort', handler, { once: true });
+    const timeout = setTimeout(() => handler, ms);
+    const fetchOptions = {
+      signal: controller.signal as AbortSignal,
+      ...options,
+    };
+    if (fetchOptions.method != null) {
+      // Custom methods like 'patch' need to be uppercased
+      // See https://github.com/nodejs/undici/issues/2294
+      fetchOptions.method = fetchOptions.method.toUpperCase();
+    }
+    return (
+      // use undefined this binding; fetch errors if bound to something else in browser/cloudflare
+      // eslint-disable-next-line @typescript-eslint/ban-ts-comment
+      /** @ts-ignore */
+      this.fetch.call(undefined, url, fetchOptions).finally(() => {
+        clearTimeout(timeout);
+      })
+    );
+  }
+}
+/** @ts-expect-error We are intentionally overriding `getReasoningParams` */
+export class ChatOpenAI extends OriginalChatOpenAI<t.ChatOpenAICallOptions> {
+  _lc_stream_delay?: number;
+  constructor(
+    fields?: t.ChatOpenAICallOptions & {
+      _lc_stream_delay?: number;
+    } & t.OpenAIChatInput['modelKwargs']
+  ) {
+    super(fields);
+    this._lc_stream_delay = fields?._lc_stream_delay;
+  }
+  public get exposedClient(): CustomOpenAIClient {
+    return this.client;
+  }
+  static lc_name(): string {
+    return 'IllumaOpenAI';
+  }
+  protected _getClientOptions(
+    options?: OpenAICoreRequestOptions
+  ): OpenAICoreRequestOptions {
+    if (!(this.client as OpenAIClient | undefined)) {
+      const openAIEndpointConfig: t.OpenAIEndpointConfig = {
+        baseURL: this.clientConfig.baseURL,
+      };
+      const endpoint = getEndpoint(openAIEndpointConfig);
+      const params = {
+        ...this.clientConfig,
+        baseURL: endpoint,
+        timeout: this.timeout,
+        maxRetries: 0,
+      };
+      if (params.baseURL == null) {
+        delete params.baseURL;
+      }
+      this.client = new CustomOpenAIClient(params);
+    }
+    const requestOptions = {
+      ...this.clientConfig,
+      ...options,
+    } as OpenAICoreRequestOptions;
+    return requestOptions;
+  }
+  /**
+   * Returns backwards compatible reasoning parameters from constructor params and call options
+   * @internal
+   */
+  getReasoningParams(
+    options?: this['ParsedCallOptions']
+  ): OpenAIClient.Reasoning | undefined {
+    // apply options in reverse order of importance -- newer options supersede older options
+    let reasoning: OpenAIClient.Reasoning | undefined;
+    if (this.reasoning !== undefined) {
+      reasoning = {
+        ...reasoning,
+        ...this.reasoning,
+      };
+    }
+    if (options?.reasoning !== undefined) {
+      reasoning = {
+        ...reasoning,
+        ...options.reasoning,
+      };
+    }
+    return reasoning;
+  }
+  protected _getReasoningParams(
+    options?: this['ParsedCallOptions']
+  ): OpenAIClient.Reasoning | undefined {
+    return this.getReasoningParams(options);
+  }
+  async *_streamResponseChunks(
+    messages: BaseMessage[],
+    options: this['ParsedCallOptions'],
+    runManager?: CallbackManagerForLLMRun
+  ): AsyncGenerator<ChatGenerationChunk> {
+    if (!this._useResponseApi(options)) {
+      return yield* this._streamResponseChunks2(messages, options, runManager);
+    }
+    const streamIterable = await this.responseApiWithRetry(
+      {
+        ...this.invocationParams<'responses'>(options, { streaming: true }),
+        input: _convertMessagesToOpenAIResponsesParams(
+          messages,
+          this.model,
+          this.zdrEnabled
+        ),
+        stream: true,
+      },
+      options
+    );
+    for await (const data of streamIterable) {
+      const chunk = _convertOpenAIResponsesDeltaToBaseMessageChunk(
+        data as ResponseReturnStreamEvents
+      );
+      if (chunk == null) continue;
+      yield chunk;
+      if (this._lc_stream_delay != null) {
+        await sleep(this._lc_stream_delay);
+      }
+      await runManager?.handleLLMNewToken(
+        chunk.text || '',
+        undefined,
+        undefined,
+        undefined,
+        undefined,
+        { chunk }
+      );
+    }
+    return;
+  }
+  async *_streamResponseChunks2(
+    messages: BaseMessage[],
+    options: this['ParsedCallOptions'],
+    runManager?: CallbackManagerForLLMRun
+  ): AsyncGenerator<ChatGenerationChunk> {
+    const messagesMapped: OpenAICompletionParam[] =
+      _convertMessagesToOpenAIParams(messages, this.model);
+    const params = {
+      ...this.invocationParams(options, {
+        streaming: true,
+      }),
+      messages: messagesMapped,
+      stream: true as const,
+    };
+    let defaultRole: OpenAIRoleEnum | undefined;
+    const streamIterable = await this.completionWithRetry(params, options);
+    let usage: OpenAIClient.Completions.CompletionUsage | undefined;
+    for await (const data of streamIterable) {
+      const choice = data.choices[0] as
+        | Partial<OpenAIClient.Chat.Completions.ChatCompletionChunk.Choice>
+        | undefined;
+      if (data.usage) {
+        usage = data.usage;
+      }
+      if (!choice) {
+        continue;
+      }
+      const { delta } = choice;
+      if (!delta) {
+        continue;
+      }
+      const chunk = this._convertOpenAIDeltaToBaseMessageChunk(
+        delta,
+        data,
+        defaultRole
+      );
+      if ('reasoning_content' in delta) {
+        chunk.additional_kwargs.reasoning_content = delta.reasoning_content;
+      } else if ('reasoning' in delta) {
+        chunk.additional_kwargs.reasoning_content = delta.reasoning;
+      }
+      if ('provider_specific_fields' in delta) {
+        chunk.additional_kwargs.provider_specific_fields =
+          delta.provider_specific_fields;
+      }
+      defaultRole = delta.role ?? defaultRole;
+      const newTokenIndices = {
+        prompt: options.promptIndex ?? 0,
+        completion: choice.index ?? 0,
+      };
+      if (typeof chunk.content !== 'string') {
+        // eslint-disable-next-line no-console
+        console.log(
+          '[WARNING]: Received non-string content from OpenAI. This is currently not supported.'
+        );
+        continue;
+      }
+      // eslint-disable-next-line @typescript-eslint/no-explicit-any
+      const generationInfo: Record<string, any> = { ...newTokenIndices };
+      if (choice.finish_reason != null) {
+        generationInfo.finish_reason = choice.finish_reason;
+        // Only include system fingerprint in the last chunk for now
+        // to avoid concatenation issues
+        generationInfo.system_fingerprint = data.system_fingerprint;
+        generationInfo.model_name = data.model;
+        generationInfo.service_tier = data.service_tier;
+      }
+      if (this.logprobs == true) {
+        generationInfo.logprobs = choice.logprobs;
+      }
+      const generationChunk = new ChatGenerationChunk({
+        message: chunk,
+        text: chunk.content,
+        generationInfo,
+      });
+      yield generationChunk;
+      if (this._lc_stream_delay != null) {
+        await sleep(this._lc_stream_delay);
+      }
+      await runManager?.handleLLMNewToken(
+        generationChunk.text || '',
+        newTokenIndices,
+        undefined,
+        undefined,
+        undefined,
+        { chunk: generationChunk }
+      );
+    }
+    if (usage) {
+      const inputTokenDetails = {
+        ...(usage.prompt_tokens_details?.audio_tokens != null && {
+          audio: usage.prompt_tokens_details.audio_tokens,
+        }),
+        ...(usage.prompt_tokens_details?.cached_tokens != null && {
+          cache_read: usage.prompt_tokens_details.cached_tokens,
+        }),
+      };
+      const outputTokenDetails = {
+        ...(usage.completion_tokens_details?.audio_tokens != null && {
+          audio: usage.completion_tokens_details.audio_tokens,
+        }),
+        ...(usage.completion_tokens_details?.reasoning_tokens != null && {
+          reasoning: usage.completion_tokens_details.reasoning_tokens,
+        }),
+      };
+      const generationChunk = new ChatGenerationChunk({
+        message: new AIMessageChunk({
+          content: '',
+          response_metadata: {
+            usage: { ...usage },
+          },
+          usage_metadata: {
+            input_tokens: usage.prompt_tokens,
+            output_tokens: usage.completion_tokens,
+            total_tokens: usage.total_tokens,
+            ...(Object.keys(inputTokenDetails).length > 0 && {
+              input_token_details: inputTokenDetails,
+            }),
+            ...(Object.keys(outputTokenDetails).length > 0 && {
+              output_token_details: outputTokenDetails,
+            }),
+          },
+        }),
+        text: '',
+      });
+      yield generationChunk;
+      if (this._lc_stream_delay != null) {
+        await sleep(this._lc_stream_delay);
+      }
+    }
+    if (options.signal?.aborted === true) {
+      throw new Error('AbortError');
+    }
+  }
+}
+/** @ts-expect-error We are intentionally overriding `getReasoningParams` */
+export class AzureChatOpenAI extends OriginalAzureChatOpenAI {
+  _lc_stream_delay?: number;
+  constructor(fields?: t.AzureOpenAIInput & { _lc_stream_delay?: number }) {
+    super(fields);
+    this._lc_stream_delay = fields?._lc_stream_delay;
+  }
+  public get exposedClient(): CustomOpenAIClient {
+    return this.client;
+  }
+  static lc_name(): 'IllumaAzureOpenAI' {
+    return 'IllumaAzureOpenAI';
+  }
+  /**
+   * Returns backwards compatible reasoning parameters from constructor params and call options
+   * @internal
+   */
+  getReasoningParams(
+    options?: this['ParsedCallOptions']
+  ): OpenAIClient.Reasoning | undefined {
+    if (!isReasoningModel(this.model)) {
+      return;
+    }
+    // apply options in reverse order of importance -- newer options supersede older options
+    let reasoning: OpenAIClient.Reasoning | undefined;
+    if (this.reasoning !== undefined) {
+      reasoning = {
+        ...reasoning,
+        ...this.reasoning,
+      };
+    }
+    if (options?.reasoning !== undefined) {
+      reasoning = {
+        ...reasoning,
+        ...options.reasoning,
+      };
+    }
+    return reasoning;
+  }
+  protected _getReasoningParams(
+    options?: this['ParsedCallOptions']
+  ): OpenAIClient.Reasoning | undefined {
+    return this.getReasoningParams(options);
+  }
+  protected _getClientOptions(
+    options: OpenAICoreRequestOptions | undefined
+  ): OpenAICoreRequestOptions {
+    if (!(this.client as unknown as AzureOpenAIClient | undefined)) {
+      const openAIEndpointConfig: t.OpenAIEndpointConfig = {
+        azureOpenAIApiDeploymentName: this.azureOpenAIApiDeploymentName,
+        azureOpenAIApiInstanceName: this.azureOpenAIApiInstanceName,
+        azureOpenAIApiKey: this.azureOpenAIApiKey,
+        azureOpenAIBasePath: this.azureOpenAIBasePath,
+        azureADTokenProvider: this.azureADTokenProvider,
+        baseURL: this.clientConfig.baseURL,
+      };
+      const endpoint = getEndpoint(openAIEndpointConfig);
+      const params = {
+        ...this.clientConfig,
+        baseURL: endpoint,
+        timeout: this.timeout,
+        maxRetries: 0,
+      };
+      if (!this.azureADTokenProvider) {
+        params.apiKey = openAIEndpointConfig.azureOpenAIApiKey;
+      }
+      if (params.baseURL == null) {
+        delete params.baseURL;
+      }
+      const defaultHeaders = normalizeHeaders(params.defaultHeaders);
+      params.defaultHeaders = {
+        ...params.defaultHeaders,
+        'User-Agent':
+          defaultHeaders['User-Agent'] != null
+            ? `${defaultHeaders['User-Agent']}: illuma-azure-openai-v2`
+            : 'illuma-azure-openai-v2',
+      };
+      this.client = new CustomAzureOpenAIClient({
+        apiVersion: this.azureOpenAIApiVersion,
+        azureADTokenProvider: this.azureADTokenProvider,
+        ...(params as t.AzureOpenAIInput),
+      }) as unknown as CustomOpenAIClient;
+    }
+    const requestOptions = {
+      ...this.clientConfig,
+      ...options,
+    } as OpenAICoreRequestOptions;
+    if (this.azureOpenAIApiKey != null) {
+      requestOptions.headers = {
+        'api-key': this.azureOpenAIApiKey,
+        ...requestOptions.headers,
+      };
+      requestOptions.query = {
+        'api-version': this.azureOpenAIApiVersion,
+        ...requestOptions.query,
+      };
+    }
+    return requestOptions;
+  }
+  async *_streamResponseChunks(
+    messages: BaseMessage[],
+    options: this['ParsedCallOptions'],
+    runManager?: CallbackManagerForLLMRun
+  ): AsyncGenerator<ChatGenerationChunk> {
+    if (!this._useResponseApi(options)) {
+      return yield* super._streamResponseChunks(messages, options, runManager);
+    }
+    const streamIterable = await this.responseApiWithRetry(
+      {
+        ...this.invocationParams<'responses'>(options, { streaming: true }),
+        input: _convertMessagesToOpenAIResponsesParams(
+          messages,
+          this.model,
+          this.zdrEnabled
+        ),
+        stream: true,
+      },
+      options
+    );
+    for await (const data of streamIterable) {
+      const chunk = _convertOpenAIResponsesDeltaToBaseMessageChunk(
+        data as ResponseReturnStreamEvents
+      );
+      if (chunk == null) continue;
+      yield chunk;
+      if (this._lc_stream_delay != null) {
+        await sleep(this._lc_stream_delay);
+      }
+      await runManager?.handleLLMNewToken(
+        chunk.text || '',
+        undefined,
+        undefined,
+        undefined,
+        undefined,
+        { chunk }
+      );
+    }
+    return;
+  }
+}
+export class ChatDeepSeek extends OriginalChatDeepSeek {
+  public get exposedClient(): CustomOpenAIClient {
+    return this.client;
+  }
+  static lc_name(): 'IllumaDeepSeek' {
+    return 'IllumaDeepSeek';
+  }
+  protected _getClientOptions(
+    options?: OpenAICoreRequestOptions
+  ): OpenAICoreRequestOptions {
+    if (!(this.client as OpenAIClient | undefined)) {
+      const openAIEndpointConfig: t.OpenAIEndpointConfig = {
+        baseURL: this.clientConfig.baseURL,
+      };
+      const endpoint = getEndpoint(openAIEndpointConfig);
+      const params = {
+        ...this.clientConfig,
+        baseURL: endpoint,
+        timeout: this.timeout,
+        maxRetries: 0,
+      };
+      if (params.baseURL == null) {
+        delete params.baseURL;
+      }
+      this.client = new CustomOpenAIClient(params);
+    }
+    const requestOptions = {
+      ...this.clientConfig,
+      ...options,
+    } as OpenAICoreRequestOptions;
+    return requestOptions;
+  }
+}
+/** xAI-specific usage metadata type */
+export interface XAIUsageMetadata
+  extends OpenAIClient.Completions.CompletionUsage {
+  prompt_tokens_details?: {
+    audio_tokens?: number;
+    cached_tokens?: number;
+    text_tokens?: number;
+    image_tokens?: number;
+  };
+  completion_tokens_details?: {
+    audio_tokens?: number;
+    reasoning_tokens?: number;
+    accepted_prediction_tokens?: number;
+    rejected_prediction_tokens?: number;
+  };
+  num_sources_used?: number;
+}
+export class ChatXAI extends OriginalChatXAI {
+  _lc_stream_delay?: number;
+  constructor(
+    fields?: Partial<ChatXAIInput> & {
+      configuration?: { baseURL?: string };
+      clientConfig?: { baseURL?: string };
+      _lc_stream_delay?: number;
+    }
+  ) {
+    super(fields);
+    this._lc_stream_delay = fields?._lc_stream_delay;
+    const customBaseURL =
+      fields?.configuration?.baseURL ?? fields?.clientConfig?.baseURL;
+    if (customBaseURL != null && customBaseURL) {
+      this.clientConfig = {
+        ...this.clientConfig,
+        baseURL: customBaseURL,
+      };
+      // Reset the client to force recreation with new config
+      // eslint-disable-next-line @typescript-eslint/no-explicit-any
+      this.client = undefined as any;
+    }
+  }
+  static lc_name(): 'IllumaXAI' {
+    return 'IllumaXAI';
+  }
+  public get exposedClient(): CustomOpenAIClient {
+    return this.client;
+  }
+  protected _getClientOptions(
+    options?: OpenAICoreRequestOptions
+  ): OpenAICoreRequestOptions {
+    if (!(this.client as OpenAIClient | undefined)) {
+      const openAIEndpointConfig: t.OpenAIEndpointConfig = {
+        baseURL: this.clientConfig.baseURL,
+      };
+      const endpoint = getEndpoint(openAIEndpointConfig);
+      const params = {
+        ...this.clientConfig,
+        baseURL: endpoint,
+        timeout: this.timeout,
+        maxRetries: 0,
+      };
+      if (params.baseURL == null) {
+        delete params.baseURL;
+      }
+      this.client = new CustomOpenAIClient(params);
+    }
+    const requestOptions = {
+      ...this.clientConfig,
+      ...options,
+    } as OpenAICoreRequestOptions;
+    return requestOptions;
+  }
+  async *_streamResponseChunks(
+    messages: BaseMessage[],
+    options: this['ParsedCallOptions'],
+    runManager?: CallbackManagerForLLMRun
+  ): AsyncGenerator<ChatGenerationChunk> {
+    const messagesMapped: OpenAICompletionParam[] =
+      _convertMessagesToOpenAIParams(messages, this.model);
+    const params = {
+      ...this.invocationParams(options, {
+        streaming: true,
+      }),
+      messages: messagesMapped,
+      stream: true as const,
+    };
+    let defaultRole: OpenAIRoleEnum | undefined;
+    const streamIterable = await this.completionWithRetry(params, options);
+    let usage: OpenAIClient.Completions.CompletionUsage | undefined;
+    for await (const data of streamIterable) {
+      const choice = data.choices[0] as
+        | Partial<OpenAIClient.Chat.Completions.ChatCompletionChunk.Choice>
+        | undefined;
+      if (data.usage) {
+        usage = data.usage;
+      }
+      if (!choice) {
+        continue;
+      }
+      const { delta } = choice;
+      if (!delta) {
+        continue;
+      }
+      const chunk = this._convertOpenAIDeltaToBaseMessageChunk(
+        delta,
+        data,
+        defaultRole
+      );
+      if (chunk.usage_metadata != null) {
+        chunk.usage_metadata = {
+          input_tokens:
+            (chunk.usage_metadata as Partial<UsageMetadata>).input_tokens ?? 0,
+          output_tokens:
+            (chunk.usage_metadata as Partial<UsageMetadata>).output_tokens ?? 0,
+          total_tokens:
+            (chunk.usage_metadata as Partial<UsageMetadata>).total_tokens ?? 0,
+        };
+      }
+      if ('reasoning_content' in delta) {
+        chunk.additional_kwargs.reasoning_content = delta.reasoning_content;
+      }
+      defaultRole = delta.role ?? defaultRole;
+      const newTokenIndices = {
+        prompt: (options as OpenAIChatCallOptions).promptIndex ?? 0,
+        completion: choice.index ?? 0,
+      };
+      if (typeof chunk.content !== 'string') {
+        // eslint-disable-next-line no-console
+        console.log(
+          '[WARNING]: Received non-string content from OpenAI. This is currently not supported.'
+        );
+        continue;
+      }
+      // eslint-disable-next-line @typescript-eslint/no-explicit-any
+      const generationInfo: Record<string, any> = { ...newTokenIndices };
+      if (choice.finish_reason != null) {
+        generationInfo.finish_reason = choice.finish_reason;
+        // Only include system fingerprint in the last chunk for now
+        // to avoid concatenation issues
+        generationInfo.system_fingerprint = data.system_fingerprint;
+        generationInfo.model_name = data.model;
+        generationInfo.service_tier = data.service_tier;
+      }
+      if (this.logprobs == true) {
+        generationInfo.logprobs = choice.logprobs;
+      }
+      const generationChunk = new ChatGenerationChunk({
+        message: chunk,
+        text: chunk.content,
+        generationInfo,
+      });
+      yield generationChunk;
+      if (this._lc_stream_delay != null) {
+        await sleep(this._lc_stream_delay);
+      }
+      await runManager?.handleLLMNewToken(
+        generationChunk.text || '',
+        newTokenIndices,
+        undefined,
+        undefined,
+        undefined,
+        { chunk: generationChunk }
+      );
+    }
+    if (usage) {
+      // Type assertion for xAI-specific usage structure
+      const xaiUsage = usage as XAIUsageMetadata;
+      const inputTokenDetails = {
+        // Standard OpenAI fields
+        ...(usage.prompt_tokens_details?.audio_tokens != null && {
+          audio: usage.prompt_tokens_details.audio_tokens,
+        }),
+        ...(usage.prompt_tokens_details?.cached_tokens != null && {
+          cache_read: usage.prompt_tokens_details.cached_tokens,
+        }),
+        // Add xAI-specific prompt token details if they exist
+        ...(xaiUsage.prompt_tokens_details?.text_tokens != null && {
+          text: xaiUsage.prompt_tokens_details.text_tokens,
+        }),
+        ...(xaiUsage.prompt_tokens_details?.image_tokens != null && {
+          image: xaiUsage.prompt_tokens_details.image_tokens,
+        }),
+      };
+      const outputTokenDetails = {
+        // Standard OpenAI fields
+        ...(usage.completion_tokens_details?.audio_tokens != null && {
+          audio: usage.completion_tokens_details.audio_tokens,
+        }),
+        ...(usage.completion_tokens_details?.reasoning_tokens != null && {
+          reasoning: usage.completion_tokens_details.reasoning_tokens,
+        }),
+        // Add xAI-specific completion token details if they exist
+        ...(xaiUsage.completion_tokens_details?.accepted_prediction_tokens !=
+          null && {
+          accepted_prediction:
+            xaiUsage.completion_tokens_details.accepted_prediction_tokens,
+        }),
+        ...(xaiUsage.completion_tokens_details?.rejected_prediction_tokens !=
+          null && {
+          rejected_prediction:
+            xaiUsage.completion_tokens_details.rejected_prediction_tokens,
+        }),
+      };
+      const generationChunk = new ChatGenerationChunk({
+        message: new AIMessageChunk({
+          content: '',
+          response_metadata: {
+            usage: { ...usage },
+            // Include xAI-specific metadata if it exists
+            ...(xaiUsage.num_sources_used != null && {
+              num_sources_used: xaiUsage.num_sources_used,
+            }),
+          },
+          usage_metadata: {
+            input_tokens: usage.prompt_tokens,
+            output_tokens: usage.completion_tokens,
+            total_tokens: usage.total_tokens,
+            ...(Object.keys(inputTokenDetails).length > 0 && {
+              input_token_details: inputTokenDetails,
+            }),
+            ...(Object.keys(outputTokenDetails).length > 0 && {
+              output_token_details: outputTokenDetails,
+            }),
+          },
+        }),
+        text: '',
+      });
+      yield generationChunk;
+      if (this._lc_stream_delay != null) {
+        await sleep(this._lc_stream_delay);
+      }
+    }
+    if (options.signal?.aborted === true) {
+      throw new Error('AbortError');
+    }
+  }
+}