npm - illuma-agents - Versions diffs - 1.0.2 → 1.0.4 - Mend

illuma-agents 1.0.2 → 1.0.4

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (225) hide show

package/LICENSE +25 -21
package/dist/cjs/agents/AgentContext.cjs +222 -0
package/dist/cjs/agents/AgentContext.cjs.map +1 -0
package/dist/cjs/common/enum.cjs +5 -4
package/dist/cjs/common/enum.cjs.map +1 -1
package/dist/cjs/events.cjs +7 -5
package/dist/cjs/events.cjs.map +1 -1
package/dist/cjs/graphs/Graph.cjs +328 -207
package/dist/cjs/graphs/Graph.cjs.map +1 -1
package/dist/cjs/graphs/MultiAgentGraph.cjs +507 -0
package/dist/cjs/graphs/MultiAgentGraph.cjs.map +1 -0
package/dist/cjs/llm/anthropic/index.cjs.map +1 -1
package/dist/cjs/llm/google/index.cjs.map +1 -1
package/dist/cjs/llm/ollama/index.cjs.map +1 -1
package/dist/cjs/llm/openai/index.cjs +35 -0
package/dist/cjs/llm/openai/index.cjs.map +1 -1
package/dist/cjs/llm/openai/utils/index.cjs +3 -1
package/dist/cjs/llm/openai/utils/index.cjs.map +1 -1
package/dist/cjs/llm/openrouter/index.cjs.map +1 -1
package/dist/cjs/llm/providers.cjs +0 -2
package/dist/cjs/llm/providers.cjs.map +1 -1
package/dist/cjs/llm/vertexai/index.cjs.map +1 -1
package/dist/cjs/main.cjs +12 -1
package/dist/cjs/main.cjs.map +1 -1
package/dist/cjs/messages/cache.cjs +123 -0
package/dist/cjs/messages/cache.cjs.map +1 -0
package/dist/cjs/messages/content.cjs +53 -0
package/dist/cjs/messages/content.cjs.map +1 -0
package/dist/cjs/messages/format.cjs +17 -29
package/dist/cjs/messages/format.cjs.map +1 -1
package/dist/cjs/run.cjs +119 -74
package/dist/cjs/run.cjs.map +1 -1
package/dist/cjs/stream.cjs +77 -73
package/dist/cjs/stream.cjs.map +1 -1
package/dist/cjs/tools/Calculator.cjs +45 -0
package/dist/cjs/tools/Calculator.cjs.map +1 -0
package/dist/cjs/tools/CodeExecutor.cjs +22 -22
package/dist/cjs/tools/CodeExecutor.cjs.map +1 -1
package/dist/cjs/tools/ToolNode.cjs +5 -3
package/dist/cjs/tools/ToolNode.cjs.map +1 -1
package/dist/cjs/tools/handlers.cjs +20 -20
package/dist/cjs/tools/handlers.cjs.map +1 -1
package/dist/cjs/utils/events.cjs +31 -0
package/dist/cjs/utils/events.cjs.map +1 -0
package/dist/cjs/utils/handlers.cjs +70 -0
package/dist/cjs/utils/handlers.cjs.map +1 -0
package/dist/cjs/utils/tokens.cjs +54 -7
package/dist/cjs/utils/tokens.cjs.map +1 -1
package/dist/esm/agents/AgentContext.mjs +220 -0
package/dist/esm/agents/AgentContext.mjs.map +1 -0
package/dist/esm/common/enum.mjs +5 -4
package/dist/esm/common/enum.mjs.map +1 -1
package/dist/esm/events.mjs +7 -5
package/dist/esm/events.mjs.map +1 -1
package/dist/esm/graphs/Graph.mjs +330 -209
package/dist/esm/graphs/Graph.mjs.map +1 -1
package/dist/esm/graphs/MultiAgentGraph.mjs +505 -0
package/dist/esm/graphs/MultiAgentGraph.mjs.map +1 -0
package/dist/esm/llm/anthropic/index.mjs.map +1 -1
package/dist/esm/llm/google/index.mjs.map +1 -1
package/dist/esm/llm/ollama/index.mjs.map +1 -1
package/dist/esm/llm/openai/index.mjs +35 -0
package/dist/esm/llm/openai/index.mjs.map +1 -1
package/dist/esm/llm/openai/utils/index.mjs +3 -1
package/dist/esm/llm/openai/utils/index.mjs.map +1 -1
package/dist/esm/llm/openrouter/index.mjs.map +1 -1
package/dist/esm/llm/providers.mjs +0 -2
package/dist/esm/llm/providers.mjs.map +1 -1
package/dist/esm/llm/vertexai/index.mjs.map +1 -1
package/dist/esm/main.mjs +7 -2
package/dist/esm/main.mjs.map +1 -1
package/dist/esm/messages/cache.mjs +120 -0
package/dist/esm/messages/cache.mjs.map +1 -0
package/dist/esm/messages/content.mjs +51 -0
package/dist/esm/messages/content.mjs.map +1 -0
package/dist/esm/messages/format.mjs +18 -29
package/dist/esm/messages/format.mjs.map +1 -1
package/dist/esm/run.mjs +119 -74
package/dist/esm/run.mjs.map +1 -1
package/dist/esm/stream.mjs +77 -73
package/dist/esm/stream.mjs.map +1 -1
package/dist/esm/tools/Calculator.mjs +24 -0
package/dist/esm/tools/Calculator.mjs.map +1 -0
package/dist/esm/tools/CodeExecutor.mjs +22 -22
package/dist/esm/tools/CodeExecutor.mjs.map +1 -1
package/dist/esm/tools/ToolNode.mjs +5 -3
package/dist/esm/tools/ToolNode.mjs.map +1 -1
package/dist/esm/tools/handlers.mjs +20 -20
package/dist/esm/tools/handlers.mjs.map +1 -1
package/dist/esm/utils/events.mjs +29 -0
package/dist/esm/utils/events.mjs.map +1 -0
package/dist/esm/utils/handlers.mjs +68 -0
package/dist/esm/utils/handlers.mjs.map +1 -0
package/dist/esm/utils/tokens.mjs +54 -8
package/dist/esm/utils/tokens.mjs.map +1 -1
package/dist/types/agents/AgentContext.d.ts +94 -0
package/dist/types/common/enum.d.ts +7 -5
package/dist/types/events.d.ts +3 -3
package/dist/types/graphs/Graph.d.ts +60 -66
package/dist/types/graphs/MultiAgentGraph.d.ts +47 -0
package/dist/types/graphs/index.d.ts +1 -0
package/dist/types/index.d.ts +1 -0
package/dist/types/llm/openai/index.d.ts +10 -0
package/dist/types/messages/cache.d.ts +20 -0
package/dist/types/messages/content.d.ts +7 -0
package/dist/types/messages/format.d.ts +1 -7
package/dist/types/messages/index.d.ts +2 -0
package/dist/types/messages/reducer.d.ts +9 -0
package/dist/types/run.d.ts +16 -10
package/dist/types/stream.d.ts +4 -3
package/dist/types/tools/Calculator.d.ts +8 -0
package/dist/types/tools/ToolNode.d.ts +1 -1
package/dist/types/tools/handlers.d.ts +9 -7
package/dist/types/tools/search/tool.d.ts +4 -4
package/dist/types/types/graph.d.ts +124 -11
package/dist/types/types/llm.d.ts +13 -9
package/dist/types/types/messages.d.ts +4 -0
package/dist/types/types/run.d.ts +46 -8
package/dist/types/types/stream.d.ts +3 -2
package/dist/types/utils/events.d.ts +6 -0
package/dist/types/utils/handlers.d.ts +34 -0
package/dist/types/utils/index.d.ts +1 -0
package/dist/types/utils/tokens.d.ts +24 -0
package/package.json +162 -145
package/src/agents/AgentContext.ts +323 -0
package/src/common/enum.ts +177 -176
package/src/events.ts +197 -191
package/src/graphs/Graph.ts +1058 -846
package/src/graphs/MultiAgentGraph.ts +598 -0
package/src/graphs/index.ts +2 -1
package/src/index.ts +25 -24
package/src/llm/anthropic/index.ts +413 -413
package/src/llm/google/index.ts +222 -222
package/src/llm/google/utils/zod_to_genai_parameters.ts +86 -88
package/src/llm/ollama/index.ts +92 -92
package/src/llm/openai/index.ts +894 -853
package/src/llm/openai/utils/index.ts +920 -918
package/src/llm/openrouter/index.ts +60 -60
package/src/llm/providers.ts +55 -57
package/src/llm/vertexai/index.ts +360 -360
package/src/messages/cache.test.ts +461 -0
package/src/messages/cache.ts +151 -0
package/src/messages/content.test.ts +362 -0
package/src/messages/content.ts +63 -0
package/src/messages/format.ts +611 -625
package/src/messages/formatAgentMessages.test.ts +1144 -917
package/src/messages/index.ts +6 -4
package/src/messages/reducer.ts +80 -0
package/src/run.ts +447 -381
package/src/scripts/abort.ts +157 -138
package/src/scripts/ant_web_search.ts +158 -158
package/src/scripts/cli.ts +172 -167
package/src/scripts/cli2.ts +133 -125
package/src/scripts/cli3.ts +184 -178
package/src/scripts/cli4.ts +191 -184
package/src/scripts/cli5.ts +191 -184
package/src/scripts/code_exec.ts +213 -214
package/src/scripts/code_exec_simple.ts +147 -129
package/src/scripts/content.ts +138 -120
package/src/scripts/handoff-test.ts +135 -0
package/src/scripts/multi-agent-chain.ts +278 -0
package/src/scripts/multi-agent-conditional.ts +220 -0
package/src/scripts/multi-agent-document-review-chain.ts +197 -0
package/src/scripts/multi-agent-hybrid-flow.ts +310 -0
package/src/scripts/multi-agent-parallel.ts +343 -0
package/src/scripts/multi-agent-sequence.ts +212 -0
package/src/scripts/multi-agent-supervisor.ts +364 -0
package/src/scripts/multi-agent-test.ts +186 -0
package/src/scripts/search.ts +146 -150
package/src/scripts/simple.ts +225 -225
package/src/scripts/stream.ts +140 -122
package/src/scripts/test-custom-prompt-key.ts +145 -0
package/src/scripts/test-handoff-input.ts +170 -0
package/src/scripts/test-multi-agent-list-handoff.ts +261 -0
package/src/scripts/test-tools-before-handoff.ts +222 -0
package/src/scripts/tools.ts +153 -155
package/src/specs/agent-handoffs.test.ts +889 -0
package/src/specs/anthropic.simple.test.ts +320 -317
package/src/specs/azure.simple.test.ts +325 -316
package/src/specs/openai.simple.test.ts +311 -316
package/src/specs/openrouter.simple.test.ts +107 -0
package/src/specs/prune.test.ts +758 -763
package/src/specs/reasoning.test.ts +201 -165
package/src/specs/thinking-prune.test.ts +769 -703
package/src/specs/token-memoization.test.ts +39 -0
package/src/stream.ts +664 -651
package/src/tools/Calculator.test.ts +278 -0
package/src/tools/Calculator.ts +25 -0
package/src/tools/CodeExecutor.ts +220 -220
package/src/tools/ToolNode.ts +170 -170
package/src/tools/handlers.ts +341 -336
package/src/types/graph.ts +372 -185
package/src/types/llm.ts +141 -140
package/src/types/messages.ts +4 -0
package/src/types/run.ts +128 -89
package/src/types/stream.ts +401 -400
package/src/utils/events.ts +32 -0
package/src/utils/handlers.ts +107 -0
package/src/utils/index.ts +6 -5
package/src/utils/llmConfig.ts +183 -183
package/src/utils/tokens.ts +129 -70
package/dist/types/scripts/abort.d.ts +0 -1
package/dist/types/scripts/ant_web_search.d.ts +0 -1
package/dist/types/scripts/args.d.ts +0 -7
package/dist/types/scripts/caching.d.ts +0 -1
package/dist/types/scripts/cli.d.ts +0 -1
package/dist/types/scripts/cli2.d.ts +0 -1
package/dist/types/scripts/cli3.d.ts +0 -1
package/dist/types/scripts/cli4.d.ts +0 -1
package/dist/types/scripts/cli5.d.ts +0 -1
package/dist/types/scripts/code_exec.d.ts +0 -1
package/dist/types/scripts/code_exec_files.d.ts +0 -1
package/dist/types/scripts/code_exec_simple.d.ts +0 -1
package/dist/types/scripts/content.d.ts +0 -1
package/dist/types/scripts/empty_input.d.ts +0 -1
package/dist/types/scripts/image.d.ts +0 -1
package/dist/types/scripts/memory.d.ts +0 -1
package/dist/types/scripts/search.d.ts +0 -1
package/dist/types/scripts/simple.d.ts +0 -1
package/dist/types/scripts/stream.d.ts +0 -1
package/dist/types/scripts/thinking.d.ts +0 -1
package/dist/types/scripts/tools.d.ts +0 -1
package/dist/types/specs/spec.utils.d.ts +0 -1
package/dist/types/tools/example.d.ts +0 -78
package/src/tools/example.ts +0 -129

package/src/llm/anthropic/index.ts CHANGED Viewed

@@ -1,413 +1,413 @@
-import { AIMessageChunk } from '@langchain/core/messages';
-import { ChatAnthropicMessages } from '@langchain/anthropic';
-import { ChatGenerationChunk } from '@langchain/core/outputs';
-import type { BaseChatModelParams } from '@langchain/core/language_models/chat_models';
-import type {
-  BaseMessage,
-  UsageMetadata,
-  MessageContentComplex,
-} from '@langchain/core/messages';
-import type { CallbackManagerForLLMRun } from '@langchain/core/callbacks/manager';
-import type { AnthropicInput } from '@langchain/anthropic';
-import type { Anthropic } from '@anthropic-ai/sdk';
-import type {
-  AnthropicMessageCreateParams,
-  AnthropicStreamingMessageCreateParams,
-  AnthropicStreamUsage,
-  AnthropicMessageStartEvent,
-  AnthropicMessageDeltaEvent,
-} from '@/llm/anthropic/types';
-import { _makeMessageChunkFromAnthropicEvent } from './utils/message_outputs';
-import { _convertMessagesToAnthropicPayload } from './utils/message_inputs';
-import { handleToolChoice } from './utils/tools';
-import { TextStream } from '@/llm/text';
-function _toolsInParams(
-  params: AnthropicMessageCreateParams | AnthropicStreamingMessageCreateParams
-): boolean {
-  return !!(params.tools && params.tools.length > 0);
-}
-function _documentsInParams(
-  params: AnthropicMessageCreateParams | AnthropicStreamingMessageCreateParams
-): boolean {
-  for (const message of params.messages ?? []) {
-    if (typeof message.content === 'string') {
-      continue;
-    }
-    for (const block of message.content ?? []) {
-      if (
-        typeof block === 'object' &&
-        block != null &&
-        block.type === 'document' &&
-        typeof block.citations === 'object' &&
-        block.citations.enabled
-      ) {
-        return true;
-      }
-    }
-  }
-  return false;
-}
-function _thinkingInParams(
-  params: AnthropicMessageCreateParams | AnthropicStreamingMessageCreateParams
-): boolean {
-  return !!(params.thinking && params.thinking.type === 'enabled');
-}
-function extractToken(
-  chunk: AIMessageChunk
-): [string, 'string' | 'input' | 'content'] | [undefined] {
-  if (typeof chunk.content === 'string') {
-    return [chunk.content, 'string'];
-  } else if (
-    Array.isArray(chunk.content) &&
-    chunk.content.length >= 1 &&
-    'input' in chunk.content[0]
-  ) {
-    return typeof chunk.content[0].input === 'string'
-      ? [chunk.content[0].input, 'input']
-      : [JSON.stringify(chunk.content[0].input), 'input'];
-  } else if (
-    Array.isArray(chunk.content) &&
-    chunk.content.length >= 1 &&
-    'text' in chunk.content[0]
-  ) {
-    return [chunk.content[0].text, 'content'];
-  } else if (
-    Array.isArray(chunk.content) &&
-    chunk.content.length >= 1 &&
-    'thinking' in chunk.content[0]
-  ) {
-    return [chunk.content[0].thinking, 'content'];
-  }
-  return [undefined];
-}
-function cloneChunk(
-  text: string,
-  tokenType: string,
-  chunk: AIMessageChunk
-): AIMessageChunk {
-  if (tokenType === 'string') {
-    return new AIMessageChunk(Object.assign({}, chunk, { content: text }));
-  } else if (tokenType === 'input') {
-    return chunk;
-  }
-  const content = chunk.content[0] as MessageContentComplex;
-  if (tokenType === 'content' && content.type === 'text') {
-    return new AIMessageChunk(
-      Object.assign({}, chunk, {
-        content: [Object.assign({}, content, { text })],
-      })
-    );
-  } else if (tokenType === 'content' && content.type === 'text_delta') {
-    return new AIMessageChunk(
-      Object.assign({}, chunk, {
-        content: [Object.assign({}, content, { text })],
-      })
-    );
-  } else if (tokenType === 'content' && content.type?.startsWith('thinking')) {
-    return new AIMessageChunk(
-      Object.assign({}, chunk, {
-        content: [Object.assign({}, content, { thinking: text })],
-      })
-    );
-  }
-  return chunk;
-}
-export type CustomAnthropicInput = AnthropicInput & {
-  _lc_stream_delay?: number;
-} & BaseChatModelParams;
-/**
- * A type representing additional parameters that can be passed to the
- * Anthropic API.
- */
-// eslint-disable-next-line @typescript-eslint/no-explicit-any
-type Kwargs = Record<string, any>;
-export class CustomAnthropic extends ChatAnthropicMessages {
-  _lc_stream_delay: number;
-  private message_start: AnthropicMessageStartEvent | undefined;
-  private message_delta: AnthropicMessageDeltaEvent | undefined;
-  private tools_in_params?: boolean;
-  private emitted_usage?: boolean;
-  top_k: number | undefined;
-  constructor(fields?: CustomAnthropicInput) {
-    super(fields);
-    this.resetTokenEvents();
-    this.setDirectFields(fields);
-    this._lc_stream_delay = fields?._lc_stream_delay ?? 25;
-  }
-  static lc_name(): 'IllumaAnthropic' {
-    return 'IllumaAnthropic';
-  }
-  /**
-   * Get the parameters used to invoke the model
-   */
-  override invocationParams(
-    options?: this['ParsedCallOptions']
-  ): Omit<
-    AnthropicMessageCreateParams | AnthropicStreamingMessageCreateParams,
-    'messages'
-  > &
-    Kwargs {
-    const tool_choice:
-      | Anthropic.Messages.ToolChoiceAuto
-      | Anthropic.Messages.ToolChoiceAny
-      | Anthropic.Messages.ToolChoiceTool
-      | undefined = handleToolChoice(options?.tool_choice);
-    if (this.thinking.type === 'enabled') {
-      if (this.top_k !== -1 && (this.top_k as number | undefined) != null) {
-        throw new Error('topK is not supported when thinking is enabled');
-      }
-      if (this.topP !== -1 && (this.topP as number | undefined) != null) {
-        throw new Error('topP is not supported when thinking is enabled');
-      }
-      if (
-        this.temperature !== 1 &&
-        (this.temperature as number | undefined) != null
-      ) {
-        throw new Error(
-          'temperature is not supported when thinking is enabled'
-        );
-      }
-      return {
-        model: this.model,
-        stop_sequences: options?.stop ?? this.stopSequences,
-        stream: this.streaming,
-        max_tokens: this.maxTokens,
-        tools: this.formatStructuredToolToAnthropic(options?.tools),
-        tool_choice,
-        thinking: this.thinking,
-        ...this.invocationKwargs,
-      };
-    }
-    return {
-      model: this.model,
-      temperature: this.temperature,
-      top_k: this.top_k,
-      top_p: this.topP,
-      stop_sequences: options?.stop ?? this.stopSequences,
-      stream: this.streaming,
-      max_tokens: this.maxTokens,
-      tools: this.formatStructuredToolToAnthropic(options?.tools),
-      tool_choice,
-      thinking: this.thinking,
-      ...this.invocationKwargs,
-    };
-  }
-  /**
-   * Get stream usage as returned by this client's API response.
-   * @returns The stream usage object.
-   */
-  getStreamUsage(): UsageMetadata | undefined {
-    if (this.emitted_usage === true) {
-      return;
-    }
-    const inputUsage = this.message_start?.message.usage as
-      | undefined
-      | AnthropicStreamUsage;
-    const outputUsage = this.message_delta?.usage as
-      | undefined
-      | Partial<AnthropicStreamUsage>;
-    if (!outputUsage) {
-      return;
-    }
-    const totalUsage: UsageMetadata = {
-      input_tokens: inputUsage?.input_tokens ?? 0,
-      output_tokens: outputUsage.output_tokens ?? 0,
-      total_tokens:
-        (inputUsage?.input_tokens ?? 0) + (outputUsage.output_tokens ?? 0),
-    };
-    if (
-      inputUsage?.cache_creation_input_tokens != null ||
-      inputUsage?.cache_read_input_tokens != null
-    ) {
-      totalUsage.input_token_details = {
-        cache_creation: inputUsage.cache_creation_input_tokens ?? 0,
-        cache_read: inputUsage.cache_read_input_tokens ?? 0,
-      };
-    }
-    this.emitted_usage = true;
-    return totalUsage;
-  }
-  resetTokenEvents(): void {
-    this.message_start = undefined;
-    this.message_delta = undefined;
-    this.emitted_usage = undefined;
-    this.tools_in_params = undefined;
-  }
-  setDirectFields(fields?: CustomAnthropicInput): void {
-    this.temperature = fields?.temperature ?? undefined;
-    this.topP = fields?.topP ?? undefined;
-    this.top_k = fields?.topK;
-    if (this.temperature === -1 || this.temperature === 1) {
-      this.temperature = undefined;
-    }
-    if (this.topP === -1) {
-      this.topP = undefined;
-    }
-    if (this.top_k === -1) {
-      this.top_k = undefined;
-    }
-  }
-  private createGenerationChunk({
-    token,
-    chunk,
-    usageMetadata,
-    shouldStreamUsage,
-  }: {
-    token?: string;
-    chunk: AIMessageChunk;
-    shouldStreamUsage: boolean;
-    usageMetadata?: UsageMetadata;
-  }): ChatGenerationChunk {
-    const usage_metadata = shouldStreamUsage
-      ? (usageMetadata ?? chunk.usage_metadata)
-      : undefined;
-    return new ChatGenerationChunk({
-      message: new AIMessageChunk({
-        // Just yield chunk as it is and tool_use will be concat by BaseChatModel._generateUncached().
-        content: chunk.content,
-        additional_kwargs: chunk.additional_kwargs,
-        tool_call_chunks: chunk.tool_call_chunks,
-        response_metadata: chunk.response_metadata,
-        usage_metadata,
-        id: chunk.id,
-      }),
-      text: token ?? '',
-    });
-  }
-  async *_streamResponseChunks(
-    messages: BaseMessage[],
-    options: this['ParsedCallOptions'],
-    runManager?: CallbackManagerForLLMRun
-  ): AsyncGenerator<ChatGenerationChunk> {
-    this.resetTokenEvents();
-    const params = this.invocationParams(options);
-    const formattedMessages = _convertMessagesToAnthropicPayload(messages);
-    const payload = {
-      ...params,
-      ...formattedMessages,
-      stream: true,
-    } as const;
-    const coerceContentToString =
-      !_toolsInParams(payload) &&
-      !_documentsInParams(payload) &&
-      !_thinkingInParams(payload);
-    const stream = await this.createStreamWithRetry(payload, {
-      headers: options.headers,
-    });
-    const shouldStreamUsage = this.streamUsage ?? options.streamUsage;
-    for await (const data of stream) {
-      if (options.signal?.aborted === true) {
-        stream.controller.abort();
-        throw new Error('AbortError: User aborted the request.');
-      }
-      if (data.type === 'message_start') {
-        this.message_start = data as AnthropicMessageStartEvent;
-      } else if (data.type === 'message_delta') {
-        this.message_delta = data as AnthropicMessageDeltaEvent;
-      }
-      let usageMetadata: UsageMetadata | undefined;
-      if (this.tools_in_params !== true && this.emitted_usage !== true) {
-        usageMetadata = this.getStreamUsage();
-      }
-      const result = _makeMessageChunkFromAnthropicEvent(data, {
-        streamUsage: shouldStreamUsage,
-        coerceContentToString,
-      });
-      if (!result) continue;
-      const { chunk } = result;
-      const [token = '', tokenType] = extractToken(chunk);
-      if (
-        !tokenType ||
-        tokenType === 'input' ||
-        (token === '' && (usageMetadata != null || chunk.id != null))
-      ) {
-        const generationChunk = this.createGenerationChunk({
-          token,
-          chunk,
-          usageMetadata,
-          shouldStreamUsage,
-        });
-        yield generationChunk;
-        await runManager?.handleLLMNewToken(
-          token,
-          undefined,
-          undefined,
-          undefined,
-          undefined,
-          { chunk: generationChunk }
-        );
-        continue;
-      }
-      const textStream = new TextStream(token, {
-        delay: this._lc_stream_delay,
-        firstWordChunk: true,
-        minChunkSize: 4,
-        maxChunkSize: 8,
-      });
-      const generator = textStream.generateText(options.signal);
-      try {
-        let emittedUsage = false;
-        for await (const currentToken of generator) {
-          if ((options.signal as AbortSignal | undefined)?.aborted === true) {
-            break;
-          }
-          const newChunk = cloneChunk(currentToken, tokenType, chunk);
-          const generationChunk = this.createGenerationChunk({
-            token: currentToken,
-            chunk: newChunk,
-            usageMetadata: emittedUsage ? undefined : usageMetadata,
-            shouldStreamUsage,
-          });
-          if (usageMetadata && !emittedUsage) {
-            emittedUsage = true;
-          }
-          yield generationChunk;
-          await runManager?.handleLLMNewToken(
-            currentToken,
-            undefined,
-            undefined,
-            undefined,
-            undefined,
-            { chunk: generationChunk }
-          );
-        }
-      } finally {
-        await generator.return();
-      }
-    }
-    this.resetTokenEvents();
-  }
-}
+import { AIMessageChunk } from '@langchain/core/messages';
+import { ChatAnthropicMessages } from '@langchain/anthropic';
+import { ChatGenerationChunk } from '@langchain/core/outputs';
+import type { BaseChatModelParams } from '@langchain/core/language_models/chat_models';
+import type {
+  BaseMessage,
+  UsageMetadata,
+  MessageContentComplex,
+} from '@langchain/core/messages';
+import type { CallbackManagerForLLMRun } from '@langchain/core/callbacks/manager';
+import type { AnthropicInput } from '@langchain/anthropic';
+import type { Anthropic } from '@anthropic-ai/sdk';
+import type {
+  AnthropicMessageCreateParams,
+  AnthropicStreamingMessageCreateParams,
+  AnthropicStreamUsage,
+  AnthropicMessageStartEvent,
+  AnthropicMessageDeltaEvent,
+} from '@/llm/anthropic/types';
+import { _makeMessageChunkFromAnthropicEvent } from './utils/message_outputs';
+import { _convertMessagesToAnthropicPayload } from './utils/message_inputs';
+import { handleToolChoice } from './utils/tools';
+import { TextStream } from '@/llm/text';
+function _toolsInParams(
+  params: AnthropicMessageCreateParams | AnthropicStreamingMessageCreateParams
+): boolean {
+  return !!(params.tools && params.tools.length > 0);
+}
+function _documentsInParams(
+  params: AnthropicMessageCreateParams | AnthropicStreamingMessageCreateParams
+): boolean {
+  for (const message of params.messages ?? []) {
+    if (typeof message.content === 'string') {
+      continue;
+    }
+    for (const block of message.content ?? []) {
+      if (
+        typeof block === 'object' &&
+        block != null &&
+        block.type === 'document' &&
+        typeof block.citations === 'object' &&
+        block.citations.enabled
+      ) {
+        return true;
+      }
+    }
+  }
+  return false;
+}
+function _thinkingInParams(
+  params: AnthropicMessageCreateParams | AnthropicStreamingMessageCreateParams
+): boolean {
+  return !!(params.thinking && params.thinking.type === 'enabled');
+}
+function extractToken(
+  chunk: AIMessageChunk
+): [string, 'string' | 'input' | 'content'] | [undefined] {
+  if (typeof chunk.content === 'string') {
+    return [chunk.content, 'string'];
+  } else if (
+    Array.isArray(chunk.content) &&
+    chunk.content.length >= 1 &&
+    'input' in chunk.content[0]
+  ) {
+    return typeof chunk.content[0].input === 'string'
+      ? [chunk.content[0].input, 'input']
+      : [JSON.stringify(chunk.content[0].input), 'input'];
+  } else if (
+    Array.isArray(chunk.content) &&
+    chunk.content.length >= 1 &&
+    'text' in chunk.content[0]
+  ) {
+    return [chunk.content[0].text, 'content'];
+  } else if (
+    Array.isArray(chunk.content) &&
+    chunk.content.length >= 1 &&
+    'thinking' in chunk.content[0]
+  ) {
+    return [chunk.content[0].thinking, 'content'];
+  }
+  return [undefined];
+}
+function cloneChunk(
+  text: string,
+  tokenType: string,
+  chunk: AIMessageChunk
+): AIMessageChunk {
+  if (tokenType === 'string') {
+    return new AIMessageChunk(Object.assign({}, chunk, { content: text }));
+  } else if (tokenType === 'input') {
+    return chunk;
+  }
+  const content = chunk.content[0] as MessageContentComplex;
+  if (tokenType === 'content' && content.type === 'text') {
+    return new AIMessageChunk(
+      Object.assign({}, chunk, {
+        content: [Object.assign({}, content, { text })],
+      })
+    );
+  } else if (tokenType === 'content' && content.type === 'text_delta') {
+    return new AIMessageChunk(
+      Object.assign({}, chunk, {
+        content: [Object.assign({}, content, { text })],
+      })
+    );
+  } else if (tokenType === 'content' && content.type?.startsWith('thinking')) {
+    return new AIMessageChunk(
+      Object.assign({}, chunk, {
+        content: [Object.assign({}, content, { thinking: text })],
+      })
+    );
+  }
+  return chunk;
+}
+export type CustomAnthropicInput = AnthropicInput & {
+  _lc_stream_delay?: number;
+} & BaseChatModelParams;
+/**
+ * A type representing additional parameters that can be passed to the
+ * Anthropic API.
+ */
+// eslint-disable-next-line @typescript-eslint/no-explicit-any
+type Kwargs = Record<string, any>;
+export class CustomAnthropic extends ChatAnthropicMessages {
+  _lc_stream_delay: number;
+  private message_start: AnthropicMessageStartEvent | undefined;
+  private message_delta: AnthropicMessageDeltaEvent | undefined;
+  private tools_in_params?: boolean;
+  private emitted_usage?: boolean;
+  top_k: number | undefined;
+  constructor(fields?: CustomAnthropicInput) {
+    super(fields);
+    this.resetTokenEvents();
+    this.setDirectFields(fields);
+    this._lc_stream_delay = fields?._lc_stream_delay ?? 25;
+  }
+  static lc_name(): 'IllumaAnthropic' {
+    return 'IllumaAnthropic';
+  }
+  /**
+   * Get the parameters used to invoke the model
+   */
+  override invocationParams(
+    options?: this['ParsedCallOptions']
+  ): Omit<
+    AnthropicMessageCreateParams | AnthropicStreamingMessageCreateParams,
+    'messages'
+  > &
+    Kwargs {
+    const tool_choice:
+      | Anthropic.Messages.ToolChoiceAuto
+      | Anthropic.Messages.ToolChoiceAny
+      | Anthropic.Messages.ToolChoiceTool
+      | undefined = handleToolChoice(options?.tool_choice);
+    if (this.thinking.type === 'enabled') {
+      if (this.top_k !== -1 && (this.top_k as number | undefined) != null) {
+        throw new Error('topK is not supported when thinking is enabled');
+      }
+      if (this.topP !== -1 && (this.topP as number | undefined) != null) {
+        throw new Error('topP is not supported when thinking is enabled');
+      }
+      if (
+        this.temperature !== 1 &&
+        (this.temperature as number | undefined) != null
+      ) {
+        throw new Error(
+          'temperature is not supported when thinking is enabled'
+        );
+      }
+      return {
+        model: this.model,
+        stop_sequences: options?.stop ?? this.stopSequences,
+        stream: this.streaming,
+        max_tokens: this.maxTokens,
+        tools: this.formatStructuredToolToAnthropic(options?.tools),
+        tool_choice,
+        thinking: this.thinking,
+        ...this.invocationKwargs,
+      };
+    }
+    return {
+      model: this.model,
+      temperature: this.temperature,
+      top_k: this.top_k,
+      top_p: this.topP,
+      stop_sequences: options?.stop ?? this.stopSequences,
+      stream: this.streaming,
+      max_tokens: this.maxTokens,
+      tools: this.formatStructuredToolToAnthropic(options?.tools),
+      tool_choice,
+      thinking: this.thinking,
+      ...this.invocationKwargs,
+    };
+  }
+  /**
+   * Get stream usage as returned by this client's API response.
+   * @returns The stream usage object.
+   */
+  getStreamUsage(): UsageMetadata | undefined {
+    if (this.emitted_usage === true) {
+      return;
+    }
+    const inputUsage = this.message_start?.message.usage as
+      | undefined
+      | AnthropicStreamUsage;
+    const outputUsage = this.message_delta?.usage as
+      | undefined
+      | Partial<AnthropicStreamUsage>;
+    if (!outputUsage) {
+      return;
+    }
+    const totalUsage: UsageMetadata = {
+      input_tokens: inputUsage?.input_tokens ?? 0,
+      output_tokens: outputUsage.output_tokens ?? 0,
+      total_tokens:
+        (inputUsage?.input_tokens ?? 0) + (outputUsage.output_tokens ?? 0),
+    };
+    if (
+      inputUsage?.cache_creation_input_tokens != null ||
+      inputUsage?.cache_read_input_tokens != null
+    ) {
+      totalUsage.input_token_details = {
+        cache_creation: inputUsage.cache_creation_input_tokens ?? 0,
+        cache_read: inputUsage.cache_read_input_tokens ?? 0,
+      };
+    }
+    this.emitted_usage = true;
+    return totalUsage;
+  }
+  resetTokenEvents(): void {
+    this.message_start = undefined;
+    this.message_delta = undefined;
+    this.emitted_usage = undefined;
+    this.tools_in_params = undefined;
+  }
+  setDirectFields(fields?: CustomAnthropicInput): void {
+    this.temperature = fields?.temperature ?? undefined;
+    this.topP = fields?.topP ?? undefined;
+    this.top_k = fields?.topK;
+    if (this.temperature === -1 || this.temperature === 1) {
+      this.temperature = undefined;
+    }
+    if (this.topP === -1) {
+      this.topP = undefined;
+    }
+    if (this.top_k === -1) {
+      this.top_k = undefined;
+    }
+  }
+  private createGenerationChunk({
+    token,
+    chunk,
+    usageMetadata,
+    shouldStreamUsage,
+  }: {
+    token?: string;
+    chunk: AIMessageChunk;
+    shouldStreamUsage: boolean;
+    usageMetadata?: UsageMetadata;
+  }): ChatGenerationChunk {
+    const usage_metadata = shouldStreamUsage
+      ? (usageMetadata ?? chunk.usage_metadata)
+      : undefined;
+    return new ChatGenerationChunk({
+      message: new AIMessageChunk({
+        // Just yield chunk as it is and tool_use will be concat by BaseChatModel._generateUncached().
+        content: chunk.content,
+        additional_kwargs: chunk.additional_kwargs,
+        tool_call_chunks: chunk.tool_call_chunks,
+        response_metadata: chunk.response_metadata,
+        usage_metadata,
+        id: chunk.id,
+      }),
+      text: token ?? '',
+    });
+  }
+  async *_streamResponseChunks(
+    messages: BaseMessage[],
+    options: this['ParsedCallOptions'],
+    runManager?: CallbackManagerForLLMRun
+  ): AsyncGenerator<ChatGenerationChunk> {
+    this.resetTokenEvents();
+    const params = this.invocationParams(options);
+    const formattedMessages = _convertMessagesToAnthropicPayload(messages);
+    const payload = {
+      ...params,
+      ...formattedMessages,
+      stream: true,
+    } as const;
+    const coerceContentToString =
+      !_toolsInParams(payload) &&
+      !_documentsInParams(payload) &&
+      !_thinkingInParams(payload);
+    const stream = await this.createStreamWithRetry(payload, {
+      headers: options.headers,
+    });
+    const shouldStreamUsage = this.streamUsage ?? options.streamUsage;
+    for await (const data of stream) {
+      if (options.signal?.aborted === true) {
+        stream.controller.abort();
+        throw new Error('AbortError: User aborted the request.');
+      }
+      if (data.type === 'message_start') {
+        this.message_start = data as AnthropicMessageStartEvent;
+      } else if (data.type === 'message_delta') {
+        this.message_delta = data as AnthropicMessageDeltaEvent;
+      }
+      let usageMetadata: UsageMetadata | undefined;
+      if (this.tools_in_params !== true && this.emitted_usage !== true) {
+        usageMetadata = this.getStreamUsage();
+      }
+      const result = _makeMessageChunkFromAnthropicEvent(data, {
+        streamUsage: shouldStreamUsage,
+        coerceContentToString,
+      });
+      if (!result) continue;
+      const { chunk } = result;
+      const [token = '', tokenType] = extractToken(chunk);
+      if (
+        !tokenType ||
+        tokenType === 'input' ||
+        (token === '' && (usageMetadata != null || chunk.id != null))
+      ) {
+        const generationChunk = this.createGenerationChunk({
+          token,
+          chunk,
+          usageMetadata,
+          shouldStreamUsage,
+        });
+        yield generationChunk;
+        await runManager?.handleLLMNewToken(
+          token,
+          undefined,
+          undefined,
+          undefined,
+          undefined,
+          { chunk: generationChunk }
+        );
+        continue;
+      }
+      const textStream = new TextStream(token, {
+        delay: this._lc_stream_delay,
+        firstWordChunk: true,
+        minChunkSize: 4,
+        maxChunkSize: 8,
+      });
+      const generator = textStream.generateText(options.signal);
+      try {
+        let emittedUsage = false;
+        for await (const currentToken of generator) {
+          if ((options.signal as AbortSignal | undefined)?.aborted === true) {
+            break;
+          }
+          const newChunk = cloneChunk(currentToken, tokenType, chunk);
+          const generationChunk = this.createGenerationChunk({
+            token: currentToken,
+            chunk: newChunk,
+            usageMetadata: emittedUsage ? undefined : usageMetadata,
+            shouldStreamUsage,
+          });
+          if (usageMetadata && !emittedUsage) {
+            emittedUsage = true;
+          }
+          yield generationChunk;
+          await runManager?.handleLLMNewToken(
+            currentToken,
+            undefined,
+            undefined,
+            undefined,
+            undefined,
+            { chunk: generationChunk }
+          );
+        }
+      } finally {
+        await generator.return();
+      }
+    }
+    this.resetTokenEvents();
+  }
+}